PyTorch软件下载_PyTorchv1.8.1官方版下载-创佳软件园

软件介绍
相关专题
下载地址

PyTorch简介

PyTorch提供神经网络分析的功能。您可以使用多个模板快速创建分析方案。您可以在软件上编辑分析代码，并通过执行代码来分析项目，这样软件就可以自动分析复杂的系统和程序。该软件提供强大的计算能力，可以帮助企业分析大规模的神经网络项目。结合分布式训练系统，可以优化计算过程，加快项目计算速度。PyTorch允许您创建数据模型分析。分析完成后，可以在软件的可视化界面中显示模型，并结合GUI界面查看分析结果。它还支持模型的导出和使用。这个软件还有很多功能，可以满足大部分神经网络的训练需求！

PyTorch软件功能

PyTorch是一个Python软件包，提供了两个高级功能:

1.具有强大U加速功能的张量计算(如NumPy)

2.基于带基自动毕业系统的深度神经网络

您可以在需要时重用您最喜欢的Python包(如NumPy、SciPy和Cython)来扩展PyTorch。

就粒度而言，PyTorch是由以下组件组成的库:

1.torch:像NumPy这样的张量库有很强的u支持。

2.torch.tograd:一个基于磁带的自动微分库，支持torch中所有可微分的Tensor。

3.torch.jit:编译堆栈(TorchScpt)以从PyTorch代码创建可序列化和优化的模型。

4.torch.nn:一个与tograd深度集成的神经网络库，旨在提供最大的灵活性。

5.火炬。多处理:Python是多处理，但是跨进程Torch张量有神奇的内存共享。对数据加载和霍格沃茨训练有用。

6.火炬。utils:数据加载器和其他方便的实用功能。

通常，PyTorch可以用作:

替换NumPy使用u的功能。

以最大的灵活性和速度提供深度学习研究平台。

PyTorch软件特色

准备生产

使用TorchScpt在急切模式和图形模式之间无缝过渡，使用TorchServe加快生产速度。

分布式培训

火炬。分布式后端可以在研发和生产中实现可扩展的分布式训练和能量优化。

强健的生态系统

丰富的工具和库生态系统扩展PyTorch并支持计算机视觉、NLP等的发展。

云支持

/[/k0/

PyTorch使用说明

音频输入输出预处理和火炬输出

PyTorch是一个开源的深度学习平台，在U的支持下提供了从研究原型到生产部署的无缝路径。

解决机器学习问题的重要任务是准备数据。Torchdio充分利用了PyTorch的U支持，并提供了许多工具来简化数据加载，使其更具可读性。在本教程中，我们将看到如何从一个简单的数据集中加载和预处理数据。请访问音频I/O预处理和torchdio了解更多信息。

对于本教程，请确保安装了matplotlib包以便于查看。

打开文件

Torchdio还支持加载wav和mp3格式的声音文件。我们称波形为原始音频信号。

在torchdio中加载文件时，可以通过torchdio.set _ dio _后端选择指定后端使用SoX或SoundFile。这些后端会在需要时延迟加载。

Torchdio还使函数的JIT编译成为可选的，并使用nn。模块，如果可能。

变化

Torchdio支持越来越多的转换。

重采样:将波形重采样到另一个采样率。

频谱图:从波形创建频谱图。

GffinLim:使用Gffin-Lim变换从线性比例振幅谱图计算波形。

计算张量的增量系数(通常是谱图)。

ComplexNorm:计算复张量的范数。

MelScale:使用转换矩阵将正常STFT转换为Mel频率STFT。

截肢分贝:这将声谱图从功率/振幅标度改变为分贝标度。

MFCC:从波形创建梅尔频率倒谱系数。

梅尔谱图:使用PyTorch中的STFT特征从波形创建梅尔谱图。

MuLawEncoding:基于μ律压扩的编码波形。

MuLawDecoding:解码mu-law编码波形。

时间拉伸:在不改变给定速率音高的情况下，及时拉伸频谱图。

频率掩蔽:在频域中对频谱图应用掩蔽。

时间掩蔽:在时域中对谱图应用掩蔽。

每个变换都支持批处理:您可以对单个原始音频信号或声谱图或多个相同形状的信号执行变换。

因为所有的变换都是nn。模块或jit。ScptModules，它们可以在任何时候用作神经网络的一部分。

首先，我们可以在对数尺度上检查谱图的对数。

外出:

光谱图形状:火炬。大小([2，201，1385])

或者我们可以在对数尺度上看梅尔的谱图。

使用torchdio的语音命令识别

本教程将向您展示如何正确格式化音频数据集，并在数据集上训练/测试音频分类器网络。

Colab提供了u选项。在菜单选项卡中，选择“操作系统”和“更改操作系统类型”。在随后的弹出窗口中，您可以选择u。更改后，运行时应该会自动重新启动(这意味着来自被执行单元的将会消失)。

首先我们导入常用的Torch包，比如torchdio，可以按照网站上的说明进行安装。

让我们检查一下CUDA U是否可用，然后选择我们的设备。在U上运行网络将大大减少培训/测试时间。

导入数据集

我们使用torchdio来下载和表示数据集。这里，我们使用SpeechCommands，这是一个由不同人说出的35个命令的数据集。SPEECHCOMMANDS是数据集的torch.utils.data.Dataset版本。在这个数据集中，所有音频文件的长度约为1秒(因此，它约为16，000个时间帧)。

的实际加载和格式化步骤发生在访问数据点时，torchdio负责将音频文件转换为张量。如果想直接加载音频文件，可以使用torchdio.load()。它返回一个元组，包含新创建的张量和音频文件的采样频率(SpeechCommands为16kHz)。

回到数据集，这里我们创建一个子类，并将其分为标准训练、验证和测试子集。

SPEECHCOMMANDS数据集中的数据点是由波形(音频信号)、采样率、话语(标签)、说话人ID和话语编号组成的元组。

让我们在数据集中找到可用标签的列表。

这35个音频标签是用户说出的命令。前几份文件就是人们所说的马文。

最后一份文件是，有人说“远景”。

格式数据

这是对数据应用转换的好地方。对于波形，我们对音频进行下采样，以便在不损失太多分类能力的情况下进行更快的处理。

我们不需要在这里应用其他转换。对于某些数据集，通常需要通过沿通道维度求平均值或仅保留一个通道来减少通道的数量(例如，从立体声到单声道)。由于SpeechCommands使用单个音频通道，因此这里不需要它。

我们使用标签列表中的每个索引来编码每个单词。

为了将录音和语音组成的数据点列表转换为模型的两个批处理张量，我们实现了排序函数，该函数由PyTorch DataLoader使用，允许我们批处理迭代数据集。

在整理功能中，我们还应用了重采样和文本编码。