PyTorch 中的傅里叶卷积实现示例_Python

卷积

卷积在数据分析中无处不在。几十年来，它们一直被用于信号和图像处理。最近，它们成为现代神经网络的重要组成部分。如果你处理数据的话，你可能会遇到错综复杂的问题。

数学上，卷积表示为：

PyTorch 中的傅里叶卷积实现示例

尽管离散卷积在计算应用程序中更为常见，但在本文的大部分内容中我将使用连续形式，因为使用连续变量来证明卷积定理(下面讨论)要容易得多。之后，我们将回到离散情况，并使用傅立叶变换在PyTorch中实现它。离散卷积可以看作是连续卷积的近似，其中连续函数离散在规则网格上。因此，我们不会为这个离散的案例重新证明卷积定理。

卷积定理

从数学上来说，卷积定理可以这样描述：

PyTorch 中的傅里叶卷积实现示例

其中的连续傅里叶变换是(达到正常化常数)：

PyTorch 中的傅里叶卷积实现示例

换句话说，位置空间中的卷积等价于频率空间中的直乘。这个想法是相当不直观的，但是对于连续的情况来说，证明卷积定理是惊人的容易。要做到这一点，首先要写出等式的左边。

PyTorch 中的傅里叶卷积实现示例

现在切换积分的顺序，替换变量(x=y+z)，并分离两个被积函数。

PyTorch 中的傅里叶卷积实现示例

我们为什么要关心这一切？

因为快速傅里叶变换的算法复杂度低于卷积。直接卷积运算具有复杂度O(n^2)，因为在f中，我们传递g中的每个元素，所以可以在O(nlogn)时间内计算出快速傅立叶变换。当输入数组很大时，它们比卷积要快得多。在这些情况下，我们可以使用卷积定理计算频率空间中的卷积，然后执行逆傅里叶变换回到位置空间。

当输入较小时(例如3x3卷积内核)，直接卷积仍然更快。在机器学习应用程序中，使用小内核更为常见，因此像PyTorch和Tensorflow这样的深度学习库只提供直接卷积的实现。但是在现实世界中有很多使用大内核的用例，其中傅立叶卷积算法更有效。

PyTorch实现

现在，我将演示如何在PyTorch中实现傅里叶卷积函数。它应该模仿torch.nn.functional.convNd的功能，并利用fft，而不需要用户做任何额外的工作。因此，它应该接受三个Tensors(signal、kernel和可选bias)和应用于输入的padding。从概念上讲，这个函数的内部工作原理是：

deffft_conv( signal:Tensor,kernel:Tensor,bias:Tensor=None,padding:int=0, )->Tensor: #1.Padtheinputsignal&kerneltensors #2.ComputeFFTforbothsignal&kernel #3.MultiplythetransformedTensorstogether #4.ComputeinverseFFT #5.Addbiasandreturn

让我们按照上面显示的操作顺序逐步构建FFT卷积。对于这个例子，我将构建一个一维傅里叶卷积，但是将其扩展到二维和三维卷积是很简单的。

1.填充输入数组

我们需要确保signal和kernel在填充之后有相同的大小。应用初始填充signal，然后调整kernel的填充以匹配。

#1.Padtheinputsignal&kerneltensors signal=f.pad(signal,[padding,padding]) kernel_padding=[0,signal.size(-1)-kernel.size(-1)] padded_kernel=f.pad(kernel,kernel_padding)

注意，我只在一边填充kernel。我们希望原始内核位于填充数组的左侧，这样它就可以与signal数组的开始对齐。

2.计算傅立叶变换

这非常简单，因为n维fft已经在PyTorch中实现了。我们简单地使用内置函数，并计算沿每个张量的最后一个维数的FFT。

#2.Performfourierconvolution signal_fr=rfftn(signal,dim=-1) kernel_fr=rfftn(padded_kernel,dim=-1)

3.变换张量相乘

令人惊讶的是，这是我们功能中最复杂的部分。这有两个原因。(1)PyTorch卷积运行于多维张量上，因此我们的signal和kernel张量实际上是三维的。从PyTorch文档中的这个方程式，我们可以看到矩阵乘法是在前两个维度上运行的(不包括偏差项)：

PyTorch 中的傅里叶卷积实现示例

我们将需要包括这个矩阵乘法，以及对转换后的维度的直接乘法。

PyTorch实际上实现了互相关/值方法而不是卷积方法。(TensorFlow和其他深度学习库也是如此。)互相关与卷积密切相关，但有一个重要的标志变化：

PyTorch 中的傅里叶卷积实现示例

与卷积相比，这有效地逆转了核的方向(g)。我们不是手动翻转内核，而是在傅里叶空间中利用内核的共轭复数来纠正这个问题。由于我们不需要创建一个全新的Tensor，所以这样做的速度明显更快，内存效率也更高。(本文末尾的附录中简要说明了这种方法的工作原理。)

#3.Multiplythetransformedmatrices defcomplex_matmul(a:Tensor,b:Tensor)->Tensor: """Multipliestwocomplex-valuedtensors.""" #

Scala

rmatrixmultiplicationoftwotensors,overonlythefirsttwodimensions. #Dimensions3andhigherwillhavethesameshapeaftermultiplication. scalar_matmul=partial(torch.einsum,"ab...,cb...->ac...") #Computetherealandimaginarypartsindependently,thenmanuallyinsertthem #intotheoutputTensor.ThisisfairlyhackybutnecessaryforPyTorch1.7.0, #becauseAutogradisnotenabledforcomplexmatrixoperationsyet.Notexactly #idiomaticPyTorchcode,butitshouldworkforallfutureversions(>=1.7.0). real=scalar_matmul(a.real,b.real)-scalar_matmul(a.imag,b.imag) imag=scalar_matmul(a.imag,b.real)+scalar_matmul(a.real,b.imag) c=torch.zeros(real.shape,dtype=torch.complex64) c.real,c.imag=real,imag returnc #Conjugatethekernelforcross-correlation kernel_fr.imag*=-1 output_fr=complex_matmul(signal_fr,kernel_fr)

PyTorch1.7改进了对复数的支持，但是在autograd中还不支持对复数张量的许多操作。现在，我们必须编写我们自己的复杂matmul方法作为一个补丁。虽然不是很理想，但是它确实有效，并且在未来的版本中不会出现问题。

4.计算逆变换

使用torch.irfftn可以直接计算逆变换，然后裁剪出额外的数组填充。

#4.ComputeinverseFFT,andremoveextrapaddedvalues output=irfftn(output_fr,dim=-1) output=output[:,:,:signal.size(-1)-kernel.size(-1)+1]

5.添加偏执项并返回

添加偏差项也很容易。请记住，对于输出阵列中的每个通道，偏置项都有一个元素，并相应地调整其形状。

#5.Optionally,addabiastermbeforereturning. ifbiasisnotNone: output+=bias.view(1,-1,1)

将上述代码整合在一起

为了完整起见，让我们将所有这些代码片段编译成一个内聚函数。

deffft_conv_1d( signal:Tensor,kernel:Tensor,bias:Tensor=None,padding:int=0, )->Tensor: """ Args: signal:(Tensor)Inputtensortobeconvolvedwiththekernel. kernel:(Tensor)Convolutionkernel. bias:(Optional,Tensor)Biastensortoaddtotheoutput. padding:(int)Numberofzerosamplestopadtheinputonthelastdimension. Returns: (Tensor)Convolvedtensor """ #1.Padtheinputsignal&kerneltensors signal=f.pad(signal,[padding,padding]) kernel_padding=[0,signal.size(-1)-kernel.size(-1)] padded_kernel=f.pad(kernel,kernel_padding) #2.Performfourierconvolution signal_fr=rfftn(signal,dim=-1) kernel_fr=rfftn(padded_kernel,dim=-1) #3.Multiplythetransformedmatrices kernel_fr.imag*=-1 output_fr=complex_matmul(signal_fr,kernel_fr) #4.ComputeinverseFFT,andremoveextrapaddedvalues output=irfftn(output_fr,dim=-1) output=output[:,:,:signal.size(-1)-kernel.size(-1)+1] #5.Optionally,addabiastermbeforereturning. ifbiasisnotNone: output+=bias.view(1,-1,1) returnoutput

直接卷积测试

最后，我们将使用torch.nn.functional.conv1d来确认这在数值上等同于直接一维卷积。我们为所有输入构造随机张量，并测量输出值的相对差异。

importtorch importtorch.nn.functionalasf torch.manual_seed(1234) kernel=torch.randn(2,3,1025) signal=torch.randn(3,3,4096) bias=torch.randn(2) y0=f.conv1d(signal,kernel,bias=bias,padding=512) y1=fft_conv_1d(signal,kernel,bias=bias,padding=512) abs_error=torch.abs(y0-y1) print(f'\nAbsErrorMean:{abs_error.mean():.3E}') print(f'AbsErrorStdDev:{abs_error.std():.3E}') #AbsErrorMean:1.272E-05

考虑到我们使用的是32位精度，每个元素相差大约1e-5ー相当精确！让我们也执行一个快速的基准来测量每个方法的速度：

fromtimeitimporttimeit direct_time=timeit( "f.conv1d(signal,kernel,bias=bias,padding=512)", globals=locals(), number=100 )/100 fourier_time=timeit( "fft_conv_1d(signal,kernel,bias=bias,padding=512)", globals=locals(), number=100 )/100 print(f"Directtime:{direct_time:.3E}s") print(f"Fouriertime:{fourier_time:.3E}s") #Directtime:1.523E-02s #Fouriertime:1.149E-03s

测量的基准将随着您使用的机器而发生显著的变化。(我正在用一台非常旧的MacbookPro进行测试。)对于1025的内核，傅里叶卷积似乎要快10倍以上。

总结

我希望这已经提供了一个彻底的介绍傅里叶卷积。我认为这是一个非常酷的技巧，在现实世界中有很多应用程序可以使用它。我也喜欢数学，所以看到编程和纯数学的结合是很有趣的。欢迎和鼓励所有的评论和建设性的批评，如果你喜欢这篇文章，请鼓掌！

附录：

卷积vs.互相关

在本文的前面，我们通过在傅里叶空间中取得内核的互相关共轭复数来实现。这实际上颠倒了kernel的方向，现在我想演示一下为什么会这样。首先，记住卷积和互相关的公式：

PyTorch 中的傅里叶卷积实现示例