光电工程  2020, Vol. 47 Issue (3): 190584      DOI: 10.12086/oee.2020.190584     
基于机器学习的轨道角动量光束模式探测技术研究进展
尹霄丽 , 崔小舟 , 常欢 , 张兆元 , 苏元直 , 郑桐     
北京邮电大学电子工程学院天地互联与融合北京市重点实验室,北京 100876
摘要:轨道角动量(OAM)复用和编码技术可有效提高光通信系统信道容量。近些年研究者提出将机器学习(ML)技术用于OAM模式探测以提高OAM光通信系统性能。本文对基于机器学习的OAM模式探测方案进行了综述,包括误差反向传播(BP)神经网络、自组织神经网络(SOM)、支持向量机(SVM)、卷积神经网络(CNN)、光束变换辅助的识别技术以及全光衍射深度神经网络(D2NN),分析了各类机器学习OAM探测器在对抗大气、水下信道带来的干扰时展现出的性能差异以及各自优势。
关键词轨道角动量    机器学习    神经网络    
Research progress of orbital angular momentum modes detecting technology based on machine learning
Yin Xiaoli, Cui Xiaozhou, Chang Huan, Zhang Zhaoyuan, Su Yuanzhi, Zheng Tong     
Beijing Key Laboratory of Space-Ground Interconnection and Convergence, School of Electronic Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China
Abstract: The orbital angular momentum (OAM) multiplexing and encoding technologies can effectively increase the channel capacity of the optical communication systems. In recent years, some researchers focus on using machine learning (ML) technology to detect OAM modes to improve the performance of OAM optical communication system. In this paper, the OAM modes detecting schemes based on ML technology are reviewed, including error back-propagating (BP) neural networks, self-organizing feature map (SOM), support vector machine (SVM), convolutional neural network (CNN), mode recognition techniques base on beam transformations and all-optics diffractive deep neural networks (D2NN). The performance, advantages and obstacles of each kind of the neural networks in atmosphere and underwater channels are analyzed.
Keywords: orbital angular momentum    machine learning    neural network    

1 引言

空间光(Free space optical, FSO)通信以激光束作为信息载体,具有空间和时间相干性好,传输速率高,通信容量大,且无需铺设光纤等优点[1-2],是解决微波通信瓶颈,构建天基宽带网,实现全球高速、实时通信的有效手段,具有很大的民用和军事应用潜力[3]。光的轨道角动量(orbital angular momentum,OAM)是具有相位因子$\exp ({\rm{i}}l\varphi )$的螺旋形波前光束特有的物理属性,其中l表示拓扑荷,φ表示方位角。自1992年Allen等人提出光OAM的概念以来[4],光OAM的应用引起了人们的广泛关注。OAM光束的拓扑荷数理论上可取无穷多个值,并且具有不同拓扑荷的OAM模式间相互正交[5-7]。因此,可将OAM视为一个新的自由度,与波长、偏振态等复用方式一起作为数据信息载体或实现高阶编码,从而大大提高通信系统容量与频谱效率[8-12]。OAM编解码在空间光通信的应用起源于2004年,Gibson等人在实验室演示了通过OAM态编码实现信息的传输[5];2010年Awaji等人首次完成了采用1550 nm通信波长的2信道OAM复用、每信道10 Gbit/s的相干光通信实验[13];2011年,华中科技大学的Wang等人进行了OAM复用的高速通信实验并达到1.37 Tbit/s的速率以及25.6 (bit/s)/Hz的频谱效率[8];2012年,Wang将其实验通信速率进一步提升到2.56 Tbit/s,频谱效率提升到95.7 (bit/s)/Hz[14];2013年,美国南加州大学的Huang等人在Wang的工作基础上,实现了32路20 Gbit/s、16-QAM数据流的OAM态复用传输,达到了2.56 Tbit/s高速数据通信,且系统误码率小于2×10-3[15];2014年,Huang等人综合了OAM复用、偏振复用和波分复用技术建立了12个OAM光束、2个偏振态和42个波长的包含1008条数据通道的系统,总容量可达到100.8 Tbit/s[16];同年,Wang等人基于双偏振26路OAM复用,结合8QAM-OFDM调制和368路波分复用成功实现了1.036 Pbit/s的传输容量,且频谱效率达112.6 (bit/s)/Hz[17];2016年,Ren等人通过OAM复用技术完成120 m大气环境下的总速率为400 Gbit/s的通信,并且误码率小于3.8×10-3[18]。2019年,Li等人将OAM复用技术用于固定地点与无人机间的通信,实现了100 m链路2路OAM复用共200 Gbit/s的速率,误码率低于3.8×10-3[19]

然而,大气是一种不稳定的随机介质,光波在大气中传播时,会受到分子吸收、大气气体和气溶胶散射、湍流扰动等影响。大气中湍流会对光束的复振幅造成破坏,干扰OAM态的正交性,进而降低空间光通信系统的误码率性能[20-21]。因此,如何提高OAM通信系统的抗干扰能力成为了迫切需要解决的问题。

OAM光束用于复用或者编码时,由于不同叠加态的OAM光束有着不同的物理表现(如强度图样),故可将OAM模式识别问题转换为图像分类的问题。此类问题通常使用识别率(即对图像正确分类的比例)和误码率(即传输信息比特的错误率)来表示。2014年,维也纳大学Krenn等人首次使用人工神经网络(artificial neural network,ANN)作为OAM模式分类器。该研究在3 km的城市环境大气中对16个OAM模式进行识别,平均误码率接近1%[22]。2016年,Krenn等在143 km的海面上空(海洋性大气信道)进行了类似的实验。该实验利用4种OAM模式对文字进行编码,误码率为8.33%。尽管误码率偏高,但该研究验证了机器学习作为OAM识别器可以在长达数百公里的传输距离中使用的可能性[23]。但ANN在图像分类上存在无法学习相邻像素点关联性等问题,并且部分ANN需要人工设置特征函数,故基于ANN的OAM模式识别器在系统实现上具有一定的局限性。2017年,基于卷积神经网络(convolutional neural network, CNN)在处理图像分类问题上的优势,美国海军实验室和北京邮电大学等先后提出使用AlexNet、LeNet等框架的CNN对受大气湍流影响的OAM光束强度图样进行分类识别,在实验室通过实验和仿真的方式取得了大于99%的识别率,从此开启了CNN-OAM模式分类器的研究热潮[24-25]

本文将对基于机器学习的OAM模式分类研究进行综述,分类器包括常见的ANN、支持向量机(support vector machine, SVM)、CNN以及近一年受到广泛关注的全光神经网络——衍射深度神经网络(diffractive deep neural networks,D2NN)等。

2 OAM叠加态光束强度分布特点

拉盖尔-高斯(Laguerre Gaussian,LG)光束是最常见的OAM光束,LG光束在柱坐标系$(r, \varphi , z)$下传输的复振幅表达式为[26]

${u_l}(r, \varphi , z){\rm{ = }}{R_l}(r, z)\exp ({\rm{i}}l\varphi ), $ (1)

式中径向基函数${R_l}(r, z)$可以表示为

${R_l}(r, z) = \sqrt {\frac{{2p!}}{{{\rm{ \mathsf{ π} }}(p + \left| l \right|)!}}} \frac{1}{{\omega (z)}}{\left[ {\frac{{r\sqrt 2 }}{{\omega (z)}}} \right]^{\left| l \right|}}{\rm{L}}_p^l\left[ {\frac{{2{r^2}}}{{{\omega ^2}(z)}}} \right]\exp \left[ {\frac{{ - {r^2}}}{{{\omega ^2}(z)}}} \right]$
$ \times \exp \left[ {\frac{{ - {\rm{i}}k{r^2}z}}{{2({z^2} + z_{\rm{R}}^2)}}} \right]\exp \left[ {{\rm{i}}(2p + \left| l \right| + 1)\arctan\left( {\frac{z}{{{z_{\rm{R}}}}}} \right)} \right], $ (2)

p为径向指数,l为拓扑荷数,$\omega (z){\rm{ }} = {\rm{ }}{\omega _0}\sqrt {1{\rm{ + (}}{z^2}/z_{\rm{R}}^2{\rm{)}}} $ω0为束腰半径,${z_{\rm{R}}} = {\rm{ \mathsf{ π} }}\omega _0^2/\lambda $为瑞利距离,λ为波长,${\rm{L}}_p^l( \cdot )$为缔合拉盖尔多项式。当p=0时,LG模的强度分布是半径与$\sqrt {|l|} $成正比的圆环,同时相位从0至2π变化的次数为|l|。

为了方便研究,考虑径向指数p=0,拓扑荷数为$ \pm {l_0}$的叠加LG光束,叠加后的光场强度可以表示为

$|{u_{ \pm {l_0}}}{|^2} = |{u_{{l_0}}}(r, \varphi , z){\rm{ + }}{u_{ - {l_0}}}(r, \varphi , z){|^2}$
$ = |{R_{{l_0}}}(r, z)\exp ({\rm{i}}{l_0}\varphi ) + {R_{ - {l_0}}}(r, z)\exp ( - {\rm{i}}{l_0}\varphi ){|^2}$
$ = 2|{R_{|{l_0}|}}(r, z){|^2}(1{\rm{ + cos}}(2{l_0}\varphi ))。$ (3)

对于p=0,

$|{R_{|{l_0}|}}(r, z){|^2}{\rm{ = }}\frac{2}{{{\rm{ \mathsf{ π} }}|{l_0}|!}}\frac{1}{{{\omega ^2}(z)}}\exp \left[ { - 2\left( {\frac{{{r^2}}}{{{\omega ^2}(z)}}} \right)} \right]{\left[ {\frac{{\sqrt 2 r}}{{\omega (z)}}} \right]^{2|{l_0}|}}。$

图 1是8种拓扑荷数{l0=±1,±2,±3,±4,±5,±6,±7,±8}叠加态的LG光束在发送端的光场强度分布图。从图 1可以看出,发送端拓扑荷数为$ \pm {l_0}$的叠加态光束的光场强度分布不再呈圆环状,而是呈现“花瓣状”。“花瓣”的数量,即光斑数量为$N = 2|{l_0}|$。对于单态LG光束强度分布,不同态大小主要反映在光环的半径与粗细上。态越大,光环半径越大,光环越细。与单态LG光束的圆环状强度分布相比,叠加态光束的“花瓣状”光强分布中瓣状光斑的数量特征也蕴含着光束拓扑荷的信息。这种独特的光强分布为模式识别带来了有利条件。

图 1 拓扑荷数为l0的叠加态光束在发送端的光场强度分布图。(a)(h)对应的拓扑荷l0分别对应1至8 Fig. 1 Superposed intensity distributions of OAM modes l0 at the transmitted terminal.(a)(h) the superposed OAM modes l0 from 1 to 8
3 大气湍流信道

在温度梯度的作用下,大气的湍流运动会导致大气折射率紊乱,称为大气的光学湍流。Kolmogorov早期的研究表明,所有光学湍流的一个亚类具有一定程度的统计一致性,便于进行有意义的理论分析和建模处理。折射率在时空上随机地重新分布会造成与其相关的光束闪烁现象和相位波动等各种影响[27]

对于光波传播,折射率的变化几乎都是因温度微弱变化引起的,湿度变化、压力变化通常可以忽略不计。因此,折射率的空间功率谱函数形式与温度空间功率谱函数类似,温度起伏功率谱也类似于风速起伏功率谱,符合相同的次方规律。大气湍流的折射率功率谱模型已有Kolmogorov谱,Tatarskii谱,修正型von Karman谱,以及修正型Kolmogorov大气谱等[28]。其中表述最简洁并且运用十分广泛的是Kolmogorov功率谱:

${{\mathit{\Phi}} _n}(\kappa ) = 0.033C_n^2{\kappa ^{ - 11/3}}, $ (4)

其中:$1/{L_0} \leqslant \kappa \leqslant 1/{l_0}$$C_n^2$是大气湍流折射率结构常数,与大气湍流的强弱程度相关;$C_n^2$值越大,则湍流强度越大;其分布大致在$C_n^2 = {10^{ - 17}}{{\rm{m}}^{ - {2 / 3}}}$$C_n^2 = {10^{ - 13}}{{\rm{m}}^{ - {2 / 3}}}$之间,对应着弱湍流到强湍流的情况。

然而,该公式建立的功率谱模型理论上只在的$1/{L_0} \leqslant \kappa \leqslant 1/{l_0}$惯性区域成立。为了扩大该模型的应用范围,通常假定大气外尺度无穷大(${L_0} \approx \infty $),内尺度无限小(${l_0} = 0$)。但是该模型应用范围的扩大可能会导致积分不收敛,在使用该模型时需要特别注意这一点。当内尺度与外尺度不能忽略时,人们提出了其他的谱模型。为了使式(4)应用于$\kappa > 1/{l_0}$的情形,需要一个新的功率谱,即Tatarskii谱:

${{\mathit{\Phi}} _n}\left( \kappa \right) = 0.033{\rm{C}}_n^2{\kappa ^{ - \frac{{11}}{3}}}\exp \left( { - \frac{{{\kappa ^2}}}{{\kappa _m^2}}} \right), $ (5)

其中:$1/{L_0} \ll \kappa $${\kappa _m} = 5.92/{l_0}$。然而,Kolmogorov谱和Tatarskii谱模型都存在$\kappa = 0$奇点(${L_0} \to \infty $)。在实际使用时,通常将Kolmogorov谱模型和Tatarskii谱模型加以改进,使其在其他条件下也是均匀和各向同性的,改进之后,相应的结构函数与协方差函数都可以进行计算。由此可以得到它们的修正型功率谱。

由Tatarskii谱可以得到如下的修正型von Karman谱:

${{\mathit{\Phi}} _n}\left( \kappa \right) = 0.033C_n^2\frac{1}{{{{({\kappa ^2} + \kappa _0^2)}^{11/6}}}}\exp \left( { - \frac{{{\kappa ^2}}}{{\kappa _m^2}}} \right), $ (6)

其中:$0 \leqslant \kappa < \infty $${\kappa _m} = 5.92/{l_0}$

在Kolmogorov谱基础上可以得到修正型Kolmogorov大气谱:

${{\mathit{\Phi}} _n}\left( \kappa \right) = 0.033C_n^2\left[ {1 + 1.802\left( {\frac{\kappa }{{{\kappa _l}}}} \right) - 0.254{{\left( {\frac{\kappa }{{{\kappa _l}}}} \right)}^{7/6}}} \right]$
$ \times \frac{1}{{{{({\kappa ^2} + \kappa _0^2)}^{11/6}}}}\exp \left( { - \frac{{{\kappa ^2}}}{{\kappa _l^2}}} \right), $ (7)

其中:$0 \leqslant \kappa < \infty $${\kappa _l} = 3.3/{l_0}$

OAM光束经湍流信道的传输可以利用分步传输法进行数值仿真,也可以通过空间光调制器产生满足Kolmogrov湍流理论的随机相位屏进行模拟[29]。OAM光束经海洋信道的仿真传输与大气信道类似,需要采用相应的折光率谱模型。

4 基于ANN的OAM模式识别技术

机器学习通常是指计算机根据“学习算法”从经验数据中产生模型,再利用模型对新的情况提供相应的判断[30]。早期的神经网络需要人类设计特征函数,特征设计的好坏直接决定了神经网络的性能,因此又被称作“特征工程”。但对于图像识别而言,仅仅图像角度的变化就会导致原有特征发生改变,识别率无法得到提升。到了二十一世纪,“深度学习”的提出让连接主义再次成为热潮。狭义地说,深度学习就是使用很多层的神经网络进行机器学习。使用深度学习进行图像分类处理,无需人工设计特征,网络通过多层学习可以自动提取特征。随着计算机技术的发展,可以使用的数据样本越来越大,避免了“过拟合”的局限;计算能力越来越强,能够使用更复杂的神经网络和更多数据,这两个原因让深度学习走向了工程实践,在各个领域获得了广泛应用[31]

4.1 BP神经网络

误差反向传播(Back propagation, BP)神经网络结构较为简单,一般是具有三层或三层以上的多层神经网络。其按功能可分为输入层、隐含层和输出层。其各层神经元之间实现全连接,但上下各神经元之间无连接,其结构如图 2所示[32]。在进行有导师训练时,神经元的激活值从输入层经过各隐含层传递至输出层,输出信号的误差经各隐含层回传到输入层修正各节点权值,因此称为“误差反向传播”。经过多次迭代更新后,神经网络的输出最大值点即为分类的结果。

图 2 BP神经网络结构示意图[32] Fig. 2 Schematic diagram of BP-ANN[32]

由于BP神经网络在处理图像分类问题时效果不好,故在OAM模式探测相关文章中多作为比较组,在此不单独进行BP-OAM探测器的综述。

4.2 自组织竞争神经网络(SOM)

BP神经网络这一类有导师的神经网络需要提前已知大量数据并进行标记,然而在对外界未知环境进行学习时,则需要无导师的学习模型。自组织竞争神经网络(self-organizing feature map,SOM)便是无导师学习的一种典型模型,其本质为划分聚类。该神经网络模仿生物学中的“侧抑制”现象(即一个神经细胞兴奋后会对周围神经细胞产生抑制作用),竞争层中各神经元竞争对输入模式的相应机会,最终产生一个获胜者;与获胜者相连的各个连接权值会朝向有利于竞争的方向调整。再经多次迭代后,获胜的结点对将来出现的相似向量更加容易赢得该结点的胜利,从而归为一类。其网络结构如图 3所示[32]

图 3 SOM神经网络结构示意图[32] Fig. 3 Schematic diagram of SOM[32]

2014年起,维也纳大学Krenn等人提出使用SOM对单OAM态和叠加OAM态进行分类[22]。该团队在维也纳市区进行了大气信道的OAM光束传输实验。其实验架构与场景图如图 4(a)所示。由于长距离传输光束尺寸发生展宽,实验采用面板对接收光束进行漫反射并用CCD记录。在经过3 km的大气信道传输后,OAM光斑受到了城市环境中大气湍流及大气颗粒物的干扰并发生畸变,但OAM强度图样仍然可以辨别。接收端使用自组织神经网络识别16个OAM叠加态,错误率约为1.7%。实验还利用OAM编码传输了两幅图片,如图 4(b)4(c)所示,可以看出,相较于小OAM态而言,较大的OAM态出现了较大的串扰。该实验首次证明了机器学习作为非相干解码器在FSO-OAM系统中的可行性。

图 4 (a) 维也纳市区OAM光束传输外场实验图[22];(b) OAM模式串扰矩阵;(c)传输及接收的两幅图片 Fig. 4 (a) The OAM transmitted experiments in Vienna[22]; (b) OAM crosstalk matrix; (c) Transmitted and received pictures

2016年,Krenn团队在Canary岛屿间的海面上进行了海洋性大气信道OAM光束传输研究[23]图 5(a)为实验的示意图与外场照片。海洋性大气信道存在大气湍流、海雾、云层等因素,信道质量较差。图 5(b)显示光束受到了较为严重的湍流干扰。实验使用60 mW、波长为532 nm的绿光激光器作为光源。OAM叠加光束在经过143 km的传输后光束尺寸扩展较为严重,实验中将光束打在一个灯塔墙面上再拍照。图 6展示了CCD采集的灯塔漫反射出来的光斑。可以看出,即使经过了长距离传输,光束“花瓣”仍清晰可见。该实验为目前通信距离最长的OAM外场实验,在较强的海洋性大气干扰下,识别错误率为8.33%。

图 5 Canary岛屿间海洋性大气信道OAM光束传输实验示意图与外场照片[23] Fig. 5 Diagram and pictures of OAM transmitted experiments in marine atmospheric channels between Canary Islands[23]

图 6 灯塔上的接收光斑[23] Fig. 6 Captured intensity pictures at the lighthouse[23]

总体而言,使用ANN对OAM强度图样进行识别可以得到一定的准确率,但由于ANN网络架构不擅长处理多维图像问题,无法取得较高的识别率与较低的误码率。

5 基于SVM的OAM模式识别技术

作为解决分类问题的又一代表,SVM早在1995年便在文本分类任务中显示了卓越的性能。SVM分类的核心思想为寻找具有样本“最大间隔”的超平面。其理论基础为:如果原始空间是有限维的,那么一定存在一个高维特征空间使样本可分,其求解通常基于凸优化技术。分类过程可由图 7形象表示[32]

图 7 SVM分类的输入空间和特征空间原理图[32] Fig. 7 Schematic of input and feature space of SVM[32]

将SVM思想应用于OAM模式分类问题是一个崭新的思路。在拥有出色分类能力的同时,该方案也存在一定的弊端,例如需要人工设计特征。2019年,西安电子科技大学的Sun等人将OAM光束受到大气湍流干扰的程度与其模式数的关系作为OAM光束的人工特征,提出了基于SVM的单态OAM模式识别方案,其系统结构如图 8所示[33]。该方案使用OAM光束作为信号光,同时使用一束高斯光束作为探针光。由于SVM在处理小样本数、非线性等方面性能优异,该方案使用SVM去识别光束的闪烁指数、光束展宽、光束漂移等参数,使用遗传算法来优化SVM参数设置,通过探针光来判断信道条件,并根据信号光各个参数的受干扰程度反推出OAM模式。如图 8所示,即使在较强湍流长距离传输信道中,该方案也可达到较高的识别准确率。

图 8 (a) 基于SVM的单态OAM模式识别系统原理图;(b)基于SVM的OAM模式识别系统在不同信道条件下识别率曲线[33] Fig. 8 a) Schematic of SVM-OAM detecting system; (b) Curves of detecting accuracies under different channels of SVM-OAM systems[33]
6 基于CNN的OAM模式识别技术

利用ANN对图像进行识别、分类的研究在十年前较为缓慢。传统的机器学习需要通过人类“经验”为神经网络设计“特征”。“特征”设计的好坏直接影响了整体的性能。而深度学习则是将原始数据作为输入,由机器逐层抽象生成最终的“特征”。近些年来,随着硬件层面图形处理单元(graphics processing unit, GPU)的迅速发展以及CNN的研究热潮,图像识别的准确率和训练速度有了极大的提升。1998年,Yann等人发明的LeNet型CNN在当时的计算条件下就能取得低于1%的手写数字识别错误率,成为了第一个产生商业价值的CNN[34]。2012年,Geoffrey等人凭借AlexNet型CNN以超过第二名12%的准确率夺得了ImageNet图像分类竞赛的冠军,奠定了CNN在图像领域的霸主地位[35]。2015年,CNN在ImageNet数据集上的识别错误率(4.94%)首次低于了人类判断错误率(5.1%)。此后,深度CNN成为了计算机视觉、自然语言处理等领域的主要研究技术,并获得了大量的商用价值。

由于具有共享卷积核、局部感受野等特点,CNN在处理网格结构数据(时间序列、图像等)时具有显著的优势,并且对一定程度的数据扭曲、平移等具有较强鲁棒性。该网络模型采用梯度下降法(stochastic gradient descent, SGD)最小化损失函数,对网络中的权重参数逐层反向调节,通过频繁的迭代训练提高网络的精度。在CNN中多采用批处理随机梯度下降法(mini-batch SGD),训练阶段选取若干个小样本作为一“批”(batch)训练,并进行多次重复;当遍历完全部训练样本后便成为一“轮”(epoch)。这样的方法可以兼顾训练集过大和处理器硬件资源有限的问题。

图 9(a)为CNN的工作流程,即前馈运算(feed- forward)过程。典型的CNN主要包含输入层、卷积层、池化层和全连接层。图像作为网络输入依次经过每一层操作。输入层与原始数据相连接,一般为输入图片的像素矩阵。若输入为黑白图片则为一维矩阵,若输入为彩色图片则为三维矩阵。通过卷积层时,图像与卷积核做卷积。图 9(b)为典型的二维卷积操作示意图。卷积是一种局部操作,通过一定大小的卷积核(convolution kernel)作用于局部图像区域可获得图像的局部信息。卷积核一般为3×3或5×5的矩阵,其通过一定的步长(stride)从输入数据的左上角移至右下角并计算相对应的矩阵;通过一系列简单的卷积核(滤波器)将输入信息抽象为具有高层寓意的概念表示。这样学习到的权重对于不同位置的所有输入都是相同的,成为“权值共享(weight sharing)”特性。图 9(c)为两种典型池化(pooling)方式的示意图,其典型方式为最大值池化(max-pooling)和平均值池化(average-pooling)。平均值(最大值)池化操作将池化核覆盖的区域内所有值的平均值(最大值)作为汇合结果。池化操作可以描述为通过一定的方式将高分辨率图片降为低分辨率,相当于进行“降采样”(down-sampling)操作。该操作不仅可以使计算维度大大减少,还会使神经网络对一定范围内的偏移有所容忍,同时可以抽取更广范围的特征。举例而言,对于最大值池化方法,可以理解为是在询问某一范围内是否存在这样一个特征而不关心特征具体出现的位置。在经过多个卷积层和池化层后,数据进入全连接层(fully connected layers)。全连接层可视为分类器,将前面学习到的特征表示映射到样本的标记空间上。该层采用柔性最大值传输函数(softmax)全连接,得到的激活值即卷积神经网络提取到的图片特征。

图 9 (a) CNN的工作流程(前馈运算)过程;(b)卷积操作示意图;(c)池化操作示意图 Fig. 9 (a) Process of forward-propagation of CNNs; (b) Example of convolution operation; (c) Example of pooling operation
6.1 对光强分布进行识别

2017年,北京邮电大学张民教授团队对比研究了K最邻近神经网络(K-nearest neighbor, KNN)、朴素贝叶斯分类器(Naive Bayers classifier, NBC)、BP-ANN和CNN作为OAM模式分类器的性能,仿真了1000 m的大气湍流信道传输并分别对4, 8和16个OAM叠加态进行识别[25]。文中使用识别率作为评价指标。图 10展示了仿真结果,可以看出在不同情况下,CNN性能要优于其他神经网络解码器。在中弱湍流(小于$C_n^2 = {10^{ - 15}}{{\rm{m}}^{ - {2 / 3}}}$)情况下,系统在1000 m范围内能达到接近100%的识别率。该工作为神经网络类型选择提供了参考。2018年,张民教授团队对原有LeNet-5架构的CNN进行改进,增加了网络复杂度、输入图片分辨率与输出种类,解码器在解OAM模式的同时可探测大气湍流强度区间[36]图 11为该解码器的结构示意图。可以看出输出层可同时输出两类结果,即OAM态种类和大气湍流强度区间范围。论文进行了1000 m大气湍流信道的仿真,对6种大气湍流强度的探测准确率可达95.2%,对8个OAM态的探测准确率可达99.8%。本工作的贡献在于,由于单一湍流强度下的涡旋光束作为训练集训练出的神经网络解码器对其他湍流强度的识别率不高,所以同时对信道强度进行探测可以对解码器的转换提供指导作用。

图 10 不同网络结构的OAM模式识别效果图[25] Fig. 10 OAM modes detecting accuracies of different neural network structures[25]

图 11 CNN-OAM解码和大气湍流识别系统结构示意图[36] Fig. 11 Schematic of decoding process and structure of CNN-OAM systems[36]

2017年,美国海军研究实验室Doster等人使用叠加贝塞尔高斯光束进行OAM编码,他们在CCD前加一面傅里叶透镜以得到贝塞尔高斯光束在焦点的强度分布[24]。该实验结构示意图如图 12所示。实验使用空间光调制器同时产生OAM的叉形光栅和模拟大气湍流的相位扰动。解码器选用的神经网络为层数较深的AlexNet形式并在GPU上进行训练,其中包含5个卷积层大约两千万个训练权重。由于采用了较深的神经网络,在很强的大气湍流下5 bit OAM编码得到了大于99%的识别率。实验同时证明了在大气湍流信道中使用CNN识别OAM模式的正确率要远高于传统的共轭解法。该工作证明了使用深度神经网络和高分辨率图片,在以计算复杂度和时间复杂度为代价的情况下,在强湍流信道下也可得到极高(大于99%)的识别率。

图 12 CNN-OAM模式识别系统方案图[24] Fig. 12 Schematic of CNN-OAM detecting system [24]

2018年,国防科技大学的赵青松等人研究了CNN对大气湍流信道中接收机未对准情况下的畸变OAM光束的识别率[37]。为提高性能,提出使用混合数据集作为数据扩充手段,并增加view-pooling层,系统结构示意图如图 13所示。该层可以使得CNN同时学习不同倾斜角度下的OAM光斑图样。结果表明,在倾斜角度小于35度的情况下,在传输距离为1000 m,大气湍流强度为$C_n^2 = {10^{ - 15}}{{\rm{m}}^{ - {2 / 3}}}$, $C_n^2 = {10^{ - 14}}{{\rm{m}}^{ - {2 / 3}}}$$C_n^2 = {10^{ - 13}}{{\rm{m}}^{ - {2 / 3}}}$的信道下CNN识别率可达到99%, 93%和88%;2018年,北京邮电大学田清华等人将Turbo信道编码引入了FSO-OAM编码中并应用CNN进行解码。结果表明,Turbo码可以有效降低大气湍流带来的误码影响[38];2019年,合肥工业大学王子坤等人研究了识别率和时间复杂度的权衡问题,简化了一种CNN结构,提高了在CPU站上的训练速度,对于16种叠加OAM态,在强湍流数公里的传输情况下,CNN也可达到大于90%的识别率[39]

图 13 View-pooling层CNN系统示意图[37] Fig. 13 Schematic diagram of CNN with view-pooling layer[37]

本课题组尹霄丽等研究了OAM光束参数对识别率的影响[40]。研究了LG光束${U_{ - l}}(r, {\rm{ }}\theta {\rm{, }}z)$$\mu {U_l}(r, {\rm{ }}\theta {\rm{, }}z)$叠加光束强度分布特点,正实数μ表示强度相对分布,结果表明当μ=1时叠加光束花瓣分布的锐利度最大,更有利于提高识别率,如图 14所示。

图 14 μ取不同值时±l叠加光束光斑图样的锐利度曲线[40] Fig. 14 Sharpness curves of intensity distribution for different μ[40]

2018年,本课题组崔小舟等人使用随机相位屏的方法仿真了叠加LG光束在海洋湍流信道中的传输并利用经典LeNet-5架构的CNN对8种叠加LG光束进行识别[41]。研究结果表明,在较弱湍流()情况下系统可在传输距离小于80 m时保持大于95%的识别率,在中强湍流()的情况下在60 m内保持高于90%的识别率。然而,实际水下信道中不仅存在湍流的影响,还存在水分子的吸收、水中粒子的散射等干扰因素。2019年,崔小舟等人通过1 m的水箱实验模拟实际水下信道,通过在自来水中加入氯化钠、氢氧化铝、氢氧化镁、碳酸钙等化学试剂模拟清澈、浑浊海水情况[42]。通过空间光调制器生成随机相位屏来模拟海洋湍流信道。实验的结构图与照片如图 15所示。实验使用海洋通信中常用的532 nm绿光光源,使用一台空间光调制器实现OAM编码;光束通过水箱后经透镜汇聚由CCD采集并送入解码器。从图 15(b)可以看出,浑浊水体对光束的吸收和侧向散射作用十分明显,光束即使传播很短的距离功率衰减也很显著。研究结果表明,CNN解码器在短距离清澈的(衰减系数约为0.24 dB/m)和浑浊的(衰减系数约为9.42 dB/m)模拟海水内均能保持较高的识别率(大于或接近于99%);在弱湍流中解码器能保持较高的识别率(大于或接近于99%),但在强湍流($C_n^2 = 2 \times {10^{ - 14}}\;{{\rm{K}}^2} \cdot {{\rm{m}}^{ - {2 / 3}}}$)中识别率迅速降低。增大OAM模式间隔或降低编码位数均能有效提高识别率。本工作初步证明了在短距离海水信道利用CNN-OAM编解码系统的可行性。

图 15 (a) 水下信道传输CNN-OAM系统示意图;(b)水下信道传输CNN-OAM系统实验装置图[42] Fig. 15 Schematic of underwater CNN-OAM systems; (b) Photo of underwater CNN-OAM experiment[42]
6.2 基于光束变换的识别技术

上述研究工作均是对CCD采集的OAM强度图样直接进行训练和识别,其大多是基于OAM叠加态强度图样会呈现不同的“花瓣”图样特征的。当OAM态较大时,“花瓣”特征细节较多,低像素、层数较少的神经网络难以收敛。因此,一些研究工作提出在进行训练前对光束进行某些变换以突出其OAM模式特点。

2018年,美国海军研究实验室Park等人利用Radon累积分布变换(Radon-cumulative distribution transform, R-CDT)对OAM强度图样进行预处理以提高其特征区分度[43]。R-CDT在特定条件下,可以将非线性不易区分的分类转换成线性可分的,其示意图如图 16(a)所示。图 16(b)为CCD采集到的贝塞尔高斯叠加光束的强度图,图 16(c)为经过R-CDT变换后的对应输出图片。可以看到,R-CDT变换将集中在圆环上的“花瓣”变化转换成分布更广的“鱼鳞”状特征,但其变化细节较多,需要更高的分辨率才能提供足够的信息(使用的R-CDT分辨率高达217×90)。对比研究表明,经过R-CDT变换后在获得相同的识别率情况下耗费的计算代价约为原来的1/90。

图 16 (a) 将非线性不易区分分类转换成线性可分分类示意图;(b) CCD采集到的贝塞尔高斯叠加光束在焦点处的强度图;(c)经过R-CDT变换后的输出图片[43] Fig. 16 (a) Schematic of transforming linearly un-separating to linearly separating; (b) Intensity distributions of BG beams at focus point; (c) Output pictures after R-CDT transformation[43]

2019年,浙江大学Jiang等人,将相干光干涉探测方法引入CNN-OAM探测系统,其系统结构如图 17(a)所示[44]。其特点为在接收端加入相干光源,使得CCD探测OAM叠加光束的干涉条纹,结果如图 17(b)17(c)所示。可以看出,相较于OAM强度图样,干涉条纹特征更为明显。研究结果表明,在传输距离为1500 m的仿真强湍流大气信道中,对16个OAM编码的识别率可以大于99%。本方案可以较大地提高识别率,但对光束与接收光束对准要求较高。

图 17 (a) 基于相干光干涉探测的CNN-OAM模式识别系统结构图;(b) OAM叠加光束的干涉条纹;(c)受到大气湍流干扰的OAM叠加光束的干涉条纹[44] Fig. 17 (a) Structure of CNN-OAM detecting system based on coherent optical interference; (b) Interference fringes of OAM superposition beams; (c) Interference fringes of OAM superposition beams propagating in atmospheric turbulence channels[44]

根据上述研究可知,光束在经过一些特定变换后,拥有不同OAM模式的特征差异会更加明显,因此更有利于神经网络进行识别。

7 全光神经网络

由于使用神经网络进行识别需要CCD采集图片并送入计算机进行运算,硬件的刷新速率和神经网络的计算时间均会对高速通信产生较大影响。

2018年,加利福尼亚大学的Lin等人在Science上发表论文介绍了一种新型的全光神经网络,称为D2NN,其系统结构图如图 18所示[45]。该网络结构与传统CNN类似,输入为携带图像的光波或太赫兹波,经多层相位调制板衍射后,在对应的不同位置出现相应的光点,所出现的位置即为分类结果。其训练过程与CNN类似,采用BP算法;训练成功的模型可由3D打印制作。全光神经网络中信号以光速进行传播,可视为以光速进行并行计算,有望解决使用电域神经网络的计算复杂度和时间复杂度问题。

图 18 (a) D2NN结构示意图;(b)识别数字示例[45] Fig. 18 (a) Structure of D2NN; (b) Process of identifying a digits[45]

2019年,国防科技大学的赵青松等人将D2NN模型应用于OAM模式分类上并进行了仿真研究[46]。其工作原理如图 19所示。对于衍射面上的任意一点,都可视为一个二次光源。光束经过衍射面后可视为进行了一段菲涅尔衍射。光束在经过多个衍射屏后聚焦在输出平面的某一点上,对应的点即为识别的OAM模式。研究结果表明,使用3层衍射层即可使训练识别率在弱湍流(小于$C_n^2 = {10^{ - 15}}{{\rm{m}}^{ - {2 / 3}}}$)的情况下达到100%,并对于大多数OAM模式可达到较高(接近100%)的识别率。

图 19 D2NN-OAM模式识别系统示意图[46] Fig. 19 Schematic of D2NN-OAM detecting systems[46]
8 结论

本文对近年基于机器学习的OAM模式分类器的研究进行了综述。ANN网络最早提供了机器学习进行OAM模式分类识别的可能,CNN将识别率进行了有效提高。随着适应于图像分类的神经网络架构的不断改进以及计算硬件(如GPU)性能不断提升,神经网络OAM分类器的识别率稳步提升,并表现出了对抗复杂信道(如强大气湍流、海洋湍流等)的高鲁棒性。然而,类似方案还存在着许多的问题有待攻克。例如,CCD只能探测到光强信息而忽略了相位信息,因此用作OAM复用时该系统只可对各信道的OOK编码格式进行探测,而不能探测MPSK、MQAM等高阶相位调制格式。其次,空间光调制器调制速率低(大多数仅为几十Hz)以及CCD采集图像速率过低(仅为数十到几百张每秒)等硬件缺陷,导致通信速率还不够理想。全光D2NN具有传输快的特点,有望克服传统神经网络时延大的问题从而显著提高OAM模式解码系统的速率。

参考文献
[1]
Zhai X H, Zhang H T, Jiang W Y. The development of space laser link communications technique[J]. Optical Communication Technology, 2004, 28(1): 42-45.
翟旭华, 张洪涛, 姜威远. 国外空间激光链路通信技术进展[J]. 无线光通信, 2004, 28(1): 42-45 [Crossref]
[2]
Chan V. Space coherent optical communication systems--An introduction[J]. Journal of Lightwave Technology, 1987, 5(4): 633-637. [Crossref]
[3]
Chan V W S. Free-space optical communications[J]. Journal of Lightwave Technology, 2006, 24(12): 4750-4762. [Crossref]
[4]
Allen L, Beijersbergen M W, Spreeuw R J C, et al. Orbital angular momentum of light and the transformation of Laguerre-Gaussian Laser modes[J]. Physical Review A, 1992, 45(11): 8185-8189. [Crossref]
[5]
Gibson G, Courtial J, Padgett M J, et al. Free-space information transfer using light beams carrying orbital angular momentum[J]. Optics Express, 2004, 12(22): 5448-5456. [Crossref]
[6]
Mandel L, Wolf E, Shapiro J H. Optical coherence and quantum optics[J]. Physics Today, 1996, 49(5): 172. [Crossref]
[7]
Xi R, Zhu B. Experimental study on short-distance free-space transmission characteristics of OAM beam[J]. Opto-Electronic Engineering, 2019, 46(6): 180386.
席瑞, 朱冰. OAM光束短距离自由空间传输特性的实验研究[J]. 光电工程, 2019, 46(6): 180386 [Crossref]
[8]
Wang J, Yang J Y, Fazal I M, et al. 25.6-bit/s/Hz spectral efficiency using 16-QAM signals over pol-muxed multiple orbital-angular-momentum modes[C]//Proceedings of IEEE Photonic Society 24th Annual Meeting, 2011: 587–588.
[9]
Bozinovic N, Yue Y, Ren Y X, et al. Terabit-scale orbital angular momentum mode division multiplexing in fibers[J]. Science, 2013, 340(6140): 1545-1548. [Crossref]
[10]
Fazal I M, Ahmed N, Wang J, et al. 2 Tbit/s free-space data transmission on two orthogonal orbital-angular-momentum beams each carrying 25 WDM channels[J]. Optics Letters, 2012, 37(22): 4753-4755. [Crossref]
[11]
Huang H, Xie G D, Yan Y, et al. 100 Tbit/s free-space data link using orbital angular momentum mode division multiplexing combined with wavelength division multiplexing[C]//Proceedings of 2013 Optical Fiber Communication Conference and Exposition and the National Fiber Optic Engineers Conference, 2013: 1–3.
[12]
Wei S B, Wang D P, Lin J, et al. Demonstration of orbital angular momentum channel healing using a Fabry-Pérot cavity[J]. Opto-Electronic Advances, 2018, 1(5): 180006. [Crossref]
[13]
Awaji Y, Wada N, Toda Y. Demonstration of Spatial Mode Division Multiplexing using Laguerre-Gaussian Mode Beam in telecom-wavelength[C]//Proceedings of 2010 23rd Annual Meeting of the IEEE Photonics Society, 2010: 551–552.
[14]
Wang J, Yang J Y, Fazal I M, et al. Terabit free-space data transmission employing orbital angular momentum multiplexing[J]. Nature Photonics, 2012, 6(7): 488-496. [Crossref]
[15]
Huang H, Ren Y X, Yan Y, et al. Performance analysis of spectrally efficient free-space data link using spatially multiplexed orbital angular momentum beams[J]. Proceedings of SPIE, 2013, 8647: 864706. [Crossref]
[16]
Huang H, Xie G D, Yan Y, et al. 100 Tbit/s free-space data link enabled by three-dimensional multiplexing of orbital angular momentum, polarization, and wavelength[J]. Optics Letters, 2014, 39(2): 197-200. [Crossref]
[17]
Wang J, Li S H, Luo M, et al. N-dimentional multiplexing link with 1.036-Pbit/s transmission capacity and 112.6-bit/s/Hz spectral efficiency using OFDM-8QAM signals over 368 WDM pol-muxed 26 OAM modes[C]//Proceedings of 2014 the European Conference on Optical Communication, 2014: 1–3.
[18]
Ren Y X, Wang Z, Liao P C, et al. Experimental characterization of a 400  Gbit/s orbital angular momentum multiplexed free-space optical link over 120 m[J]. Optics Letters, 2016, 41(3): 622-625. [Crossref]
[19]
Li L, Zhang R Z, Liao P C, et al. Limited-size aperture effects in an orbital-angular-momentum-multiplexed free-space optical data link between a ground station and a retro-reflecting UAV[J]. Optics Communications, 2019, 450: 241-245. [Crossref]
[20]
Jiang H L, Tong S F, Zhang L Z, et al. The Technologies and Systems of Space Laser Communication[M]. Beijing: National Defense Industry Press, 2010.
姜会林, 佟首峰, 张立中, 等. 空间激光通信技术与系统[M]. 北京: 国防工业出版社, 2010.
[21]
Wang D F, Chu Z F, Ren Z L, et al. Influence of atmospheric turbulence on BER of laser communication system[J]. Laser & Infrared, 2011, 41(4): 390-393.
王德飞, 楚振峰, 任正雷, 等. 大气湍流对激光通信系统误码率影响的研究[J]. 激光与红外, 2011, 41(4): 390-393 [Crossref]
[22]
Krenn M, Fickler R, Fink M, et al. Communication with spatially modulated light through turbulent air across Vienna[J]. New Journal of Physics, 2014, 16(11): 113028. [Crossref]
[23]
Krenn M, Handsteiner J, Fink M, et al. Twisted light transmission over 143 km[J]. Proceedings of the National Academy of Sciences of Sciences of the United States of America, 2016. [Crossref]
[24]
Doster T, Watnik A T. Machine learning approach to OAM beam demultiplexing via convolutional neural networks[J]. Applied Optics, 2017, 56(12): 3386-3396. [Crossref]
[25]
Li J, Zhang M, Wang D S. Adaptive demodulator using machine learning for orbital angular momentum shift keying[J]. IEEE Photonics Technology Letters, 2017, 29(17): 1455-1458. [Crossref]
[26]
Yao A M, Padgett M J. Orbital angular momentum: Origins, behavior and applications[J]. Advances in Optics and Photonics, 2011, 3(2): 161-204. [Crossref]
[27]
Rao R Z, Wang H Y. The Propagation of Optical Vortex in Turbulent Atmosphere[M]. Shanghai: Shanghai Jiaotong University Press, 2013.
饶瑞中, 王海燕. 光学涡旋在湍流大气中的传播[M]. 上海: 上海交通大学出版社, 2013.
[28]
Andrews L C, Phillips R L. Laser Beam Propagation through Random Media[M]. 2nd ed. Bellingham: SPIE Press,, 2005.
[29]
Lane R G, Glindemann A, Dainty J C. Simulation of a Kolmogorov phase screen[J]. Waves in Random Media, 1992, 2(3): 209-224. [Crossref]
[30]
Zhou Z H. Machine Learning[M]. Beijing: Tsinghua University Press, 2016.
周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.
[31]
Sun Z J, Xue L, Xu M Y, et al. Overview of deep learning[J]. Application Research of Computers, 2012, 29(8): 2806-2810.
孙志军, 薛磊, 许阳明, 等. 深度学习研究综述[J]. 计算机应用研究, 2012, 29(8): 2806-2810 [Crossref]
[32]
杨杰, 占君, 张继传. MATLAB神经网络30例[M]. 北京: 电子工业出版社, 2014.
[33]
Sun R D, Guo L X, Cheng M J, et al. Identifying orbital angular momentum modes in turbulence with high accuracy via machine learning[J]. Journal of Optics, 2019, 21(7): 075703. [Crossref]
[34]
Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324. [Crossref]
[35]
Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]//Proceedings of the 25th International Conference on Neural Information Processing Systems, 2012: 1097–1105.
[36]
Jin L, Min Z, Wang D S, et al. Joint atmospheric turbulence detection and adaptive demodulation technique using the CNN for the OAM-FSO communication[J]. Optics Express, 2018, 26(8): 10494-10508. [Crossref]
[37]
Zhao Q S, Hao S Q, Wang Y, et al. Mode detection of misaligned orbital angular momentum beams based on convolutional neural network[J]. Applied Optics, 2018, 57(35): 10152-10158. [Crossref]
[38]
Tian Q H, Li Z, Hu K, et al. Turbo-coded 16-ary OAM shift keying FSO communication system combining the CNN-based adaptive demodulator[J]. Optics Express, 2018, 26(21): 27849-27864. [Crossref]
[39]
Wang Z K, Dedo M I, Guo K, et al. Efficient Recognition of the Propagated Orbital Angular Momentum Modes in Turbulences With the Convolutional Neural Network[J]. IEEE Photonics Journal, 2019, 11(3): 7903614.
[40]
Yin X L, Guo Y L, Cui X Z, et al. Method of mode recognition for multi-OAM multiplexing based on convolutional neural network[J]. Journal of Beijing University of Posts and Telecommunications, 2019, 42(1): 47-52.
尹霄丽, 郭翊麟, 崔小舟, 等. 基于卷积神经网络的多OAM态识别方法[J]. 北京邮电大学学报, 2019, 42(1): 47-52 [Crossref]
[41]
Cui X Z, Yin X L, Chang H, et al. Analysis of an adaptive orbital angular momentum shift keying decoder based on machine learning under oceanic turbulence channels[J]. Optics Communications, 2018, 429: 138-143. [Crossref]
[42]
Cui X Z, Yin X L, Chang H, et al. Experimental study of machine-learning-based orbital angular momentum shift keying decoders in optical underwater channels[J]. Optics Communications, 2019, 452: 116-123. [Crossref]
[43]
Park S R, Cattell L, Nichols J M, et al. De-multiplexing vortex modes in optical communications using transport-based pattern recognition[J]. Optics Express, 2018, 26(4): 4004-4022. [Crossref]
[44]
Jiang S Q, Chi H, Yu X B, et al. Coherently demodulated orbital angular momentum shift keying system using a CNN-based image identifier as demodulator[J]. Optics Communications, 2019, 435: 367-373. [Crossref]
[45]
Lin X, Rivenson Y, Yardimci N T, et al. All-optical machine learning using diffractive deep neural networks[J]. Science, 2018, 361(6406): 1004-1008. [Crossref]
[46]
Zhao Q S, Hao S Q, Wang Y, et al. Orbital angular momentum detection based on diffractive deep neural network[J]. Optics Communications, 2019, 443: 245-249. [Crossref]