1.40 基于WiFi的室内定位深度学习方法综述(1)
文献来源:Feng X, Nguyen K A, Luo Z. A survey of deep learning approaches for WiFi-based indoor positioning[J]. Journal of Information and Telecommunication, 2022, 6(2): 163-216.
以下为文章的中文翻译版
摘要
最流行的室内定位方法之一是WiFi指纹识别,从一开始,它就被当作一个传统的机器学习问题来解决,平均精度达到几米。近年来,深度学习作为一种替代方法出现,大量出版物报告了亚米级的定位精度。因此,这项调查及时、全面地回顾了用于WiFi指纹识别的最有趣的深度学习方法。在此过程中,我们的目标是在各种定位评估指标下为不同的读者识别最有效的神经网络。我们将证明,尽管出现了新的WiFi信号测量(即CSI和RTT),RSS在深度学习下仍能产生有竞争力的表现。我们还将展示,在某些环境中,简单的神经网络比更复杂的神经网络表现得更好。
1. Introduction
在室内定位应用的技术中,WiFi是最常用的技术之一。由于智能手机无处不在,过去十年见证了WiFi设备的激增,包括电脑、智能手机和众多接入点(ap)。现在,办公室、医院、商场和工厂都密集地安装了WiFi接入点,为用户提供互联网服务。因此,利用这种技术进行室内定位是很方便的。然而,提出一个亚米级精度的wifi导航系统仍然是一个研究挑战。
这类系统的问题是高维数据。为了准确定位室内环境中的目标人物或物体,该系统需要分析来自附近数百个WiFi ap的信号。传统的机器学习方法在处理这种高维数据集时速度很慢。然而,最近的系统通过应用深度学习来利用这些大数据,这是一种相对较新的机器学习方法,可以提供输入数据的新表示。深度学习的本质使其适合处理大量高维数据。除了从离散输入数据中提取层次信息的能力外,深度学习还可以直接生成准确的位置估计。与传统的机器学习方法类似,深度学习可以作为回归器或分类器进行修改,以执行区分定位任务。因此,在目前基于wifi的室内定位系统中,深度学习可以作为一种特征提取方法,也可以作为一种定位预测方法。
作者在谷歌学术上汇集了1000多篇研究论文,满足以下三个条件:(1)必须包含“indoor”和“WiFi”关键字。(2)至少包含以下关键字之一:‘navigation’, ‘positioning’, ‘localization’, ‘tracking’。(3)至少包含以下关键词之一:‘deep learning’, ‘neural network’, ‘CNN’, ‘ANN’, ‘RNN’.
然后,每一篇论文被仔细审查,以确定其相关性和适合这篇文章。最后选取了150多篇研究论文进行进一步详细的比较分析。在此过程中,我们的目标是回答以下研究问题。室内定位系统最准确的WiFi信号测量是什么?接收信号强度、信道状态信息和往返时间是文献中报道的WiFi信号最常用的测量方法。基于wifi的室内定位系统最有效的神经网络是什么?普遍的看法是,具有复杂结构的神经网络将提供更好的结果(例如,CNN具有数十或数百个隐藏层),广泛报道用于图像分类。同样的假设是否适用于WiFi室内定位?
1.1. 综述范围
室内定位只关注在受限环境下(如办公楼、医院、火车站、商场等)预测用户的位置。这样的环境往往包含多个房间、走廊和楼层,并挤满了家具、墙壁和人。因此,电磁信号在室内环境中传播时,通常会被阻挡、衰减和反射。本综述所涵盖的所有系统都在上述有限条件下的室内环境中进行实验。
虽然WiFi室内定位和深度学习已经独立存在,但直到最近几年才有研究人员开始将深度学习和神经网络应用到WiFi室内定位中。从一开始,传统的机器学习方法(即浅学习)在这一领域就占据了垄断地位。然而,浅学习无法有效利用海量的高维数据,难以达到亚米级的精度。深度学习的进步使研究人员能够找到WiFi数据的有效表示。这一趋势促使本文的写作。
在深度学习、神经网络和室内定位的交叉领域已经有了一些研究。然而,它们中的大多数要么专注于所有相关的机器学习方法,要么涵盖了广泛的室内技术。相比之下,本综述只强调基于wifi的系统,使用深度学习和神经网络,为读者提供对这种新兴方法的简明理解。
1.2. 文章的贡献
这篇综述的贡献如下。
(1)我们将基于深度学习的系统分为两类:使用深度学习作为特征提取方法的系统和使用深度学习作为定位预测方法的系统。所有的比较都是在每个类别中单独进行的。
(2)我们特别分析了不同WiFi信号作为深度学习系统输入的效果。
(3)我们充分考虑了不同类型神经网络的各种系统的结果,以找出WiFi室内定位系统最准确的解决方案。
(4)我们推导了一套标准的评估指标来评估和比较150多个基于深度学习的室内定位系统的性能。
本文的其余部分组织如下。第2节介绍WiFi指纹识别的基本思想。第3节介绍了室内定位系统中使用的WiFi技术的主要类型和数据测量。第4节侧重于深度学习和神经网络的一般概念,并进一步讨论了所涵盖论文中使用的主要神经网络类型。第5节概述了本综述中采用的常用评估指标。定位系统类别的分类将在第6节和第7节中提出,其中每个类别将在这两个节中进行彻底和单独的研究。最后,第8节总结全文并展望未来。
2. WiFi fingerprinting
WiFi指纹识别是基于WiFi的室内定位中最流行的方法,它首先建立一个数据库,其中包含在目标室内环境中每个参考点收集的WiFi信号。WiFi指纹识别的目的是将用户接收到的实时WiFi信号与数据库中的WiFi信号进行匹配,从而根据两者的相关性对用户当前的位置进行定位估计。由于复杂的室内环境会严重影响WiFi信号的传播,因此目标区域内的每个位置都会有自己独特的WiFi信号模式,即WiFi指纹。环境越复杂,WiFi指纹就越明显。因此,定位系统可以利用WiFi指纹的这些特征来准确地对用户进行位置估计。
WiFi指纹识别方法通常分为离线阶段和在线阶段。WiFi室内指纹识别系统的基本结构示例如图1所示。离线阶段是准备阶段,在此阶段收集数据并进行预处理,然后将数据存储到数据集中。在室内定位系统中,数据集中的样本是在特定的环境中收集的,并标记为它们的目标,要么是它们所属的建筑物/楼层/网格,要么是它们的确切地面真值坐标。为了更好地提取数据中有用和有意义的信息,许多研究人员采用了归一化、填充缺失数据、选择接入点、增强和校准等预处理方法。一些从业者甚至应用机器学习方法来提取数据中最强大的特征,同时降低数据的维数和预测的计算复杂性。在离线阶段,利用采集到的数据对定位预测算法进行预训练,学习输入数据与输出预测之间的关系。在在线阶段,用户或接收器将在未知位置检测到的WiFi信号报告给定位系统,系统使用相同的预处理方法对新数据进行过滤。然后,将与脱机阶段相同格式的数据馈送到定位算法中。最后,利用定位算法对用户当前位置进行预测。
图1。以机器学习为定位算法的经典WiFi室内指纹识别系统的基本架构。该系统分为离线阶段和在线阶段。在离线阶段,采集WiFi指纹信号,即这里的WiFi RSS数据,进行预处理、标记并存储在数据库中。在在线阶段,通过机器学习定位算法将用户接收到的RSS信号与数据库中的信号进行比较,得到最终的位置估计。基于深度学习的WiFi室内指纹识别系统的基本架构如图9和图19所示。
3. WiFi signal measures
本节介绍本文所涉及的WiFi室内定位系统的主要技术类型和信号措施。
3.1. Received signal strength (RSS)
WiFi接收信号强度(RSS)技术是WiFi室内定位中最常用的一种技术。该技术利用用户接收到的信号强度来估计用户的位置。WiFi RSS数据库通常包含在每个位置收集的不同接入点的RSS值和数据标签。WiFi RSS数据示例如表1所示,其中WAP001至WAP520列中的值表示从特定WiFi接入点接收到的RSS信号(例如,标题WAP001下面的值表示来自第一接入点的RSS信号)。每行表示收集RSS信号的参考点。RSS的单位是dBm。值为100表示参考点无法接收到来自特定接入点的RSS。FLOOR和BUILDINGID列表示RSS数据的标签,LONGITUDE和LATITUDE列表示参考点的二维坐标。三边测量、近似感知和指纹识别是利用WiFi RSS进行室内定位的可能方法。三边定位,更像GPS,利用三个或更多的接入点和接收器和发射器之间的距离来计算用户的可能位置。近似感知要简单得多,它根据提供最强WiFi RSS的接入点来估计最终位置。这两种方法(三边定位和近似感知?)不需要机器学习方法,因此不在本综述的范围内。
指纹识别技术可以说是这三种方法中最受欢迎的,被广泛应用于室内定位系统,特别是那些使用深度学习方法的室内定位系统。由于WiFi信号在复杂的室内环境中容易衰减和反射,不同的位置可能从多个接入点接收到很大不同的RSS。RSS信号在特定位置的这种特定分布被视为该位置的指纹。就像通过指纹识别一个人一样,该技术利用特定位置RSS的唯一性作为估计证据来预测用户的位置。因此,指纹识别方法的关键任务是将在某个位置检测到的RSS与数据库中收集的RSS相匹配。
3.2. Channel state information (CSI)
信道状态信息(CSI)是通过正交频分复用(OFDM)技术从WiFi信号中获取的另一种丰富信息。CSI是在接入点和接收器之间的通信链路中WiFi信道属性的表示和描述。该表示揭示了WiFi信号在传播过程中的多径、散射、衰落和功率随距离衰减的综合影响(Basri & El Khadimi, 2016;He & Chan, 2015)。由于其性质,CSI在时间尺度上比RSS更稳定,但在空间上具有很强的特异性。此外,WiFi发射机的单个天线有许多子载波,不同天线中子载波的特性也不同。因此,研究人员的目标是在室内定位系统中使用CSI来达到亚米级的精度。CSI信号又可进一步分为幅度信号和相位信号两种。两者都可以作为室内定位系统的输入。然而,CSI数据比WiFi RSS更难获得。与可以从接收器轻松获得的RSS不同,CSI数据需要从笔记本电脑上的WiFi接收器的驱动程序中获得。因此,在智能手机上实现基于csi的室内定位系统更具挑战性。
3.3. Round-trip time (RTT)
WiFi往返时间(RTT)信息是IEEE 802.11-2016提出的精细时间测量(FTM)测距协议的创建。这是一种新的协议,可以用来直接计算单个WiFi信号从发射器到接收器的持续时间。然而,据我们所知,该领域只有一篇研究论文同时使用了RTT和深度学习在室内定位系统中。
4.Deep learning neural networks
由于本调查涵盖的所有论文都是基于深度学习和神经网络,因此首先了解它们是至关重要的。本节介绍深度学习的概念以及在本调查范围内使用的几种主要类型的神经网络。
4.1 Deep learning
深度学习被认为是机器学习的进化。它基于神经网络,但更侧重于更深层次的表征学习。深度学习神经网络通过多层从数据中学习越来越有意义的表示来进行预测(Chollet, 2018)。层是一个处理阶段或单元,它使用特定的功能从本层的输入中提取信息,然后将更高级的信息输出到下一层。因为层是深度学习的基本计算单元,层的数量可以用来描述深度学习的“深度”。
本文将比较150多个使用神经网络的WiFi室内定位系统的性能,包括深度神经网络和简单神经网络。研究使用不同的神经网络及其复杂度对WiFi室内定位的影响。因此,不同类型的神经网络将在以下小节中简要介绍,而隐藏层的数量(即神经网络的相同“深度”概念)将在第6节和第7节中用于比较不同深度学习方法的复杂性。
图2 基于WiFi RSS的深度神经网络结构,用于预测用户所在的建筑。在这个结构中,输入层包含原始输入。第1层到第3层是隐藏层。在隐藏层和最终输出之间的第4层是输出层。
4.2. Artificial neural network (ANN)
人工神经网络(ANN)是一种通用的、基本的神经网络,如图3所示。人工神经网络是基于被称为神经元的连接单元或节点的集合。单个神经网络神经元的模型如图3所示,其中存储了从前一层学习到的输入数据或信息,并将其传递到下一层。
神经元的输出y定义为
N代表的最大数量在前一层神经元,ˆy是该神经元的输出,x (i)代表的信息存储在第i个先前层的神经元,w0偏差单元,设置为1时,和f是激活函数,生成基于输入输出信息以及所有连接神经元的权重在前面的层。在输出层,这些函数负责执行不同的预测任务,如回归或分类。
人工神经网络最初用于描述只有一个输入层、一个隐藏层和一个输出层的简单结构网络。然后对ANN做了一些改变,并命名不同。它们是多层感知器(MLP)、深度神经网络(DNN)、反向传播神经网络(BPNN)、前馈神经网络(FFNN)、极限学习机(ELM)、并行多层神经网络(PMNN)等。为了在接下来的章节中进行比较时更加明确和具体,所有这些与人工神经网络相似的神经网络都将被包含在人工神经网络组中。WiFi室内定位系统一般直接对预处理后的输入数据采用人工神经网络。由于其简单性,ANN的目的只是寻找数值WiFi数据到具体位置的映射关系。
4.3. Auto-encoder (AE)
自动编码器是一种无监督学习神经网络。AE的常见结构如图4所示。该网络主要有两个部分,编码器部分和解码器部分。编码器部分将输入数据引入神经网络,并使用无监督方法学习数据的紧凑表示。解码器部分解码这样的紧凑表示,使得输出尽可能类似于原始输入。
AE也有许多变体,如去噪自编码器(DAE)、堆叠自编码器(SAE)和堆叠去噪自编码器(SDAE)。所有这些变化都包含在以下部分的AE组中。与传统的无监督机器学习方法一样,利用AE的室内定位系统需要对输入的WiFi数据进行过滤和细化,并查看压缩后的输入数据与定位估计之间是否存在隐藏的联系。这样既可以减少高维WiFi数据的复杂性,又可以减少稀疏数据的不相关信息。
4.4. Convolutional neural network (CNN)
卷积神经网络(CNN)是一种以图像分类能力而闻名的神经网络。如图5所示,该网络的主要特征是输入主要是二维图像数据,CNN的各层使用卷积运算来总结输入图像中是否存在特征。这种使用卷积操作的层被称为“卷积层”,它从输入图像数据中提取更高级的信息。卷积层利用一个小的过滤器,在所有可能的位置滑动输入,同时在每个位置获得一个特定的值。然后,这些来自所有可能位置的值被转换成一个新的数据“图像”,然后输入到下一层。
此外,CNN还包含max pooling layer和flatten layer等特殊层,以便更好地从输入图像数据中提取特征(见图5)。注意,处理一维数据的CNN称为1D-CNN。输入的层次特征是在WiFi室内定位中使用CNN的主要目的。为了模仿人们在图像中发现某些语义模式的方式,室内定位系统正在尝试在CNN的帮助下从WiFi数据中寻找这种模式。将WiFi信号转换成二维图像、简单地形成WiFi数据的二维矢量、或者对WiFi数据进行一维CNN处理是CNN在WiFi室内定位中最常用的三种方式。
4.5. Recurrent neural network (RNN)
递归神经网络(RNN)利用“递归层”来处理序列数据。因此,在WiFi室内定位场景中,RNN更有可能被用于跟踪。RNN的基本结构如图6所示。RNN学习数据表示的方式就像我们读句子的方式一样。它迭代数据中的所有顺序元素,并学习它们之间隐藏的相关性。循环层中的RNN单元利用当前输入元素input t和上一个RNN单元状态t的状态,然后生成一个临时输出输出t和一个新状态状态t+1。状态t+1表示RNN目前所看到的信息。
然而,RNN的基本结构存在梯度消失和爆炸等问题,也就是说,RNN容易忘记序列数据开头的信息。长短期记忆(LSTM)是RNN的一种扩展,利用遗忘门、输入门和输出门的结构来解决这一问题。在接下来的章节中,RNN和LSTM都将包含在RNN组中。由于RNN在分析时间序列数据方面的优势,利用这种网络的系统主要是在一定时间内收集连续的时间步长WiFi数据。基于评估用户在一段时间内的运动,系统可以比其他网络在相同的情况下更好地估计位置。因此,运动跟踪或预测用户的行走轨迹是RNN在WiFi室内定位中的主要任务。
4.6. Other neural networks
有几个神经网络被包括在这个调查的范围内,但没有广泛使用。它们分别是深度信念网络(DBN)、生成对抗网络(GAN)和胶囊神经网络。DBN由多个堆叠的受限玻尔兹曼机(rbm)组成,并使用贪婪学习策略生成输入层和隐藏层之间的概率分布(Hinton, 2009;Kozma et al., 2018)。如图7所示,GAN是一种学习模拟数据的神经网络。它包括两个模型:生成模型和判别模型。这两个模型是同时训练的,生成模型的目的是生成与真实数据尽可能相似的数据,判别模型输出的是真实数据与生成数据之间的相似度。胶囊神经网络可以看作是CNN的一个简单版本,只是需要更少的计算成本。