0%

1.研究背景

当异常检测形式化为一个无监督的学习问题时,通常需要模型学习正常数据的分布。基于GAN的方法以及改进版本已经被提出。很多工作主要是修改生成器的结构。

Read more »

不规则采样时间序列的插值预测网络

摘要

本文提出了一种新的深度学习体系结构,来解决具有稀疏和不规则采样多元时间序列监督学习问题。该架构基于插值网络的使用,随后是预测网络的应用。

  • 插值网络允许在插值阶段跨多元时间序列的多个维度共享信息,而任何标准深度学习模型都可以用于预测网络。这项工作的动机是分析电子健康记录中的生理时间序列数据,这些数据是稀疏的、不规则采样的和多变量的。我们研究了这个架构在分类和回归任务上的性能,表明我们的方法优于一系列基线和最近提出的模型。
Read more »

Abstract

无监督的对比学习取得了成功,而对比损失的机制很少被研究。本文专注于探究无监督损失的行为。本文将证明对比损失是一个具有难样本感知能力的损失函数,温度τ控制难样本的惩罚强度。以往的研究表明,均匀性是对比学习的一个重要特征。我们建立了均匀性和温度τ之间的关系。本文将证明,均匀性有助于对比学习学习可分离的特征,但过分追求均匀性会使对比损失对语义相似的样本无法容忍,这可能会破坏潜在的语义结构,不利于形成对下游任务有用的特征。究其原因,是由于实例判别目标函数的内在缺陷。具体来说,实例判别目标函数试图将所有不同的实例分开,忽略样本之间的潜在关系。将语义一致的样本分开对于获取一般下游任务的先验信息没有积极的作用。一个设计良好的对比损失应该对语义相似性样本有一定程度的容忍度。因此,我们发现对比损失会遇到一个均匀性-容忍性的困境,而温度的良好选择可以协调这两个特性,既有利于学习可分离特征,又有利于对语义相似样本的容忍,从而提高特征质量和下游性能。

Read more »

本文提出了一种利用多源数据识别窃电行为的方法。除了用户用电记录外,我们还利用区域因素(非技术损失)和气候因素(温度)对用户行为进行了分析。通过进行分析实验,我们了解了几种有趣的现象:例如,电力可能会消耗更多的电力大致用户,特别是在极高或低温下。通过这些经验观察,我们进一步设计了识别电力盗贼的Anovel等级框架 。 基于现实世界数据集的实际结果表明,大家建议的模型可以在电力检测中实现最佳性能(例如,在F0.5方面至少+ 3.0%)相比。 最后,我们的工作已被中国国家电网应用,用来在杭州成功地捕捉电力盗窃行为,精度为15%

Read more »

image-20220720111309043

2022年新发表在IEEE Transaction Intelligent Transportation Systems上

作者团队来自北京邮电大学的信息与通讯工程系

随着通信技术的发展和智能设备的普及,蜂窝网络中的用户体验成为人们关注的首要因素。同时,网络运营商面临着两个难题:预测用户实时体验,寻找对用户体验有决定性影响的网络参数。针对这两个问题,我们提出了一种新的用户体验预测方案。蜂窝网络的因果结构学习用于分析从基站收集的众多性能指标(kpi)和关键质量指标(kqi)。通过因果结构学习,可以得到基于kpi与KQI之间关联的有向因果图。这种因果结构可以嵌入到图的注意网络中。其中,选择注意机制进一步强化参数之间的相关性。每个KPI之间以及KPI与KQI之间的相关性用于预测单元级用户体验的未来价值。结果表明,该方法在蜂窝网络数据分析和用户体验预测方面具有良好的性能。

技术路线:算法挖掘因果结构图 $\to$ 因果图作为输入参与图注意力网络 $\to$ 预测用户体验质量(QoE)

背景

视频领域的主要矛盾之一是==流媒体质量评价的高需求==和==体验质量预测结果[7]的低准确性==之间的矛盾。QoS的具体指标是KPI,通常是蜂窝网络中基站采集的数据。QoE指标和QoS指标不一样。QoE指标通常是平均意见评分(MOS),由主观和客观两个部分组成。主观部分往往因人而异,没有具体的判断标准。客观部分是KQI。目前对体验质量的研究多集中在主观指标上。虽然MOS和QoE[8]的映射可以很好地判断用户的感知,但在实际的网络优化中,获取每个用户的主观意见显然是不现实的。对于客观部分,KQI的预测常常面临预测精度不高的问题。

当前问题:KPI参数的预测比较成熟预测结果较准确,但是KPI并不能准确估计用户体验,因此KQI的估计逐渐成为研究热点。KQI估计的主要方法是找出KPI和KQI之间的关系,通过KPI的值估计KQI。虽然这种方法对当前的KQI估计准确性较高,但是对其未来值得预测却不好,因为这依赖于==KPI预测算法的稳定性==和==从KPI估计KQI算法的稳定性==。

解决方案:为了保证算法的稳定性,作者主张利用KPI和KQI之间的因果关系构建预测算法。

好处有1.在QoS(各种KPI指标)中找到影响video service的因果关系,用该因果结构取估计用户的体验(KQI)2.无线网络的各种数值型参数中也挖掘出一个因果结构,只使用直接影响用户体验的参数,实现了数据降维。这样得到的1-有向无环因果图和降维了的数据集将会被用到KQI的预测当中。

image-20220720111433829

方法

数据集介绍

image-20220720111503413

三个月内一个基站收集到的数据,数据是每一小时记录一次,其统计值是一个小时内的平均值,KPI参数和KQI参数如上表所示;(在实际网络部署中,一个基站通常有两个载波频率。每个频率的资源分别分配给三个cell。)在图2中,目标细胞被标记为绿色,蓝色部分表示相邻相同载频的细胞。棕色部分表示不同的载波频率。不同载频小区的覆盖范围与目标小区的覆盖范围一致。数据收集方面,在空间上,采用目标单元相邻单元的kpi进行分析;从频域角度,采集与目标单元相同位置的不同频段数据;就时间而言,所有kpi都是时间序列数据。我们的分析是基于这三个方面的kpi。

image-20220720111637004

因果结构学习

作者使用了TE(传递熵)来探测KPIs之间和KPI与KQI之间的因果关系。$S=[V_1,V_2,…,V_N]$是包含KPI参数的矩阵,$C=[c_1,c_2,…,c_T]$是包含KQI参数的一个向量,$T$表示时间序列的长度。给定来自$S$的两条时间序列$V_i$和$V_j$,从$V_i$到$V_j$的TE定义为

image-20220720111705873

image-20220720111730430

比值大于1说明有$V_i \to V_j$,小于1则说明不存在(这种度量方法有失偏颇,强行假设$V_i,V_j$一定存在因果联系);进一步地,根据因果强度构造关于所有参数地一个因果图,如算法1所示,在stage1,具有因果关系的每两个节点根据TE会给予一条有向边。stage2将会进图结构优化,具体地,删除因果链的中间节点,最后保留的因果结构类似于一个树图。在树图中,KQI是根节点,其它叶子节点表示不同的KPIs。

image-20220720111801763

image-20220720111814717

图注意力网络

图卷积网络(GCN)是常用的网络模型,它的缺点是根据训练集的图结构整合邻接节点的特征,使得不易在其它图结构上获取好的泛化性能。图注意力网络(GAT)则通过注意力机制聚合邻接节点,实现不同邻点权值的自适应分配,提高了图神经网络模型的表达能力。注意力机制被用于对相邻节点的加权特征进行求和。相邻节点特征的权值完全依赖于节点特征,与图结构无关。在因果结构学习时,我们只获得了因果结构,而KQI的邻接节点的影响则需要通过图神经网络来学习,作者采用GAT模型实现。

具体操作:GAT模型的输入是因果关系结构数据,具体表示为$h={h_1,h_2,…,h_N}$,$h_1$表示C即KQI参数,其余表示结构图中的KPI参数,$h_i\in R^T$,即拥有T个特征,$T$是时间序列长度。这里的注意力系数根据有向图的连边关系采用masked attention,并且只计算节点$i$和它的邻接节点$j$的相关性,引入leakyReLU激活

image-20220720111950219

整个嵌入过程如图5所示

image-20220720112008784

模型此外还采用了多头注意力,K个相互独立的注意力机制执行下,最后的输出结果表示如下(||表示拼接)

image-20220720112127963

整个的流程图

image-20220720112445936

评价

从参数降维的层面上,有用的KPI参数得到提炼,如下图的对比

image-20220720112550395

验证因果结构学习的作用,比较本网络模型与其它模型的预测能力

image-20220720112617531

CGAT是本文的模型,GAT和LSTM是baseline,本文模型的RMSE更小。

此外作者还比较了本方法和之前的先预测KPI再估计KQI的模式(KPI预测用GCN或LSTM,KQI估计用SVM,GNB)。本文预测的是连续值,但通常KQI会根据阈值进行离散化,因此连续的预测值将会按照阈值分成两类。下面展示本文方法和之前方法的AUC

image-20220720112639248

结果表明在两种阈值设置下(中位数,更低的分位数)本文的AUC都更大一些。

总结

这是一篇特定任务场景下的结合传统因果推断算法的时间序列预测任务的研究论文,将因果算法引入到图神经网络当中,可以降低模型和数据的复杂度,提高模型的解释性,特征与标签之间的因果关系也可能为模型的泛化性能提供鲁棒性。

​ 作者认为 negative sample 对于表征学习是有很大益处的,对于 negative sample 最主要的挑战就是不能采用现有使用真实相似度信息的负采样策略。因此,本文开发了无监督采样方法来选择 harder negative samples, 并且 user 可以控制 hardness。这种抽样结果的一个极限情况是将每个类紧密地聚在一起,并将不同的类尽可能地分开。该方法提高了跨多模式的下游性能。

Read more »

MTL可以训练一个神经网络同时解决多个任务,减少时间成本,但是性能一般,因为任务间可能有竞争关系。MTL中,哪些任务应该、不应该在一个网络中一起学习?

本文提出了一个框架,将若干个任务分配给几个网络,将协作的任务分配到同一个网络,将竞争的任务分配到不同的网络。与单个大型网络、多个单任务网络相比,该框架能提供时间-精度的折中,在有限的时间内达到尽量高的精度

Read more »

介绍

一般来说,利用干预是最好的揭示因果机制的方式,因为它能得到一个直观且鲁棒的因果概念。然而,只有当观测数据可获得的时候,我们才有显著的辨明因果依赖性的需求,这些数据必须具有实用性,并且收集成本较低(例如,在还没有介入临床试验之前,必须依靠观察性研究)。然而,与临床试验相比,来自较少控制的环境的真实数据给我们的分析带来了许多挑战。如果不可能进行干预,则无法确定某些因果结构。重要的是,真实数据的主要问题是缺失值。特别是,当收集纵向数据时,所得到的时间序列通常是零星的:采样在时间上是不规律的,并且跨维度导致了在任何给定时间上的一个给定变量的观察值和多个缺失的观察值之间的时间间隔的变化。这一问题普遍存在于各个领域,例如医疗保健,气候科学或者航空航天。

Read more »