大数据分析与安全
一、人-机-物的系统级设计方法
针对人-机-物智能系统进行有效融合并进行系统级自动化设计,尚欠缺相关技术。为实现在多用户情境下进行安全低能耗的人-机-物智能系的系统级设计目标,基于Petri网提出人-机-物系统级设计框架;提出了智慧空间设计中间表示模型;基于多目标优化理论提出人-机-物全局优化机制,为智慧空间的设计提供了新的思路,实现了信息空间与社会空间之间的对象交互。在TECS、TETC、MWC等高质量学术期刊上发表学术论文10篇,其中SCI/EI检索论文10篇。
二、基于张量的数据降维方法
针对数据在分析和处理过程中由于计算规模巨大和中间计算结果爆炸性增长所导致的重复计算和效率低下等问题,提出基于张量的大数据增量式降维方法;提出张量分块模型;基于分布式张量分解算法;基于半同态加密机制的安全降维方法,加快了大数据的处理速率。在TETC、TCC、TC等高质量学术期刊上发表学术论文10篇,其中SCI/EI检索论文10篇。
三、基于张量分解的高效计算
由于数据采集设备的多样化,产生的数据规模庞大。为实现用户在人-机-物系统中产生的大数据进行系统高效地分解、并合理地利用高质量数据集的目标,提出了分布式高阶奇异值分解方法;提出了分布式高阶增量计算方法以及基于高阶奇异值分解的多属性匹配计算模型,可以有效地对人-机-物系统中产生大数据进行系统地组织、高效地分解、并合理地利用提取的高质量数据。在TCSS、TBD、TSC等高质量学术期刊上发表学术论文10篇,其中SCI/EI检索论文10篇。
四、基于张量的大数据多聚类方法
针对现有多聚类研究大多针对小规模、单领域数据集,其聚类结果难以解释,无法根据上下文情境变化实现多模态的聚类,且算法大多面向具体应用,难以扩展到其他领域,缺乏通用性等问题,提出了一种基于多线性属性排名的权重学习方法;提出一种安全高阶密度峰值聚类方法;提出基于张量链分解的张量多聚类及其并行计算方法。有利于从多方面揭示隐藏在数据中的不同结构,是解决网络舆情分析、重大疾病分析和资源推荐等众多应用问题的关键技术。在TII、IEEE Network、Information Science等高质量学术期刊上发表学术论文8篇,其中SCI/EI检索论文8篇。
五、基于张量的大数据多模态分析
大数据中蕴含的特征和规律与多个空间、多种因素关联相关,呈现多模态特性。为实现从CPSS大数据中挖掘有价值的、潜在的、复杂的多模态,提出了大数据多模态预测框架;提出基于张量分解的多模态降维方法;提出了大数据多模态强化学习架构,为CPSS大数据多模态分析提供了理论基础。在TSC、TNSE、Information Science等高质量学术期刊上发表学术论文9篇,其中SCI/EI检索论文9篇。
六、人-机-物系统数据恢复与补全
针对人-机-物智能系统缺失数据的恢复与补全尚存在恢复精度不高等问题。通过结合概率图模型和贝叶斯理论,充分挖掘张量数据之间的潜在关联关系,为高精度的张量数据的恢复与补全提供理论支持。基于张量的人-机-物系统数据统一建模,基于概率图模型的张量分解与特征提取,基于贝叶斯理论的张量数据恢复与补全。为多源异构的人机物系统数据统一建模提供理论基础;通过结合概率图模型,为多源异构的人机物系统数据特征提取和缺失数据补全提供有效的理论与方法。