当前信息处理技术逐渐向智能化方向发展,从信息的载体到信息处理的各个环节,广泛地应用人工智能来处理各种信息。拟建人工智能实验室将紧密围绕国家在人工智能产业化方面的需求,追踪国际科技的发展前沿,同时考虑服务于国民经济建设的需求,以提升新一代人工智能科技创新能力为主攻方向,构建开放协同的人工智能科技创新体系,把握人工智能技术属性和社会属性高度融合的特征,坚持人工智能研发攻关、产品应用和产业培育“三位一体”推进,全面支撑科技、经济、社会发展和国家安全。
实验室定位于探索智能感知与认知的机理、理论、方法、技术,开展基础性研究以及相关的应用基础性研究,提出新的概念与模型,解决核心技术问题,并构建相应的系统。实验室的目标是在智能信息处理基础理论及相关应用领域达到世界一流水平,培育前瞻思想,产出一流成果,培养基础人才,为智能技术形成智能产业提供基础原理、核心技术以及关键应用原型,为“人工智能”走向“人工智能+X”提供技术支撑,为国家信息技术的长期发展储备知识、创新技术和复合型人才。
实验室以信息的智能处理为主线,依托东南大学信号与信息处理国家重点学科在信息科学领域的科研优势与积累,从信息的智能化获取、表示、理解与转换等几个方面进行布局,构成了一个互为支撑的有机整体。实验室主要研究方向包括:图像理解与智能人机接口、智能无线通信、自然语言智能处理、多媒体、以及大数据挖掘与分析等。
1 神经网络基础理论
在神经网络基础理论研究方面,曾领头承担国家八五攀登计划(神经网络)重大项目和国家自然科学重点基金项目“混沌神经网络模型及其智能信息处理理论与技术”,对神经网络模型、基本理论及智能信息处理应用基础进行了系统深入的研究。项目以神经网络模型、动态特性及能力的分析为主线进行了理论体系的研究,充分利用脑科学、生物神经学、认知科学、信息科学等领域的新进展,开展神经网络模型如何逼近生物神经网络现实性模型的开拓性研究,从非线性动态特性全面考察它们的生物信息处理机理,以及它们的自学习、自组织能力和逼近、泛化能力等,利用创新的模型、结构和算法实现类脑的智能信息处理系统的理论和方法。主要成果包括:1)发现细胞神经网络的新动态轨迹,提出可调参数范围很大的混沌与超混沌数学模型和多种种混沌同步方法。2)提出多种新型联想记忆模型(静态和动态),给出了神经网络分类能力、联想记忆容量及容错性的若干定理和重要结论。证明了指数双向联想记忆网络可解决联想记忆中互余编码和连续性要求这两个重要理论问题。3)给出了仿射、径向、椭圆基函数神经网络激发函数的充要条件;证明了神经网络逼近多元连续函数、非线性泛函及非线性算子;较完整地解决了神经网络的非线性映射问题;等。发表该领域学术论文150余篇,专著2本,其中SCI收录论文30多篇,EI收录论文80多篇。研究成果获国家教育部科技进步一等奖和江苏省科技进步一等奖。
2 智能视觉
实验室长期从事基于抑郁症表情的视觉智能技术研究,与美国卡内基-梅隆大学机器人研究所合作数年,在表情动作单元识别领域提出了任务级联方法,取得了一系列算法成果。此外,提出了一套基于深度学习的方法,开发了上万人量级的人脸识别系统,并嵌入到了ARM中,近期已建立百万量级东亚人人脸数据库,为后续面向东亚人种的人脸识别系统提供标准人脸库。此外,在江苏省科技厅临床医学科技专项“卒中后抑郁障碍规范性诊治策略研究”支持下,与江苏省的多家医院,包括中大医院、江苏省人民医院、南京中医药大学、南京市第一医院、苏州大学附属广济医院等单位进行了一系列交流与合作,通过对卒中后抑郁的临床数据分析和抑郁表情分析,建立了关于卒中后抑郁临床数据的数据库及相应症状的风险预测模型。
3 智能通信
实验室利用人工智能与大数据构建了有效处理无线数据可扩展的无线网络架构,并有效地整合和利用数据来提高无线系统性能。主要内容包括:
深入研究了无线通信智能计算体系。通过人工智能将物理层与网络层联合起来,发挥云计算,边缘计算的优势为用户提供更好的用户体验。充分利用机器学习的智能性,构建智能通信系统使它能够在学习算法的帮助下自主自动地接入可利用频谱,智能地对功率进行控制以节约能源,并能及时有效地调整传输协议;利用机器学习解决新一代无线通信系统中各种问题的建模与求解,利用机器学习解决信道特征建模问题,信道场景识别问题,室内定位问题,天线选择,基站选择以及新一代5G通信中资源分配与管理等问题,在大规模MIMO,端到端(D2D),异构网络等系统中使用机器学习能提高系统的智能化程度。使用监督学习完成大规模信道估计与检测,也可以用于对用户位置和行为分析和分类;构建了无线大数据平台,采用大数据智能无线网络提高通信网络性能增益。通过提取无线大数据的特征完成系统的优化。借助人工智能中的主成分降维,深度学习等技术完成数据特征的识别与提取,然后将特征用于完成更好的服务和形成更多有用的移动应用;研究了智能无线通信网络。利用集群计算,分布式计算,移动边缘计算和软件自定义网络完成新一代无线通信网络的构建。将复杂耗时的计算问题迁移到云端进行处理,运算结果通过高速链路返回给用户,将无线云部署到网络中,并使用软件自定义网络代替传统的硬件配置路由和具有软件编程单元的转发设备,从而大大降低核心网络的负担,并缓解全局下载均衡和隐藏终端问题。
4 智能语音
实验室在智能语音信号处理方面有较长的研究历史和丰富的研究经验,研究内容涉及听觉模型、多通道响度补偿、时频域回声消除、声源定位、语音分析、语音情感信息处理、语音增强、语音识别、语音合成、语音编码等方向,建立了一整套语音分析与数字助听的软硬件系统。在人类听觉系统对声信号的感知机理方面,包括听觉测试、听力补偿、听觉的空间定位机理、听觉生理学、感知心理学等方面取得一些国际领先的研究成果。研发完成的YT360 助听器专用SOC芯片是一颗具有16通道宽动态压缩、内置先进的声信号处理算法的专用芯片,适合于外耳式及耳道式各类型单耳助听系统,经过外围电路,也可以扩展为双耳助听系统。实验室为配合YT360 助听器专用SOC芯片的产业应用,完成了听觉认知测量与交互自验配方案,建立了听觉认知测试语音数据库,设计了完整可信的听觉测量评分方法。根据以上方案,设计并完成了测听软件及听力补偿分析软件。在临床测试方面,实验室与业内知名助听器验配机构“立聪堂”长期合作,为本研究顺利实施提供了行业支持。