成果介绍
本发明提供了一种基于语义?标签多粒度注意力的多标签分类方法及系统。该方法包括:语义?标签多粒度注意力模型构建:将堆叠的扩张卷积编码模块与标签图注意力模块的输出共同连接多粒度注意力机制网络,多粒度注意力机制网络输出的加权后的标签作为全连接层的输入,全连接层得到的用于映射预测标签的输出值输入一个Sigmoid层,得到每个标签的预测概率;模型训练:采用多标签数据集对构建的语义?标签多粒度注意力模型进行训练,调整参数直至语义?标签多粒度注意力模型收敛,得到训练完成的语义?标签多粒度注意力模型;以待分类的多标签数据集作为输入,训练完成后的语义?标签多粒度注意力模型输出分类结果。
成果亮点
针对多标签文本分类任务,提出了一种具有强解释性的语义-标签细粒度注意力模型。该模型通过堆叠的扩张卷积结构来构建文本序列在局部相关性和长期依赖性方面的多粒度语义特征表示。同时,模型还利用图注意力网络来主动地建模标签之间复杂的相关性。此外,我们设计了一种多粒度注意力机制,它使用不同粒度的语义特征对标签进行加权,有效保证了信息的传递性。我们在三个基准数据集上进行了一系列的实验,结果表明,所提出的模型在各种评价指标上都有非常先进的性能。额外的分析实验表明我们的模型不仅具有良好的迁移能力,而且在面对高、低频数据时表现出很强的鲁棒性。
团队介绍
杨振宇,男,工学博士,副教授。
长期从事人工智能领域的研究,在图像处理、自然语言处理方面取得了一定的研究成果。发表SCI学术论文20余篇,申请及授权国家发明专利20项。主持国家重点研发计划子课题1项,主持山东省科技重大专项课题1项、山东省重点研发计划1项、山东省自然基金1项、济南市科技明星计划1项,主持横向课题4项;作为主要成员参与国家重点研发计划1项、国家星火计划1项、山东省重点研发计划7项、山东省自然基金3项;获得教育部科学技术进步二等奖1项、山东省科技进步奖三等奖1项、山东省计算机应用优秀成果一等奖1项、山东省计算机应用优秀成果三等奖2项、山东省高等学校优秀成果奖三等奖3项、中国轻工业联合会科学技术进步三等奖1项。
成果资料