您所在的位置: 成果库 一种基于TF-IDF和CNN启发式短文本特征提取与分类方法

一种基于TF-IDF和CNN启发式短文本特征提取与分类方法

发布时间: 2022-07-01

来源: 科创项目库

基本信息

合作方式: 技术转让
成果类型: 发明专利,新技术
行业领域:
其他
成果介绍

本专利公开发明了一种基于TF?IDF和CNN启发式短文本特征提取与分类方法,首先对短文本集用结巴分词工具实现中文的文本分词,然后去除文本噪声词,得到文本数据集UNION,其次使用TF?IDF特征选择方法处理文本数据集UNION,得出选择后的文本特征值VALUE1,将VALUE1导入到卷积神经网络模型,集成标签并且生成批处理迭代器M,接着使用嵌入层、卷积层、池化层和softmax方法搭建CNN神经网络文本分类模型,导入M到模型中,然后配置训练集模型的超参数和训练参数,给出训练集每1步和测试集每100步的损失函数和准确度,生成训练模型MODEL,最后将待分类短文本集进行预处理之后,得到数据集VALUE2,导入MODEL到预测模型,得出分类结果。本发明不仅节约了计算时间,而且准确率高。

成果亮点
团队介绍
成果资料