本发明涉及互联网数据分析领域,公开一种微博开心指数实时分析方法,包括:调用第三方应用接口,获取微博数据并提取时间要素,根据所述时间要素实时进行时间线跟踪;对微博数据进行文本语义分析;通过构建短文本映射库对微博数据中的短文本进行还原;引入关联元素参数并根据所述关联元素参数进行微博情感倾向判断;根据预设微博开心指数公式对所述微博情感倾向判断结果进行统计计算;以及对计算结果进行可视化呈现。本发明还公开了一种微博开心指数分析系统。所述方法和系统通过计算获得开心指数,并进行实时可视化呈现,可对信息传播、社区发现、舆情的监控、商业分析、市场的营销与反馈提供有效的协助。
一种微博开心指数分析方法,包括:调用第三方应用接口,获取微博数据并提取时间要素,根据所述时间要素实时进行时间线跟踪;对微博数据进行文本语义分析,所述文本语义分析至少包括话题关联分析,表情关联分析和特殊字符关联分析;通过构建短文本映射库对微博数据中的短文本进行还原;引入关联元素参数并根据所述关联元素参数进行微博情感倾向判断,所述关联元素参数至少包括与话题关联参数,表情关联参数和特殊字符关联参数;根据预设微博开心指数公式对所述微博情感倾向判断结果进行统计计算,以及对计算结果进行实时可视化呈现。
社会化媒体应用平台已经成为了人们发表、评论、转播信息的主要平台。因此,积累了大量用户的行为数据和情感数据。其中包括了用户的时间、空间等个人属性,也包括了用户发表的文本内容属性。社会化媒体数据的分析和研究越来越受到人们的关注。对信息传播、社区发现、舆情的监控、商业分析、市场的营销与反馈等具有重要的理论研究意义和应用价值。
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
开心指数是某一地区网民情感倾向的宏观描述和反应。本实施例基于地区微博数据的情感判断,计算该地区网络的开心指数,主要包括对该地区微博正向情感的统计、负向情感的统计、中性情感的统计和微博数量指数等指数的计算指标,然后应用开心指数计算公式进行该地区开心指数计算。相对于现有技术,本发明实施例提供的微博开心指数分析方法及系统基于时间线追踪的方式获取微博数据,并对文本进行语义分析及情感倾向判定,通过计算获得开心指数,并进行可视化呈现,可对信息传播、社区发现、舆情的监控、商业分析、市场的营销与反馈提供有效的协助。
技术合作
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。