更新时间:11-19 上传会员:将大紫
分类:工业大学 论文字数:17431 需要金币:2000个
摘 要:随着互联网的蓬勃发展,文本这种信息载体在微博,论坛和电商平台中扮演了越来越重要的角色,近几年呈指数形式增长,其中也蕴含了巨大的科研与商业价值。随着处理技术的进步,对社交媒体上各种短文本和评论文本这种主观性的文本进行文本情感分析的工作也成为可能。
国内的情感分析研究当前主要集中在信息量最大的实时信息分享平台微博和淘宝、京东等电子商务平台用户评论的情感极性判断上。如企业通过对购物评价进行分析,从宏观上知晓该商品的买家对该商品的使用感受,从而有针对性地改善商品的质量问题和售后;如政府对社会热点事件的网民讨论中挖掘出观点,从而实现舆论监控,更好地推进政策的落地。
但是,当情感分析越来越细化,我们想要通过情感分析技术去辨析细粒度情感时,原来粗粒度的情感分析技术就不适用了。首先,传统的方法是,使用一些技术,例如特征向量和引入权重计算的方法,具体量化包含情绪的文本,然后使用基于支持向量机和k‐最近邻算法分别进行情绪分类。本文系统所采用的是深度学习的方法,用LSTM神经网络直接对文本情感进行判断,省去了复杂的人工操作,更高效地实现对中文社会媒体的细粒度情绪分析。
综上所述,针对中文社会媒体所展开的细粒度情感分析技术,不仅能够做到对社会焦点事件的舆论控制和网络舆情监管,起到感受社会舆论律动,聆听社会脉搏的作用;而且其中蕴含着非常庞大的商业和社会价值。目前,面向中文的细粒度情感分析的精确度仍有待发展。
关键词:细粒度情感分析;中文社会媒体;自然语言处理;支持向量机;LSTM
目录
摘要
Abstract
1-绪论-1
1.1 研究背景与意义-1
1.2 国内外研究现状-2
1.2.1 文本情感分析的研究现状-2
1.2.2 深度学习在文本情感分析领域研究现状-4
1.3 本文内容-6
1.4 论文组织结构-6
2-中文社会媒体的细粒度文本情感分析介绍-7
2.1 为什么要做中文文本细粒度情感分析-7
2.2 中文社交媒体文本特征-7
2.3 存在的问题和难点-8
2.3.1 中文文本情感分析难点-8
2.3.2 细粒度情感分析难点-8
3-情感分析技术综述-9
3.1 基本技术-9
3.1.1 社交媒体文本预处理-9
3.1.2 文本表示技术-11
3.1.3 情感特征提取-13
3.2 3.3 基于传统机器学习的情感分类方法-15
3.2.1 3.3.1 朴素贝叶斯算法-15
3.2.2 k近邻(k-NN)算法-15
3.2.3 支持向量机-17
3.3 人工神经网络及深度学习相关算法-18
3.3.1 卷积神经网络-21
3.3.2 LSTM循环神经网络-21
3.3.3 本章小结-23
4-实验结果及分析-24
4.1 实验环境配置-24
4.2 实验数据预处理-24
4.2.1 实验语料数据-24
4.3 实验评价指标-24
4.4 词向量-25
4.4.1 词向量模型-25
4.5 词向量训练-27
4.6 实验设计-27
4.7 实验结果与分析-27
4.7.1 模型对比试验-27
5-总结与展望-29
5.1 总结-29
5.2 展望-29
参考文献