我用Python进行情感分析,让程序员和女神牵手成功
先用电影评论来做情感分析,主要包括下面几个主要内容(看到最后哦): 1、准备文本数据 2、基于文本文档来构建特征向量 3、训练机器学习模型来区分电影评论的正面评论和负面评论(对你的女神同样适用哦~~) 4、使用外存学习和在线学习算法来处理大数据 在本篇文章中,主要介绍对于电影评论数据的准备工作。 一、情感分析 情感分析也称观点挖掘(opinion mining),是机器学习中自然语言处理(NLP)领域一个非常流行的分支,它主要是分析文档的情感倾向。 二、下载数据 请自行准备一个电影信息(或者直接使用你和女神的聊天信息) 该电影评论是来自IMDb中的电影评论,数据集一共包含了50000个关于电影的正面评论和负面评论,正面评论代表对于影片的评分超过了6颗星,而负面评论则表示评分低于5颗星。50000条评论被分成了四个文件夹train的neg和pos和test的neg和pos,其中每个文件夹中包含了12500个txt电影评论文件,其中pos代表正面评论,neg代表负面评论。所以,我们需要将这50000个txt文件整合成一个表格,表格分为两列,第一列表示评论的内容,第二列表示评论是属于...





