Python抓取分析“创造101 ”菊姐微博
前一段时间,创造101很火,这个火是可以理解的,毕竟中国首部女团节目。但是还有一个人不知道为啥突然也火了,那就是我们的菊姐。关于菊姐为什么火,网上已经有很多发文了,这里就不再赘述了。
我们抓取了菊姐的最新微博评论,将评论分词以后制作成如下词云图。
这里的海外指大陆+港澳台以外的其他所有地方。
除海外用户以外就北上广的用户最多了,这些地方的互联网用户基数本来就大。
因为北京上海比较特殊,北京上海的一些区相当于北京上海这两个省下面的市区,所以你会看到一些北京上海的区域也进入了榜单,比如说朝阳群众。
但是大家都很爱学习,都想要代码学习学习,所以今天就专门来一篇讲讲代码。
在开始具体的代码讲解之前,我需要说明一下关于菊粉人数中摩羯座人数最多这个结论的一些争议,有人评论说微博用户如果不设置年龄的话,默认就是1月1,也就是摩羯座,所以摩羯座人数比较多。先




