用Python分析WordPress官网所有插件的开发者信息(续以及人物介绍)
转自丘壑博客,转载注明出处 前言 书接上回,上一篇里我们讲了一点数据分析的思路和方法,顺带分析了一下http://WordPress.org上所有插件的作者信息,得到了几个数据,比如插件数量Top10的作者、作者的区域分布等等。本篇作为补充,关于开发者的分析还可以从时间维度分析,比如 最早期的给WordPress开发插件的是哪些人呢? 每年的插件数量增长情况如何? 活跃的WordPress开发者平均多久会发布一个插件? 思路 这次主要用到的字段是added,也就是插件发布到Wordpress.org的日期。 和上次只用到一个key不同,这次我们可能需要多用到几个key,所以可以使用Python字典对象的另一种方法del。 具体来说,就是在循环jsonline文件的时候,每一行就是一个插件信息,把不需要的key全部删除掉,只保留需要的key,再把更新过的整个字典对象加入列表中即可,这样就不用每次都手动构造一个新的字典对象了。 最早期的给WordPress开发插件的是哪些人呢? 早期是多早?根据Wikipedia上的记录,2004年5月发布的WordPress 1.2开始支持插件系统(话说...