Python + Selenium 自动发布文章(二):简书

Python + Selenium 自动发布文章系列:
Python + Selenium 自动发布文章(一):开源中国
Python + Selenium 自动发布文章(二):简书
Python + Selenium 自动发布文章(三):CSDN
Python + Selenium 自动发布文章(四):加入 bat 脚本

写在开始

  本篇介绍用Python+Selenium 自动发布简书文章,一些必要的前置准备说明在上篇文章里面有提到,这里就不再重复了。

使用说明

  同样的,还是需要先分析下简书写博客的界面(记得设置默认编辑器为Markdown)。

write-blog-jianshu
write-blog-jianshu

  从上图可以看到,在简书写一篇博客,需要依次选择分类(也就是文集),新建文章,然后填入标题和内容。
  结合auto.md的内容进行分析,标题有了,定义在title处;正文内容同样通过匹配-->\n获取。剩下分类,按规则已经定义在注释里了(self_category)。

代码说明

  main.py:程序入口类,主要负责正则匹配解析Markdown和调用post发布文章

import re
import jianshu
import linecache


class Main(object):
    # init
    def __init__(self, file):
        self.title = ''
        self.content = ''
        self.category = ''
        self.tags = ''
        # OsChina的系统分类, 设个默认值
        self.osChina_sys_category = '编程语言'
        # CSDN的文章分类, 设个默认值
        self.csdn_article_category = '原创'
        # CSDN的博客分类, 设个默认值
        self.csdn_blog_category = '后端'
        self.read_file(file)

    # 读取MD中的title, content, self_category, self_tags, osChina_sys_category, csdn_article_category, csdn_blog_category
    def read_file(self, markdown_file):
        self.title = linecache.getline(markdown_file, 2).split('title: ')[1].strip('\n')
        with open(markdown_file, 'r', encoding='UTF-8') as f:
            self.content = f.read().split('-->\n')[1]
            # 重置文件指针偏移量
            f.seek(0)
            for line in f.readlines():
                if re.search('self_category: ', line) is not None:
                    self.category = line.split('self_category: ')[1].strip('\n')
                elif re.search('self_tags: ', line) is not None:
                    self.tags = line.split('self_tags: ')[1].strip('\n')
                elif re.search('osChina_sys_category: ', line) is not None:
                    self.osChina_sys_category = line.split('osChina_sys_category: ')[1].strip('\n')
                elif re.search('csdn_article_category: ', line) is not None:
                    self.csdn_article_category = line.split('csdn_article_category: ')[1].strip('\n')
                elif re.search('csdn_blog_category: ', line) is not None:
                    self.csdn_blog_category = line.split('csdn_blog_category: ')[1].strip('\n')


if __name__ == '__main__':
    md_file = 'auto.md'
    print("Markdown File is ", md_file)

    timeout = 10
    main = Main(md_file)

    # 简书
    jian_shu = jianshu.JianShu()
    jian_shu.post(main, timeout)

  authorize.py:目前仅实现了用qq进行授权登录的方法

from selenium.webdriver.support.wait import WebDriverWait


# QQ授权登录, 使用前提是QQ客户端在线
def qq(driver, timeout):
    # 切换到最新打开的窗口
    window_handles = driver.window_handles
    driver.switch_to.window(window_handles[-1])

    print('qq authorize title is ', driver.title)

    # 切换iframe
    iframe = WebDriverWait(driver, timeout).until(lambda d: d.find_element_by_id('ptlogin_iframe'))
    driver.switch_to.frame(iframe)

    # 点击头像进行授权登录
    login = WebDriverWait(driver, timeout).until(lambda d: d.find_element_by_xpath('//*[@id="qlogin_list"]/a[1]'))
    login.click()

  jianshu.py:这个是简书自动写(发)博客的核心类

import time
import authorize
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait


# 简书
class JianShu(object):
    @staticmethod
    def post(main, timeout, self_timeout=3):
        # 1.跳转登陆
        login = 'https://www.jianshu.com/sign_in'
        driver = webdriver.Chrome()
        driver.get(login)

        # 2.窗口最大化
        driver.maximize_window()

        # 3.使用QQ授权登录
        driver.find_element_by_xpath('/html/body/div[1]/div[2]/div/div/ul/li[3]/a/i').click()
        driver.close()
        authorize.qq(driver, timeout)

        # 4.点击"写文章"
        write_blog = WebDriverWait(driver, timeout).until(lambda d: d.find_element_by_xpath('/html/body/nav/div/a[2]'))
        write_blog.click()
        driver.close()
        window_handles = driver.window_handles
        driver.switch_to.window(window_handles[-1])

        # 5.点击指定分类
        classify = WebDriverWait(driver, timeout).until(lambda d: d.find_elements_by_class_name('_3DM7w'))
        for c in classify:
            html = c.get_attribute('innerHTML')
            if main.category in html:
                c.click()
            else:
                # TODO 如果分类不存在,还可以直接新建分类
                pass

        # 6.点击'新建文章'
        time.sleep(self_timeout)
        new_article = WebDriverWait(driver, timeout).until(
            lambda d: d.find_element_by_xpath('//*[@id="root"]/div/div[2]/div[1]/div/div/div/div[1]/i'))
        new_article.click()
        article = WebDriverWait(driver, timeout).until(
            lambda d: d.find_element_by_xpath('//*[@id="root"]/div/div[2]/div[1]/div/div/div/ul/li[1]'))
        article.click()

        # 7.填写标题, 内容
        time.sleep(self_timeout)
        title = driver.find_element_by_class_name('_24i7u')
        title.clear()
        title.send_keys(main.title)
        content = driver.find_element_by_id('arthur-editor')
        content.clear()
        content.send_keys(main.content)

        # 8.保存草稿
        driver.find_element_by_xpath('//*[@id="root"]/div/div[2]/div[2]/div/div/div/div/ul/li[8]/a').click()
        # 8.发布文章
        # driver.find_element_by_xpath('//*[@id="root"]/div/div[2]/div[2]/div/div/div/div/ul/li[1]/a').click()

  其实简书也是支持账号密码登录的,但无奈这种方式登录还有文字验证层,感觉比较棘手,目前也没研究怎么解决,所以先用qq授权的方式登录吧。

运行效果

  还是来看看运行效果图吧,这里测试的是保存草稿。

auto-post-jianshu
auto-post-jianshu

写在最后

  在简书自动写文章的思路大概就这样,同样这也不是唯一的办法,根据代码自己做调整即可,网页的结构也可能会改变,故不保证程序可以一直正常运行。最后,下一篇继续介绍如何在CSDN自动写(发)文章。

优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/641782

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。