Airtest-Selenium实操小课④：微信读书上阅读书籍-低调大师

Airtest-Selenium实操小课④：微信读书上阅读书籍

2024-06-20 361

👆对私有云感兴趣可以进入公众号回复“私有云”哦。

1. 前言

上一课我们讲到用Airtest-Selenium爬取下载可爱的猫猫图片，还没看的同学可以戳这里看看~

那么今天的推文，我们就来说说看，怎么实现模拟真人去打开微信读书网站，点击进入书本进行阅读。

2.需求分析和准备

整体的需求大致可以分为以下步骤：

打开chrome浏览器
打开百度网页
搜索“微信读书”
点击进入“微信读书”官网
搜索关键词“长安的荔枝”
点击进入“长安的荔枝”书本
翻阅书籍前五章内容

在写脚本之前，我们需要准备好社区版AirtestIDE（目前最新版为1.2.17），设置好chrome.exe地址和对应的driver即可。

3. 脚本实现与运行效果

3.1 脚本运行效果

在运行过程中，我们将每次的搜索结果通过读取url链接的方式去实现页面跳转，在进入到书籍阅读界面时，根据读取到的页面高度、文档高度、去计算可滑动高度，实现滑动阅读的操作。并且根据页面的JS距离去判断是否已经滑动到文档底部，从而执行点击下一章的操作。

先来看下我们整体的运行效果：

3.2 完整代码分享

这里也附上完整的示例代码给大家参考，有需要的同学可以自取学习哦：


   
   
   
 
    
    
    # -*- encoding=utf8 -*-
__author__ = "Airtest"

from airtest.core.api import *
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from airtest_selenium.proxy import WebChrome
from selenium.webdriver.common.by import By

# 创建一个实例
driver = WebChrome()
driver.implicitly_wait(20)

def start_selenium():
    driver.get("https://www.baidu.com/")
    # 输入搜索关键词并提交搜索
    search_box = driver.find_element_by_name('wd')
    search_box.send_keys('微信读书')
    search_box.submit()

    # 获取搜索结果并打开新页面
    open_new_page()

    # 滚动页面并阅读章节
    read_chapters()


def open_new_page():
    # 使用XPath查找文本为 "微信读书" 的元素并点击
    try:
        element = driver.find_element_by_xpath("//div[@id='content_left']/div[@id='1']/div[@class='c-container']/div[1]/h3[@class='c-title t t tts-title']/a")
    except Exception as e:
        element = driver.find_element_by_xpath('//*/text()[normalize-space()="微信读书"]/parent::*')
    element.click()

    # 获取所有窗口句柄
    window_handles = driver.window_handles
    # 切换到新打开的窗口
    driver.switch_to.window(window_handles[1])
    # 获取新页面的链接
    new_page_url = driver.current_url
    # 打印新页面的链接
    print(f"新页面的链接: {new_page_url}")
    driver.get(new_page_url)
    
    #点击搜索书籍《长安的荔枝》
    driver.find_element_by_xpath("//input[@type='text']").click()
    driver.find_element_by_xpath("/html/body/div[7]/div/div/div[2]/div/input").send_keys("长安的荔枝")
    driver.find_element_by_xpath("/html/body/div[7]/div/div/div[2]/span[2]").click()


    # 获取a标签的URL以及书籍简介
    search_box = driver.find_element_by_xpath("/html/body/div[7]/div/div[3]/div/ul/li/a")
    print(f"a标签的文本: {search_box.text}")
    url = search_box.get_attribute('href')
    # 打印URL
    print(f"URL: {url}")
    driver.get(url)  # 请求搜索链接-跳转

#开始阅读
def read_chapters():
 #切换上下滚动阅读模式
    button = driver.find_element(By.CSS_SELECTOR,"button[title='切换到上下滚动阅读'].readerControls_item.isHorizontalReader")
    button.click()

    for i in range(5):  # 阅读章节5章
        # 滚动到页面最下方
        scroll_to_bottom()
        sleep(5)
        # 点击下一章节按钮
        next_chapter = driver.find_element(By.XPATH,"//div[@class='readerFooter']/div/button[@class='readerFooter_button']")
        next_chapter.click()

#滑动书籍
def scroll_to_bottom():
    while True:
        is_bottom = driver.execute_script('return (window.innerHeight + window.pageYOffset) >= document.documentElement.scrollHeight;')
        # 判断是否滚动到屏幕最底部
        if not is_bottom:
            # 获取页面高度
            heig_ = driver.execute_script("return document.body.scrollHeight;")
            # 获取当前页面底部距离顶部的距离
            next_ = driver.execute_script("return (window.innerHeight + window.pageYOffset);")
            # 计算滚动距离
            p_num = heig_ / 1000
            print(heig_ / 1000)
            # 滚动到页面最下方
            driver.execute_script(f"window.scrollTo(0, {p_num + next_});")
            sleep(2)
        else:
            print('已滚动到屏幕最底部')
            break

#管理 WebDriver 的生命周期
class SeleniumDriver:
    def __enter__(self):
        return driver

    def __exit__(self, exc_type, exc_val, exc_tb):
        pass


if __name__ == "__main__":
    with SeleniumDriver():
        start_selenium()

3.2 重要知识点

1）返回当前页面的文档在垂直方向上的高度


   
   
   
 
    
    
    driver.execute_script("return document.body.scrollHeight;")

2）获取当前页面可见区域的高度和页面滚动距离


   
   
   
 
    
    
    driver.execute_script("return (window.innerHeight + window.pageYOffset);")

3) 判断页面是否已经滚动到底部


   
   
   
 
    
    
    driver.execute_script('return (window.innerHeight + window.pageYOffset) >= document.documentElement.scrollHeight;')

4）管理WebDriver的生命周期

如果不需要完成任务后就关闭浏览器的话，可以在 exit 的时候直接 pass 处理，如果需要立即关闭浏览器的话，可以选择在 exit 函数内填入 driver.close()


   
   
   
 
    
    
    class SeleniumDriver:
    def __enter__(self):
        return driver

    def __exit__(self, exc_type, exc_val, exc_tb):
        pass

4. 注意事项与小结

4.1 相关教程

4.2 课程小结

在本周的课程中，我们介绍了如何使用Airtest-selenium在微信读书web端上模拟阅读书籍的操作，也分享了Airtest-selenium比较常见的获取滑动距离、计算滑动距离以及判断是否到底部的用法。但是，请大家注意，我们的分享仅供学习参考哦！我们分享的代码并不是永远适用的，因为网页的页面元素可能会不断更新。

同时，我们也非常欢迎同学们能够提供自己常用场景的代码，我们会积极分享相关的使用技巧。让我们一起努力，共同进步~

（猜你还想看

）

▼

Airtest脚本的重构与优化：提升测试效率和可读性

多设备兼容脚本，轻松拿捏

Windows技巧：轻松连接多进程窗口之一

本文分享自微信公众号 - AirtestProject（AirtestProject）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/4594743/blog/11235113

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

自动化测试小技巧之Airtest-Selenium和Excel的无缝协作

👆对私有云感兴趣可以进入公众号回复“私有云”哦。一、前言之前在问卷以及Q群上有同学有提出过能否将网页上的一些数据通过 Airtest 去导出生成一份 Excel ，那么我们今天一起讨论一下，我们应该如何去实现，以及当我们获取的数据类型不同的时候，获取的方式该怎么随之调整？二、知识点介绍 2.1 python下的Excel的操作之前我们有篇文章有介绍过 poco跟Excel结合使用的案例，里面介绍了 Excel 的读写操作，在这里我们是使用了创建 Excel ，写入并保存Excel的操作。 importxlwingsasxw# 创建一个新的Excel工作簿和工作表wb = xw.Book()sheet = wb.sheets[0]#将内容写入Excel内sheet.range((row_index, col_index)).value = cell.text# 保存Excel文件wb.save('output.xlsx')wb.close() 2.2 获取table数据在网页上看到类似图下的表格内容时，可以在界面点击 F12 唤出页面开发者模式，可以看到表格在 HTML 中...

2024-06-27

412

本文分享自华为云社区《【GaussTech技术专栏】数据库中并行计算技术应用探秘》，作者：GaussDB数据库。并行计算是提高系统性能的重要手段之一。该技术是通过利用多台服务器、多个处理器、处理器中的多核以及SIMD指令集等技术，实现任务的并行化处理，从而加快任务处理的速度。同时，在多个计算机领域有应用，如图像处理、大数据处理、科学计算及数据库等。数据库中的并行处理技术 1. 分布式并行处理架构并行处理数据库架构的出现可以追溯到上世纪80年代。当时计算机性能非常有限，但企业已经有了大规模的数据的处理需求。那当时技术界是如何提升数据处理能力的呢？当时技术界提出了三种并行架构：Shared Nothing、Shared Disk、Shared Memory，并对他们展开了各种讨论。图灵奖获得者Michael Stonebraker在1985年发表的一篇关于Shared Nothing的文章《The Case for Shared Nothing》，从不同维度，对三种架构能力做了一些比较分析。由于在成本、扩展性、可用性方面的优势，Shared Nothing成为主流的设计思路。 1...

2024-07-01

393

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。