DrissionPage/docs/使用方法/MixPage 对象.md
2021-12-21 21:36:02 +08:00

9.4 KiB
Raw Blame History

MixPage 页面对象封装了常用的网页操作,并实现 driver 和 session 模式之间的切换。
MixPage 须控制一个 Drission 对象并使用其中的 driver 或 session如没有传入MixPage 会自己创建一个(使用传入的配置信息或从默认 ini 文件读取)。

Tips: 多对象协同工作时,可将一个 MixPage 中的 Drission 对象传递给另一个,使多个对象共享登录信息或操作同一个页面。

创建对象

创建对象方式有3种简易、传入 Drission 对象、传入配置。可根据实际需要选择。 参数说明: drission: Drission对象,如没传入则创建一个。 mode: 'd' 或 's' 即driver模式和session模式,默认是d模式 timeout: 超时时间。d模式时为寻找元素时间,s模式时为连接时间 driver_options: 浏览器设置没有传入drission参数时会用这个设置新建Drission对象 session_options: requests设置没有传入drission参数时会用这个设置新建Drission对象

# 简易创建方式,以 ini 文件默认配置自动创建 Drission 对象
page = MixPage()
page = MixPage('s')

# 以传入 Drission 对象创建
page = MixPage(drission=drission)
page = MixPage(mode='s', drission=drission, timeout=5)  # session 模式等待时间5秒默认10秒

# 传入配置信息MixPage 根据配置在内部创建 Drission
page = MixPage(driver_options=do, session_options=so)  # 默认 d 模式

访问网页

# 默认方式
page.get(url)
# 指定重试次数和间隔
page.get(url, retry=5, interval=0.5) #若连接出错,程序会自动重试若干次,可指定重试次数和等待间隔

page.post(url, data, **kwargs)  # 只有 session 模式才有 post 方法

切换模式

在 s 和 d 模式之间切换,切换时会自动同步 cookies 和正在访问的 url。

page.change_mode(mode,go)
切换模式'd'  's'切换时会把当前模式的 cookies 复制到目标模式
参数说明
    mode: str - 指定目标模式'd'  's'
    go: bool - 切换模式后是否跳转到当前 url
返回 None

Tips使用某种模式独有的方法时会自动跳转到该模式。

页面属性

page.url  # 当前访问的 url
page.mode  # 当前模式
page.drission  # 当前使用的 Dirssion 对象
page.driver  # 当前使用的 WebDirver 对象
page.session  # 当前使用的 Session 对象
page.cookies  # 获取 cookies 信息
page.html  # 页面源代码
page.json  # 当返回内容是json格式时返回对应的字典
page.title  # 当前页面标题

# d 模式独有:
page.tabs_count  # 返回标签页数量
page.tab_handles  # 返回所有标签页 handle 列表
page.current_tab_num  # 返回当前标签页序号
page.current_tab_handle  # 返回当前标签页 handle

页面操作

调用只属于 d 模式的方法,会自动切换到 d 模式。

page.set_cookies()  # 设置cookies
page.get_cookies()  # 获取 cookies可以 list 或 dict 方式返回
page.change_mode()  # 切换模式,会自动复制 cookies
page.cookies_to_session()  # 从 WebDriver 对象复制 cookies 到 Session 对象
page.cookies_to_driver()  # 从 Session 对象复制 cookies 到 WebDriver 对象
page.get(url, retry, interval, **kwargs)  # 用 get 方式访问网页,可指定重试次数及间隔时间
page.ele(loc_or_ele, timeout)  # 返回页面中符合条件的元素,默认返回第一个。​如查询参数是字符串,可选 '@属性名:'、'tag:'、'text:'、'css:'、'xpath:'、'.'、'#' 方式。无控制方式时默认用 text 方式查找。如是loc直接按照内容查询。
    参数说明
        loc_or_ele: [Tuple[str, str], str, DriverElement, SessionElement, WebElement] - 元素的定位信息可以是元素对象loc 元组或查询字符串
        timeout: float - 查找元素超时时间driver 模式下有效
    返回 [DriverElement, SessionElement, str] - 元素对象或属性文本节点文本
page.eles(loc_or_ele, timeout)  # 获取所有符合条件的元素、节点或属性 
page.download(url, save_path, rename, file_exists, **kwargs)  # 下载一个文件,返回是否成功和下载信息字符串。改方法会自动避免和目标路径现有文件重名。
    参数说明
        url: str - 文件 url
        save_path: str - 存放路径默认为 ini 文件中指定的临时文件夹
        rename: str - 重命名文件不改变扩展名
        file_exists: str - 若存在同名文件可选择 'rename', 'overwrite', 'skip' 方式处理
        **kwargs - 用于 requests 的连接参数
    返回 Tuple[bool, str] - 下载是否成功bool和状态信息成功时信息为文件路径的元组

以下方法和属性只有 driver 模式下生效调用时会自动切换到 driver 模式
page.close_driver()  # 关闭 WebDriver 对象
page.close_session()  # 关闭 Session 对象

# s 模式独有:
page.post(url, data, retry, interval, **kwargs) ##以 post 方式跳转,调用时自动切换到 session 模式。
    参数说明
        url: str - 目标 url
        data: dict - 提交的数据
        go_anyway: bool - 是否强制跳转若目标 url 和当前 url 一致默认不跳转
        show_errmsg: bool - 是否显示和抛出异常
        retry: int - 连接出错时重试次数
        interval: float - 重试间隔
        **kwargs - 用于 requests 的连接参数
    返回 [bool, None] - url 是否可用
# d 模式独有:
page.wait_ele(loc_or_ele, mode, timeout)  # 等待元素从 dom 删除、显示、隐藏
    参数说明
        loc_or_ele: [str, tuple, DriverElement, WebElement] - 元素查找方式与ele()相同
        mode: str - 等待方式可选'del', 'display', 'hidden'
        timeout: float - 等待超时时间
    返回 bool - 等待是否成功
page.run_script(js, *args) 执行JavaScript代码
    参数说明
        script: str - JavaScript 代码文本
        *args - 传入的参数
    返回 Any
page.create_tab(url)  # 新建并定位到一个标签页,该标签页在最后面。
    参数说明
        url: str - 新标签页跳转到的网址
    返回 None
page.to_tab(num_or_handle)  # 跳转到标签页
    参数说明
        num_or_handle:[int, str] - 标签页序号或handle字符串序号第一个为0最后为-1
    返回 None
page.close_current_tab()  # 关闭当前标签页
page.close_other_tabs(num_or_handles)  # 关闭传入的标签页以外标签页,默认保留当前页。可传入列表或元组。
page.to_iframe(loc_or_ele)  # 跳转到 iframe默认跳转到最高层级兼容 selenium 原生参数。
    参数说明:
        loc_or_ele: [int, str, tuple, WebElement, DriverElement] - 查找 iframe 元素的条件可接收 iframe 序号0开始)、id 
        name查询字符串loc参数WebElement对象DriverElement 对象传入 'main' 跳到最高层传入 'parent' 跳到上一层   
    示例:
        to_iframe('tag:iframe') - 通过传入 iframe 的查询字符串定位
        to_iframe('iframe_id') - 通过 iframe  id 属性定位
        to_iframe('iframe_name') - 通过 iframe  name 属性定位
        to_iframe(iframe_element) - 通过传入元素对象定位
        to_iframe(0) - 通过 iframe 的序号定位
        to_iframe('main') - 跳到最高层
        to_iframe('parent') - 跳到上一层
    返回: None   
page.screenshot(path,filename)  # 网页截图,返回截图文件路径。
    参数说明
        path: str - 截图保存路径默认为 ini 文件中指定的临时文件夹
        filename: str - 截图文件名默认为页面 title 为文件名
    返回 str
page.scroll_to_see(loc_or_ele)  # 滚动直到某元素可见
    参数说明
        loc_or_ele: [str, tuple, WebElement, DriverElement] - 查找元素的条件 ele() 方法的查找条件一致
    返回 None
page.scroll_to(mode, pixel)  # 按参数指示方式滚动页面,可选滚动方向:'top', 'bottom', 'rightmost', 'leftmost', 'up', 'down', 'left', 'right', 'half'
page.refresh()  # 刷新当前页面
page.back()  # 浏览器后退
page.set_window_size(x, y)  # 设置浏览器窗口大小,默认最大化
page.check_page()  # 检测页面是否符合预期
page.chrome_downloading(download_path)  # 获取 chrome 正在下载的文件列表
    参数说明
        download_path: str - 下载文件夹路径
    返回list
page.process_alert(mode, text)  # 处理提示框。
    参数说明
        mode: str - 'ok'  'cancel'若输入其它值不会按按钮但依然返回文本值
        text: str - 处理 prompt 提示框时可输入文本
    返回 [str, None] - 提示框内容文本

cookies 的使用

MixPage 支持获取和设置 cookies具体使用方法如下

page.cookies  # 以字典形式返回 cookies只会返回当前域名可用的 cookies
page.get_cookies(as_dict=False)  # 以列表形式返回当前域名可用 cookies每个 cookie 包含所有详细信息
page.get_cookies(all_domains=True)  # 以列表形式返回所有 cookies只有 s 模式有效
page.set_cookies(cookies)  # 设置 cookies可传入 RequestsCookieJar, list, tuple, str, dict

Tips:

  • d 模式设置 cookies 后要刷新页面才能看到效果。
  • s 模式可在 ini 文件、SessionOptions、配置字典中设置 cookies在 MixPage 初始化时即可传入d 模式只能用 set_cookies() 函数设置。