blackteay/DrissionPage

mirror of https://gitee.com/g1879/DrissionPage.git synced 2024-12-10 04:00:23 +08:00

g1879 82c4140fff 大量更新文档

2023-02-03 00:03:36 +08:00

1.3 KiB

Raw Blame History

星巴克的示例使用download()方法实现下载图片，这个示例演示在浏览器中直接保存图片。

这个功能是本库一个特色，无需操作 ui，也无需重新下载图片，而是直接读取缓存里面的图片保存，使用非常方便。

✔️ 页面分析

目标网址：https://book.douban.com/tag/小说

按F12，可以看到每本图书都在class属性为subject-item的元素中，可批量获取，然后再在其中获取<img>元素保存图片。

✔️ 编码思路

为了演示元素对象的save()方法，这里我们使用浏览器操作，把图片文件保存到本地 imgs 文件夹。

✔️ 示例代码

以下代码可直接运行。

from DrissionPage import ChromiumPage

# 创建页面对象
page = ChromiumPage()
# 访问目标网页
page.get('https://book.douban.com/tag/小说?start=0&type=T')

# 爬取4页
for _ in range(4):
    # 遍历一页中所有图书
    for book in page.eles('.subject-item'):
        # 获取封面图片对象
        img = book('t:img')
        # 保存图片
        img.save(r'.\imgs')

    # 点击下一页
    page('后页>').click(wait_loading=True)

✔️ 结果