更新文档

2024-12-10 04:00:23 +08:00 · 2022-05-27 18:11:09 +08:00 · 2022-05-27 18:11:09 +08:00 · c2f13213d7
commit c2f13213d7
parent 1f914ea5a3
5 changed files with 31 additions and 54 deletions
--- a/DrissionPage/tools.py
+++ b/DrissionPage/tools.py
@ -2,6 +2,7 @@
 """
 实用工具
 """
 from FlowViewer import Listener, RequestMan
 from .session_element import make_session_ele
 from .easy_set import get_match_driver
 from FlowViewer import Listener
--- a/README.md
+++ b/README.md
@ -8,9 +8,9 @@ DrissionPage，即 driver 和 session 组合而成的 page。
 可兼顾 selenium 的便利性和 requests 的高效率，  
 更棒的是，它的使用方式非常简洁和人性化，代码量少，对新手友好。
-点击打开：📒[使用文档](http://g1879.gitee.io/drissionpage)
+**使用文档：** 📒[点击打开](http://g1879.gitee.io/drissionpage)
-**交流QQ群：**  897838127
+**QQ群：**  897838127
 **联系邮箱：**  g1879@qq.com
@ -218,7 +218,7 @@ r = requests.get(url)
 with open(f'{save_path}\\img.png', 'wb') as fd:
   for chunk in r.iter_content():
       fd.write(chunk)
-        
+
 # 使用 DrissionPage：
 page.download(url, save_path, 'img')  # 支持重命名，处理文件名冲突，自动创建目标文件夹
 ```
@ -288,4 +288,3 @@ Git 命令学习
 如果本项目对您有所帮助，不妨请作者我喝杯咖啡 ：）
 ![](https://gitee.com/g1879/DrissionPage-demos/raw/master/pics/code.jpg)
--- a/docs/README.md
+++ b/docs/README.md
@ -8,7 +8,7 @@ DrissionPage，即 driver 和 session 组合而成的 page。
 可兼顾 selenium 的便利性和 requests 的高效率，  
 更棒的是，它的使用方式非常简洁和人性化，代码量少，对新手友好。
-点击打开：📒[使用文档](http://g1879.gitee.io/drissionpage)
+
 **交流QQ群：**  897838127
--- a/docs/_navbar.md
+++ b/docs/_navbar.md
@ -1,3 +1,5 @@
 * [DataRecorder](https://gitee.com/g1879/DataRecorder)
 * [ListPage](https://gitee.com/g1879/ListPage)
 * [DownloadKit](https://gitee.com/g1879/DownloadKit)
 * [FlowViewer](http://g1879.gitee.io/flowviewer)
 * [Demos](https://gitee.com/g1879/DrissionPage-demos)
--- a/docs/使用方法/监听浏览器网络数据.md
+++ b/docs/使用方法/监听浏览器网络数据.md
@ -1,60 +1,35 @@
 # 监听浏览器网络数据
-许多网页的数据来自接口，在网站使用过程中动态加载，如使用 JS 加载内容的翻页列表。  
+许多网页的数据来自接口，在网站使用过程中动态加载，如使用 JS 加载内容的翻页列表。
-这些数据通常以 json 形式发送，浏览器接收后，对其进行解析，再加载到 DOM 相应位置。  
+这些数据通常以 json 形式发送，浏览器接收后，对其进行解析，再加载到 DOM 相应位置。
-以前，我们从 DOM 中去获取解析后数据的，可能存在
+做数据采集的时候，我们往往从 DOM 中去获取解析后数据的，可能存在 数据不全、加载响应不及时、难以判断加载完成等问题。
-## 控制浏览器同时监听请求
+因此开发了一个监听器，专门用于抓取 Chrome 浏览器数据包。
-复制此代码可直接运行查看结果。
+由于该工具不依赖 DrissionPage，现已独立发布为一个库，但仍然可以在 DrissionPage 中导入。
 !> 为了便于维护，该工具用法请异步 [FlowViewer](https://gitee.com/g1879/FlowViewer) 查看。
 # 
 # 简单示例
 ```python
-'''
+from DrissionPage.tools import Listener
 如果监听特定请求的Chrome浏览器数据，可以采用如下代码
 '''
 p = MixPage(driver_options=do, session_options=False)
 #监听浏览器
 l =Listener(p)
 # 找到需要监听的链接
 l.listen('JobSearchResult.aspx',count=10,asyn=True)
 p.ele(".next-page PageNumber").click(by_js=True)
-for i in l.steps():
+listener =Listener(9222)  # 创建监听器，监听9222端口的浏览器
-    scode = i[0].body
+listener.set_targets('JobSearchResult.aspx')  # 设置需要监听的url
-    # 一旦数据出来，立即停止加载
+
-    p.stop_loading()
+listener.listen(count=10)  # 开始监听，接收到10条目标url的请求后停止
-    #使用解析网页   
+
-    p.ele(".next-page PageNumber").click(by_js=True)
+for i in listener.steps():
-#停止监听，可以设置条件
+    print(i[0].body)  # 打印实时打印监听到的内容
-l.stop()
+
-```
+listener.stop()  #停止监听
 ## 监听指定端口的请求
 复制此代码可直接运行查看结果。
 ```python
 '''
 如果仅仅是监听Chrome浏览器的请求可以采用下面的代码
 '''
 from FlowViewer import Listener
 #监听有端口的浏览器
 l =Listener()
 l.listen(None,count=None,asyn=True)
 for i in l.steps(): 
    print(i[0].url)
    print(i[0].body)
 #停止监听，可以设置条件或者跳出循环
 l.stop()
 ```