g1879
|
47ef460c2d
|
ele()和eles()删除show_errmsg参数
|
2020-11-07 15:00:31 +08:00 |
|
g1879
|
da849f56cc
|
去除对requests_html的依赖,改用lxml支撑s模式
|
2020-11-06 18:07:14 +08:00 |
|
g1879
|
c9eae68acb
|
弃用requests_html,未完成
|
2020-11-05 17:48:02 +08:00 |
|
g1879
|
41d700a3d9
|
弃用requests_html,未完成
|
2020-11-04 16:34:55 +08:00 |
|
g1879
|
7d8a1d88d6
|
微调,完善ele()类型判断及注解
|
2020-11-03 12:30:09 +08:00 |
|
g1879
|
f235178b36
|
可处理以(开头的xpath
|
2020-11-02 23:11:46 +08:00 |
|
g1879
|
3b3b6a55cb
|
调整execute_session_find(),未完成
|
2020-10-28 01:25:13 +08:00 |
|
g1879
|
ac90820f1e
|
download()支持post方式
|
2020-10-15 16:53:38 +08:00 |
|
g1879
|
7ae5ec6541
|
优化download()获取文件大小逻辑
|
2020-09-18 16:36:02 +08:00 |
|
g1879
|
265c997efc
|
download函数优化获取文件名逻辑
|
2020-09-15 13:43:02 +08:00 |
|
g1879
|
39a96c852e
|
优化修复网页编码逻辑
|
2020-09-08 00:04:27 +08:00 |
|
g1879
|
1b286c100e
|
修复无法分部分下载的问题
|
2020-09-07 00:15:46 +08:00 |
|
g1879
|
f83d72a6fe
|
微调
|
2020-09-03 18:01:59 +08:00 |
|
g1879
|
37bf43ac36
|
get()增加重试功能
|
2020-09-01 23:27:11 +08:00 |
|
g1879
|
0dcfcf5cd8
|
get()增加重试功能
|
2020-09-01 22:44:34 +08:00 |
|
g1879
|
159f1bf55a
|
微调download()重命名规则
|
2020-09-01 17:19:07 +08:00 |
|
g1879
|
e66f6adc79
|
用xpath查找元素时自动补全//
|
2020-08-19 10:49:42 +08:00 |
|
g1879
|
5f83e93a52
|
优化show_errmsg的逻辑
|
2020-08-18 14:18:56 +08:00 |
|
g1879
|
6162939809
|
微调注释
|
2020-08-17 10:26:22 +08:00 |
|
g1879
|
adeba1fec6
|
若从headers和meta获取不到编码,用r.apparent_encoding获取
|
2020-08-15 23:05:22 +08:00 |
|
g1879
|
016d54561c
|
连接函数增加show_errmsg参数
|
2020-08-14 00:27:31 +08:00 |
|
g1879
|
7a5c3b6f76
|
微调import
|
2020-08-13 14:16:26 +08:00 |
|
g1879
|
16847f829d
|
完善注释
|
2020-08-13 11:34:16 +08:00 |
|
g1879
|
c962e21163
|
修复eles的bug
|
2020-08-10 10:55:24 +08:00 |
|
g1879
|
4c24a57537
|
avoid_duplicate_name函数改名为get_available_file_name
|
2020-08-08 17:35:25 +08:00 |
|
g1879
|
1c9bc8dd24
|
微调
|
2020-08-08 01:05:19 +08:00 |
|
g1879
|
ddbe20f7a8
|
微调功能,完善注释
|
2020-08-08 00:08:52 +08:00 |
|
g1879
|
29dfda713d
|
完善download路径,修复路径为.\时的bug。
_make_response函数中self._url改成self.url,确保d模式download时url正确。
|
2020-08-06 23:47:24 +08:00 |
|
g1879
|
d41069c2a6
|
完善download路径,修复路径为.\时的bug。
_make_response函数中self._url改成self.url,确保d模式download时url正确。
|
2020-08-06 23:25:21 +08:00 |
|
g1879
|
19ff6ba9f6
|
修改注释
|
2020-08-06 00:00:27 +08:00 |
|
g1879
|
e4c5a6ad0c
|
修改报错提示;download()函数出错时可显示详细信息;_make_response()改为返回tuple
|
2020-08-03 23:40:47 +08:00 |
|
g1879
|
beff8263fc
|
修改报错提示;download()函数出错时可显示详细信息;_make_response()改为返回tuple
|
2020-08-03 23:28:22 +08:00 |
|
g1879
|
a5f90f5dd9
|
download函数会去除路径中的非法字符,并返回完整路径
|
2020-08-03 19:20:06 +08:00 |
|
g1879
|
c5acdf3d46
|
download函数增加文件存在时处理参数
|
2020-08-01 00:58:05 +08:00 |
|
g1879
|
983f68f9be
|
调整书写格式
|
2020-07-23 14:33:09 +08:00 |
|
g1879
|
4ffa174e5a
|
proxy设置移到drission
|
2020-06-17 17:40:00 +08:00 |
|
g1879
|
4497ee9fec
|
添加代理设置,未完成
|
2020-06-16 18:06:45 +08:00 |
|
g1879
|
af6a4e2b6e
|
修复中文网站访问出错的bug
|
2020-06-13 23:17:41 +08:00 |
|
g1879
|
c5a2555160
|
修改替换\x08的逻辑,避免下载文件乱码
|
2020-06-10 19:23:08 +08:00 |
|
g1879
|
7648c91de8
|
完善url处理
|
2020-06-10 16:51:20 +08:00 |
|
g1879
|
43b942e1ec
|
在response._content删除\x08(退格)字符,以避免页面上有这个字符时解析出错
|
2020-06-09 14:32:11 +08:00 |
|
g1879
|
fe9b308562
|
在requests的源码删除\x08(退格)和\x0D(换行)字符,以修改私有变量的方式
|
2020-06-08 21:03:55 +08:00 |
|
g1879
|
f3f4be5793
|
优化_make_response()的kwargs设置,并加入timeout设置
|
2020-06-07 00:11:17 +08:00 |
|
g1879
|
d0a23732f5
|
完善获取charset的正则语句
|
2020-06-05 16:47:48 +08:00 |
|
g1879
|
f1394d4cdd
|
修复正则有些情况下获取不到charset的bug
|
2020-06-04 23:28:18 +08:00 |
|
g1879
|
800a4239ef
|
微调download的show_msg参数
|
2020-06-03 10:26:53 +08:00 |
|
g1879
|
1c823470bd
|
当response的header没有charset时,尝试从meta获取
|
2020-06-02 00:10:55 +08:00 |
|
g1879
|
09c98d8cf6
|
修复_make_response()中自动设置host错误的bug
|
2020-05-29 00:45:06 +08:00 |
|
g1879
|
e4c7b81fa3
|
download()增加是否显示信息选项
|
2020-05-28 17:01:00 +08:00 |
|
g1879
|
058715be70
|
修复response的headers中无charset导致乱码的问题
|
2020-05-28 16:44:36 +08:00 |
|