106 Commits

Author SHA1 Message Date
g1879
47ef460c2d ele()和eles()删除show_errmsg参数 2020-11-07 15:00:31 +08:00
g1879
da849f56cc 去除对requests_html的依赖,改用lxml支撑s模式 2020-11-06 18:07:14 +08:00
g1879
c9eae68acb 弃用requests_html,未完成 2020-11-05 17:48:02 +08:00
g1879
41d700a3d9 弃用requests_html,未完成 2020-11-04 16:34:55 +08:00
g1879
7d8a1d88d6 微调,完善ele()类型判断及注解 2020-11-03 12:30:09 +08:00
g1879
f235178b36 可处理以(开头的xpath 2020-11-02 23:11:46 +08:00
g1879
3b3b6a55cb 调整execute_session_find(),未完成 2020-10-28 01:25:13 +08:00
g1879
ac90820f1e download()支持post方式 2020-10-15 16:53:38 +08:00
g1879
7ae5ec6541 优化download()获取文件大小逻辑 2020-09-18 16:36:02 +08:00
g1879
265c997efc download函数优化获取文件名逻辑 2020-09-15 13:43:02 +08:00
g1879
39a96c852e 优化修复网页编码逻辑 2020-09-08 00:04:27 +08:00
g1879
1b286c100e 修复无法分部分下载的问题 2020-09-07 00:15:46 +08:00
g1879
f83d72a6fe 微调 2020-09-03 18:01:59 +08:00
g1879
37bf43ac36 get()增加重试功能 2020-09-01 23:27:11 +08:00
g1879
0dcfcf5cd8 get()增加重试功能 2020-09-01 22:44:34 +08:00
g1879
159f1bf55a 微调download()重命名规则 2020-09-01 17:19:07 +08:00
g1879
e66f6adc79 用xpath查找元素时自动补全// 2020-08-19 10:49:42 +08:00
g1879
5f83e93a52 优化show_errmsg的逻辑 2020-08-18 14:18:56 +08:00
g1879
6162939809 微调注释 2020-08-17 10:26:22 +08:00
g1879
adeba1fec6 若从headers和meta获取不到编码,用r.apparent_encoding获取 2020-08-15 23:05:22 +08:00
g1879
016d54561c 连接函数增加show_errmsg参数 2020-08-14 00:27:31 +08:00
g1879
7a5c3b6f76 微调import 2020-08-13 14:16:26 +08:00
g1879
16847f829d 完善注释 2020-08-13 11:34:16 +08:00
g1879
c962e21163 修复eles的bug 2020-08-10 10:55:24 +08:00
g1879
4c24a57537 avoid_duplicate_name函数改名为get_available_file_name 2020-08-08 17:35:25 +08:00
g1879
1c9bc8dd24 微调 2020-08-08 01:05:19 +08:00
g1879
ddbe20f7a8 微调功能,完善注释 2020-08-08 00:08:52 +08:00
g1879
29dfda713d 完善download路径,修复路径为.\时的bug。
_make_response函数中self._url改成self.url,确保d模式download时url正确。
2020-08-06 23:47:24 +08:00
g1879
d41069c2a6 完善download路径,修复路径为.\时的bug。
_make_response函数中self._url改成self.url,确保d模式download时url正确。
2020-08-06 23:25:21 +08:00
g1879
19ff6ba9f6 修改注释 2020-08-06 00:00:27 +08:00
g1879
e4c5a6ad0c 修改报错提示;download()函数出错时可显示详细信息;_make_response()改为返回tuple 2020-08-03 23:40:47 +08:00
g1879
beff8263fc 修改报错提示;download()函数出错时可显示详细信息;_make_response()改为返回tuple 2020-08-03 23:28:22 +08:00
g1879
a5f90f5dd9 download函数会去除路径中的非法字符,并返回完整路径 2020-08-03 19:20:06 +08:00
g1879
c5acdf3d46 download函数增加文件存在时处理参数 2020-08-01 00:58:05 +08:00
g1879
983f68f9be 调整书写格式 2020-07-23 14:33:09 +08:00
g1879
4ffa174e5a proxy设置移到drission 2020-06-17 17:40:00 +08:00
g1879
4497ee9fec 添加代理设置,未完成 2020-06-16 18:06:45 +08:00
g1879
af6a4e2b6e 修复中文网站访问出错的bug 2020-06-13 23:17:41 +08:00
g1879
c5a2555160 修改替换\x08的逻辑,避免下载文件乱码 2020-06-10 19:23:08 +08:00
g1879
7648c91de8 完善url处理 2020-06-10 16:51:20 +08:00
g1879
43b942e1ec 在response._content删除\x08(退格)字符,以避免页面上有这个字符时解析出错 2020-06-09 14:32:11 +08:00
g1879
fe9b308562 在requests的源码删除\x08(退格)和\x0D(换行)字符,以修改私有变量的方式 2020-06-08 21:03:55 +08:00
g1879
f3f4be5793 优化_make_response()的kwargs设置,并加入timeout设置 2020-06-07 00:11:17 +08:00
g1879
d0a23732f5 完善获取charset的正则语句 2020-06-05 16:47:48 +08:00
g1879
f1394d4cdd 修复正则有些情况下获取不到charset的bug 2020-06-04 23:28:18 +08:00
g1879
800a4239ef 微调download的show_msg参数 2020-06-03 10:26:53 +08:00
g1879
1c823470bd 当response的header没有charset时,尝试从meta获取 2020-06-02 00:10:55 +08:00
g1879
09c98d8cf6 修复_make_response()中自动设置host错误的bug 2020-05-29 00:45:06 +08:00
g1879
e4c7b81fa3 download()增加是否显示信息选项 2020-05-28 17:01:00 +08:00
g1879
058715be70 修复response的headers中无charset导致乱码的问题 2020-05-28 16:44:36 +08:00