建议通过下载对应的wheel [url=https://pypi.python.org/pypi/lxml/3.8.0]3.8版本的lxml wheel[/ur...
2018-04-02 09:20 回复了该问题新旧版本的替换,参考[url=http://openpyxl.readthedocs.io/en/stable/]openpyxl文档[/url] 新版本的g...
2018-03-08 14:52 回复了该问题[list] [*]申请使用快递100提供的接口,不过一般接口对每天的采集量都有限制,想要获取更多信息,就自己写爬虫采集[/*] [*]自己写爬虫,进入[u...
2018-03-08 14:37 回复了该问题[b]爬虫无非三步(这里就不扯皮应对网站反爬要做的一些操作了)[/b]: [list] [*]抓取(requests、selenium、scrapy、scrap...
2018-03-01 16:33 回复了该问题你获取的rep使用正则匹配的内容就是这个 [url]http://icon.58pic.com/static/images/0.gif[/url] 这个链接本身...
2018-02-27 09:23 回复了该问题Xpath是使用路径表达式来选取 XML 文档中的节点或者节点集,如果一个网页XML的树状结构一样标签属性值是一样的,可以多处匹配,这种结构是不存在,所以是不行...
2018-02-06 15:31 回复了该问题可以看下 [url=http://beautifulsoup.readthedocs.io/zh_CN/latest/#id18]Beautiful中文文档[/...
2018-02-05 10:31 回复了该问题1、安装python环境或者参照之前写过的博客[url=https://ask.hellobi.com/blog/zhiji/10169]Python开发环境...
2018-02-05 10:05 回复了该问题这就需要在你的代码中设计增量抓取。 代码中加入逻辑判断,如果是新更新的内容,就进行采集保存。如果历史数据,就pass。
2018-02-01 16:55 回复了该问题可能是模块位置发生了变化,换个方法引用这个包试试[code]from tensorflow.examples.tutorials.mnist import in...
2018-01-31 14:40 回复了该问题