建议重新安装 [url=https://ask.hellobi.com/blog/zhiji/10180]python+scrapy安装教程[/url] 先装...
2018-01-31 14:29 回复了该问题[code]class="f-list-item ershoufang-list" [/code] 同时给div元素两个类,中间用空格格开,...
2018-01-24 18:03 回复了该问题方便展示下你爬下来需要删除某个标签的内容吗 如果是删除文本中的换行和空格可以用[code]get_text().strip().replace("\n...
2018-01-23 11:37 回复了该问题建议你尝试安装Twisted 可在cmd中用下载命令:[code]python -m pip install Twisted[/code]它是用Python实...
2018-01-18 10:59 回复了该问题对你的代码你可以加入验证ip是否可用 不可用换ip 这牵扯到逻辑 你已经想明白了 具体代码怎么写要根据你自己的项目
2018-01-18 10:56 回复了该问题报错的很明显,没找到win32api,你要安装win32py,下载地址 :[url]https://sourceforge.net/projects/pywin...
2018-01-18 10:54 回复了该问题设置提取规则 对链接中新的链接进行内容采集 或者用yield返回新的链接再进行爬取 [code] 核心处理规则: from scrapy.spiders i...
2018-01-18 10:39 回复了该问题[code]r.status_code == ?[/code]查看返回的状态码即可。
2018-01-18 10:37 回复了该问题拉勾网通过pn可以直接获取数据吗? 我记得拉勾网是ajax后台返回数据的吧,如果可行的话种类并行的话可以参考多进程 实现翻页爬取的话用Scrapy的深度爬取 设...
2018-01-18 10:26 回复了该问题使用lxml解析html 导入的应该是 使用etree.HTML解析html网页 [code]import urllib.request from lxml ...
2018-01-18 10:20 回复了该问题