天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

Scrapy安装成功后为什么scrpy -h检查却报错？

建议重新安装 [url=https://ask.hellobi.com/blog/zhiji/10180]python+scrapy安装教程[/url] 先装...

2018-01-31 14:29 回复了该问题

1

投票

soup.select如何解析带空格的class

[code]class="f-list-item ershoufang-list" [/code] 同时给div元素两个类，中间用空格格开，...

2018-01-24 18:03 回复了该问题

0

投票

Xpath为什么取不到值？

你这个xpath没写对你想要取这个页面的什么内容

2018-01-24 17:57 回复了该问题

0

投票

python3 删除标签

方便展示下你爬下来需要删除某个标签的内容吗如果是删除文本中的换行和空格可以用[code]get_text().strip().replace("\n...

2018-01-23 11:37 回复了该问题

0

投票

python中为什么相等运算符（==）的两边值相等，运算结果却为false（结果本应为true)?

一个是str 一个是int 两者是不相等的

2018-01-23 11:24 回复了该问题

0

投票

请教：如何爬在线播放的视频？

贴上网址吧具体要看它的video标签怎么生成的

2018-01-23 11:16 回复了该问题

0

投票

请问大家一下，我这个是出了什么问题？怎么解决呢？谢谢

你当前应该不在项目目录下吧需要切换到对应的项目所在文件夹，再运行crawl才行

2018-01-23 11:12 回复了该问题

0

投票

xpath能获取html类（class）名吗？

可以 [code]span/['class'][/code]

2018-01-18 11:03 回复了该问题

0

投票

问各位大神，我在安装scrapy时出现了这种错误，怎么处理？

建议你尝试安装Twisted 可在cmd中用下载命令：[code]python -m pip install Twisted[/code]它是用Python实...

2018-01-18 10:59 回复了该问题

0

投票

大神们，请教个问题，我做爬虫用的scrapy框架，使用了代理ip，目前有个问题，我用框架做爬虫每次爬取一个网址，都会从数据库中读取一个IP，这样会造成IP不够用，请问有什么办法能够设置爬取网址一直用一个IP，等IP不行了再从数据库读取下一个IP吗？

对你的代码你可以加入验证ip是否可用不可用换ip 这牵扯到逻辑你已经想明白了具体代码怎么写要根据你自己的项目

2018-01-18 10:56 回复了该问题

0

投票

前辈们，新手问个问题，学爬虫的时候安装scrapy，安装成功了，但是输入scrapy命令报错，不是很明白，里面涉及的模块都安装了

报错的很明显，没找到win32api,你要安装win32py，下载地址：[url]https://sourceforge.net/projects/pywin...

2018-01-18 10:54 回复了该问题

0

投票

scrapy需要爬取链接中链接的内容，需要怎么处理？

设置提取规则对链接中新的链接进行内容采集或者用yield返回新的链接再进行爬取 [code] 核心处理规则： from scrapy.spiders i...

2018-01-18 10:39 回复了该问题

0

投票

python 的 selenium+PhantomJS 如何知道服务器返回的是403,500，或者404？

[code]r.status_code == ？[/code]查看返回的状态码即可。

2018-01-18 10:37 回复了该问题

0

投票

使用scrapy爬取拉勾网的不同职位的数据，该怎么处理？

拉勾网通过pn可以直接获取数据吗？我记得拉勾网是ajax后台返回数据的吧，如果可行的话种类并行的话可以参考多进程实现翻页爬取的话用Scrapy的深度爬取设...

2018-01-18 10:26 回复了该问题

0

投票

4.1.1 lxml 后 from lxml import html失败怎么回事？

使用lxml解析html 导入的应该是使用etree.HTML解析html网页 [code]import urllib.request from lxml ...

2018-01-18 10:20 回复了该问题

一只写程序的猿

他关注的

他的粉丝

他的回答
排序:
时间 投票