牟瑞

大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我!

始于: 2013-06-09

发私信

1967

总声望

308

次被推荐

16

粉丝

他的回答
排序:

0
投票

SPSS分析因变量是多选的无序分类变量怎么分析?

这个跟啤酒和尿布的应用场景有什么区别么?至少做一个关联分析还是很容易实现的哇。

2016-06-15 08:41 回复了该问题
0
投票

适合hadoop进阶提高的书籍有哪些?

如果你已经入门了,我个人推荐还是官方的文档和其源代码,个人感觉,这是最好的提高方式。

2016-06-15 08:37 回复了该问题
0
投票

请问下 我现在在做钓鱼网站的页面特征检测,如果用python来爬取网页,这可以做么

只要能说清楚业务!肯定是可以的! 但是也别迷恋Python,Python可以作为胶水语言去黏合其他的语言,比如R~~ 爬虫的话,推荐用scrapy~

2016-06-14 14:34 回复了该问题
0
投票

kettle可能是对mongo的不熟吧,没找到有什么好方法去做删除的同步;kettle没有mongo的delete 控件

这是要问什么问题???我没看明白,谁跟谁同步?直接用mongodb语句删除不可以么?

2016-06-14 14:23 回复了该问题
0
投票

启动idle 报错这个怎么办啊 各位大神

没有遇到过这种能够情况,看下系统的错误日志。 安装的是什么版本?64位系统安装的32位的版本?

2016-06-14 14:22 回复了该问题
2
投票

请问我要用python爬取豆瓣的影评,但是那个影评在初始页面只有部分显示,要跳链接再在链接里提取文本 这个要怎么搞?

拿到这个链接地址,重新发起一个请求,把这个页面重新抓取下来。 [code]# coding=utf-8 __author__ = 'MuRui' # 引入相关...

2016-06-13 09:53 回复了该问题
0
投票

关于机器学习中训练数据x之间差值很小的解决办法?

这个比较容易吧。。你把参数的值同时都放大100倍,或者1000倍就可以了啊。。比如88.9,889。看哪个效果好,这样做不会影响最终的训练结果的。

2016-06-12 18:13 回复了该问题
0
投票

请教个问题,大家的python web都是用什么部署的,nginx么?有什么好的意见吗?

之前是有过分享的,Python web开发三大框架:django,flask,tornado,其他的框架也可以,nginx一般是做代理用的。

2016-06-12 13:42 回复了该问题
1
投票

python如何生成mobi文件?

不一定非要mobi的,你可以生成PDF文件,然后Kindle导入就可以了。Kindle也是支持PDF文件的!

2016-06-12 10:36 回复了该问题
1
投票

如何获取python的帮助文档,尤其是关于库的帮助,比如这个库中有哪些函数,或者某一个函数的具体用法

写了一篇博客,来回答你的问题,请参阅: [url]https://ask.hellobi.com/blog/marey_marey111/4099[/url] ...

2016-06-12 10:33 回复了该问题
0
投票

这两个文件夹怎么删除 有人碰到过吗

这个是git吧。。直接更新到本地,然后删除本地文件,然后再提交回去就可以了啊。

2016-06-08 10:54 回复了该问题
0
投票

问一下python和php做web开发原理是一样的吧

不知道你说的这个WEB开发原理具体是什么,按照自己的理解,简单回答下: WEB开发架构模式基本上是与语言无关的,Python也好,PHP也好,JAVA也好都可以...

2016-06-08 10:53 回复了该问题
1
投票

数据使用flash报表控件,有办法提取吗?来自数据分析群的问题

一般来说是没有办法解析flash报表控件的。 但有些场合下,我们可以尝试抓包flash报表控件背后数据获取的服务器接口,然后在爬虫运行的过程中,直接抓取服务器接...

2016-06-06 09:27 回复了该问题
1
投票

asp动态网页返回JSON数据,怎么抓取呢?

Python里面是有JSON的解析第三方包的。 import json // html是你抓下来的JSON的数据 data = json.loads(html)

2016-06-06 09:18 回复了该问题

改版

反馈