[b]张丹:[/b] R其实上手很快,找一本书,认真操作练习一遍就上手了。 [attach]19724[/attach]
2016-07-04 10:33 回复了该问题卓金武:如果您简历上写etl这类的工作经历,业内人很可能认为您是做数据管理,数据仓库之类的。但其实两者就很大的相关性,但为了更容易找打大数据的工作,所谓BI,一...
2016-06-27 20:58 回复了该问题[b]卓金武:[/b]变量筛选我一般比较喜欢相关系数法,得到的结果直观 [attach]19563[/attach] 这张图就是这个方法得到的相关...
2016-06-27 20:55 回复了该问题[b]卓金武:[/b]当变量多的时候,可以批量进行相关性分析,比如可以使用相关系数矩阵方法,或者定义一个评价函数,然后就可以直接一次性筛选了
2016-06-27 20:48 回复了该问题[b]卓金武:[/b]工具箱shmtools提出哪7个特征变量? 都是基于监控数据衍生得到的,具体衍生的方式也不同,有个Research的过程,这也是探索的价值...
2016-06-27 20:47 回复了该问题[b]Rong:[/b]package比较多,Scrapy我觉得就比较强大,少数代码就搞定了
2016-06-06 08:43 回复了该问题[b]Rong:[/b]数据分析和爬虫无关,主要在于你想做什么。 你都放到 mango里面再处理就可以了。遇到加密数据怎么破? 要看具体怎么加密了, 特殊的不说...
2016-06-06 08:42 回复了该问题[b]rong:[/b]这个需要具体情况具体分析了, 你能用浏览器打开吗, head有没有设置 [b]早上好啊:[/b]我设置了代理池和agent,能打开,得到...
2016-06-06 08:30 回复了该问题[b]rong :[/b]selenium + phantomjs,可以看看我这个博客 《Python网络数据采集》读后总结 --第10章抓取JavaScrip...
2016-06-06 08:28 回复了该问题奥威软件PowerBI 邹斌 :VIP占比是指销售中,来自VIP会员的占多少比重,过低,说明会员做的不好,很多零售会非常关注回头率,主要是看老客户的回流情况万一...
2016-06-01 18:32 回复了该问题