天善小编

微信直播问题收集

始于: 2015-05-03

湖南省 怀化市

发私信

139

总声望

30

次被推荐

0

粉丝

她的回答
排序:

1
投票

R语言的数据分析应该从哪方面入手练习啊?有没有学习路径推荐?

[b]张丹:[/b] R其实上手很快,找一本书,认真操作练习一遍就上手了。 [attach]19724[/attach]  

2016-07-04 10:33 回复了该问题
0
投票

做传统etl怎样能找个大数据的工作呢?

卓金武:如果您简历上写etl这类的工作经历,业内人很可能认为您是做数据管理,数据仓库之类的。但其实两者就很大的相关性,但为了更容易找打大数据的工作,所谓BI,一...

2016-06-27 20:58 回复了该问题
0
投票

在选择变量时时使用的何种方法?是根据遍历各指标的频次图,选择正常情况与异常情况频次图差别较大的变量吗?

[b]卓金武:[/b]变量筛选我一般比较喜欢相关系数法,得到的结果直观   [attach]19563[/attach] 这张图就是这个方法得到的相关...

2016-06-27 20:55 回复了该问题
0
投票

当数据的变量特别多的时候,我们一个个看是否太花时间了,判断相关的时候是否会考虑一下有些变量存在非线性相关,是否能使用功效分析确定变量更好点?

[b]卓金武:[/b]当变量多的时候,可以批量进行相关性分析,比如可以使用相关系数矩阵方法,或者定义一个评价函数,然后就可以直接一次性筛选了

2016-06-27 20:48 回复了该问题
0
投票

工业设备故障率那个案例,最终提取了哪7个特征变量?通过什么方法选择?

[b]卓金武:[/b]工具箱shmtools提出哪7个特征变量? 都是基于监控数据衍生得到的,具体衍生的方式也不同,有个Research的过程,这也是探索的价值...

2016-06-27 20:47 回复了该问题
0
投票

请问老师,python开发的爬虫脚本相比与其它语言的优势是什么?比如我一直在用C#开发

[b]Rong:[/b]package比较多,Scrapy我觉得就比较强大,少数代码就搞定了

2016-06-06 08:43 回复了该问题
0
投票

爬到的数据量太大的时候,数据分析有什么好建议?遇到加密数据怎么破?

[b]Rong:[/b]数据分析和爬虫无关,主要在于你想做什么。 你都放到 mango里面再处理就可以了。遇到加密数据怎么破? 要看具体怎么加密了, 特殊的不说...

2016-06-06 08:42 回复了该问题
0
投票

数据分析的前提不是爬虫吗?不然数据源从哪里来?

[b]Rong:[/b]爬虫可以获取一部分数据源, 不过如果网站能够提供api访问,还是走正规路径。

2016-06-06 08:41 回复了该问题
0
投票

爬虫的第一步,网络的结构具体指什么

[b]Rong:[/b]就是你访问网页的路径

2016-06-06 08:32 回复了该问题
0
投票

为什么会需要同时安装不同版本 Python

[b]Rong:[/b]有些包需要不同的python版本

2016-06-06 08:31 回复了该问题
0
投票

抓取数据时出现urlopen error no host given问题

[b]rong:[/b]这个需要具体情况具体分析了, 你能用浏览器打开吗, head有没有设置 [b]早上好啊:[/b]我设置了代理池和agent,能打开,得到...

2016-06-06 08:30 回复了该问题
0
投票

请教下,有的网页数据用js脚本返回的,页面源码没有数据怎么抓?

[b]rong :[/b]selenium + phantomjs,可以看看我这个博客 《Python网络数据采集》读后总结 --第10章抓取JavaScrip...

2016-06-06 08:28 回复了该问题
0
投票

vip占比的意义是什么呢

奥威软件PowerBI 邹斌 :VIP占比是指销售中,来自VIP会员的占多少比重,过低,说明会员做的不好,很多零售会非常关注回头率,主要是看老客户的回流情况万一...

2016-06-01 18:32 回复了该问题
0
投票

周转率的计算公式是怎样的?

张传振:出库金额/(期初+期末)/2

2016-06-01 18:24 回复了该问题
0
投票

请问有不有针对制造业工厂评价的Kpi?

奥威软件PowerBI 邹斌 :制造业的KPI主要集中在生产、质量、物控等方面,要等有机会再与大家分享了

2016-06-01 18:23 回复了该问题

改版

反馈