好的,接下来的两个月时间后,尽量安排多点实际案例跟大家分享,提升大家的实战经验。
2016-08-20 23:13 回复了该问题看中应聘者的分析思维能力,看他是否具有创造性思维,能否在工作中带来新idea;还有就是他的基本技能。
2016-08-20 23:13 回复了该问题是工具、方法论、实际案例三者结合一起来综合授课。在上课过程中会用综合案例把学到的知识串联起来。
2016-08-20 23:11 回复了该问题大型超市数据可以使用关联规则进行购物篮分析,或者研究用户偏好,可以做的点有很多。
2016-08-20 23:09 回复了该问题R可以连接数据库实现数据互通,利用ROBDC扩展包就是非常好用的包,能连接SQL Server、Oracle、MySql等常用的数据库。
2016-08-20 23:08 回复了该问题R有非常多的扩展包来帮助我们完成复杂的数据分析挖掘工作。例如近几年非常火热的数据可视化,R就可以调用js库、百度图库直接绘制交互图,利用扩展包shiny实现快速...
2016-08-20 23:07 回复了该问题有了分析主题就有分析方向了,你就知道是做用户分群还是数据预测类的研究,这样就根据自己选择的模型算法,把数据源整理成模型可以跑的数据去尝试。基本流程就是:业务理解...
2016-08-20 23:05 回复了该问题多看一些大牛的博客,还有多逛逛数据分析论坛,培养自己对数据的敏感度和分析思维,最好能补下基础的统计学基础。
2016-08-20 23:02 回复了该问题有时候我们做相关性分析、线性回归模型时,会要求变量(自变量)为数值型变量,此时我们需要将因子型变量转换成数值型变量,即进行哑变量的虚拟化处理,衍生出新的数值型变...
2016-08-20 23:00 回复了该问题并行,结合其他的工具(RHadoop,sparkR),或者用supR、微软的大数据解决工具MRO
2016-08-05 17:41 回复了该问题可以简单通过Error率查看模型是否存在过拟合或欠拟合来确定随机森林的各参数
2016-08-05 17:40 回复了该问题对于初学者,可以借助rattle包调出R Data Miner这个可视化数据挖掘工具,通过点鼠标的方式进行数据挖掘工作并可以通过Log查看R脚本。
2016-08-05 17:39 回复了该问题