聚类呀,我先问几个问题,你为什么要聚类呢,要有这些数据的业务含义是什么呢,有没有其他的办法解决你现在的问题呢
2016-07-29 11:54 回复了该问题这就说明了你的模型存在了过度的拟合,过度拟合的情况就是建模的情况模型效果较好,一旦运用后发误差特大,随机森林的话你要 调优有几个可以避免过度拟合;一个是模型自变...
2016-07-27 15:08 回复了该问题这儿可能得根据人工进行定义了,那根据业务去确定呢,例如,如果一堆客户订单数据,你要划分客户等级的话可能就会有多个类型,就要考虑多个不同的类别中心点,但是如果你要...
2016-07-25 08:17 回复了该问题我觉得吧在读研的同时也不忘记学习在数据挖掘中所运用的技能,毕竟读研是比较理论的东西,很多东西还是要实践才能体会得到,当你的理论知识达到一定高度的时候机器学习的运...
2016-07-11 15:26 回复了该问题如果你拥有统计学专业背景的话,我更推荐你学习R语言;R的统计思想更为的浓重,毕竟这个R语言是为统计学家而开发的
2016-07-11 15:22 回复了该问题看了你的那些数据好像都是连续型的,其实这样的话可以先试试使用一下线性回归模型试试看;看看效果如何
2016-07-07 17:12 回复了该问题我觉得你要是用时序的方法做预测只有六个月去预测下六个月有点牵强,指数平滑法为什么不能预测出下三个月,当你预测出下个月的时候不就相当于多知道了一个月么,然后继续用...
2016-07-05 22:52 回复了该问题spss貌似没法实现吧,R语言可以,叫做主成分回归模型,和你说的一样,先将数据进行主成分分析,然后建模回归模型
2016-07-05 08:22 回复了该问题reshape包中的cast函数你可以百度一下怎么用,或者你如果会用SQL的话建议使用sqldf包使用SQL语言操作,
2016-06-29 17:21 回复了该问题我不清楚你是要确定异常还是确定用电量比它平时规律中要高,如果是定义异常的话我推荐两个方法给你,一个三倍方差标准差原则,任何数据的分布几乎都在它的平均值的三倍标准...
2016-06-20 16:05 回复了该问题这个问题好宽泛,先说一下是干什么用的,支持向量机就是一个分类器,就是要用它来给你对数据进行分类,首先你得有数据去构造支持向量机,也就是我们所说的训练数据集,当你...
2016-06-15 15:02 回复了该问题