1,总体和样本的数据量级差距大; 2,总体和样本各自的正反例相差比重相差很大; 3,样本的抽样规则是否符合业务(随机抽样还是分层抽样还是其他.....)
2018-03-26 20:00 回复了该问题这里是统计抽样部分的知识可能会被大数据取代,但其他统计知识还是难以撼动的,比如各种检验,各种预测分析
2016-09-29 09:53 回复了该问题均值检验针对的是数值型数据,但a1应该不属于数值型数据。你做个逻辑回归吧,看系数是否显著
2016-09-23 15:19 回复了该问题网络爬虫是按照一定的规则,从网上上进行抓取信息(数据,文本,视频等); 文本分析是对数据类型为文本的信息进行分析; 数据挖掘是从大量的数据中通过算法等搜索隐藏于...
2016-09-20 16:22 回复了该问题logistic回归的原理是利用logistic函数进行映射。而logistic函数的图形是S曲线,又叫 sigmoid曲线。
2016-09-19 09:53 回复了该问题可以参考免费课程,主成分分分析部分, https://edu.hellobi.com/course/83
2016-09-13 08:57 回复了该问题table类型?你说的列联表吧 table(var1, var2, …, varN) ##使用N 个类别型变量(因子)创建一个N 维列联表
2016-09-06 18:57 回复了该问题我没有看到具体的corr.test(),就结果而言,是错误的,正确的结果是对称的,对角线为1
2016-09-06 18:51 回复了该问题可以做,首先得检查数据的平稳性(ADF检验,甚至是协整检验)。 如果都通过了,就可以做相应的时间序列分析
2016-09-06 10:35 回复了该问题因为不知道具体业务哈,所以就数据而言,应该是异常值吧,如果不是,请结合业务进行解释。
2016-09-06 10:33 回复了该问题