确定业务目标后(目标变量),需要依据业务知识来列出合适的自变量,做一下相关性分析和方差分析,删掉重复解释变量(相关性很高>0.8)和一些没用的变量(方差贡...
2016-08-01 15:44 回复了该问题看你做了什么转换咯,编码问题可以试一试iconv函数 > x <- "fa\xE7ile" > x [1] "f...
2016-08-01 15:37 回复了该问题试一下iconv函数 > x <- "fa\xE7ile" > x [1] "fa鏸le" > ...
2016-08-01 15:30 回复了该问题还有一种简单暴力的方法,直接用==就好,然后sum统计个数,大于0,则表示存在,这种方式还适用找大于某元素,小于某元素的情况 比如上述的例子 > x1&l...
2016-08-01 15:23 回复了该问题很正常啊,现在经济形势不稳定,很多大型公司都是多元化经营,国电还有房地产业务呢,但一般都是以子公司或分公司的形式存在,对于这种类型公司,首先要区分主营业务和营业...
2016-07-27 09:08 回复了该问题多维分析是BI里面的概念,多元分析是统计学的概念 在BI中,多维分析指从不同的角度分析一个对象,比如销售额,可以从产品的角度分析,也可以从地区的角度分析 多元分...
2016-07-27 09:01 回复了该问题楼主是不是想问怎么确定K值啊,确定K值目前也是聚类算法的一个难点,没有通用的方法,都需要根据所选的算法,并结合分析目的来定,对于K-means,目前比较通用的方...
2016-07-27 08:50 回复了该问题就用社交网络图呗,echart有这个组件,很多BI工具也有
2016-07-27 08:42 回复了该问题一般来说如果所有的样本点都在95%的置信区间曲线内,就可以算是通过正态分布检验,这算不算是“a reasonable straight line” 现在一般都...
2016-07-26 13:54 回复了该问题本身hive就是一个数据库,有对应的JDBC jar包,因此R语言可以通过RJDBC包来访问hive 大概是这个步骤: library("rJava&...
2016-07-26 13:02 回复了该问题