数据挖掘

  数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程

1
推荐
2171
阅读

数据挖掘——初学篇(一)

当今的数据行业日益成熟,大数据行业更是如日中天,数据挖掘自然也是耳熟能详了,但是其中有些地方容易对初学者或门外人产生一些误解,主要是三个部分:一、...
0
推荐
1995
阅读

可视化探索是数据挖掘的基本功

在大数据时代下,有人把数据比喻为蕴藏能量的地下石油。但你知道石油的平均采收率指标么?你知道你所拥有的数据,其中的“地质储量“有多大么?你知道自己的”挖...
0
推荐
1742
阅读

数据挖掘十大经典算法及各自优势

1. C4.5C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法.  C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:1) ...
0
推荐
3710
阅读

“KNN(K最邻近)算法”——数据分析、数据挖掘

KNN分类算法KNN(k-Nearest Neighbor algorithm )分类算法是最简单的机器学习算法之一,采用向量空间模型来分类,概念为相同类别的案例,彼此的相似度高,而...
1
推荐
2515
阅读

数据挖掘技术:客户价值分析(转)

使用RFM方法(最近购买日Recency, 各期购买频率Frequency, 各期平均单次购买金额Monetary)能够科学地预测老客户(有交易客户)今后的购买金额,再对销售毛利率、...
2
推荐
6286
阅读

“多变量分析”——数据挖掘、数据分析【初稿】

I。多重对应分析 多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换...
0
推荐
4530
阅读

假设检验——统计学基础知识点

什么是假设检验假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设...
0
推荐
1416
阅读

数据挖掘试题150道,你能答对几道呢?

一、单选题1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)A. 关联规则发现B. 聚类C. 分类D. 自然语言...
5
推荐
4136
阅读

数据挖掘系列篇(1):总结职业

       今天下半年计划把数据分析、数据挖掘、机器学习这些东西都撸一把,很可能以后就没有时间再来撸了。希望各位也能互相监督,看看今...
0
推荐
2423
阅读

Google Analytics 网址的构造

在Google Analytics里要区分百度的竞价广告和自然流量是有写困难的,Google URL Builder 可以根据自定义跟踪码来区分流量的来源 用户只要自己定义几个参数 UR...
0
推荐
2215
阅读

常见的数据科学家面试77个问题

下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。     1、你处理过的最大的数据量?你是如何处...
0
推荐
2684
阅读

市场研究的数据方法再回顾【第一章】——线性回归分析

一、线性回归方程的基本模型•线性回归方程从样本资料出发,一般利用最小二乘法,根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则,进行回归方程的...
0
推荐
2344
阅读

市场研究的数据方法再回顾【第二章】——判别分析

一、判别分析法的基本思想      判别分析包括以下两步:    1、分析和解释各类指标之间存在的差异,并建立判别函数。   ...
0
推荐
2682
阅读

市场研究的数据方法再回顾【第三章】——聚类分析

一、聚类分析的基本思想 • 聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。 •样品聚类是对事件进行聚类,或...
0
推荐
2681
阅读

市场研究的数据方法再回顾【第四章】——因子分析

一、因子分析的基本思想        因子分析是一项多元统计分析技术,其主要目的就是简化数据。它通过研究众多变量之间的内部依赖关系,探...

1878 人关注

最佳回复者

改版

反馈