生成模型与判别模型监督学习的任务就是学习一个模型,这个 模型一般是决策函数:或者条件概率分布:分类监督学习的方法分为两类:生成方法判别方法生成方法生...
贝叶斯定理太有用了,不管是在投资领域,还是机器学习,或是日常生活中高手几乎都在用到它。我准备花一个系列,从下面4个方面来科普下贝叶斯定理:1.贝叶斯...
昨天万众瞩目的2017NBA总决赛G1,想必各位JRs们都看了吧?不是骑士不尽力,奈何对面有高达,比赛结果是书包杜和打卡库双星闪耀先下一城。...
把世界上的70亿人想象成100人,然后按各种百分比的统计数据来看,就变得有点意思了。统计数据看起来会是这样的:11人在欧洲、5人在北美洲、9人在南美洲、15人...
大数据时代如何活用数据可视化、大数据与众包、群体智慧、贝叶斯方法等为失联搜救出谋献策?请看下文。引子“MH370”作为航班代码,是近日震惊世界的马来西亚航...
引言数月前,广受好评的“十大原则”系列(“Ten Simple Rules” series)的创始人和长期作者Phil Bourne建议一些统计学家写一篇关于统计学“十大原则”的文章。(既...
概率与统计分析描述性分析用一个数字描述一组数字的特征。用一个数字来归纳一组数字,这个数字称为统计量或统计指标。均值、中位数:描述一组数据的集中趋势...
1. 学习理解什么是极大似然估计似然函数:设样本 X 有概率函数 f(x,θ),这里 θθ为参数,在参数空间内取值。当固定 x 而把 f(x,θ)f看成 θ...
这是浩彬老撕自己的学习书单,希望能够帮助大家更好更快地理解数据科学,同时也希望继续完善自己。#关于这份学习清单#我会按照基础到入门给出详细推荐,并且...
毫无疑问,数据的集中趋势和离散趋势是数据分布的最主要两个特征。因此,我们常常会借助算术平均数,中位数,方差,四分位数等...
简单线性回归是最基础的一种回归模型,自变量只有一个,函数曲线为直线,因变量为连续型,自变量可以是连续的或者是离散的。函数表示如下:其中 y 是因变量,...
均值:为什么会有均值?背景:从一大堆数字中看出模式和趋势可能颇为不易,而求出平均数往往是把握全局的第一步。有了平均数就能迅速找出数据中最具代表性的...
1简单自回归模型当X具有间隔为1的自相关系数时,滞后值X(T-1)可能会在预测X(T)时有用,下面的简单模型可以利用这样的预测功能其中a(t)是均值为0,方差为常...
聚类分析是一类将研究对象进行分类的统计方法。 思路:这一类方法的共同特点是:事先不知道类别的个数与结构;据以进行分析的数据是对象之间的相...
最近做了一个客户分析,想了好久,最终也没做出有啥技术含量的东东,其中用了一下聚类分析,感觉还算是体现了那么一点点的统计...