机器学习

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

3
推荐
2028
阅读

ipython qtconsole matplotlib pylab撒么子

参考 http://hyry.dip.jp/tech/book/page/scipynew/ipython.htmlIPython-最佳Python交互环境一直以来IPython被当作Python自带的命令行的加强版使用,它提供了...
2
推荐
2281
阅读

train set, validation set, and test set

1. train set, validation set, test set先把样本分成train set和test set。再对train set分出validation set做交叉验证。train set:训练模型参数validation ...
1
推荐
2562
阅读

caffe对图片提取特征

一、生成lmdb格式文件实际经常碰到图片大小不一致,如何从原始图片文件转换成caffe中能够运行的db(leveldb/lmdb)文件?1. 创建图片列表清单,包含类标签,存...
3
推荐
2441
阅读

ultraEdit高亮python语法

1.从http://www.ultraedit.com/downloads/extras.html#wordfiles根据目标版本,下载相应的python语法文件2.如果需要支持更多的扩展名,打开wordfiles文件,在...
3
推荐
1919
阅读

Firefox浏览器缓存目录位置

1. about:cache查看默认缓存目录2. about:config右键新建字符串browser.cache.disk.parent_directory,值为d:\tmp右键新建字符串browser.cache.offline.paren...
4
推荐
2728
阅读

禁止QPCore Service自启动

QPCore Service跟QQ程序捆绑在一起,不能删除,否则qq也不能用了,每次开机自启动,甚是流氓。症状:1. 开机自启动,且服务和注册表里禁止修改。2. 每次使用q...
3
推荐
2936
阅读

案例+课件下载 | 品质课件!机器学习技术在Python 语言的商业应用

1、本文是12月15日(周四晚)机器学习技术在Python 语言的商业应用的课件;2、12月22日韦玮老师主讲《Spark网站流量异常大规模检测案例实战》直播地址:http:...
0
推荐
1819
阅读

你不得不知道的机器学习十大算法(二)

6PageRank算法是google的页面排序算法,是基于从许多优质的网页链接过来的网页,必定还是优质网页的回归关系,来判定所有网页的重要性。(也就是说,一个人有...
1
推荐
1776
阅读

你不得不知道的机器学习十大算法(一)

1、C4.5算法:ID3算法是以信息论为基础,以信息熵和信息增益度为衡量标准,从而实现对数据的归纳分类。ID3算法计算每个属性的信息增益,并选取具有最高增益的...
1
推荐
5185
阅读

【干货】深度学习Meetup演讲速记(四)——深度学习在图像处理中的应用简介

深度学习在图像处理中的应用简介作者:周昌​ 编者按  8月27日,星环科技与深度学习国际交流群举行首次深度学习Meetup,共有四位嘉宾进行了精彩的...
1
推荐
1899
阅读

三个框架与库,SFrame,Hdp2与skflow

今天给各位亲推荐数据科学的三个框架或者库。01 SFrame这家公司最初的名字叫graphlab,后来改名为dato,最近又进行了一次改名,叫turi了,这名字起得,图日吗...
4
推荐
3864
阅读

【强推】数据挖掘比赛通用框架

【原创,转载请注明来自公众号『数据挖掘机养成记』并注明作者『穆文』】1. 前言Kaggle上有篇名为「Approaching (Almost) Any Machine Learning Problem」的...
6
推荐
4980
阅读

自学机器学习、数据挖掘的几点建议

【原创,若要转载,请注明:来自微信公众号“数据挖掘机养成记”】前言背景:一直有朋友希望我能介绍下自学机器学习、数据挖掘的经历,然而当我认真回首研究生...
0
推荐
2778
阅读

合理设置Spark数据分区

在Hadoop的map-reduce编程模型中,框架要做的第一步事情,也是对数据进行分块切分,然后对每块数据调用mapper程序进行处理,mapper处理完将结果交给reducer进...
5
推荐
1945
阅读

《全栈数据之门》初稿完成

《全栈数据之门》(暂定书名)是末学近5年来工作技能的积累,从8个月前开通公众号写的第一篇起,中间也不知度过了多少个寂寞的夜晚。写文章本来就是一个很费...

1588 人关注

最佳回复者

改版

反馈