数据挖掘

  数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程

0
推荐
2313
阅读

使用Python爬取网页图片

近一段时间在学习如何使用Python进行网络爬虫,越来越觉得Python在处理爬虫问题是非常便捷的,那么接下来我就陆陆续续的将自己学习的爬虫知识分享给大家。首...
6
推荐
6491
阅读

Python爬取链家北京二手房数据

今天分享一下前段时间抓取链家上北京二手房数据的项目。本次分享分为两部分,第一部分介绍如何使用scrapy抓取二手房数据,第二部分我将抓下来的数据进行了一...
2
推荐
1700
阅读

寒冬之下,互联网金融的数据化建设心得

序一:行业回顾互联网金融从2007年开始发展,短短数年,经历了波峰波谷的骤然转变。2007年到2013年上半年还处于发展缓慢,逐步破土的阶段;2013年到2015年上...
1
推荐
1552
阅读

R语言之矩阵操作

R语言作为一门统计语言,肯定缺少不了矩阵处理。下面是我参考《R语言与数据挖掘》总结出来以下关于矩阵运算的函数,其中包括矩阵的求和,转置,等。+, -, * ,...
1
推荐
3615
阅读

SAS之逻辑库、数据集和变量

SAS通过DATA步获取外部数据、处理和管理数据,然后通过PROC步对其进行统计分析、预测和优化。在此我们先了解一些关于逻辑库、数据集和变量的一些知识、概念。...
2
推荐
1986
阅读

数据 | 今年春节档电影,在失望中逆袭

今年大年初一同时有五部国产片同时上映,竞争异常惨烈,他们是西游伏妖篇 | 功夫瑜伽 | 大闹天竺 | 乘风破浪 | 熊出没之奇幻空间。《西游伏妖记》也以3.5亿创...
2
推荐
2058
阅读

你绝对想不到,数据地图还能这么玩~

这个周末刷微信的时候,偶然看到一篇关于R语言12月更新包的介绍,翻到底部看了一眼,刚好看到一个关于ggplot2的一个图层插件——geom_scatterpie。这个包安装之...
5
推荐
5292
阅读

数据科学家成长指南(上)

少年,你渴望力量么?这才是真正的力量,年轻人!这是Swami Chandrasekaran所绘制的一张地图。名字叫MetroMap to Data Scientist(数据科学家之路),别称怎...
2
推荐
2094
阅读

最全微信红包数据解读

今天微信公布除夕的红包数据,1月27日除夕夜,从零点到24点,微信用户共收发红包142亿个,红包收发比猴年增长75.7%,24:00祝福达到峰值,收发达到每秒76万个...
1
推荐
2171
阅读

吉林说R系列 | 第六篇:分类问题

本人一直向往那种指点江山的人的霸气,却只能望其项背,从未能够达到。最近R语言大会开的如火如荼,一场又一场不停歇,可惜我都没有去参加,那都是牛人、大咖...
3
推荐
1950
阅读

吉林说R系列 | 第五篇:数据管理

前些日子,一位贾姓朋友加我微信,问R语言中数据管理的问题,其实多多少少在前面的几篇文当中都有涉及了,今天索性来个系统的介绍,以抛砖引玉,还请各位大神...
1
推荐
3206
阅读

吉林说R系列第三篇(下):数据的分布、处理及模拟

本文作者:王吉林(十一)指数分布指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0...
4
推荐
4584
阅读

吉林说R系列第三篇(上):数据的分布、处理及模拟

引言最近常看papi酱的周一放送,觉得很喜欢,她每次都可以从不同的角度,用欢乐的、幽默的、讽刺的语言搭配搞笑的、发人深省的动作揭示生活中各种现实问题,...
3
推荐
1884
阅读

吉林说R系列第二篇:如何进行数据读写

1.引言本周在刷微博的时候看到一篇博文叫做《一个农村女孩的自由》,写的真实感人,其内容折射出了中国农村很长一段时间的现状。人生的选择很多,选择代表了...
4
推荐
2086
阅读

吉林说R图系列|第一篇:如何绘制各类图形

引言六月一个星期六的晚上,我静静地坐在顺德图书馆文筑书店的一张书台前看书,伸懒腰之际,无意间看到了龙应台的书籍(人生三本书),我随手拿起其中的一本—...

1878 人关注

最佳回复者

改版

反馈