R语言

  R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

2
推荐
1819
阅读

用数据来聊聊国产电影~

最近国产电影评分风波引起了很多人的关注,豆瓣和猫眼因国产电影评分过低此被电影局约谈了,猫眼电影还因此下线了自己的专业评分系统,作为好奇宝宝,小魔方...
1
推荐
2915
阅读

R语言| 使用REmap绘制超炫酷的地图

  REmap这个包是通过调用百度地图API的一个程序包,与Google的ggmap包相比,不用翻墙就可以使用。其函数主要有:remap(),remapB()、remapC()、remapH()...
4
推荐
2337
阅读

借助caret包实现特征选择的工作

前言我们有一期的文章讲述了如何使用caret包进行数据的预处理,其中内容包括哑变量的创建、近零方差变了的筛选、数据标准化、缺失值处理、数据分割等。可以在...
1
推荐
2076
阅读

用数据解读摩羯智投

前言进入2016年,伴随世界经济危机的到来,中国互联网创业,也在经历长时间的寒冬,有不少的公司都因资金链断裂,停止了运营。与寒冬反差很大的是,AI技术却...
3
推荐
2190
阅读

浅谈C5.0与CART算法的比较--理论理解

一、决策树的发展决策树是目前比较流行的一种分类算法,实质上是一种自上而下的归纳学习算法。该算法最早由Quinlan在1986年提出,当时称为ID3算法,该算法是...
1
推荐
2656
阅读

15分钟学会数据地图分析

什么都不说,先上一张最终的数据地图效果图,热力图部分是目标用户的分布,紫色和蓝色的购物车表示2种类型的商业购物场所。而深浅不一的蓝色格子块则代表房价...
1
推荐
2818
阅读

运用R分析全唐诗与全宋词

宋词词云分析步骤主要由三部分构成:资料收集、词频统计、对比分析从网上共搜集唐诗4.8万首,宋词1400首;进过预处理过程之后,对其进行分词与词频统计,各取...
3
推荐
2843
阅读

借助tesseract包实现图片文本提取功能

2016年11月,Jeroen Ooms在CRAN发布了tesseract包,实现了R语言对简单图片的文本提取、分析功能。利用开源OCR引擎进行图片处理,目前可以识别超过100种语言,...
2
推荐
1844
阅读

快讯| 12月R 新包发布

12月份,CRAN总计新增217个新包。这是过去9年以来数量增加最多的一个月。下文主要简单介绍其中部分R包,包括六个类别:数据类、数据科学、金融分析、统计类、...
2
推荐
1752
阅读

R文本挖掘初探之“天下风云出我辈, 一入江湖岁月催”(2)

原计划的4、5基本不打算去操作了,因为没有用到新的东西。这贴就记录下实现的过程,以及用到的知识和工具,期间遇到的各类问题及解决也会出现在这里。起先,...
13
推荐
13701
阅读

如何七周成为数据分析师

写这个系列,是希望在当初知乎某一个回答的基础上,单独完善出针对互联网产品和运营们的教程。不论对数据分析或数据运营,我都希望它是一篇足够好的教材。得...
1
推荐
1577
阅读

收藏 | 全球大数据7大阵营,你都知道吗?

近几年,大数据行业已经逐渐成熟,在也不是大家谈之缥缈的行业,目前国内外从事这一行业的企业多入牛毛,但能称的上权威和代表,也都数的过来,下面我们就目...
3
推荐
2881
阅读

量化投资教程:用R语言打造量化分析Web平台

概述和Python计算环境中的tushare包一样,在R中我们使用quantmod包接入第三方数据源,实现自定义量化分析平台的构建。本文打算以陌陌的股票分析为背景,介绍...
3
推荐
2178
阅读

RStudio IDE,那些你容易忽视的技巧

The RStudio IDE 最新版本1.0已经发布,经过多个重要版本的迭代,增加了很多核心功能:创建项目、R包创建等,同时也有很多小功能并不明显,本文主要简单展示...
4
推荐
1585
阅读

快讯| RStudio Connect 发布

RStudio公司最新推出最新产品:RStudio Connect.现在即可下载并免费试用45天! RStudio Connect是一个全新发布的平台,可以实现团队所有的工作在R中集...

1176 人关注

最佳回复者

改版

反馈