R语言

  R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

0
推荐
1766
阅读

R文件系统管理

文件系统交互的重要性文件系统管理是存储和组织我们的数据的方法。在数据科学项目中频繁地接触到文件夹和文件管理。如在爬虫项目中,涉及工作路径的设置,文...
0
推荐
4475
阅读

变量选择之SCAD算法

SCAD的提出据说学术界有一种现象叫做『大牛挖坑,小牛灌水』。而我等『小菜』就只有『吹水』的份了。不过还真不要小看本『小菜』,根据著名的『六度分割理论...
0
推荐
2541
阅读

SQL及关系型数据库入门

什么是关系型数据库及数据库管理系统数据库(Database)是一种数据的组织和存储方式,通常用于处理结构化的数据。而关系型数据库(Relational Database)指的是创...
0
推荐
2039
阅读

R中的正则表达式及字符处理函数总结

我们日常生活中接触到的大部分数据都是以文本的形式存在。如何高效地处理文本数据,将看似杂乱无章的数据整理成可以进行统计分析的规则数据,是『数据玩家』...
0
推荐
4182
阅读

R文本挖掘之tm包

认识tm包tm包是R文本挖掘方面不可不知也不可不用的一个package。它提供了文本挖掘中的综合处理功能。如:数据载入,语料库处理,数据预处理,元数据管理以及...
0
推荐
3154
阅读

R文本分类之RTextTools

RTextTools简介古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。它集成了(或者说支持)如下算法...
0
推荐
1860
阅读

R字符串处理应用之邮件考勤自动化

引言最近发现,担任助教真不是一件轻松的事情啊。虽然老师一直在想方设法减轻我的工作负担,可是核对名单真的是一件考验眼力和耐力的事情。最近有一件非常艰...
0
推荐
2226
阅读

广义线性模型中的Gauss Seidel 迭代算法实现

数值模拟的算法迭代公式推导R代码实现根据以上公式,代入迭代步骤,即可实现算法。##------数据模拟-------- library(MASS) ##mvrnorm() ##定义一个产生多...
1
推荐
3044
阅读

RHadoop实践系列之二:RHadoop安装与使用

第二篇 RHadoop安装与使用部分,分为3个章节。1. 环境准备 2. RHadoop安装 3. RHadoop程序用例 每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明...
1
推荐
2609
阅读

RHadoop实践系列之一:Hadoop环境搭建

第一篇 Hadoop环境搭建部分,分为3个章节。Haddop环境准备 Hadoop完全分步式集群搭建 HDFS测试 每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明...
5
推荐
2219
阅读

R数据处理|data.table篇(一)

概述data.table包是一个超高性能处理包,在数据处理上代码异常简洁,速度非常快。由于data.table的语法主要基于[],有些用法和基础函数会不一致,所以没有放...
3
推荐
2062
阅读

使用R绘制其他图形之热图及网络图

热力图是一种非常常用的统计图形,该图将两个变量(一般是离散变量)的交叉汇总信息以颜色的形式展现出来,而映射给颜色变量的是连续型数值变量,下面就以例...
2
推荐
2019
阅读

使用R绘制几种常用的双坐标轴图形

之前公众号推送了一系列关于使用ggplot2包绘制统计图形的文章,有网友询问是否可以绘制双轴的统计图形。很抱歉,Hradly在设计ggplot2包时就没有将双轴图形功...
1
推荐
2244
阅读

使用R语言实现数据分段

今天跟大家讲讲我工作中用到的数据分段,数据分段一般在什么地方会使用到呢?评分。之前写过一篇实战: RFM模型使用,那篇文章就详细介绍了CRM(客户关系管理...
0
推荐
2716
阅读

干货--线性回归模型与CART树的比较

有关CART算法的理论这里不再赘述,可参考《浅谈C5.0与CART算法的比较--理论理解》,线性回归的理论部分也不过多讲解,可以参考我之前写的文章《R语言下的线性...

1176 人关注

最佳回复者

改版

反馈