R语言核心技术手册(第2版)

作者: (美)Joseph Adler(约瑟夫 阿德勒) 著,刘思喆 等译
页数: 633
定价: 99.00
出版社: 电子工业出版社
出版时间: 2014-04
购买地址: 京东   当当  

35

笔记

24

粉丝

推荐语:如果你打算用R进行统计计算和数据可视化,本书就是关于使用开源R语言(软件环境)快速解决上述问题的实用指导教程。通过本书,你将学会如何编写R函数以及借助R包进行数据预处理、可视化以及数据分析。作者用取自制医学、商业和体育领域的丰富案例对上述问题进行了讲解。

撰写笔记
夏尔康2016-12-24 11:21已经看到
第6章 R语法 6.13 条件语句
条件控制这个大部分应该都用过,IF ELSE 之类的语句,在R语言里面也有
示例
if (FALSE)"this will not be printed" else "this will be printed"
在R语言中,条件语句如果不是向量型运算,如果条件语句是由一个以上的逻辑值组成的向量,那么执行该语句时只会用到向量中的第一个元素
x <- 10
y <- c(8,10,12,3,17)
if (x根据输入不同返回的值也不同借助switch 函数
switcheroo.switch <-function(x){
switch(
x,
a='alligator',
b="near",
c="camel",
"moose"
)
}
switcheroo.switch('a')
夏尔康2016-12-21 18:58已经看到
第6章 R语法 6.11 花括号
花括号用于执行一系列表达式,并返回最后一个表达式的执行结果
f <- function(){x <-1;y <-2;x+y}
f()
夏尔康2016-12-21 18:47已经看到
第6章 R语法 6.10 括号
该运算符合函数调用的优先级相同
2*(5+2)
f <- function(x)x
2*f(5+1)
夏尔康2016-12-21 18:36已经看到
第6章 R语法 6.7 赋值操作
x <- 1
y <-list(shoes="loafers",hat='yankees cap',shirt="white")
z <- function(a,b,c){a^b/c}
z(1,2,3)
大多数赋值操作都是将一个对象赋给一个符号,R语言还有一类赋值操作语句,他们将一个对象替换转换为一个属性略有不同的新对象
dim(v) <- c(2,4)
夏尔康2016-12-21 18:27已经看到
第6章 R语法 6.6 运算顺序
R语言里面的运算优先级(高到低排序)
函数调用和分组表达式
索引和查找运算符
算术运算
比较运算
公式
赋值
帮助
夏尔康2016-12-20 21:02已经看到
第5章 R 语言概览 5.12 强制转换
在调用一个参数类型有误的时候,R会尝试转换该参数取值的类型,此外,R会视情况自动地对各内建对象类型进行转换,
假如定义一个向量
X <- c(1,2,3,4,5)
typeof(x)
修改第二个元素为字符串
x[2] <- "hat'
typeof(x)
class(x)
可以使用Asis函数来禁止强制转换
夏尔康2016-12-13 20:37已经看到
第5章 R 语言概览 5.4 函数
函数是R中特别对象,它接受一些输入对象,并返回一个输出对象,R中的所有工作都是由函数完成的,包括设定变量、数学运算和代码循环
简单的赋值操作
animals <- c('cow','chicken','pig','tuba')
向量简洁的引用方式
animals[3]
animals[4] <- 'duck'
简洁的IF-THEN 操作
if (apples>oranges) 'apples are better' else 'orangs are beeter'
夏尔康2016-12-13 20:26已经看到
第5章 R 语言概览 5.1 表达式
R代码是由一系列表达式组成
x <- 1
if (1>2) 'yes' else 'no'
x<-137 %% 3
'this expression will be printed'
exp(0+1i*pi)
c(1,2,3,4,5)[1]
夏尔康2016-12-13 20:06已经看到
第4章 R 包 4.11 创建包目录
如果想要和其他人分享代码或者数据,需要创建R包,在创建包前需要将所有的包文件存放在一个单独的目录里。通过package.skeleton函数可以创建一个合适的目录结构。
package.skeleton(bane='anRpackage',path='')
夏尔康2016-12-11 21:44已经看到
第4章 R 包 4.6 搜索R 包资源库
常见的包的安装命令
new.packages 显示所有可从资源库上获得而当前未安装的包
old.packages 显示所有已安装的包中具有新版本的包
update.packages 移除一系列已安装的R包
remove.packages 移除一系列已安装的R包
夏尔康2016-12-11 21:35已经看到
第4章 R 包 4.6 搜索R 包资源库
互联网上最大的R包资源库是CRAN和Bioconductor,Bioconductor和R是独立发布的,因此在R中大多数包在CRAN上无法找到
夏尔康2016-12-11 20:23已经看到
第4章 R 包 4.2 列示本地库中的R 包
一般加载R包我们一般都是使用library()加载,也有个类似的require函数
夏尔康2016-12-11 20:21已经看到
第4章 R 包 4.2 列示本地库中的R 包
使用getOption函数查看defualtPackages参数值,可以得到默认的加载的R包清单,使用(,packages())查看已经加载的所有R包的清单,查看已经安装的R包的清单可以(.packages(all.available=TRUE))
夏尔康2016-12-11 20:03已经看到
第4章 R 包 4.1 R 包概览
R包是由一系列函数、帮助文档和数据文件组成的文件夹,其相当于JAVA语言中的类;在使用包之前确认是否安装R包,加载过多包容易造成R语言帮助系统缓慢;若果R包里包含有相同名字的对象,会容易造成函数的混用
夏尔康2016-12-08 21:02已经看到
第3章 简短的示例 3.8 获得帮助
R语言里面获取帮助方式有好多种
help(glm)
?glm
如果使用帮助文件中的例子,可以使用example函数来自动运行他们。例如
example(glm)
可以搜索某个主题,例如“regression”,使用help.search函数
help.search("regression")
如果不记得函数名称
??regression
获取帮助文档使用
library(help="grDevices")
有些函数至少有一个指南文档
vignette("affy")
夏尔康2016-12-08 20:46已经看到
第3章 简短的示例 3.6 模型和公式
R语言内置了几个数据可视化的:graphics,grid和lattice.还可以自己安装使用计较流行的ggplot2和这个包,使用教材数据
library(nutshell)
data(field.goals)
这些数据描述美国橄榄球的射门次数,和其他相关数据
首先我们查看一下这个数据框的列名
names(field.goals)
然后调用HIST函数
hist(field.goals$yerds)---貌似执行结果错误
stripchart(field.goals[field.goals$play.type=='FG bocked']$yards,pch=19,method='jitter')
library(lattice)
data("consumption")
names(consumption)
dotplot(Amount~Year|Food,consumption)
夏尔康2016-12-08 20:06已经看到
第3章 简短的示例 3.6 模型和公式
R中,我们通常使用符号~去表示描述变量之间的关系,使用自带数据集cars这个数据
cars.lm <- lm(dist~speed,cars)
可以直接cars.lm打印结果,查看详细的结果话可以使用summary函数
夏尔康2016-12-07 21:10已经看到
第3章 简短的示例 3.4 数据结构简介
R是一种面向对象编程语言,每个对象都具有类型,此外,R中的每个对象都是某个类的成员,我们已经遇见很多个类了,字符向量,数字向量,数据库,列表以及数组
使用class()函数定义一个对象的类
class(teams)
某些函数和特定的类相关联,我们称之为方法,在R中作用不同类型的方法可以拥有相同的名字,我们称之为泛型函数
17+6
as.Date('2009-09-08')+7
夏尔康2016-12-07 20:48已经看到
第3章 简短的示例 3.4 数据结构简介
在R语言里面还有,像数组型的变量,使用array()函数,其中他的内置DIM是指定数据的纬度,还有一个就是举证使用matrix函数,还可以制定矩阵的行列;
R语言对数组的自己取值在个维度之间使用逗号分隔A[1,2]
取得第一行 A[1,]
取得第一列A[,1]
也可以引用若干行A[1:2,]
R语言还有一个列表数据结果,可以混合多种不同的类型对象List函数构造
e <- list(ting='hat',size='8.25')
e$ting
e[1]
一个列表还可以包含其他的列表
数据框是一种特殊的列表,他可以包含多个具有相同长度的向量作为其元素,每个元素相当于一个列,和现实中的很相似
teams <- c('phi','nym')
w <- c(60,2)
l <- c(70,2)
nleast <- data.frame(teams,w,l)
可以使用$获取列名
夏尔康2016-12-04 21:06已经看到
第3章 简短的示例 3.3 变量
R和大多数语言一样支持对变量赋值
X <- 1
可以对函数进行赋值,R语言提供几种不同方式对向量,可以通过元素在向量中的位置对其取值
B[1:6],B[7],等
R语言里有两种赋值操作符,一种是<- ,一种是=这个操作符将把右边的值赋给左边的符号,->赋值相反的一个符号;
在R中,函数也可以做一个对象赋值给某个符号,可以定义一个属于自己的函数
F <- function(x,y){c(x+1,y+1)}

目录

前言 xvi
第1 章获取和安装R
1.1 R 版本
1.2 R 的安装
1.3 Windows
1.4 Mac OS X
1.5 Linux 和UNIX 系统
第2章R 的用户界面
2.1 R 的图形用户界面
2.2 Windows
2.3 Mac OS X
2.4 Linux 和UNIX 程序
2.5 R 控制台
2.6 命令行编辑
2.7 批处理模式
2.8 在Excel 中使用R
2.9 RStudio
2.10 其他运行R 的方式
第3章 简短的示例
3.1 基本操作
3.2 函数
3.3 变量
3.4 数据结构简介
3.5 对象和类
3.6 模型和公式
3.7 图表
3.8 获得帮助
第4章 R 包
4.1 R 包概览
4.2 列示本地库中的R 包
4.3 加载R 包
4.4 在Windows 和Linux 系统下加载R 包
4.5 在Mac OS X 系统下加载R 包
4.6 搜索R 包资源库
4.7 搜索网络上的R 包资源库
4.8 基于R 界面搜寻和安装包
4.9 从其他资源库安装R 包
4.10 定制R 包
4.11 创建包目录
4.12 创建R 包
第5章 R 语言概览
5.1 表达式
5.2 对象
5.3 符号
5.4 函数
5.5 在赋值语句中,对象会被复制
5.6 R 中一切皆为对象
5.7 特殊值
5.8 NA
5.9 Inf和-Inf
5.10 NaN
5.11 NULL
5.12 强制转换
5.13 R解释器
5.14 观察R是如何工作的
第6章 R语法
6.1 常量
6.2 数值向量
6.3 字符向量
6.4 符号
6.5 运算符
6.6 运算顺序
6.7 赋值操作
6.8 表达式
6.9 分离型表达式
6.10 括号
6.11 花括号
6.12 控制结构
6.13 条件语句
6.14 循环
6.15 访问数据结构
6.16 数据结构操作符
6.17 通过整数向量引用
6.18 通过逻辑向量引用
6.19 通过名字进行引用
6.20 R编程标准
第7章 R对象
7.1 基本对象类型
7.2 向量
7.3 列表
7.4 其他对象
7.5 矩阵
7.6 数组
7.7 因子
7.8 数据框
7.9 公式
7.10 时间序列
7.11 Shingl 对象
7.12 日期和时间对象
7.13 连接对象
7.14 属性
7.15 类
第8章 符号和环境
8.1 符号
8.2 环境
8.3 全局环境
8.4 环境和函数
8.5 调用堆栈
8.6 在不同的环境中对函数求值
8.7 向环境中添加对象
8.8 异常
8.9 提示错误
8.10 捕获错误
第9章 函数
9.1 函数的关键字
9.2 参数
9.3 返回值
9.4 函数参数
9.5 匿名函数
9.6 函数的属性
9.7 参数顺序和具名实参
9.8 副作用
9.9 改变其他环境
9.10 输入/输出
9.11 图形
第10章 面向对象编程
10.1 R的面向对象编程概览
10.2 核心概念
10.3 实现的例子
10.4 R的面向对象编程:S4
10.5 类的定义
10.6 对象的新建
10.7 槽的存取
10.8 对象的操作
10.9 创建强制转换方法
10.10 方法
10.11 方法的管理
10.12 基本类型
10.13 更多的帮助
10.14 守旧派的OOP:S3
10.15 S3的类
10.16 S3方法
10.17 在S4的类中使用S3的类
10.18 查找隐藏的S3方法
第11章 数据的存取和编辑
11.1 在R中输入数据
11.2 用R命令输入数据
11.3 用图形界面输入数据
11.4 保存和读入R对象
11.5 用save 保存对象
11.6 从外部文件导入数据
11.7 文本文件
11.8 其他软件
11.9 导出数据
11.10 从数据库获取数据
11.11 RODBC
11.12 导出然后导入
11.13 数据库连接包
11.14 DBI
11.15 TSDBI
11.16 从Hadoop中获取数据
第12章 准备数据
12.1 合并数据集
12.2 粘贴数据结构
12.3 通过共同字段合并数据
12.4 数据转换
12.5 变量重新赋值
12.6 转换函数
12.7 对对象的每个元素进行函数运算
12.8 数据分段
12.9 shingle
12.10 Cut
12.11 利用分组变量合并对象
12.12 子集
12.13 中括号索引的方式
12.14 subset函数
12.15 随机抽样
12.16 汇总函数
12.17 tapply与aggregate
12.18 用rowsum聚合表格
12.19 计数
12.20 数据修整
12.21 数据清洗
12.22 查找和删除重复数据
12.23 排序
第13章 图形
13.1 R Graphics 概述
13.2 散点图
13.3 时间序列
13.4 柱状图
13.5 饼图
13.6 分类数据绘图
13.7 三维数据
13.8 绘制分布图
13.9 箱线图
13.10 画图设备
13.11 自定义图形
13.12 绘图函数常见参数
13.13 图形参数
13.14 基本图形函数
第14章 Lattice绘图
14.1 历史
14.2 lattice包概述
14.3 lattice的工作原理
14.4 例子
14.5 使用lattice函数
14.6 定制面板函数
14.7 高级lattice函数
14.8 单一的网格作图
14.9 二元网格作图
14.10 三元图
14.11 其他图形
14.12 定制lattice图
14.13 lattice函数的常用参数
14.15 trellis.skeleton
14.16 指定如何绘制坐标轴
14.17 参数
14.18 plot.trellis
14.19 strip.default
14.20 simpleKey
14.21 低级函数
14.22 低级绘图函数
14.23 面板函数
第15章 ggplot2
15.1 一个简短的介绍
15.2 图形语法
15.3 一个更复杂的例子:医保数据
15.4 快速绘图
15.5 用ggplot2绘图
15.6 更多信息
第16章 数据分析
16.1 描述性统计
16.2 相关系数和协方差
16.3 主成分分析
16.4 因子分析
16.5 bootstrap重抽样
第17章 概率分布
17.1 正态分布
17.2 常见分布的参数
17.3 分布函数族
第18章 统计检验
18.1 连续型数据
18.2 基于正态分布的检验
18.3 不依赖分布的检验
18.4 离散数据
18.5 比例检验
18.6 二项式检验
18.7 列联表检验
18.8 列联表非参数检验
第19章 功效检验
19.1 实验设计示例
19.2 t检验实验设计
19.3 比例实验设计
19.4 方差分析设计
第20章 回归模型
20.1 简单的线性模型示例
20.2 拟合模型
20.3 指定模型的工具函数
20.4 获取模型信息
20.6 k近邻
20.5 更新模型
20.6 lm 函数的详述
20.7 最小二乘回归的假设
20.8 稳健回归和阻力回归
20.9 子集选取和Shrinkage回归
20.10 变量的逐步选取
20.11 岭回归
20.12 Lasso和最小角回归
20.13 弹性网络
20.14 主成分回归和偏最小二乘回归
20.15 非线性模型
20.16 广义线性模型
20.17 glmnet包
20.18 非线性最小二乘
20.19 生存模型
20.20 平滑
20.21 样条线
20.22 拟合多项式曲面
20.23 核平滑
20.24 回归的机器学习算法
20.25 回归树模型
20.26 MARS算法
20.27 神经网络
20.28 投影寻踪回归
20.29 广义可加模型
20.30 支持向量机
第21章 分类模型
21.1 线性分类模型
21.2 logistic回归
21.3 线性判别分析
21.4 对数线性模型
21.5 机器学习分类模型
21.7 分类树模型
21.8 神经网络
21.9 支持向量机
第22章 机器学习
22.1 购物篮分析
22.2 聚类
22.3 距离度量
22.4 聚类算法
第23章 时间序列分析
23.1 自相关函数
23.2 时间序列模型
第24章 优化R程序性能
24.1 R程序性能的测量R程序性能的测量
24.2 时间测定
24.3 性能分析
24.4 监控内存的使用
24.5 内存性能分析
24.6 优化你的R代码
24.7 使用向量操作
24.8 R中查找的性能
24.9 使用数据库查询大数据集
24.10 内存预分配
24.11 清理内存
24.12 大数据集的函数
24.13 加速R的其他方法
24.14 R字节码编译器
24.15 高性能的R版本
第25章 Bioconductor
25.1 例子
25.2 加载原始的表达数据
25.3 从GEO读取数据
25.4 匹配表型数据
25.5 分析表达数据
25.6 关键的Bioconductor包
25.7 数据结构
25.8 eSet
25.9 AssayData
25.10 AnnotatedDataFrame
25.11 MIAME
25.12 Bioconductor包使用的其他类
25.13 如何进一步学习
25.14 Bioconductor之外的资源
25.16 教程
25.17 课程
25.18 相关图书
第26章 R和Hadoop
26.1 R和Hadoop
26.2 Hadoop简介
26.3 R Hadoop
26.4 Hadoop streaming
26.5 了解更多
26.6 一些其他的用R做并行计算的包
26.7 Segue
26.8 doMC
26.9 从哪里我们可以了解更多
参考文献
索引

改版

反馈