本章内容:操纵日期和缺失值熟悉数据类型的转换变量的创建和重编码数据集的排序,合并与取子集选入和丢弃变量4。1一个示例处于管理岗的男性和女性在听从上级...
数据中的离群值往往会扭曲预测结果并影响模型精度,回归模型中离群值的影响尤其大,因此我们需要对其进行检测和处理。离群值检测的重要性处理离群值或者极端...
以下将会学习到:geojson地图格式数据英国公投网页数据抓取stringdist包中的模糊匹配脱欧地图可视化的建立概述 最近最火的国际事件莫过于英国的...
2017年2月份约有145个新包在R-CRAN正式发布。本文共列举了五个类别共计22个R包,包括生物统计、数据、数据科学、统计学和工具类。希望有助于大家的学...
dplyr是R中用来进行数据操作的一个包,由Hadley...
通过本文我会展示一种将回归结果(或者输出)从R传输到Word的简单方法。 先前我曾写过一个文档,指导大家如何创建一个含有学习特征的表格并将其传输到Word上...
前言移动平均线(MA)是股市中最常用的一种技术...
本章内容:探索R的数据结构;输入数据;导入数据;标注数据在R中,这个任务包括以下两步:(1)选择其中一种数据结构来储存数据(2)将数据输入或导入这个数...
什么是不平衡问题 不平衡数据一直是业务场景比较常见的问题之一,癌症数据、欺诈数据、不合格产品数据等都是不平衡数据问题的典型应用。对于一...
对于有SQL背景的R语言学习者而言,sqldf是一个非常有用的包,因为它使我们能在R中使用SQL命令。只要掌握了基本的SQL技术,我们就能利用它们在R中操作数据框。...