这篇文章旨在为R语言的新手铺砖引路,行文相对基础,希望对在R语言安装上有问题的小伙伴提供帮助和指引。一、什么是 R 语言R 编程语言被广泛应用在统计科学和...
笔者最近利用决策树对贷前风控的策略进行调整和优化,因为目前的任务是降低资损,所以对好用户的误杀高一点是可以容忍的,但是任然想在降低误杀的前提下提升识...
(一) 开始筹备在深圳买房 2018年2月12号坐上上海回深圳的火车第二天开始,一直到除夕农历初五,整整一个春节8天的假期,...
本文的主要内容就是针对经典的Breast Cancer Wisconsin (Diagnostic)数据,分别通过R和Python两种语言去实现KNN分类算法。本文的R代码源于Brett Lantz的《Mac...
星巴克,诞生于美国西雅图,靠咖啡豆起家,自1971年正式成立以来,从来不打广告,却在近20年时间里一跃成为巨型连锁咖啡集团,其...
上一期我们对泰坦尼克数据进行了部分预处理和可...
Kaggle是由联合创始人、首席执行官Anthony Goldbloom和Ben Hamner于2010年在墨尔本创立,主要为开发商和数据科学家们提供举办机器学习竞赛、托管数据库、编写...
在R中经常会用到一些循环,对于数据量较小的数据,我们使用for循环之类的显循环也没发现什么弊端,但是针对数据量较大的数据,依旧使用显循环,就会发现R中的...
stringr包常用函数总结stringr包是伟大的Hadley Wickham开发的处理字符串的程序包,该包包含的函数如下图:这篇文章我会给大家举例讲解其中的几个常用函数,...
本文章的主要目的是想研究美国成年人、儿童以及青少年中肥胖人口最多的州。其次展示如何在R中使用rvest包从HTML页面中抓取数据、以及使用ggplot绘制地图。使...