knn算法也称k最近邻算法,其乃十大最有影响力的数据挖掘算法之一,该算法是一种有监督的挖掘算法,既可以解决离散因变量的分类问题,也可以做连续因变量的预...
瀑布图是反映在诸多原因和因素下,使得一个状态演变成另一个状态的过程图表,这个过程中我们可以了解哪些是导致该变化结果的主要因素,以及产生影响的强弱,R...
最近一直在研究ggplot剩余还没有涉略过的图表类型,试图挖掘出一些新的图表形式,就像是该包的作者所暗示的那样,ggplot2只是给你搭建了一个图层语法环境,至...
2017年1月份,官方发布的R包已经超过10000个,在所有官方包中,约有超过10%的包提供了获取数据的方式(路径)。同时,部分包自身包含数据集、提供API接口或者...
转载 文章来源 https://www.zhihu.com/question/23328249热图(heat map)也称热力图,是以特殊高亮的形式显示用户页面点击位置或用户所在页面位置的图...
在数据分析过程中最头疼的应该是如何应付脏数据,脏数据的存在将会对后期的建模、挖掘等工作造成严重的错误,所以必须谨慎的处理那些脏数据。脏数据的存在形...
R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提...
一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即1)if或switch分支语句2)for循环3)while循环下面就说说这几种控制流,并讲...
作者:天善特邀专家 钟轶 一个分析者,有着流浪者的灵魂。数据行业从业近12年,专注于大数据,数据分析和数据行业应用。致力于各类BI,客户画像,...
17年首更,献给这篇小短文了,文章虽短,但是经历了从数据抓取、数据清洗、数据呈现等全过程,数据主要展示2016年我国top100地级市GDP、增长率、及地区分布密...
为什么贱客呢?主要是因为apply函数家族的几个函数经常容易搞混,有时候不知道该用哪个函数才合适呢?现在我就给咱们把apply函数家族细细说来,让这个贱客变...
在数据可视化中,如果数据是三维或者不多于六维的话,那么星图就是反映数据分布得最佳图像。R的基础包里面提供了绘制星图的函数——stars()函数。每一个星图都...
自从用了ggplot2包,越来越觉得其博大精深,通过图层的概念可以绘制丰富的可视化图形,如常见的散点图、直方图、条形图、折线图等。今天就教大家如何使用ggpl...
在之前的一系列gglot2绘制条形图、折线图和散点图后,有网友问如何使用ggplot2绘制饼图。其实ggplot2并没有类似于geom_pie()这样的函数实现饼图的绘制,但ggp...
数据探索过程中往往需要了解数据的分布情况,例如上、下四分位数的位置、数据符合哪种分布等,下文将使用R的ggplot2包探索数据分布情况。绘制直方图数据探索...