作者简介浩彬老撕,R语言中文社区特邀作者,好玩的IBM数据工程师,立志做数据科学界的段子手。个人公众号:探数寻理在大数据时代下,数据科学家可说是当下最...
总第115篇前言聚类是一种非监督学习,是将一份给定数据集划分成k类,这一份数据集可能是某公司的一批用户,也可能是某媒体网站的一系列文章,如果是某公司的...
个性化推荐系统实现该系统主要是使用的编程语言主要是R,然后配合css在样式上进行一定优化,使用shiny开发的一款web程序,主要实现的核心功能是基于spark的AL...
作者:Joseph Rickert翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职网易杭州6月份,144个R新包收录于CRAN。其中31个是专门针对特定学科或...
作者:师爷,R语言中文社区作者知乎专栏:https://zhuanlan.zhihu.com/rstudio交互式文档是一种创建Shiny apps的新途径。交互式文档是一种包含Shiny控件与输...
作者简介:祝小宇,R语言中文社区专栏作者个人公众号:大猫的R语言课堂写在前面一提到用R做文本挖掘,小伙伴们最先想到的应该是tm包。的确,作为R平台文本挖...
作者:徐麟,数据分析师,就职于上海唯品会。热爱数据挖掘和分析,喜欢用R、Python玩点不一样的数据。个人公众号:数据森麟(微信ID:shujusenlin) 前...
stringr包,顾名思义,处理字符串专用包,本篇笔记对它进行简单介绍。提到字符串处理,有一个绕不过去的主题,它是字符串处理的利器,也是字符串处理的问题制...
作者简介:祝小宇,个人公众号:大猫的R语言课堂这期大猫课堂将会教大家如何用35行R代码写出最有效率的事件研究法。注意,本代码主要使用data.table完成,关...
总第113篇前言这篇介绍Boosting的第二个模型GBDT,GBDT和Adaboost都是Boosting模型的一种,但是略有不同,主要有以下两点不同:GBDT使用的基模型是CART决策树...
前两个笔记笔者集中探讨了卷积神经网络中的卷积原理,对于二维卷积和三维卷积的原理进行了深入的剖析,对 CNN 的卷积、池化、全连接、滤...
作者简介taoyan:R语言中文社区特约作家,伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/简介Complexheatmap是由顾祖光博士创建的...
之前有网友问我如何在ggplot2绘制的图片左上角添加文字,由于最近个人的一些事情比较忙,一直没能及时回复,所以今天通过这篇文章分享一个通过注释的方法来完...
tidyr包,tidyverse工具箱中的改锥和锤子,哪儿不顺眼修哪里,犀利得好比找茬儿的老板,专注把数据在长和宽的形态中互转,功能类似reshape2包,本篇顺带也回...
作者简介作者:吴健 中国科学院大学 R语言、统计学爱好者,尤其擅长R语言和Arcgis在生态领域的应用分享个人公众号:统计与编程语言 前文推送:R语言绘制...