前言朴素贝叶斯算法仍然是流行的十大挖掘算法之一,该算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题...
联合分析(conjoint analysis) 是一种先进的市场研究技术,名词解释可以看这里https://ask.hellobi.com/blog/bigdataren/3860, 一般用于企业推出新产品或者...
自然语言处理(Natural Language Processing)自然语言处理(NLP)是机器学习重要分支之一,主要应用于篇章理解、文本摘要、情感分析、知识图谱、文本翻译等...
爬虫基础:Rcurl与XML包 爬虫是一种利用代码(例如:R code或Python code)模拟浏览器访问(下载)页面并根据HTML结构筛选获取所需信息的一种工...
文本分析是目前比较热门的一项研究,例如如何切词、文档矩阵的建立、主题模型的应用、文档聚类、分类、情感分析等。就情感分析而言,目前比较流行的方法有两...
一、从URL读取并返回html树1.1 Rcurl包 使用Rcurl包可以方便的向服务器发出请求,捕获URI,get 和 post 表...
你没有看错,确实是求增长率。用Excel可以很简单的使用=(A1-A2)/A1*100再加鼠标拖动就可以实现的功能,在R下确实让我头痛了一个晚上,在网上找了一个没有找...
缘起:猴子在《从零学会数据分析:简单数据处理》中留下作业:用日常工作中的数据,进行数据预处理,并分析出有价值的信息。为此,我找到了《深圳统计年鉴201...
我的问题:最近在某单位的岗位分类表中看到“会计”属专业技术岗,而一字之差的“统计”属专辅助技术岗,工资待遇的差距可是几何级的,职业发展也是天壤之别。心...
本文所使用的代码是之前一篇关于航线图的数据,之所以要从新写一遍,是为了让大家体会借助在线地图制作地图可视化在代码效率上的便利(当然,也会有损失,你...
之前列举了部分数据相关的R包,本文主要选摘了其他一些比较优秀的29个R包,主要类别包括综合类、机器学习、统计类和工具类,希望有助于大家的学习,时刻关注R...
储存数据,尤其是字符型数据,有时候不会储存完整的内容,可能会用一个字符代替整个内容,这样会使存储的体积更小,那么我们在使用时候需要将数据完整的表达...
实在没时间写文字步骤了,算了,就甩一篇代码给大家吧,这篇代码包含五张图,分别可以呈现放射状线路图、迁徙路径图、闭环路径图、菱形气泡图、方形气泡图。l...
今天向大家分享自己编的绘制万花规的函数,只需修改几个简单的参数就会带给你一个不一样的惊喜,直接把代码分享给大家。代码:library(ggplot2)library(ggthe...
我们都知道Java语言长期处于霸主地位,在所有编程语言排行榜中,Java也是常年位居第一。在近几年也是爆炸式发展,几乎覆盖到了应用开发的所有领域。而R语言则...