数据分析

  数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。

0
推荐
2137
阅读

运用R创建医学论文中描述基本特征的 Table one

       描述病人基本特征应该算是每个医学研究论文所必须的步骤,而且常以“Table 1”表示,说明其在研究中的重要位置。 R非常人性化的方...
1
推荐
2698
阅读

[数据处理]提高R运算效率的方法总结

R在大文本处理,内存管理和平行计算早为人所诟病。作为一种单线程运算,确实在处理“大数据”方面有或多或少的缺陷,但是随着计算机内存容量的不断提升以及R本...
0
推荐
5826
阅读

SPSS分析技术:列联表分析;男生肺活量一定比女生大吗?

基础准备之前介绍的参数估计和参数检验面向的都是定距或定比数据总体,也就是我们最常面对的数据类型,例如,温度,湿度,金钱,身高和体重等等,这些数据可...
1
推荐
3646
阅读

总体比率的区间估计;如何估计手机支付的普及率

基础准备在实践中,有许多情况要对总体比率进行估计。例如,生产制造业的品控部门需要通过样本合格率估计整批产品的总体合格率;在大选之前,民意调查机构采...
4
推荐
2442
阅读

如何用 R 创作古诗

引子最近中国诗词大会很受欢迎,才女武亦姝凭借超强的记忆力和超快的反应能力一炮走红,成为大家心目中的偶像。在欣赏节目的同时,我也不禁想到,既然古代的...
0
推荐
1481
阅读

共享单车,千万人骑出的大数据

共享单车用户数激增700% 男性是主用户比达咨询数据显示,到2016年,国内共享单车用户数激增700%,预计未来三年用户数仍将大幅增长。“烧钱大战”盛况空前国内共...
3
推荐
3274
阅读

教你明白啥是朴素贝叶斯分类器

前言朴素贝叶斯算法仍然是流行的十大挖掘算法之一,该算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题...
4
推荐
3270
阅读

NLP自然语言处理(一)——jieba分词(R vs. python)

自然语言处理(Natural Language Processing)自然语言处理(NLP)是机器学习重要分支之一,主要应用于篇章理解、文本摘要、情感分析、知识图谱、文本翻译等...
1
推荐
2728
阅读

【重磅】33款可用来抓数据的开源爬虫软件工具

要玩大数据,没有数据怎么玩?这里推荐一些33款开源爬虫软件给大家。爬虫,即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜索...
6
推荐
3210
阅读

网络数据爬虫总结【R】

爬虫基础:Rcurl与XML包    爬虫是一种利用代码(例如:R code或Python code)模拟浏览器访问(下载)页面并根据HTML结构筛选获取所需信息的一种工...
3
推荐
4012
阅读

干货--基于词库的情感分析

文本分析是目前比较热门的一项研究,例如如何切词、文档矩阵的建立、主题模型的应用、文档聚类、分类、情感分析等。就情感分析而言,目前比较流行的方法有两...
2
推荐
1881
阅读

Python word_cloud 样例 标签云系列(三)

word_cloud/examples at master · amueller/word_cloud · GitHub上面是官方样例。这一篇里的大部分尝试都基于这些样例进行修改。前提是你已经完成了安装,依...
0
推荐
1671
阅读

Python word_cloud 部分文档翻译 标签云系列(二)

上文末尾提到 Python 下还有一款词云生成器。amueller/word_cloud · GitHub可以直接使用命令 pip install wordcloud 安装,自行补充完整依赖。网上搜不到有关...
0
推荐
2604
阅读

Python pytagcloud 中文分词 生成标签云 系列(一)

毕业设计选题不知道怎么就选了个中文分词…寒假前要开题。还没联系老师了解具体情况,自己尝试着先入了个门应用一下。试用了几款分词的项目,有时间另开一篇记...
26
推荐
5863
阅读

从代码到300优质客户,用户画像在销售的实战应用

    “美女,头像是你本人吗?发张照片来看看!”好吧,这是时下最让女生反感的搭讪方式,基本可以被列为性骚扰的范畴了。然而在颜值即正义的今天,...

2273 人关注

最佳回复者

改版

反馈