数据挖掘

  数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程

1
推荐
4826
阅读

简单的Seq2Seq实现作对联

Seq2Seq全称Sequence to Sequence,在机器翻译、文章摘要等领域有着广泛的应用。其本身很简单,是一个如下图所示的Encoder-Decoder框架。本文不纠结于Seq2Seq...
1
推荐
2324
阅读

经典Kaggle之泰坦尼克(下)

                            上一期我们对泰坦尼克数据进行了部分预处理和可...
2
推荐
2726
阅读

经典Kaggle之泰坦尼克(上)

                                       191...
2
推荐
2799
阅读

使用Tensorflow实现简单的RNN

之前我们用word2vec训练了词向量,但光词向量其实没有什么实际的用处,我们还要结合深度学习模型比如rnn,LSTM,seq2seq才行,所以我们首先来介绍一下如何使...
4
推荐
2785
阅读

扎心实战案例:麻(shi)雀(zhan)虽小,五脏俱全

                                          ...
2
推荐
3728
阅读

共享单车租用频次分析

                                          ...
2
推荐
3438
阅读

从零开始,小白如何通过Kaggle竞赛提高数据分析能力!

Kaggle是由联合创始人、首席执行官Anthony Goldbloom和Ben Hamner于2010年在墨尔本创立,主要为开发商和数据科学家们提供举办机器学习竞赛、托管数据库、编写...
2
推荐
2495
阅读

apply家活跃成员小聚会

在R中经常会用到一些循环,对于数据量较小的数据,我们使用for循环之类的显循环也没发现什么弊端,但是针对数据量较大的数据,依旧使用显循环,就会发现R中的...
2
推荐
2364
阅读

R for data science 之 stringr包

stringr包常用函数总结stringr包是伟大的Hadley Wickham开发的处理字符串的程序包,该包包含的函数如下图:这篇文章我会给大家举例讲解其中的几个常用函数,...
2
推荐
3649
阅读

R可视化分析美国的肥胖症,嘿!

本文章的主要目的是想研究美国成年人、儿童以及青少年中肥胖人口最多的州。其次展示如何在R中使用rvest包从HTML页面中抓取数据、以及使用ggplot绘制地图。使...
3
推荐
2452
阅读

SPSS Modeler与数据库的链接查询

浩彬老撕曾经在《IBM SPSS Modeler最强工具书收藏系列(四)-数据读取奥秘》中提到怎么利用spss读取各种来源的数据,其中也重点介绍了如何通过odbc读取数据库...
3
推荐
4830
阅读

《人人都会数据分析》20万字电子版

去年的时间把之前的数据分析工作经历、大环境背景、职场选择、公司选择、岗位选择、统计学的基本常识、需要掌握的分析工具、怎么写好一个报告、互联网和金融...
2
推荐
5434
阅读

基于自动PDQ值的ARIMA时间序列预测应用

宋天龙(TonySong)  Webtrekk中国区技术和咨询负责人(Webtrekk,德国最大的网站数据分析服务提供商), 数据常青藤和数据研究与商业应用博主,资...
2
推荐
2720
阅读

基于多项式贝叶斯的增量学习的文本分类

 宋天龙(TonySong)  Webtrekk中国区技术和咨询负责人(Webtrekk,德国最大的网站数据分析服务提供商), 数据常青藤和数据研究与商业应用博...
2
推荐
3462
阅读

kaggle数据科学社区调查报告

附视频链接: 天善智能Kaggle十大案例精讲(连载中)  提供案例代码和数据,可以实操。欢迎学习!(数据集和代码在链接公告处提供下载)2017年8月2...

1878 人关注

最佳回复者

改版

反馈