——背景——近来,想把学习过的机器学习算法做一个总结,于是打算结合网上的面试经验和工作的需求写下一个机器学习系列文章。这里是更多是参考网上以及书本中的...
马上快过年了,公司(乙方)把很多新的项目也都放到了年后,领导说趁着时间有些空闲让我们赶快充电,也对我们加强了培训(业务方面和技术方面)。于是就想着...
阅读路线:Hadoop与Spark比较Spark的安装Spark知识点一、Hadoop与Spark比较1.简单的比较刚开始学习Spark的时候,自己总是会想当然的理解两者之间的关系。Hadoo...
由于这两天所做的项目涉及到了文本分析的内容,并在处理脏乱文本(就是做一个词云图,要把英文、一些标点符号之类的给清除掉)时使用了正则表达式,所以特别来...
这篇文章主要是自己的学习总结,阅读路线如下:理解API理解Restful API 理解装饰器理解Flask框架使用Python Flask 实现Restful API API的理解API(application...
还记得上个月的时候,准备学习机器学习的知识,想着线性回归模型较简单一些,那就从它开始吧。可是仔细一看里面的知识包括矩阵、极大似然函数、求导等方面的...
看到好多人都分享了如何成功转行数据分析工作的文章,确实能让我们有了别人能够做到,我们也能做到的信心。在大家对转行数据分析工作有信心并努力的同时,也...
这篇文章讲述的是Kaggle上一个赛题的解决方案——Titanic幸存预测.问题背景是我们大家都熟悉的【Jack and Rose】的故事,豪华游艇与冰山相撞,大家惊慌而逃,可...
首先说明这篇文章的数据来源,是爬虫拉勾网"数据分析师"这一职位信息所得来的。并且主要分析了数据分析师总体薪酬情况、不同城市薪酬分布、不同学历薪酬分布...
用Python进行数据分析时常用包有numpy、scipy、pandas,matplotlib,由于自己现在还是数据分析的初级阶段,一般情况下numpy、pandas、matplotlib包的一些基本...
数据库简单来讲就是一堆互相关联的数据,最基础的数据组成了表(table),也是我们经常看到的一张Excel的sheet。Mysql的安装Mysql安装注意首先去MySQL的官网下...
今天想和大家讨论的问题是:飞机航行距离和延误时间有没有关系呢?我们的数据是R 中nycflights13包的航班数据。好了,搬好小板凳,我们要开始分析了。先简单...
这篇的文章主要目的是,根据提供的朝阳区医院2016年销售数据.xlsx数据表,得出月均消费次数、月均消费金额、客单价和消费趋势这五个结论。阅读路线:数据导入...
阅读指南:总体均值和比例的统计推断总体方差的统计推断总体均值和比例的统计推断其实数据分析更多情况是两个总体的比较,譬如男女用户的差异、用户群体的差...
阅读路线:概率介绍离散型概率分布和连续型概率分布抽样和抽样分布区间估计假设检验概率介绍概率是指的对于某一个特定事件的可能性的数值度量,且在0-1之间。...