轨迹是指预测吗?时间预测的话,这些python都有专门的库,掌握好pandas,scikit,spark mllib都很有用。
2016-07-10 22:30 回复了该问题云戒:还是要分清楚哈,大数据和云计算并不太一样哦。搞数据的以大数据方面的书为主。大数据以spark和hadoop为核心,找些这方面的书箱来看即可。
2016-07-10 22:27 回复了该问题[b]张丹:[/b]R的机制,会把数据一次性加载到内存中。就算能读到内存,每次计算时,也会有中间变量,所以你的基础内存是不够的。而且对于win性能会更差。
2016-07-04 10:43 回复了该问题[b]张丹:[/b]hadoop有很多书了,我当初看的是 权威指南。hadoop的MR的原理要了解,找到懂JAVA的同事,帮你把环境搭好。
2016-07-04 10:41 回复了该问题[b]张丹:[/b]量化投资,其实是IT人都想转的行业。你写的代码,不是通过工资来赚钱,而直接通过交易赚钱。代码的效用是最大化的。这个行业竞争很大,聪明人都在这...
2016-07-04 10:40 回复了该问题[b]张丹:[/b]对于基于hadoop大数据的MR计算,建议做数学变成,通过数学的角度处理。我写过2个例子,一个是pagerank, 一个是itemcf。
2016-07-04 10:39 回复了该问题[b]张丹:[/b] pandas.DataFrame,在底层处理,还需要对原PYTHON的数据结构做映射。当然他可以解决的很好,但你看到的内存结构,可能并不...
2016-07-04 10:38 回复了该问题[b]张丹:[/b] “尽量使用向量计算或矩阵计算的计算方法",可以这样理解,对于一个二维结构,for需要2次,0(N^2)的时间复杂度。如果我们把数...
2016-07-04 10:37 回复了该问题[b]张丹:[/b] quantmod使用的是yahoo等国外的数据源,这些数据源本身没有A股数据,如果需要A股数据,用tushare还是不错的。 R特有的da...
2016-07-04 10:36 回复了该问题[b]张丹:[/b]R和python比,R更面向数据,特别是对于没有编程基础的人。PYTHON,还是程序语言,还要了解程序结构,程序架构,代码量不会少。有IT背...
2016-07-04 10:36 回复了该问题[b]张丹: [/b]你所说的统计,只能说简单计数。比如,你要预测下个月的考勤情况,从而设计预算。你可能就需要做个,回归分析,这时R就能给你很大的帮助了。
2016-07-04 10:35 回复了该问题张丹:R的优势,就是在数学计算,数据处理上。但另外,我们从开发或使用的角度,更多的用到的R包,都是rstudio公司的产品,我觉得是rstudio在推动R的整个...
2016-07-04 10:35 回复了该问题