主要还是看你的业务场景,如果需要实时计算,可以通过spark读取kafka-〉计算指标-〉写入HDFS,这个官方是有例子的。 如果不需要实时计算,可以通过定时任...
2015-11-20 09:16 回复了该问题截图点数据看看,没有数据,没有log,无法确定具体问题
2015-11-18 10:04 回复了该问题都可以的。你可以使用windows开发,注意下windows与linux的区别就可以:比如,路径,默认文件编码等等。 如果你的部属服务器是centos,你也可以...
2015-11-18 09:52 回复了该问题是可以的,之前子健老师的课程里面有提到。但是我个人推荐的是使用Python,直接使用Python去请求api.然后解析XML文件,毕竟快速解析还是重要的业务实现...
2015-11-18 09:50 回复了该问题这个问题一般产生有两种情况,一种是在分片集群的时候导致某些数据丢失,第二种是mongodb里面存的字段内容的编码格式与kettle的不兼容,由于Kettle是J...
2015-11-18 09:49 回复了该问题推荐Python的web端框架tornado,flask,django等。我个人经常使用tornado,Python开发web程序,与其他的语言没有什么区别。都...
2015-11-14 10:10 回复了该问题请转告你们公司。。hadoop是在linux上玩的,不是在windows上玩的,如果想在windows上玩,请安装SQLServer,几千万的数据量没多大,SQ...
2015-11-13 10:01 回复了该问题datanode节点的登录用户不同,权限就不同,使用没有权限的用户输入jps就会显示不出来
2015-11-11 09:51 回复了该问题这个配置文件是不是你在windows上编辑的,然后上传到linux服务器上的?两者的编码格式不一样,别直接上传。把文本内容复制进去就可以了。
2015-11-10 21:59 回复了该问题参看下我的博客:kettle的参数配置:http://www.flybi.net/blog/marey_marey111/2062
2015-11-10 10:47 回复了该问题这要看你的博客的规模,如果规模很小,那mongodb的一个collection就可以。既然使用了nosql,设计方式肯定与mysql是有区别的。 评论,标签,所...
2015-11-10 10:38 回复了该问题python爱好者的名言:人生苦短,我用Python 我之前写过的一个博客,我转到了天善的博客中:我们为什么用Python [url]http://www.fl...
2015-11-09 10:37 回复了该问题首先:现在的大数据是一个趋势。现在各样各业都在讨论大数据,即使各个行业的水平,能力等参差不齐。 第二:个人不是很了解安全行业,也不清楚你以后想从事的安全工作是什...
2015-11-09 10:25 回复了该问题可以参考下 Kettle的参数配置:[url]http://www.flybi.net/blog/marey_marey111/2062[/url] 不过如果有...
2015-11-08 11:01 回复了该问题为啥不能统一一下类型呢?没有遇到过这种情况。。如果都是bigint不可以么?
2015-11-06 10:02 回复了该问题