[有多个字段要进行输出,要输出的字段是一个数组]有点不是很清楚什么意思,如果业务很复杂的话,可以通过存储过程,或者临时表的方式来解决,不一定非要用Kettle。...
2015-08-28 13:15 回复了该问题部署在什么地方,这个需要考虑很多的因素:比如网络。带宽,服务器性能等。提供思路,仅供参考: 1.部署在带宽比较大的地方,如果Kettle需要通过网络连接处理数据...
2015-08-28 10:30 回复了该问题不是很清楚你的问题。远程的Excel可以通过FTP,FileSync,Web api等等很多种方式下载到本地,然后在本地处理。否则是没有办法远程打开Excel的...
2015-08-27 21:05 回复了该问题说到数据分析,这真的是一个非常非常大的范围和概念,在这里提几个方向: 1.趋势分析:对该商品在当月的销量做趋势分析,分析商品在当月每天的销量,分析销量随日期的变...
2015-08-27 20:54 回复了该问题这个问题好难回答啊。只有报错信息,什么都没有。你先确认下Hbase是否能远程连接。
2015-08-27 17:58 回复了该问题如果你有足够的权限的话,可以开启数据监控服务,对源数据库做数据的监控。 SQLServer有CDC,MySQL可以监控bin log.然后通过处理监控到的数据日...
2015-08-27 14:20 回复了该问题Kettle是一个ETL工具,用来处理转换数据。工具本身与数据量的大小无关。 针对T级别的数据一般单服务器存储数据的可能性比较小,会采用分布式文件系统的方式存储...
2015-08-27 14:13 回复了该问题详细描述下你的问题。没懂你的样例是什么意思。一般这个都是在SQL语句里面根据时间字段去拆分就可以了啊。
2015-08-26 16:04 回复了该问题升级一下JDK的版本,现在的JDK一般最低都是1.6了。如果还是闪退,可以采用命令行的方式启动,这个时候会有出错信息显示在屏幕上。按照出错信息来排除一下就可以。
2015-08-26 16:01 回复了该问题往数据库里面插入数据最快的方式是采用Load的方式。如果你是从其他的数据源大批量的插入MySQL的数据库,可以采用,在数据库里面建一个与目标数据库一样的临时数据...
2015-08-26 15:53 回复了该问题我不是这方面的专家,不过可以大概说一下我的理解。维度表更多是一些基础数据,元数据等相对稳定数据,如果我们仅仅是有限次的分析应用的话,可以根据实际的需求,减少指标...
2015-08-25 21:53 回复了该问题在回答你的问题之前,我想先啰嗦点概念性的东西。摘自我的收藏,原文出自什么地方已经找不到了,有知道的朋友可以给我留言 一、大数据概念 "大数据"...
2015-08-25 17:58 回复了该问题这个要看具体的应用场景 单纯的从文件存储上来说,这两种情况,都可以使用hadoop来管理。但是hadoop在处理大文件上有很大的优势,默认的Hadoop的Blo...
2015-08-25 13:30 回复了该问题