牟瑞

大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我!

始于: 2013-06-09

发私信

1967

总声望

308

次被推荐

0

粉丝

他的回答
排序:

0
投票

kettle插件开发输出流的问题

[有多个字段要进行输出,要输出的字段是一个数组]有点不是很清楚什么意思,如果业务很复杂的话,可以通过存储过程,或者临时表的方式来解决,不一定非要用Kettle。...

2015-08-28 13:15 回复了该问题
2
投票

两台库都不在本地区,我在本地使用kettle在两库之前导数,需要经过我本地么?如何能提升性能?把kettle部署在哪里?

部署在什么地方,这个需要考虑很多的因素:比如网络。带宽,服务器性能等。提供思路,仅供参考: 1.部署在带宽比较大的地方,如果Kettle需要通过网络连接处理数据...

2015-08-28 10:30 回复了该问题
3
投票

请教下大家 我使用KETTLE在读取excel的时候 如果读取远程文件系统的excel 怎么设置

不是很清楚你的问题。远程的Excel可以通过FTP,FileSync,Web api等等很多种方式下载到本地,然后在本地处理。否则是没有办法远程打开Excel的...

2015-08-27 21:05 回复了该问题
3
投票

如何进行商品销量进行分析?

说到数据分析,这真的是一个非常非常大的范围和概念,在这里提几个方向: 1.趋势分析:对该商品在当月的销量做趋势分析,分析商品在当月每天的销量,分析销量随日期的变...

2015-08-27 20:54 回复了该问题
1
投票

大神们,连接hbase点击Get table names,提示java.lang.reflect.InvocationTargetException,怎么整

这个问题好难回答啊。只有报错信息,什么都没有。你先确认下Hbase是否能远程连接。

2015-08-27 17:58 回复了该问题
1
投票

kettle中几个节点都跑完才能执行下面的节点用什么控件?

不好意思,没有明白你是要做什么,Kettle里面的控件,默认都是顺序执行的啊。

2015-08-27 17:49 回复了该问题
1
投票

在ETL过程中,如果遇到源库物理删除一条记录,在本库同步做逻辑删除。这个除了写SQL通过主键全表比对外,大家可有通过kettle解决的?

如果你有足够的权限的话,可以开启数据监控服务,对源数据库做数据的监控。 SQLServer有CDC,MySQL可以监控bin log.然后通过处理监控到的数据日...

2015-08-27 14:20 回复了该问题
1
投票

kettle能否支持T级的数据?如何支持?通过集群的方式?

Kettle是一个ETL工具,用来处理转换数据。工具本身与数据量的大小无关。 针对T级别的数据一般单服务器存储数据的可能性比较小,会采用分布式文件系统的方式存储...

2015-08-27 14:13 回复了该问题
2
投票

kettle运行spoon.bat时找不到javaw文件

这个你是不是没有配置JDK啊。。

2015-08-26 16:22 回复了该问题
1
投票

大家有没有实施过将一张表按时间拆分多张表的样例?

详细描述下你的问题。没懂你的样例是什么意思。一般这个都是在SQL语句里面根据时间字段去拆分就可以了啊。

2015-08-26 16:04 回复了该问题
1
投票

Kettle启动之后闪退怎么回事?还没到输入信息的界面就退了

升级一下JDK的版本,现在的JDK一般最低都是1.6了。如果还是闪退,可以采用命令行的方式启动,这个时候会有出错信息显示在屏幕上。按照出错信息来排除一下就可以。

2015-08-26 16:01 回复了该问题
1
投票

使用kettle向mysql插入数据~ 每秒10条...应该是mysql的问题。有谁知道怎么能提高效率么~

往数据库里面插入数据最快的方式是采用Load的方式。如果你是从其他的数据源大批量的插入MySQL的数据库,可以采用,在数据库里面建一个与目标数据库一样的临时数据...

2015-08-26 15:53 回复了该问题
2
投票

大家在做分析的时候 维度一般几个比较合适?

我不是这方面的专家,不过可以大概说一下我的理解。维度表更多是一些基础数据,元数据等相对稳定数据,如果我们仅仅是有限次的分析应用的话,可以根据实际的需求,减少指标...

2015-08-25 21:53 回复了该问题
6
投票

研究生准备选择大数据技术方向,现阶段该如何准备?

在回答你的问题之前,我想先啰嗦点概念性的东西。摘自我的收藏,原文出自什么地方已经找不到了,有知道的朋友可以给我留言 一、大数据概念 "大数据&quot...

2015-08-25 17:58 回复了该问题
1
投票

hadoop能管理的数据量大具体指什么?

这个要看具体的应用场景 单纯的从文件存储上来说,这两种情况,都可以使用hadoop来管理。但是hadoop在处理大文件上有很大的优势,默认的Hadoop的Blo...

2015-08-25 13:30 回复了该问题

改版

反馈