牟瑞

大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我!

始于: 2013-06-09

发私信

1967

总声望

308

次被推荐

16

粉丝

他的回答
排序:

0
投票

应用程序中集成kettle来导数据库?

kettle不支持自动建表,如果你非要是嫌这种需求,需要自己写个脚本。

2015-12-11 07:36 回复了该问题
0
投票

安装hive后,启动hive时报错

看下你的防火墙关闭了么?如果已经关闭了,把你的Hadoop配置文件上传一下。

2015-12-09 17:46 回复了该问题
1
投票

关于Sqoop1.99.6的性能问题!

不好意思。兄弟,你这个oracle是真没有遇到过。我个人的建议如下: 1.降低sqoop1.99.6版本到sqoop 1.99.3版本试一下。 2.运行sqoo...

2015-12-08 13:00 回复了该问题
0
投票

如何将hdfs里某一目录下的所有文件的文件名读取出来?

通过程序读取么?如果是Java的话,可以通过FileSystem的listStatus()方法 当你传入的参数是目录时,返回的FileStatus的对象列表,里...

2015-12-04 20:13 回复了该问题
0
投票

关于Sqoop1.99.6实现从oracle到hive的数据表导入任务的问题!

不好意思,通过oracle与hive导数据没有实施过,能不能换种思路。比如从oracle导出txt,然后通过hive的load命令load进去?

2015-12-03 14:57 回复了该问题
0
投票

问一下,用kettle将关系型数据库的数据,抽取到hive上。输出用什么组件?

使用开源的sqoop来实现关系型数据库与Hive的数据互导。 或者将关系型数据库的数据导出成文本,上传到HDFS,然后Hive重新配置下当天的分区就可以了。

2015-12-03 08:27 回复了该问题
0
投票

数据服务目录发布开源平台?

自己搭一个ipython notebook 或者使用为知笔记的团队项目。 worktile也不错。

2015-12-02 10:13 回复了该问题
0
投票

有分析微博的工具吗?

先抓数据,然后自己分析。

2015-12-02 10:11 回复了该问题
0
投票

kettle 流程走不完,是什么情况

造成这种情况很可能是多方面的。在runing的时候,你登上这台服务器看一下服务器的各项指标是否正常。CPU,内存等等。 另外,java_decode主要是做什么...

2015-12-02 10:06 回复了该问题
1
投票

运维工作中,对于监控的告警信息,应该如何分析,或者说应该从哪些方向去分析呢

1.首先最起码要做的,就是一个监控日志的收集,这个在本周五的微信直播里面会讲。 2.运维分为系统运维和应用运维,系统运维就是分析系统的各项指标,对系统优化提供参...

2015-12-01 20:28 回复了该问题
0
投票

修改 如何设计一个系统可以存下大量的数据,并且实现多种索引?

用列存储数据库一般都能解决你这个问题。。但是C++的话,一般实现接口的很少。。需要自己实现调用。

2015-12-01 20:25 回复了该问题
0
投票

大家好,请问一个小问题,今天凌晨的kettle任务在连接一个国外数据库的时候没连接上,结果停在那边两个小时,最后才报错的,有没有什么地方可以设置一下让超时报错的时间缩短呢?

重新定位下这个问题,或者是否有日志上传一下。一般kettle连接不上数据库会立即报错。你看看是不是数据库timeout了?如果是的话,修改一下数据库的timeo...

2015-12-01 09:54 回复了该问题
0
投票

IT面试题,求思路?

大数据或者数据分析师常见的10道面试题解答:http://www.flybi.net/blog/marey_marey111/2323看看有没有思路

2015-12-01 09:46 回复了该问题
0
投票

kettle里边,给一个变量赋值,这个变量的名字,可不可以使用参数?

原则上变量名必须提前指定,如果变量名都是可以变的,那需要重写kettle组件了。  

2015-11-30 15:58 回复了该问题

改版

反馈