1.oozie 2.阿里的宙斯(zeus) 3.LinkedIn的Azkaban 以上三个都是基于web的工作流调度平台,都很优秀 建议你可以选阿里的 ze...
2017-02-21 11:37 回复了该问题在hive/warehouse中看看目录是否存在 或者运行: sqoop create-hive-table --connect 'jdbc:sqlserve...
2017-02-17 14:32 回复了该问题1.core-site.xml等hadoop核心配置是否存在 2.检查hadoop的classpath有没有配置所有hadoop相关的jar包
2017-02-17 13:54 回复了该问题在hadoop上搭建kylin进行数据的预先处理,然后使用可视化工具进行连接 你也可以在hadoop上使用hive清洗好待呈现的结果,然后同步输出到db中,...
2017-02-08 13:20 回复了该问题输出6个是因为hbase在进行元数据加载时会对表的region进行处理,这个时候发现dns出现问题,机器名称无法连接
2017-02-07 20:00 回复了该问题在python中可以使用pyhs2 访问hive 也可以使用PyHive 访问 import pyhs2 as hive import getpass DE...
2017-02-07 19:54 回复了该问题为表建立快照的标准语法: snapshot 'myTable','myTable_snapshot' 如果想每天都创建一个快照,则建议使用shell脚本: ...
2017-02-07 19:44 回复了该问题要看你的数据是怎么使用的。 如果要保障高性能的查询,建议可以用ElstaticSearch集群替换hbase集群来存储数据
2017-02-07 19:39 回复了该问题在数据到达hbase之前建立多重缓存和check机制。 在写入hbase时要保障hbase的wal大小是最合适的,并且程序api写入hbase前最好有消息队列缓...
2017-02-07 19:37 回复了该问题