Bob

同程旅游大数据+BI 架构师

始于: 2015-09-29

江苏省 苏州市

发私信

250

总声望

142

次被推荐

0

粉丝

他的回答
排序:

1
投票

有什么比较好的Hadoop作业调度平台吗?基于WEB 有比较友好的UI 集成了常用的操作

1.oozie 2.阿里的宙斯(zeus) 3.LinkedIn的Azkaban 以上三个都是基于web的工作流调度平台,都很优秀   建议你可以选阿里的 ze...

2017-02-21 11:37 回复了该问题
0
投票

sqoop使用create-hive-table命令

在hive/warehouse中看看目录是否存在 或者运行: sqoop create-hive-table --connect 'jdbc:sqlserve...

2017-02-17 14:32 回复了该问题
0
投票

错误: 找不到或无法加载主类 org.apache.hadoop.hdfs.server.namenode.NameNode

1.core-site.xml等hadoop核心配置是否存在 2.检查hadoop的classpath有没有配置所有hadoop相关的jar包

2017-02-17 13:54 回复了该问题
0
投票

代理作业执行数据写入平面文件出现错误0xC020200E

这个应该是权限问题

2017-02-14 08:57 回复了该问题
0
投票

SSIS在SQL SERVER作业中报错:分配 10485216 个字节时某个缓冲区失败

在数据源里面的目标组件中设置减少缓存池的大小

2017-02-14 08:55 回复了该问题
0
投票

SSRS Error

提示这个dll文件未被加载,可能是文件不存在或是权限问题导致无法访问

2017-02-14 08:53 回复了该问题
0
投票

你好,老师,hdfs中有上pb级别的数据量,如何更好的做可视化呢?采用哪些技术更加合理呢?谢谢

在hadoop上搭建kylin进行数据的预先处理,然后使用可视化工具进行连接   你也可以在hadoop上使用hive清洗好待呈现的结果,然后同步输出到db中,...

2017-02-08 13:20 回复了该问题
0
投票

Hbase drop 表失败

检查下zookeeper集群中存储的元数据是否正常

2017-02-07 20:01 回复了该问题
0
投票

spark 读取预分region的Hbase

输出6个是因为hbase在进行元数据加载时会对表的region进行处理,这个时候发现dns出现问题,机器名称无法连接

2017-02-07 20:00 回复了该问题
0
投票

hive配置hdfs地址问题

首先你得为hadoop集群开启并配置 HA模式 这样 fs.defaultFS 就可以指向 HA集群

2017-02-07 19:55 回复了该问题
0
投票

谁有python操作Hive的文档或例子啊?麻烦大家了

在python中可以使用pyhs2 访问hive 也可以使用PyHive 访问   import pyhs2 as hive import getpass DE...

2017-02-07 19:54 回复了该问题
0
投票

hive自定义函数,如何输出json,求解思路,谢谢

你可以尝试在自定义函数中输出json格式的字符串

2017-02-07 19:45 回复了该问题
1
投票

Hbase hbase.snapshot.enabled 如何做快照?

为表建立快照的标准语法: snapshot 'myTable','myTable_snapshot'   如果想每天都创建一个快照,则建议使用shell脚本: ...

2017-02-07 19:44 回复了该问题
0
投票

每天两千亿条数据是否适合用Hbase?

要看你的数据是怎么使用的。 如果要保障高性能的查询,建议可以用ElstaticSearch集群替换hbase集群来存储数据

2017-02-07 19:39 回复了该问题
0
投票

hbase高并发读写,写入是实时的,读取也是实时的,怎么保证机制的可靠性?

在数据到达hbase之前建立多重缓存和check机制。 在写入hbase时要保障hbase的wal大小是最合适的,并且程序api写入hbase前最好有消息队列缓...

2017-02-07 19:37 回复了该问题

改版

反馈