这个winutil.exe是啥?
2016-10-18 15:25 回复了该问题Apache Kylin可以做到维度建模。 原始数据以Hive表的形式存储,包括事实表和各个维度表,Hive也被称为是Hadoop之上的数据仓库,所以完全可...
2016-10-18 15:24 回复了该问题资源有限时可访在一个集群,如楼上Bob大神说的,Spark对内存要求高,但是有些场景下,为了避免维护2个集群,会将Hadoop和Spark不属于一个集群上。看具...
2016-10-18 15:19 回复了该问题效果确实不错,比单纯的MR还要很多。但是比完全的Spark SQL又要慢一点。 我有一篇博文介绍Hive on Spark实践的,仅供参考https://ask...
2016-10-18 15:18 回复了该问题HDFS文件系统有副本恢复策略,当一个节点挂掉了,Master一旦检测到(或通过心跳反应没能获得该节点信息),则就会将其上面的所有Block根据一定的原理复制一...
2016-10-18 15:16 回复了该问题那回过头去Jps查看时,进程还存在吗?有可能掉了,或者是Web端还没同步。 如果不是上述原因,则可能该节点进程出现错误挂掉了,希望提供错误日志以供分析
2016-10-18 15:14 回复了该问题做了SSH吗?好像权限有问题。
2016-10-18 15:12 回复了该问题已经比较火了,如果说你工作环境有用Spark的,那基本上会用原生的Scala,用Python的也有,但是算少数吧,毕竟Spark对Python的支持也是有限的
2016-10-18 15:10 回复了该问题可能你的Hive所执行的任务输入Local任务,不是集群的任务,所以不会涉及到MR,你在执行Hive时是可以看到的,启动一个Job后,可能看到带local字样的...
2016-10-18 15:08 回复了该问题你使用的regexp_replace()函数,第一个参数是原始字符串,第二个参数是要被替换的字串(Java正则表达式表示),第三个参数是用于替换的字符串,你只要...
2016-10-18 15:06 回复了该问题错误提示:Error parsing arguments for list-databases,解析list-databases后面的参数出错,你的connec...
2016-10-18 15:02 回复了该问题楼上Seng总解释清了MySQL作为元数据的问题。 还请注意,1,HDFS存储数据是有副本的,1T的数据,如果副本是3,则需要3T的空间;2,如果是把HDFS某...
2016-10-11 15:11 回复了该问题命令没有错,你可以先用sqoop-list-databases --connect --username --password测试一下是否能连接正常。
2016-10-11 15:08 回复了该问题Spark有对应支持的Python版本,不过貌似PySpark的环境也是个坑,可以踩坑然后分享经验。 MLlib中的协同过滤的链接:[url]https://...
2016-10-08 10:58 回复了该问题