还需要一些配置的,具体的参考一下这个文档吧: [url]https://cwiki.apache.org/confluence/display/Hive/Hiv...
2016-07-16 10:47 回复了该问题Hadoop 2.7.2和Hive 2.0.0版本是OK的。你的Hive无法启动所报的错误可以贴出来看一下。
2016-07-15 14:13 回复了该问题可以自己写一套前端可视化工具; 也可以使用开源的工具,例如Pentaho,Zepplin等,后者是Apache的孵化项目,支持多种查询(shell/hive/s...
2016-07-15 08:26 回复了该问题ssh是否配置成功? 需要cat id_rsa.pub>>authorized_keys,并且将authorized_keys的权限设置为600
2016-07-14 08:28 回复了该问题在hive-site.xml中的配置项中添加上UTF-8[code]<property> <name>javax.jdo.opt...
2016-07-13 17:46 回复了该问题yarn的日志需要配置的,在yarn-site.xml中。 配置日志属性有这些: [code]<property> <name>y...
2016-07-11 17:27 回复了该问题1、《统计学》第五版,William Mendenhall/Terry Sincich,统计学入门的经典教材,中文版; 2、《Introduction to S...
2016-07-11 10:22 回复了该问题楼主使用的是增量导入吗?或者是采用的导入到HDFS目录的方式,这种方式有可能导致的结果是数据直接附加(Append),这样昨天导入id为1-10的,今天照样会导...
2016-07-11 10:12 回复了该问题Hadoop主要以Java为主。 Spark主要以Scala为主,但是还有Python、R和Java都有较多的使用。
2016-07-11 10:10 回复了该问题个人觉得云计算更多的是构建云环境,并且有些企业已经把云计算做到服务层面——存储、计算、服务、架构、安全等等,一应俱全。例如阿里云。 而大数据更多的关注的是数据,...
2016-07-11 10:05 回复了该问题Spark-sql是支持Hive的,但是需要生成HiveContext对应的sqlContext,具体在Spark中操作Hive的部分可以参考Spark官方的H...
2016-07-08 14:53 回复了该问题专门的讲Spark 文本挖掘的书好像没有,但是有些不错的博客以及Spark的官方文档中对文本挖掘的内容还是很不错的,推荐给你: Spark MLlib: h...
2016-07-08 14:41 回复了该问题