Hive

  Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。

5
推荐
2122
阅读

Hive分区技术

本周已经更新完成Hive分区的三个章节:技术详解,多重分区,动态分区在Hive Select查询中一般会扫描整个表的内容,会消耗很多时间做没必要的工作。有时候只需...
0
推荐
1752
阅读

【老贝伏枥】Hive表的存储格式对比分析

  Hive支持Hadoop中使用的几种熟悉的文件格式,在建表时使用STORED AS (TextFile|RCFile|SequenceFile|AVRO|ORC|Parquet)来指定存储格式。1、Hive的建表...
1
推荐
1606
阅读

【老贝伏枥】Hive的系列化和反系列化

  对象的序列化主要有两种用途:对象的持久化,即把对象转换成字节序列后保存到文件中。  hive的序列化的作用是可以方便的将数据加载到表中而不需...
2
推荐
2797
阅读

【老贝伏枥】HIVE的索引、分区和分桶

1、索引Hive索引目的是提高Hive表指定列的查询速度Hive支持索引,但是Hive的索引与关系型数据库中的索引并不同,如 Hive不支持主键或者外键没有索引时Hive会...
1
推荐
2166
阅读

Hive中order by,sort by, distribute by, cluster by

面试中问到了这些问题,今天特意全方位的总结一下。另外,数据思维比技术更重要。1.Order by    Hive中的order by跟传统的sql语言中的order by作用...
6
推荐
2620
阅读

Hive实战技能 第一部

课程终于上线了,自己的第一部课,算是对自己这几年职业生涯的一次总结。接触Hive比较久,一个版本一个版本的跟到现在,从最初连NOT IN 和 NOT LIKE都不支持...
3
推荐
3362
阅读

HPL/SQL (Hive Hybrid Procedural SQL On Hadoop) --- 一个在Hive上执行过程SQL的工具

HPL / SQL是一种为Hive实现过程化SQL的工具。从Hive 2.0.0(HIVE-11055)开始可用。HPL/SQL对于Hive的意义,也就是PL/SQL对于Oracle的意义。对于广大的数据开...
1
推荐
2369
阅读

遇到的一些hive字符串处理 汇总

持续更新。。。--取第一个顿号前面的所有字符 split(new_occupy,'、')[0] as new_occupy--替换regexp_replace(occupy,',','、')--hive不识别英文分号,...
1
推荐
6861
阅读

HIVE like和rlike

like与rlike的区别:like不是正则,是通配符。这个通配符可以看一下SQL的标准,例如%代表任意多个字符。rlike是正则,正则的写法与java一样。'\'需要使用'\\'...
2
推荐
4818
阅读

Hive建表报错问题解决

1:环境信息:2:问题描述在Hive中创建表报错,报错信息如下:建表脚本:CREATE TABLE DET_SPM_PARTS_PROVIDE_DAY_DETAIL( JULIAN_DAY_KEY INT , STATI...
3
推荐
4429
阅读

Hadoop + Hive + Spark 完整安装攻略

Prerequisites 桌面环境: Mac OSX虚拟机管理软体: Vagrant虚拟机: Virtual BoxClone repogit clone https://github.com/bryanyang0528/hellobicd h...
0
推荐
5494
阅读

启动HIVE报错Exception in thread "main" java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

启动hive报错[hadoop@master2 conf]$ hive which: no hbase in (/home/hadoop/app/hive-2.1.1/bin:/home/hadoop/app/sqoop/bin:/usr/local/bin:/usr/bin:/usr...
1
推荐
1941
阅读

hive如何分区

Hive 是用于大数据集查询的好工具 —— 特别是当数据集需要全表扫描时。但用户经常需要对某个列的值进行过滤,这时候分区就非常有效。分区是一个包含数据块的目...
1
推荐
1939
阅读

Hive命令行使用方法

输入$HIVE_HOME/bin/hive –H 或者 –help可以显示帮助选项: -d,–define 定义一个变量值,这个变量可以在Hive交互Shell中引用,后面会介绍用法,比如:-d...
0
推荐
2428
阅读

Hive 2.1.1 MySQL 集群安装

接上一次单机方式的安装,开始进行分布式基于mysql存储方式的安装启动mysql  service mysql start启动后使用root账户登录,在命令行下输入如下  &n...

相关话题

713 人关注

最佳回复者

改版

反馈