Hive SQL-DML-Load加载数据
在 Hive 中,可以使用 SQL DML(Data Manipulation Language)语句中的 LOAD 命令来加载数据到表中。LOAD 命令用于将本地文件系统或 HDFS(Hadoop 分布式文件系统)中的数据加载到 Hive 表中。

 
 
LOAD 命令的基本语法:

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)];
其中,各部分含义如下:
-  LOCAL:可选参数,表示数据文件位于本地文件系统。如果不使用LOCAL参数,则表示数据文件位于 HDFS。
  
  
-  INPATH 'filepath':指定要加载的数据文件的路径。
  
-  OVERWRITE:可选参数,如果目标表中已经存在数据,则使用OVERWRITE可以覆盖原有数据。如果不使用OVERWRITE,则默认是追加数据。
  
-  INTO TABLE tablename:指定要加载数据的目标表名。
-  PARTITION (partcol1=val1, partcol2=val2 ...):可选参数,如果目标表是分区表,则可以使用PARTITION子句指定要加载数据的分区。
示例
1.从本地加载数据

 复制操作:原路径下的文件将会被复制到目标路径。
 
 
2.从HDFS加载数据

 移动操作:原路径下的文件将会被移动到目标路径。
 
3.从HDFS加载数据到分区表中并制定分区

 

Hive3.0 Load 新特性

 



















