HBaseAPI——IDEA操作HBase数据库HBase与Hive的集成

news2025/11/7 4:47:43

目录

一、IDEA操作HBase数据库

(一)添加依赖

(二)配置log4j

(三)IDEA连接HBase并插入数据

1.代码实现

2.查看命名空间的表

(四)java操作HBase数据库——单元测试

1.导包

2.初始化

3.关闭连接

4.创建命名空间

5.创建表

6.删除命名空间下的指定表

7.查看所有的命名空间

8.往表中新增数据

9.get查询数据

10.全表扫描

二、HBase与 Hive 的集成

(一)停止hive服务并配置hive-site.xml

(二)将HBase的lib目录下所有的文件复制到Hive的lib目录下

(三)不覆盖路径复制

(四)删除HBase/lib目录下低版本的guava

(五)继续配置hive-site.xml

(六)重新启动Hive

(七)HQL创建表

1.student表

2.kb21_student表

3.car表

一、IDEA操作HBase数据库

(一)添加依赖

    <dependency>
      <groupId>org.apache.hbase</groupId>
      <artifactId>hbase-client</artifactId>
      <version>2.3.5</version>
    </dependency>
    <dependency>
      <groupId>org.apache.hbase</groupId>
      <artifactId>hbase-server</artifactId>
      <version>2.3.5</version>
    </dependency>

(二)配置log4j

hadoop.root.logger=DEBUG, console
log4j.rootLogger = ERROR, console
log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.out
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{2}: %m%n

(三)IDEA连接HBase并插入数据

1.代码实现

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HConstants;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Connection;
import org.apache.hadoop.hbase.client.ConnectionFactory;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Table;
import org.apache.hadoop.hbase.util.Bytes;

import java.io.IOException;

public static void main( String[] args )
    {
        // 配置HBase信息，连接HBase数据库
        Configuration conf = new Configuration();
        // 2. 添加配置参数
        conf.set(HConstants.HBASE_DIR,"hdfs://lxm147:9000/hbase");
        conf.set(HConstants.ZOOKEEPER_QUORUM,"lxm147");
        conf.set(HConstants.CLIENT_PORT_STR,"2181");
        try {
            Connection conn = ConnectionFactory.createConnection(conf);
            System.out.println(conn);// hconnection-0x55182842

            Table stuTb = conn.getTable(TableName.valueOf("bigdata:student"));
            
            // 打印表名
            System.out.println(stuTb.getName());// bigdata:student

            // 插入数据
            Put put = new Put(Bytes.toBytes("rowkey11"));
            put.addColumn("baseinfo".getBytes(),"name".getBytes(),"zhangsan".getBytes());
            put.addColumn("baseinfo".getBytes(),"age".getBytes(),"20".getBytes());
            put.addColumn("baseinfo".getBytes(),"birthday".getBytes(),"2003-01-01".getBytes());

            put.addColumn("schoolinfo".getBytes(),"schoolname".getBytes(),"清华大学".getBytes());
            put.addColumn("schoolinfo".getBytes(),"address".getBytes(),"北京".getBytes());

            stuTb.put(put);

            conn.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

2.查看命名空间的表

插入成功

(四)java操作HBase数据库——单元测试

1.导包

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

import static org.junit.Assert.assertTrue;

2.初始化

public class AppTest {
    static Configuration config = null;
    private Connection conn = null;
    private Admin admin = null;

    @Before
    public void init() throws Exception {
        System.out.println("执行init()方法");
        config = HBaseConfiguration.create();
        config.set(HConstants.HBASE_DIR, "hdfs://lxm147:9000/hbase");
        config.set(HConstants.ZOOKEEPER_QUORUM, "lxm147");
        config.set(HConstants.CLIENT_PORT_STR, "2181");
        conn = ConnectionFactory.createConnection(config);
        admin = conn.getAdmin();
    }
  
    @Test
    public void test1() {
        System.out.println(conn);
        System.out.println("执行test1方法");
    }
}

3.关闭连接

 @After
    public void close() throws IOException {
        System.out.println("执行close()方法");
        if (admin != null)
            admin.close();
        if (conn != null)
            conn.close();
    }

4.创建命名空间

    @Test
    public void createNameSpace() throws IOException {
        NamespaceDescriptor kb21 = NamespaceDescriptor.create("kb21").build();
        try {

            admin.createNamespace(kb21);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

5.创建表

    @Test
    public void createTable() throws IOException {
        // 创建表的描述类
        TableName tableName = TableName.valueOf("kb21:student");
        HTableDescriptor desc = new HTableDescriptor(tableName);

        // 创建列族的描述类
        HColumnDescriptor family1 = new HColumnDescriptor("info1");
        HColumnDescriptor family2 = new HColumnDescriptor("info2");
        desc.addFamily(family1);
        desc.addFamily(family2);

        admin.createTable(desc);
    }

6.删除命名空间下的指定表

    @Test
    public void deleteTable() throws IOException {
        admin.disableTable(TableName.valueOf("kb21:student"));
        admin.deleteTable(TableName.valueOf("kb21:student"));
    }

7.查看所有的命名空间

    @Test
    public void getAllNamespace() throws IOException {
        String[] nps = admin.listNamespaces();
        String s = Arrays.toString(nps);
        System.out.println(s);
        // 获取命名空间下的表
        List<TableDescriptor> tableDesc = admin.listTableDescriptorsByNamespace("kb21".getBytes());
        System.out.println(tableDesc.toString());
    }

8.往表中新增数据

    @Test
    public void insertData() throws IOException {
        Table table = conn.getTable(TableName.valueOf("kb21:student"));

        Put put = new Put(Bytes.toBytes("student1"));
        put.addColumn("info1".getBytes(), "name".getBytes(), "zs".getBytes());
        put.addColumn("info2".getBytes(), "school".getBytes(), "fudan".getBytes());

        table.put(put);

        Put put2 = new Put(Bytes.toBytes("student2"));
        put2.addColumn("info1".getBytes(), "name".getBytes(), "zs111".getBytes());
        put2.addColumn("info2".getBytes(), "school".getBytes(), "fudan111".getBytes());

        Put put3 = new Put(Bytes.toBytes("student3"));
        put3.addColumn("info1".getBytes(), "name".getBytes(), "zs222".getBytes());
        put3.addColumn("info2".getBytes(), "school".getBytes(), "fudan222".getBytes());

        List<Put> list = new ArrayList<>();
        list.add(put2);
        list.add(put3);

        table.put(list);
    }

9.get查询数据

    @Test
    public void queryData() throws IOException {
        Table table = conn.getTable(TableName.valueOf("kb21:student"));
        Get get = new Get(Bytes.toBytes("student1"));
        Result result = table.get(get);
        byte[] value = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("name"));
        System.out.println("姓名" + Bytes.toString(value));

        value = result.getValue(Bytes.toBytes("info2"), Bytes.toBytes("school"));
        System.out.println("学校" + Bytes.toString(value));
    }

10.全表扫描

    @Test
    public void scanData() throws IOException {
        Table table = conn.getTable(TableName.valueOf("kb21:student"));
        Scan scan = new Scan();
        ResultScanner scanner = table.getScanner(scan);
        for (Result result :
                scanner) {
            // 打印表名
            System.out.println(Bytes.toString(result.getRow()));
            // 打印表数据
            byte[] value = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("name"));
            System.out.println("姓名" + Bytes.toString(value));

            value = result.getValue(Bytes.toBytes("info2"), Bytes.toBytes("school"));
            System.out.println("学校" + Bytes.toString(value));

            System.out.println("-----------------------");           
        }
    }

二、HBase与 Hive 的集成

(一)停止hive服务并配置hive-site.xml

[root@lxm147 ~]# vim /opt/soft/hive312/conf/hive-site.xml 

<property>
 <name>hive.zookeeper.quorum</name>
 <value>192.168.180.147</value>
</property>
<property>
 <name>hbase.zookeeper.quorum</name>
 <value>192.168.180.147</value>
</property>

(二)将HBase的lib目录下所有的文件复制到Hive的lib目录下

[root@lxm147 conf]# cp /opt/soft/hbase235/lib/* /opt/soft/hive312/lib/

(三)不覆盖路径复制

(四)删除HBase/lib目录下低版本的guava

如果hive的lib目录下有两个guava，需要删除低版本guava
rm -rf /opt/soft/hive312/lib/guava-11.0.2.jar

将Hive/lib的guava复制到HBase/lib目录下
cp /opt/soft/hive312/lib/guava-27.0-jre.jar /opt/soft/hbase235/lib

(五)继续配置hive-site.xml

[root@lxm147 ~]# vim /opt/soft/hive312/conf/hive-site.xml 

<property>
 <name>hive.aux.jars.path</name>
 <value>file:///opt/soft/hive312/lib/hive-hbase-handler-3.1.2.jar,file:///opt/soft/hive312/lib/zookeeper-3.4.6.jar,file:///opt/soft/hive312/lib/hbase-client-2.3.5.jar,file:///opt/soft/hive312/lib/hbase-common-2.3.5-tests.jar,file:///opt/soft/hive312/lib/hbase-server-2.3.5.jar,file:///opt/soft/hive312/lib/hbase-common-2.3.5.jar,file:///opt/soft/hive312/lib/hbase-protocol-2.3.5.jar,file:///opt/soft/hive312/lib/htrace-core-3.2.0-incubating.jar</value>

(六)重新启动Hive

刷新DataGrip，不报错就说明HBase映射到Hive成功！

(七)HQL创建表

1.student表

use default;
drop table if exists student;
create external table student(
    id string,
    name string,
    age int,
    birthday string,
    schoolname string,
    address string
)stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with
serdeproperties ("hbase.columns.mapping"=":key,baseinfo:name,baseinfo:age,baseinfo:birthday,schoolinfo:schoolname,schoolinfo:address")
tblproperties ("hbase.table.name"="bigdata:student");

select * from student;

2.kb21_student表

drop table if exists kb21_student;
create external table kb21_student(
    id string,
    name string,
    school string
)stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with
serdeproperties ("hbase.columns.mapping"=":key,info1:name,info2:school")
tblproperties ("hbase.table.name"="kb21:student");

select * from kb21_student;

3.car表

Xshell端

create 'bigdata:car','product'


put 'bigdata:car','product1','product:name','宝马'
put 'bigdata:car','product1','product:info','x1'
put 'bigdata:car','product1','product:address','北京'
                                                                    
put 'bigdata:car','product2','product:name','奔驰'
put 'bigdata:car','product2','product:info','x2'                                                
put 'bigdata:car','product2','product:address','南京'
                                                    
put 'bigdata:car','product3','product:name','夏利'
put 'bigdata:car','product3','product:info','x3'               
put 'bigdata:car','product3','product:address','上海' 
  
                                                                  
scan 'bigdata:car'
ROW                     COLUMN+CELL                                                      
 product1               column=product:address, timestamp=2023-03-08T14:23:46.731, value=\xE5\x8C\x97\xE4\xBA\xAC
 product1               column=product:info, timestamp=2023-03-08T14:18:12.235, value=x1 
 product1               column=product:name, timestamp=2023-03-08T14:22:49.590, value=\xE5\xAE\x9D\xE9\xA9\xAC
 product2               column=product:address, timestamp=2023-03-08T14:23:58.666, value=\xE5\x8D\x97\xE4\xBA\xAC
 product2               column=product:info, timestamp=2023-03-08T14:18:34.899, value=x2 
 product2               column=product:name, timestamp=2023-03-08T14:23:13.930, value=\xE5\xA5\x94\xE9\xA9\xB0
 product3               column=product:address, timestamp=2023-03-08T14:24:16.804, value=\xE4\xB8\x8A\xE6\xB5\xB7
 product3               column=product:info, timestamp=2023-03-08T14:19:12.294, value=x3 
 product3               column=product:name, timestamp=2023-03-08T14:19:03.873, value=\xE5\xA4\x8F\xE5\x88\xA9

DataGrip中建表

create database bigdata;
USE bigdata;

drop table if exists car;
create external table car(
    id string,
    name string,
    info string,
    address string
)stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with
serdeproperties ("hbase.columns.mapping"=":key,product:name,product:info,product:address")
tblproperties ("hbase.table.name"="bigdata:car");

select * from car;

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/396096.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【记录nuxt2项目运行遇到的问题】

【记录nuxt2项目运行遇到的问题】

背景前段时间小老弟离职了,之前交给他的nuxt2官网项目又回到了我的手中,然后产品跟我说有几个东西需要优化一下,我说小意思,然后我就clone了最新代码准备露一手,然后…我项目就跑不起来了…理论上来说不应该啊,之前这个项目我开发过,不存在环境上的兼容,然后我就npm,cnpm,yarn…

阅读更多...

从0开始自制解释器——实现多位整数的加减法计算器

从0开始自制解释器——实现多位整数的加减法计算器

上一篇我们实现了一个简单的加法计算器，并且了解了基本的词法分析、词法分析器的概念。本篇我们将要对之前实现的加法计算器进行扩展，我们为它添加以下几个功能计算减法能自动识别并跳过空白字符不再局限于单个整数，而是能计算多位整数提…

阅读更多...

基于轻量级YOLOv5开发构建汉字检测识别分析系统

基于轻量级YOLOv5开发构建汉字检测识别分析系统

汉字检测、字母检测、手写数字检测、藏文检测、甲骨文检测在我之前的文章中都有做过了，今天主要是因为实际项目的需要，之前的汉字检测模型较为古老了还使用的yolov3时期的模型，检测精度和推理速度都有不小的滞后了，这里要基于yolo…

阅读更多...

rabbitmq集群-普通模式

rabbitmq集群-普通模式

RabbitMQ的Cluster模式分为两种普通模式镜像模式 1. 概念解释 1.1 什么是普通模式普通集群模式，就是将 RabbitMQ 部署到多台服务器上，每个服务器启动一个 RabbitMQ 实例，多个实例之间进行消息通信。此时我们创建的队列 Queue&#xf…

阅读更多...

Android ANR trace日志如何导出

Android ANR trace日志如何导出

什么是ANR ？上网搜索，一搜一大片，我就说个很容易识别的字眼，XXXAPP无响应 ANR trace日志如何导出？使用ADB命令： adb pull data/anr/trace.txt 你要存放的路径。查看ANR报错位置全局搜索你APP的包名&#x…

阅读更多...

基于MATLAB的无线信道的传播与衰落（附完整代码与分析）

基于MATLAB的无线信道的传播与衰落（附完整代码与分析）

目录一. 一般路径损耗模型 1. 1自由环境下路径损耗 1. 2 考虑实际情况 1.3 考虑阴影衰落二. 代码仿真与理解 （1）函数文件 （2）函数文件 （3）主运行文件三. 运行结果及理解 3.1 3.2 3.3 一. …

阅读更多...

Nacos2.2.0多数据源适配oracle12C-修改Nacos源码

Nacos2.2.0多数据源适配oracle12C-修改Nacos源码

从2.2.0版本开始,可通过SPI机制注入多数据源实现插件,并在引入对应数据源实现后,便可在Nacos启动时通过读取application.properties配置文件中spring.datasource.platform配置项选择加载对应多数据源插件.本文档详细介绍一个多数据源插件如何实现以及如何使其生效。文章目录一…

阅读更多...

机器人运动｜浅谈Time Elastic Band算法

机器人运动｜浅谈Time Elastic Band算法

前言在自主移动机器人路径规划的学习与开发过程中，我接触到Time Elastic Band算法，并将该算法应用于实际机器人，用于机器人的局部路径规划。在此期间，我也阅读了部分论文、官方文档以及多位大佬的文章，在此对各位大佬的…

阅读更多...

git的使用整合

git的使用整合

git的下载和安装暂时不论述了，将git安装后会自动配置环境变量，所以环境变量也不需要配置。一、初始化配置打开git bash here(使用linux系统下运行的口令)，弹出一个类似于cmd的窗口。 （1）配置属性 git config --glob…

阅读更多...

【LLVM系列】基本文件格式和 CFG 生成指令

【LLVM系列】基本文件格式和 CFG 生成指令

一、基本文件格式参考博客：llvm 文件转换图 .c 文件，c语言源代码。.bc 文件，llvm字节码的二进制形式（binary code）。.ll 文件，llvm字节码的文本形式。.s 文件，机器汇编代码。.out 文件&#…

阅读更多...

操作系统-整理

操作系统-整理

进程介绍进程是系统进行资源分配和调度的一个独立单位。每个进程都有自己的独立内存空间，不同进程通过进程间通信来通信。由于进程占据独立的内存，所以上下文进程间的切换开销（栈、寄存器、虚拟内存、文件句柄等）比较大&#…

阅读更多...

第十三章：Java反射机制

第十三章：Java反射机制

第十三章：Java反射机制 13.1：Java反射机制概述 Java Reflection Reflection(反射)是被视为动态语言的关键，反射机制允许程序在执行期借助于Reflection API取得任何类的内部信息，并能直接操作任意对象的内部属性及方法。加…

阅读更多...

Spring Boot 实现多文件上传

Spring Boot 实现多文件上传

文件上传 Spring Boot代码代码结构： Controller层 package com.yqifei.upload.controller;import io.swagger.annotations.Api; import org.springframework.web.bind.annotation.*; import org.springframework.web.multipart.MultipartFile;import javax.serv…

阅读更多...

ETL --事实表

ETL --事实表

每一个事实表通过表的粒度来定义。事实表的粒度是事件度量的定义。我们必须至始至终按照度量如何在现实世界中理解来规定事实表的粒度。所有的事实表包含了一组关联到维表的外键，而这些维表提供了事实表度量的上下文。大多数的事实表还包括了一个或者多个数值型…

阅读更多...

小樽C++ 多章⑧ (贰) 指针与数组

小樽C++ 多章⑧ (贰) 指针与数组

目录 1.C中数组变量名某些情况可以看成是指针 2.C语言的scanf 输入语句，printf 输出语句 3.用指针来当动态数组小樽C 多章⑧ (壹) 指针变量https://blog.csdn.net/weixin_44775255/article/details/129031168 小樽C 多章⑧ (叁) 指针与字符串、(肆) 函数与指针…

阅读更多...

GitLab 凭借什么连续 3 年上榜 Gartner 应用程序安全测试魔力象限？听听 GitLab 自己的分析

GitLab 凭借什么连续 3 年上榜 Gartner 应用程序安全测试魔力象限？听听 GitLab 自己的分析

本文来源：about.gitlab.com 作者：Sandra Gittlen 译者：极狐(GitLab) 市场部内容团队应用程序安全测试（AST）对于应用程序研发来说，是一个正在快速发展并且十分重要的领域。DevOps 方法论提到：需…

阅读更多...

Java基础之《dubbo（1）—dubbo基础入门》

Java基础之《dubbo（1）—dubbo基础入门》

一、为什么要使用dubbo 1、dubbo是什么 dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。 2、dubbo有何特点 （1）远程通讯：提供透明化的远程方法调用，提供…

阅读更多...

入门JAVA第十七天 Oracle的JDBC技术

入门JAVA第十七天 Oracle的JDBC技术

一、数据库JDBC技术学习内容与方法 1.1 学习内容 （1） Oracle数据库目前最好的关系型数据库。基本的CRUD命令 SQL语句。select(R),update(U),delete(D),insert(C) （2） MySQL数据库中小型项目非常好用的关系型数据库。灵活&…

阅读更多...

【零基础入门前端系列】—浮动（十八）

【零基础入门前端系列】—浮动（十八）

【零基础入门前端系列】—浮动（十八） 一、浮动的定义 float属性定义元素在哪个方向，以往这个属性总应用于图像，使得文本围绕在图像的周围，不过在CSS中，任何元素都可以浮动，浮动的元素会生成一…

阅读更多...

【Git】P5 Git 远程仓库（3）pull 发生冲突

【Git】P5 Git 远程仓库（3）pull 发生冲突

pull 发生冲突冲突在什么场景下发生？为什么要先 pull 再 push构建一个冲突场景初始开始操作：程序员2：程序员1：程序员2：发生冲突：查看冲突：解决冲突：冲突在什么场景下发生&#xff1f…

阅读更多...

推荐文章

最新文章