之前都是在客户端页面各种操作, 但是我们作为一个java开发者,需要使用代码的方式 来操作ES, 所以我们要先从 Rest Client 开始
准备数据
既然是ES 查数据 不整点测试数据 没法下饭是吧 先建个酒店表 搞点数据:
 
 (新手可能会好奇? 我靠 不是玩ES吗?? 怎么扯到mysql里面来了,不着急 我们先把数据放着 到时候再弄进ES)
Rest Client
我们用redis 有jedis java客户端, 用rabbitmq 也有AMQP ,用mysql有jdbc。 那用ES 肯定也会有个java客户端对吧? 它就是 java rest client。
我们做一部分准备工作 包括idea 框架准备 mybatis依赖 数据库建表 导入数据,Rest Client依赖相关的都准备好。 这些很简单就不赘述了
分析数据结构
首先我们在数据库中的 旅店 表 ddl是这样的:
CREATE TABLE `tb_hotel` (
  `id` bigint NOT NULL COMMENT '酒店id',
  `name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店名称',
  `address` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店地址',
  `price` int NOT NULL COMMENT '酒店价格',
  `score` int NOT NULL COMMENT '酒店评分',
  `brand` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店品牌',
  `city` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '所在城市',
  `star_name` varchar(16) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '酒店星级,1星到5星,1钻到5钻',
  `business` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '商圈',
  `latitude` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '纬度',
  `longitude` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '经度',
  `pic` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '酒店图片',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci ROW_FORMAT=COMPACT;
在数据库里面大家都很熟悉, 但是有没想过我们上一篇讲过的ES的数据是怎么存的?建索引库 然后定义mapping, 包括里面有哪些字段 怎么定义 是否加索引 参与搜索, 是否分词,分词器是什么?
这些就是我们把上面mysql的数据导入到ES中的时候需要考虑的:
我们来实践编写一下mapping:
PUT /hotel
{
  "mappings":{
    "properties":{
      "id":{
        "type":"keyword"
      },
      
      "name":{
        "type":"text",
        "analyzer":"ik_max_word",
        "copy_to": "all"
        
      },
      
      "address":{
        "type":"keyword",
        "index":false   
      },
      
      "price":{
        "type":"integer"
      },
      
      "score":{
        "type":"integer"
      },
      
      "brand":{
        "type":"keyword",
        "copy_to": "all"
      },
      
      "city":{
        "type":"keyword"
      },    
      
      "starName":{
        "type":"keyword"
      },     
            
      "business":{
        "type":"keyword",
        "copy_to": "all"
      },  
      
      "location":{
        "type":"geo_point"
      },   
      
      "pic":{
        "type":"keyword",
        "index":false   
      }, 
      
      "all":{
        "type":"text",
        "analyzer":"ik_max_word"        
      }
    }
  }
}
这个地方要按照上一篇 ES 索引库 mapping的理解来写,比如有的字段需要分词 那么就text+分词器。 不需要分词 就用keyword。 不需要搜索的字段就加 “index”:false 。
然后还有定义了一个all。 它是一个分词的text, 它是由前面字段里面 所有带 copy to all的字段组合而成的。 意味着之后 我搜索的时候 可以这几个字段一起搜。
初始化javaRestCliet
引入依赖:
    <properties>
        <java.version>1.8</java.version>
        <elasticsearch.version>7.12.1</elasticsearch.version>
    </properties>
    <dependencies>
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-high-level-client</artifactId>
            <version>7.12.1</version>
        </dependency>
写一个简单的单元测试:
public class HotelIndexTest {
    private RestHighLevelClient client;
    @BeforeEach
    void setUp(){
        this.client = new RestHighLevelClient(RestClient.builder(
                HttpHost.create("http://192.168.88.151:9200")
        ));
    }
    @AfterEach
    void tearDown() throws IOException {
        this.client.close();
    }
    @Test
    void testInit(){
        System.out.println(client);
    }
}













