Elasticsearch父子关系解析

news2025/6/3 3:43:59

引言

在复杂业务场景中,数据关联查询是搜索与分析的核心需求。以电商订单、文章评论、客户关系等场景为例,传统关系型数据库通过外键实现的多表关联,在分布式搜索场景下面临性能与扩展性挑战。Elasticsearch通过父子关系(Parent-Child Relationship)提供了一种高效的文档级联方案,支持灵活的多层数据建模与跨文档查询。

本文将以电商订单管理为实例,详解如何通过join字段实现父子文档关联,并结合has_parent/has_child查询完成跨文档检索。无论您是优化数据结构设计,还是解决高并发场景下的关联查询性能问题,均可通过本文掌握Elasticsearch父子关系的核心配置技巧与最佳实践。

父子关系

父子关系是一种在同一索引中将文档建立关联的方式。父子关系让你能够建立一种文档间的层次结构,其中子文档依赖于父文档,类似于关系数据库中的外键关系。在 Elasticsearch 中,父子关系的实现基于 nested type 和 join field(连接字段),并且需要启用 parent-child relationship 的功能。

父子关系概念

  • 父文档(Parent Document):是主文档,通常是需要进行查询和管理的核心数据。
  • 子文档(Child Document):是从文档,通常是依赖于父文档的额外数据或详细信息。

父子关系的应用场景

  • 一个订单(父文档)可以有多个订单商品(子文档)。
  • 一个客户(父文档)可以有多个订单(子文档)。
  • 一篇文章(父文档)可以有多个评论(子文档)。

举例说明

总共创建了3个文档,1 个父文档(订单),2 个子文档(订单商品)。这些文档在同一个索引(ecommerce)中,但它们通过 父子关系 互相关联。父文档为 order 类型,子文档为 order_item 类型,子文档通过 parent 字段指向父文档的 ID,从而建立了父子关系。

创建索引与映射

为 ecommerce 索引创建了一个 join 字段 relationship,并指定了父子关系:order 是父文档,order_item 是子文档。

PUT /ecommerce
{
  "mappings": {
    "properties": {
      "relationship": {
        "type": "join",
        "relations": {
          "order": "order_item"  // order 是父文档,order_item 是子文档
        }
      },
      "order_id": {
        "type": "keyword"
      },
      "product_name": {
        "type": "text"
      },
      "quantity": {
        "type": "integer"
      },
      "price": {
        "type": "double"
      }
    }
  }
}

插入父文档(订单)

插入一个父文档(订单),它没有任何子文档。

POST /ecommerce/_doc/1
{
  "order_id": "ORD12345",
  "relationship": {
    "name": "order"
  }
}

插入子文档(订单商品)

插入几个子文档(订单商品)。子文档需要指定 relationship 字段,指出它依赖的父文档。子文档 order_item 的 parent 字段指定了它所依赖的父文档(订单)的 ID。

POST /ecommerce/_doc/2
{
  "product_name": "Laptop",
  "quantity": 1,
  "price": 1200.00,
  "relationship": {
    "name": "order_item",
    "parent": "1"  // 指定父文档的ID
  }
}

POST /ecommerce/_doc/3
{
  "product_name": "Mouse",
  "quantity": 2,
  "price": 25.50,
  "relationship": {
    "name": "order_item",
    "parent": "1"   // 指定父文档的ID
  }
}

查询子文档

使用 has_parent 查询来获取特定父文档下的所有子文档。例如,我们想查找订单 ORD12345 下的所有商品。

GET /ecommerce/_search
{
  "query": {
    "has_parent": {
      "parent_type": "order",  // 父文档类型
      "query": {
        "match": {
          "order_id": "ORD12345"  // 查询父文档 ID
        }
      }
    }
  }
}

查询父文档

使用 has_child 查询来获取某个子文档下的父文档。例如,我们想查找包含 Laptop 这一商品的订单。

GET /ecommerce/_search
{
  "query": {
    "has_child": {
      "type": "order_item",  // 子文档类型
      "query": {
        "match": {
          "product_name": "Laptop"  // 查询子文档的字段
        }
      }
    }
  }
}

感谢您的阅读!如果文章中有任何问题或不足之处,欢迎及时指出,您的反馈将帮助我不断改进与完善。期待与您共同探讨技术,共同进步!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2395104.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeeCode 98. 验证二叉搜索树

给你一个二叉树的根节点 root ,判断其是否是一个有效的二叉搜索树。 有效 二叉搜索树定义如下: 节点的左子树只包含 小于 当前节点的数。节点的右子树只包含 大于 当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。 提示: 树中节…

JVM类加载高阶实战:从双亲委派到弹性架构的设计进化

前言 作为Java开发者,我们都知道JVM的类加载机制遵循"双亲委派"原则。但在实际开发中,特别是在金融支付、插件化架构等场景下,严格遵循这个原则反而会成为系统扩展的桎梏。本文将带你深入理解双亲委派机制的本质,并分享…

threejsPBR材质与纹理贴图

1. PBR材质简介 本节课没有具体的代码,就是给大家科普一下PBR材质,所谓PBR就是,基于物理的渲染(physically-based rendering)。 Three.js提供了两个PBR材质相关的APIMeshStandardMaterial和MeshPhysicalMaterial,MeshPhysicalMaterial是Mes…

深兰科技董事长陈海波受邀出席2025苏商高质量发展(常州)峰会,共话AI驱动产业升级

5月29日,2025苏商高质量发展峰会在常州隆重开幕。本次峰会聚焦新质生产力培育与产业创新转型,汇聚了众多江苏省内知名企业家、专家学者及政府代表。深兰科技创始人、董事长陈海波作为人工智能领域的领军企业代表,受邀出席盛会并参与重要活动环…

Git入门到精通:30分钟掌握核心技巧

目录 一、基础理论片 Git简介 Git安装 Git仓库 Git基本命令用法 仓库别名 二、实操命令篇 远程分支 分支的新建和合并 实操演示 1 本地新建仓库 2 gitee新建仓库 3 建立关系 4 新建分支 5 开发新功能 6 推送新分支 7 合并新分支到主分支 三、可视化工具篇 G…

Redis7底层数据结构解析

redisObject 在 Redis 的源码中,Redis 会将底层数据结构(如 SDS、hash table、skiplist 等)统一封装成一个对象,这个对象叫做 redisObject,也简称 robj。 typedef struct redisObject {unsigned type : 4; // 数…

多部手机连接同一wifi的ip一样吗?

在家庭和办公环境中,多台手机同时连接同一个WiFi路由器已成为常态。不少用户会产生疑问:这些设备的IP地址会相同吗?下面就一起来了解一下吧。 一、多部手机连接同一WiFi的IP‌一样吗 多部手机连接同一WiFi时的IP地址是否相同,需要…

大语言模型值ollama使用(1)

ollama为本地调用大语言模型提供了便捷的方式。下面列举如何在windows系统中快捷调用ollama。 winR打开运行框,输入cmd 1、输入ollama list 显示已下载模型 2、输入ollama pull llama3 下载llama3模型 3、 输入 ollama run llama3 运行模型 4、其他 ollama li…

thc-ssl-dos:SSL 压力测试的轻量级工具!全参数详细教程!Kali Linux教程!

简介 THC-SSL-DOS 是一款用于验证 SSL 性能的工具。 建立安全的 SSL 连接需要服务器比客户端高 15 倍的处理能力。 THC-SSL-DOS 利用这种不对称特性,通过使服务器过载并使其断网。 此问题影响当今所有 SSL 实现。供应商自 2003 年以来就已意识到这个问题&#x…

【速通RAG实战:进阶】17、AI视频打点全攻略:从技术实现到媒体工作流提效的实战指南

一、AI视频打点的技术底层与数据处理流程 (一)视频内容结构化的核心技术栈 AI视频打点的本质是将非结构化视频数据转化为带时间戳的结构化信息,其技术流程涵盖音视频处理、语音识别、自然语言处理三大核心模块,形成“数据采集-内容解析-智能标记-协同应用”的完整闭环。 …

立控信息智能装备柜:科技赋能军队装备管理现代化

在军事装备管理领域,高效、安全、智能化的存储解决方案至关重要。传统的人工管理模式不仅效率低下,还容易因人为疏忽导致装备丢失或管理混乱。​LKONE智能装备柜凭借先进的物联网技术、生物识别安全系统和智能管理功能,为军队提供了一套高效、…

【freertos-kernel】queue(发送)

文章目录 补充各种yeildTCB的xStateListItem和xEventListItem xQueueGenericSendprvCopyDataToQueueprvNotifyQueueSetContainervTaskInternalSetTimeOutStatevTaskSuspendAllxTaskResumeAllprvLockQueueprvUnlockQueueprvIncrementQueueTxLockvTaskPlaceOnEventListprvAddCurr…

破解高原运维难题:分布式光伏智能监控系统的应用研究

安科瑞刘鸿鹏 摘要 高原地区光照资源丰富,具有发展分布式光伏发电的巨大潜力。然而,该地区复杂的气候环境、地形地貌和运维条件对光伏电站的运行与维护带来严峻挑战。本文结合Acrel1000DP分布式光伏监控系统的技术特点和典型应用案例,探讨其…

图标变白,开始菜单栏无法打开程序(以jupyter为例)

不知道是本人删了一些东西导致的还是什么原因,总之现在本人的jupyter只能通过命令行打开,以往我是从开始菜单栏打开。琢磨了一段时间,发现是.ico文件没有了。重新在网上下载图片,用网站图片转 ico 图标 - 锤子在线工具 转换一下格…

大语言模型(LLM)入门 - (1) 相关概念

文章来自:大语言模型(LLM)小白入门自学项目-TiaoYu-1 GitHub - tiaoyu1122/TiaoYu-1: For People! For Freedom!For People! For Freedom! Contribute to tiaoyu1122/TiaoYu-1 development by creating an account on GitHub.https://github.com/tiaoyu1122/TiaoYu…

行为型:访问者模式

目录 1、核心思想 2、实现方式 2.1 模式结构 2.2 实现案例 3、优缺点分析 4、适用场景 1、核心思想 目的:数据结构稳定的情况下,解决数据与算法的耦合问题。适用于对象结构稳定但需频繁扩展操作的场景。 实现:在访问数据时根据数据类…

C++数据结构 : 哈希表的实现

C数据结构 : 哈希表的实现 目录 C数据结构 : 哈希表的实现引言1. 哈希概念1.1 直接定址法1.2 哈希冲突1.3 负载因子 2. 哈希函数2.1 除法散列法/除留余数法2.2 乘法散列法(了解)2.3 全域散列法(了解) 3. 处…

AD9268、AD9643调试过程中遇到的问题

Ad9268芯片 AD9268是一款双通道、16位、80 MSPS/105 MSPS/125 MSPS模数转换器(ADC)。AD9268旨在支持要求高性能、低成本、小尺寸和多功能的通信应用。双通道ADC内核采用多级差分流水线架构,集成输出纠错逻辑。每个ADC都具有宽带宽、差分采样保持模拟输入放大器&…

webpack CDN打包优化

CDN网络分发服务 请求资源时最近的服务器将缓存内容交给用户 体积较大且变动不多的文件存在CDN文件中 react react-dom资源 // 添加自定义对于webpack的配置const path require(path) const { whenProd, getPlugin, pluginByName } require(craco/craco)module.exports {//…

ARM内核一览

经常看介绍某某牛批芯片用的又是ARM什么核,看的云里雾里,所以简单整理整理。(内容来自官网和GPT) 1 ARM 内核总体分类 系列特点应用场景Cortex-M超低功耗、低成本、实时性嵌入式系统、微控制器、IoTCortex-R高可靠性、硬实时汽车…