【Elasticsearch】映射：fielddata 详解

news2026/5/3 14:11:04

映射：fielddata 详解

1.fielddata 是什么
2.fielddata 的工作原理
3.主要用法
- 3.1 启用 fielddata（通常在 text 字段上）
- 3.2 监控 fielddata 使用情况
- 3.3 清除 fielddata 缓存
4.使用场景示例
- 示例 1：对 text 字段进行聚合
- 示例 2：对 text 字段进行排序
5.fielddata 与 doc_values 的区别
6.注意事项
7.最佳实践

1.fielddata 是什么

fielddata 是 Elasticsearch 中一种数据结构，用于在内存中缓存字段数据，主要服务于以下场景：

聚合操作（Aggregations）
排序（Sorting）
脚本计算（Scripting）
某些类型的查询（如 field 字段上的 term 查询）

当需要对 text 字段或其他非 doc_values 支持的字段执行上述操作时，Elasticsearch 需要将这些字段的值加载到内存中，这就是 fielddata 的作用。

2.fielddata 的工作原理

按需加载：当第一次需要对某个字段执行聚合 / 排序等操作时，Elasticsearch 会从磁盘读取该字段的所有值并构建内存中的数据结构。
存储在 JVM 堆内存：fielddata 会占用 JVM 堆内存空间。
字段级启用：默认情况下，text 字段禁用 fielddata，keyword 字段使用 doc_values 而非 fielddata。

3.主要用法

3.1 启用 fielddata（通常在 text 字段上）

PUT my_index/_mapping
{
  "properties": {
    "my_text_field": { 
      "type":     "text",
      "fielddata": true
    }
  }
}

3.2 监控 fielddata 使用情况

GET _nodes/stats/indices/fielddata?fields=*

3.3 清除 fielddata 缓存

POST my_index/_cache/clear?fielddata=true

4.使用场景示例

示例 1：对 text 字段进行聚合

GET my_index/_search
{
  "size": 0,
  "aggs": {
    "my_terms": {
      "terms": {
        "field": "my_text_field"  // 需要该字段启用 fielddata
      }
    }
  }
}

示例 2：对 text 字段进行排序

GET my_index/_search
{
  "sort": [
    {
      "my_text_field": {
        "order": "asc"
      }
    }
  ]
}

5.fielddata 与 doc_values 的区别

特性	`fielddata`	`doc_values`
构建时机	查询时按需构建	索引时预先构建
存储位置	JVM 堆内存	磁盘（操作系统缓存）
内存占用	高	低
适用字段类型	主要为 `text` 字段	主要为 `keyword` / `numeric` / `date` 等字段
默认启用	`text` 字段默认禁用	支持的字段默认启用

6.注意事项

内存消耗：fielddata 会显著增加内存使用，特别是高基数（大量唯一值）字段。
性能影响：首次加载 fielddata 可能导致查询延迟。
替代方案：对于 keyword / numeric / date 等字段，优先使用 doc_values。
熔断机制：Elasticsearch 有 fielddata 熔断器防止内存耗尽。

7.最佳实践

尽量避免在 text 字段上启用 fielddata。

如需对文本进行聚合/排序，考虑使用多字段（multi-field）映射：

"my_field": {
  "type": "text",
  "fields": {
    "keyword": {
      "type": "keyword"
    }
  }
}

然后对 my_field.keyword 进行操作。

监控 fielddata 内存使用，设置合理的熔断阈值。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2405249.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【Elasticsearch】映射：fielddata 详解

映射：fielddata 详解

1.fielddata 是什么

2.fielddata 的工作原理

3.主要用法

3.1 启用 fielddata（通常在 text 字段上）

3.2 监控 fielddata 使用情况

3.3 清除 fielddata 缓存

4.使用场景示例

示例 1：对 text 字段进行聚合

示例 2：对 text 字段进行排序

5.fielddata 与 doc_values 的区别

6.注意事项

7.最佳实践

相关文章

mariadb5.5.56在centos7.6环境安装

打造你的 Android 图像编辑器：深入解析 PhotoEditor 开源库

Azure 虚拟机端口资源：专用 IP 和公共 IP Azure Machine Learning 计算实例BUG

Java核心技术-卷I-读书笔记（第十二版）

MATLAB遍历生成20到1000个节点的无线通信网络拓扑推理数据

卫星接收天线G/T值怎么计算？附G/T计算excel表格链接

基于dify的营养分析工作流：3分钟生成个人营养分析报告

新成果：GaN基VCSEL动态物理模型开发

Appium+python自动化（十一）- 元素定位- 下

免费批量PDF转Word工具

Mac/iOS 如何解压 RAR 格式压缩包：常用工具与详细操作步骤

机器学习监督学习实战四：九种回归算法对波士顿房价数据进行回归预测和评估方法可视化

微软重磅发布Magentic UI，交互式AI Agent助手实测！

老年生活照护实训室建设规划：照护质量评估与持续改进实训体系

【python深度学习】Day 48 PyTorch基本数据类型与操作

【大模型】【推荐系统】LLM在推荐系统中的应用价值

uni-app学习笔记二十九--数据缓存

工作邮箱收到钓鱼邮件，点了链接进去无法访问，会有什么问题吗?

基于安卓的线上考试APP源码数据库文档

【数据结构】顺序表和链表详解(下)