orm详解--查询执行

news2025/5/28 1:31:38

深入解析 Django ORM 查询执行阶段 的核心机制,包括查询集的惰性特性、表达式树构建、SQL 编译过程及优化原理。以下是详细分析:

一、查询集(QuerySet)的惰性执行机制

1. 惰性特性的底层实现
  • 核心类django.db.models.query.QuerySet
  • 关键属性
    • query:存储查询逻辑的 django.db.models.sql.Query 对象
    • _result_cache:结果缓存(初始为 None,首次求值后填充)
  • 惰性触发逻辑
    # 创建查询集(未执行 SQL)
    qs = Book.objects.filter(author="Doubao")
    
    # qs.query 对象此时包含:
    # {
    #   'model': Book,
    #   'where': [AND, =(author, "Doubao")],
    #   'limit': None,
    #   'offset': None,
    #   'order_by': []
    # }
    
2. 链式操作原理
  • 每次调用 filter()exclude()order_by() 等方法时:
    1. 创建新的 QuerySet 对象
    2. 复制原 QuerySetquery 对象
    3. 在新 query 对象上添加操作
  • 示例代码
    qs1 = Book.objects.filter(author="Doubao")  # QuerySet A
    qs2 = qs1.order_by("-price")               # QuerySet B(复制 QuerySet A 的 query 并添加排序)
    
    # qs2.query 现在包含:
    # {
    #   'model': Book,
    #   'where': [AND, =(author, "Doubao")],
    #   'order_by': ["-price"]
    # }
    

二、查询表达式树(Query Expression Tree)

1. 核心组件
  • WhereNode:表示 SQL 的 WHERE 子句
    • 操作类型:ANDORNOT
    • 子节点:可以是其他 WhereNode 或具体条件
  • Lookup:表示具体的查询条件(如 author="Doubao"
    • 包含:字段、操作符(如 exactgt)、值
2. 复杂查询树构建示例
# Python 查询
books = Book.objects.filter(
    Q(author="Doubao") & Q(price__gt=50) | Q(published_date__year=2023)
)

# 对应的表达式树结构(简化表示):
# WhereNode(connector=OR):
#   ├─ WhereNode(connector=AND):
#   │    ├─ Lookup(field=author, lookup=exact, value="Doubao")
#   │    └─ Lookup(field=price, lookup=gt, value=50)
#   └─ Lookup(field=published_date__year, lookup=exact, value=2023)

三、SQL 编译过程

1. 触发编译的操作

以下方法会触发 SQL 编译和执行:

  • 迭代操作for book in queryset
  • 切片操作queryset[0:10](带步长的切片会强制求值)
  • 聚合方法count()exists()aggregate()
  • 获取单个对象first()last()get()
2. SQLCompiler 工作流程
  • 核心类django.db.backends.*.compiler.SQLCompiler
  • 编译步骤
    1. 生成 SELECT 列表:根据 values() 或模型字段确定返回列
    2. 构建 FROM 子句:处理表名和别名
    3. 编译 WHERE 子句:将 WhereNode 转换为 SQL 条件
    4. 处理 JOIN:根据关联关系生成 INNER JOIN/LEFT OUTER JOIN
    5. 添加 LIMIT/OFFSET:处理分页逻辑
    6. 生成 ORDER BY:根据 order_by() 生成排序规则
3. 参数化查询实现
  • 所有动态值通过占位符传递,防止 SQL 注入:
    # Python 查询
    Book.objects.filter(title__contains="Django")
    
    # 生成的 SQL(PostgreSQL 示例)
    SELECT "books"."id", "books"."title"
    FROM "books"
    WHERE "books"."title" LIKE %s;
    
    # 参数:['%Django%']
    

四、聚合查询的实现

1. annotate() 方法
  • 实现原理
    1. 在 SELECT 列表中添加聚合表达式
    2. 自动添加 GROUP BY 子句(如果需要)
  • 示例
    # 查询每本书的评论数
    books = Book.objects.annotate(review_count=Count("reviews"))
    
    # 生成的 SQL(简化)
    SELECT 
        "books"."id", 
        "books"."title", 
        COUNT("reviews"."id") AS "review_count"
    FROM "books"
    LEFT OUTER JOIN "reviews" ON ("books"."id" = "reviews"."book_id")
    GROUP BY "books"."id";
    
2. F() 表达式与数据库计算
  • 作用:直接在 SQL 中引用字段值,避免 Python 层面的数据传输
  • 示例
    # 将所有书的价格提高 10%
    Book.objects.update(price=F("price") * 1.1)
    
    # 生成的 SQL
    UPDATE "books" SET "price" = "books"."price" * 1.1;
    

五、优化机制

1. 查询缓存
  • 一级缓存QuerySet._result_cache
    • 首次求值后缓存结果
    • 重复访问直接返回缓存
  • 示例
    qs = Book.objects.all()
    list(qs)  # 执行 SQL 并缓存结果
    list(qs)  # 直接从缓存获取,不执行 SQL
    
2. 延迟加载与预加载
  • 延迟加载(Lazy Loading)
    book = Book.objects.first()
    reviews = book.reviews.all()  # 触发额外 SQL 查询
    
  • 预加载(Eager Loading)
    # 使用 prefetch_related() 减少查询次数
    books = Book.objects.prefetch_related("reviews")
    for book in books:
        reviews = book.reviews.all()  # 无需额外查询
    

六、源码分析示例

1. QuerySet.filter() 方法
# django/db/models/query.py
class QuerySet:
    def filter(self, *args, **kwargs):
        return self._filter_or_exclude(False, *args, **kwargs)
        
    def _filter_or_exclude(self, negate, *args, **kwargs):
        clone = self._chain()  # 创建 QuerySet 副本
        clone.query.add_q(Q(*args, **kwargs))  # 添加查询条件到 query 对象
        if negate:
            clone.query.negate()
        return clone
2. SQLCompiler.as_sql() 方法
# django/db/backends/sqlite3/compiler.py
class SQLCompiler:
    def as_sql(self):
        # 生成 SELECT 列表
        select, select_params = self.get_select()
        
        # 生成 FROM 子句
        from_, from_params = self.get_from_clause()
        
        # 生成 WHERE 子句
        where, where_params = self.compile(self.query.where)
        
        # 生成 ORDER BY 子句
        order_by, order_params = self.get_order_by()
        
        # 组装完整 SQL
        sql = "SELECT %s FROM %s" % (select, from_)
        if where:
            sql += " WHERE %s" % where
        if order_by:
            sql += " ORDER BY %s" % order_by
            
        return sql, select_params + from_params + where_params + order_params

七、常见性能陷阱与优化

1. N+1 查询问题
  • 问题场景
    # 触发 1 次查询获取所有书
    books = Book.objects.all()
    
    # 遍历每本书时触发 N 次查询获取作者
    for book in books:
        print(book.author.name)  # 每次循环触发一次 SQL
    
  • 优化方案
    # 使用 select_related() 减少查询次数到 1 次
    books = Book.objects.select_related("author")
    for book in books:
        print(book.author.name)  # 无需额外查询
    
2. 过度使用 values()
  • 错误做法
    # 返回字典,失去模型方法
    data = Book.objects.values("id", "title")
    
  • 优化方案
    # 使用 only() 仅加载需要的字段,保留模型实例
    books = Book.objects.only("id", "title")
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2387140.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

运行打印Hello World启动了多少线程?

序言 看网上说阿里二面问到了一个看似最简单且没有标准答案的一个问题,所有学习编程都是从打印hello World开始的,那运行打印启动了多少个线程? 启动了多少线程? 在运行一个简单的 “Hello World” 程序时,启动的线…

java交易所,多语言,外汇,黄金,区块链,dapp类型的,支持授权,划转,挖矿(源码下载)

目前这套主要是运营交易所类型的,授权的会贵点,编译后的是可以直接跑的,图片也修复了,后门也扫了 都是在跑的项目支持测,全开源 源码下载:https://download.csdn.net/download/m0_66047725/90887047 更多…

(已开源-CVPR2024) RadarDistill---NuScenes数据集Radar检测第一名

本文介绍一篇Radar 3D目标检测模型:RadarDistill。雷达数据固有的噪声和稀疏性给3D目标检测带来了巨大挑战。在本文中,作者提出了一种新的知识蒸馏(KD)方法RadarDistill,它可以通过利用激光雷达数据来提高雷达数据的表征。RadarDistill利用三…

【MySQL】 数据库基础数据类型

一、数据库简介 1.什么是数据库 数据库(Database)是一种用于存储、管理和检索数据的系统化集合。它允许用户以结构化的方式存储大量数据,并通过高效的方式访问和操作这些数据。数据库通常由数据库管理系统(DBMS)管理&…

MongoDB 错误处理与调试完全指南:从入门到精通

在当今数据驱动的世界中,MongoDB 作为最流行的 NoSQL 数据库之一,因其灵活的数据模型和强大的扩展能力而广受开发者喜爱。然而,与任何复杂系统一样,在使用 MongoDB 过程中难免会遇到各种错误和性能问题。本文将全面介绍 MongoDB 的…

【C++】stack,queue和priority_queue(优先级队列)

文章目录 前言一、栈(stack)和队列(queue)的相关接口1.栈的相关接口2.队列的相关接口 二、栈(stack)和队列(queue)的模拟实现1.stack的模拟实现2.queue的模拟实现 三、priority_queu…

ubuntu中上传项目至GitHub仓库教程

一、到github官网注册用户 1.注册用户 地址:https://github.com/ 2.安装Git 打开终端,输入指令git,检查是否已安装Git 如果没有安装就输入指令 sudo apt-get install git 二、上传项目到github 1.创建项目仓库 进入github主页,点击号…

windows 下用yolov5 训练模型 给到opencv 使用

windows 使用yolov5训练模型,之后opencv加载模型进行推理。 一,搭建环境 安装 Anaconda 二,创建虚拟环境并安装yolov5 conda create -n yolov5 python3.9 -y conda activate yolov5 git clone https://github.com/ultralytics/yolov5 cd …

Spark集群架构解析:核心组件与Standalone、YARN模式深度对比(AM,Container,Driver,Executor)

一、核心组件定义与关系拆解 1. ApplicationMaster(AM) 定义:YARN 框架中的应用管理器,每个应用程序(如 Spark 作业)对应一个 AM。职责: 向 YARN 的 ResourceManager 申请资源(Con…

Linux Kernel调试:强大的printk(二)

前言 如果你对printk的基本用法还不熟悉,请先阅读: Linux Kernel调试:强大的printk(一) 上一篇Linux Kernel调试:强大的printk(一)我们介绍了printk的基础知识和基本用法&#xf…

Kafka Kraft模式集群 + ssl

文章目录 启用集群资源规划准备证书创建相关文件夹配置文件启动各Kafka节点 故障转移测试spring boot集成 启用集群 配置集群时关键就是提前梳理好需要的网络资源,完成对应server.properties文件的配置。在执行前先把这些梳理好,可以方便后面的配置&…

[crxjs]自己创建一个浏览器插件

参考官方 https://crxjs.dev/vite-plugin/getting-started/vue/create-project 按照流程操作会失败的原因 是因为跨域的问题, 在此处添加 server: {host: "localhost",port: 5173,cors: true,headers: {"Access-Control-Allow-Origin": "*",}…

类的设计模式——单例、工厂以及建造者模式

1.单例模式 1.1 饿汉模式 单例模式:一个类只能创建一个对象,这个设计模式可以保证系统中该类只有一个实例,并提供一个访问它的全局访问点,该实例被所有程序模块共享。 饿汉模式指在程序初始化时就创建一个唯一的实例对象。适用…

STM32之看门狗(IWDG)

一、看门狗外设的原理与应用 背景说明 随着单片机的发展,单片机在家用电器、工业自动化、生产过程控制、智能仪器仪表等领域的应用越来越广泛。然而处于同一电力系统中的各种电气设备通过电或磁的联系彼此紧密相连,相互影响,由于运行方式的…

跟着华为去变革 ——读《常变与长青》有感

《常变与长青》,是华为郭平总2024年上市的著作。走进这本书,我们能够清晰看到华为30多年的成长过程和伴随期间的变革历程:从一家设备代理商开始,起步蹒跚,砥砺前行,在闯过一个又一个磨难之后,成…

图像分割技术的实现与比较分析

引言 图像分割是计算机视觉领域中的一项基础技术,其目标是将数字图像划分为多个图像子区域(像素的集合),以简化图像表示,便于后续分析和理解。在医学影像、遥感图像分析、自动驾驶、工业检测等众多领域,图…

node.js配置变量

一、下载安装包 1、官网下载 大家可以在官网下载,适合自己电脑以及项目的需要的版本。 二、node.js安装 1、安装 双击下载的安装包文件,通常为 .exe 或 .msi 格式(Windows)或 .dmg 格式(Mac)。系统会…

Ubuntu+Docker+内网穿透:保姆级教程实现安卓开发环境远程部署

文章目录 前言1. 虚拟化环境检查2. Android 模拟器部署3. Ubuntu安装Cpolar4. 配置公网地址5. 远程访问小结 6. 固定Cpolar公网地址7. 固定地址访问 前言 本文将详细介绍一种创新性的云开发架构:基于Ubuntu系统构建Android仿真容器环境,并集成安全隧道技…

计算机网络总结(物理层,链路层)

目录 第一章 概述 1.基本概念 2.- C/S模式,B/S模式,P2P模式 3.- LAN,WAN,MAN,PAN的划分 4.电路交换与分组交换,数据报交换和虚电路交换 第二章 物理层 1.信号编码:不归零编码,曼切斯特编码 2.几种复用技术的特…

TIGER - 一个轻量高效的语音分离模型,支持人声伴奏分离、音频说话人分离等 支持50系显卡 本地一键整合包下载

TIGER 是一种轻量级语音分离模型,通过频段分割、多尺度及全频帧建模有效提取关键声学特征。该项目由来自清华大学主导研发,通过频率带分割、多尺度以及全频率帧建模的方式,有效地提取关键声学特征,从而实现高效的语音分离。 TIGER…