Rekall:基于时空查询的视频内容智能检索开源框架

news2026/5/17 7:05:52
1. 项目概述Rekall一个面向视频时空查询的开源利器如果你曾经尝试过从一段长视频里精准地找出“那个穿红色衣服的人从画面左侧走到右侧的片段”或者想快速定位“所有出现这只特定宠物狗的镜头”你就会知道这有多麻烦。传统的视频检索要么依赖人工打标签效率低下要么只能进行简单的关键词或时间戳搜索对于复杂的时空关系谁、在什么时间、出现在哪里、做了什么几乎无能为力。这正是aggarwalkartik/rekall这个开源项目要解决的核心痛点。Rekall 不是一个视频播放器也不是一个剪辑软件。它是一个用于视频时空查询Spatiotemporal Query的 Python 库和工具集。简单来说它允许你像查询数据库一样用逻辑表达式来“查询”视频内容。你不再需要手动拖动进度条而是可以编写诸如“查找所有人物A与人物B同时出现在画面中且人物A正在挥手的片段”这样的查询语句Rekall 会利用其背后的计算机视觉模型自动分析视频并返回精确到帧的时间区间和空间边界框。这个项目特别适合计算机视觉研究者、视频内容分析工程师、安防监控领域的开发者以及任何需要从海量视频数据中高效、自动化提取结构化信息的从业者。它把视频从连续的像素流变成了一个可编程、可查询的“时空数据库”。接下来我将深入拆解它的设计思路、核心技术栈、实操方法以及我趟过的一些坑希望能帮你快速上手并应用到实际项目中。2. 核心设计理念与技术栈拆解2.1 从“看视频”到“查视频”范式转换Rekall 的核心创新在于其提出的“时空查询”范式。传统视频处理流程通常是线性的先用人脸检测模型跑一遍视频再用行为识别模型跑一遍然后将结果存储起来最后写脚本去关联这些结果。这个过程耦合度高扩展性差增加一个新的查询条件比如“靠近窗户”可能就需要重新设计流程。Rekall 则采用了声明式的查询语言。它将视频分析解构为几个核心的、可组合的原子操作检测Detect识别出视频帧中的物体如人、车、狗并给出其边界框Bounding Box和置信度。跟踪Track将不同帧中属于同一个物体的检测框关联起来形成随时间移动的轨迹Trajectory。谓词Predicate定义物体或轨迹需要满足的条件例如class_is(person)、bbox_height_at_least(100)。时空关系Spatiotemporal Relation定义不同轨迹之间的关系例如before时间先后、meets时间紧接、overlaps时间重叠、spatially_near空间临近。用户通过组合这些原子操作形成一个查询表达式。Rekall 的引擎会解析这个表达式生成一个最优化的执行计划调用相应的视觉模型如 YOLO 用于检测SORT/DeepSORT 用于跟踪来处理视频并最终返回满足所有条件的视频片段集合。这种设计使得查询逻辑与底层模型执行分离极大地提升了灵活性和复用性。2.2 技术栈深度剖析Rekall 不是一个从零开始造轮子的项目它聪明地站在了巨人的肩膀上整合了当前计算机视觉领域的成熟组件查询语言与执行引擎这是 Rekall 的大脑。它自定义了一套领域特定语言DSL用于表达时空查询。引擎负责将高级查询编译成底层的、可并行化的计算图。这部分是 Rekall 的原创核心。计算机视觉模型集成作为四肢Rekall 本身不训练模型而是通过接口集成主流框架。它深度集成了Detectron2Facebook AI Research 的物体检测与分割库和PyTorch。这意味着你可以轻松使用在 COCO、LVIS 等大型数据集上预训练的、性能强大的模型如 Faster R-CNN, Mask R-CNN来进行物体检测和实例分割。多目标跟踪MOT为了实现时空查询中的“时”维度稳定的跟踪算法必不可少。Rekall 内置或可以对接像SORT和DeepSORT这样的经典多目标跟踪器将离散的检测框连接成连续的轨迹。视频解码与处理使用OpenCV或PyAV进行高效的视频帧抽取和解码这是处理流程的输入环节。交互式开发与可视化项目提供了Jupyter Notebook友好的接口和可视化工具允许用户交互式地构建查询、即时查看检测/跟踪结果以及查询命中的片段这对算法调试和原型验证至关重要。注意Rekall 对硬件有一定要求。由于需要运行深度学习模型拥有 NVIDIA GPU 和足够的显存会显著提升处理速度。纯 CPU 环境可以运行但处理长视频时会非常缓慢。3. 环境搭建与基础实操指南3.1 系统环境与依赖安装我的实践环境是 Ubuntu 20.04 LTS配备 NVIDIA RTX 3080 GPUCUDA 11.3。以下步骤在类似环境下应可复现。首先强烈建议使用Conda或Python virtualenv创建独立的虚拟环境避免依赖冲突。# 创建并激活 conda 环境 conda create -n rekall_env python3.8 conda activate rekall_envRekall 的核心安装可以通过 pip 进行。但因为它依赖 Detectron2而 Detectron2 需要与你的 PyTorch 和 CUDA 版本精确匹配所以我们需要先安装 PyTorch。# 根据你的 CUDA 版本安装 PyTorch。以 CUDA 11.3 为例 pip install torch1.12.1cu113 torchvision0.13.1cu113 torchaudio0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113 # 安装 Rekall 核心库 pip install rekall-py接下来是最关键也最容易出错的一步安装Detectron2。Rekall 的某些高级功能如实例分割查询依赖它。官方推荐从源码编译安装以确保兼容性。# 安装必要的系统依赖 sudo apt-get update sudo apt-get install -y git gcc g cmake build-essential # 克隆 Detectron2 仓库注意版本兼容性我使用与 PyTorch 1.12 兼容的版本 git clone https://github.com/facebookresearch/detectron2.git cd detectron2 pip install -e .如果编译过程报错通常与 CUDA 路径或编译器版本有关。请确保nvcc --version与系统安装的 CUDA 版本一致并且 GCC 版本不过高对于 CUDA 11GCC 7 或 8 是安全的选择。3.2 第一个查询从“找人”开始安装成功后让我们用一个最简单的例子感受一下 Rekall 的威力。假设我们有一段街景视频street.mp4我们想找出所有出现“人”的画面。import rekall from rekall import Interval, IntervalSet, IntervalSetMapping, Bounds3D from rekall.predicates import * # 1. 加载视频并创建视频流对象 video_path street.mp4 video rekall.load_video(video_path) # 2. 定义查询检测类别为“人”的物体 # 这里我们使用一个简单的“检测”操作。实际使用中Rekall 会调用后台的 Detectron2 模型。 # 为了演示我们先模拟一个结果。 query video.detect_objects(threshold0.5, model_typegrounding_dino) # 示例模型实际需配置 # 3. 执行查询此处模拟真实情况需配置好模型 # 假设我们已经有了一个检测结果 interval_set_mapping # 其结构是{轨迹ID: IntervalSet}每个 Interval 代表物体在某一时间段内出现并带有 bounds时间范围和 payload如边界框、类别 # 让我们构造一个模拟结果来理解结构 from rekall import Interval, IntervalSet, Bounds3D import numpy as np # 模拟一个检测结果第1个人在时间[1.0, 3.0]秒出现坐标在画面中央附近 person1_interval Interval( boundsBounds3D(t11.0, t23.0), # 时间区间 payload{coords: np.array([0.4, 0.4, 0.6, 0.6]), class: person} # 边界框 (x1,y1,x2,y2) 和类别 ) # 模拟第2个人在时间[2.5, 4.0]秒出现 person2_interval Interval( boundsBounds3D(t12.5, t24.0), payload{coords: np.array([0.7, 0.3, 0.9, 0.5]), class: person} ) # 将 Interval 放入 IntervalSet并构建 IntervalSetMapping person_intervals IntervalSet([person1_interval, person2_interval]) # 在真实检测中每个轨迹track会有自己的 IntervalSet这里简化为一个集合 result IntervalSetMapping({ track_1: IntervalSet([person1_interval]), track_2: IntervalSet([person2_interval]) }) # 4. 可视化结果Rekall 提供了便捷的可视化工具 # 我们可以将查询结果与原始视频叠加显示 # 注意以下可视化代码需要 rekall 的 viz 模块和正确的前端环境如 Jupyter try: from rekall.viz import visualize_intervals # 将结果与视频关联可视化 visualize_intervals(video, result) except ImportError: print(可视化模块未安装或不在 Jupyter 环境中。) # 我们可以打印出结果 for track_id, interval_set in result.items(): for interval in interval_set.get_intervals(): print(f轨迹 {track_id}: 人物出现在 {interval[bounds][t1]:.1f}s 到 {interval[bounds][t2]:.1f}s 坐标 {interval[payload][coords]})这个简单的例子揭示了 Rekall 的核心数据结构Interval表示一个物体在特定时空范围内的存在、IntervalSet同一物体的多个区间集合或满足条件的区间集合、IntervalSetMapping多个物体轨迹的映射。所有复杂的查询最终都是在操作和组合这些数据结构。4. 构建复杂时空查询实战解析掌握了基础之后我们来挑战更复杂的场景这也是 Rekall 真正闪光的地方。4.1 场景定义超市顾客行为分析假设我们有一段超市监控视频我们希望自动找出以下行为的片段顾客在货架前停留超过5秒可能是在挑选商品。顾客拿起又放下某件商品一个快速的交互动作。两位顾客在收银台附近发生交谈空间接近且面对面。4.2 查询分解与实现我们以第一个行为“顾客在货架前停留超过5秒”为例。这实际上是一个时空复合查询。空间条件顾客的边界框与“货架区域”一个我们预先定义的画面中的固定多边形区域有重叠 (overlaps)。时间条件这种重叠状态持续的时间长度 (duration) 大于5秒。首先我们需要定义货架区域。在 Rekall 中我们可以用空间谓词来定义。from rekall.predicates import overlaps_at_interval, duration_gt from shapely.geometry import Polygon # 假设我们通过视频分析或先验知识确定了货架在画面中的多边形坐标归一化坐标0到1之间 shelf_polygon Polygon([(0.1, 0.2), (0.5, 0.2), (0.5, 0.8), (0.1, 0.8)]) # 定义一个谓词物体的边界框与货架多边形重叠 def inside_shelf_region(interval): # interval.payload[coords] 是归一化的 [x1, y1, x2, y2] bbox_polygon Polygon([ (interval.payload[coords][0], interval.payload[coords][1]), (interval.payload[coords][2], interval.payload[coords][1]), (interval.payload[coords][2], interval.payload[coords][3]), (interval.payload[coords][0], interval.payload[coords][3]) ]) return bbox_polygon.intersects(shelf_polygon) # 但Rekall通常使用其内置的时空关系函数。我们假设已有顾客的检测轨迹 customer_tracks # customer_tracks 是一个 IntervalSetMapping包含所有检测到的“person”类别的轨迹。 # 步骤1筛选出所有顾客轨迹 from rekall.logical_predicates import payload_satisfies customer_tracks video.detect_objects(...).filter(payload_satisfies(lambda p: p[class] person)) # 步骤2定义“在货架区域”的谓词。这里我们需要一个能处理时空区间重叠的函数。 # 由于Rekall的 overlaps 通常用于时间关系空间重叠需要自定义或使用 spatially_near 的变体。 # 更实际的方法是在检测时为每一帧的每个检测框计算其与货架区域的空间关系并将结果是否在货架区作为payload的一部分。 # 假设我们已经有了一个处理后的 customer_tracks_with_location其中payload包含 is_near_shelf 布尔值。 # 步骤3查询“持续在货架区超过5秒”的轨迹区间。 # 我们需要找出 is_near_shelf 为 True 的连续时间段。 def get_continuous_intervals(interval_set, condition_keyis_near_shelf): # 这是一个简化逻辑实际Rekall有更优雅的时序合并操作 result_intervals [] current_start None current_end None # 按时间排序 sorted_intervals sorted(interval_set.get_intervals(), keylambda i: i[bounds][t1]) for interval in sorted_intervals: if interval.payload.get(condition_key): if current_start is None: current_start interval[bounds][t1] current_end interval[bounds][t2] else: if current_start is not None: if current_end - current_start 5.0: # 持续时间大于5秒 result_intervals.append(Interval(boundsBounds3D(t1current_start, t2current_end))) current_start None current_end None # 检查最后一个区间 if current_start is not None and current_end - current_start 5.0: result_intervals.append(Interval(boundsBounds3D(t1current_start, t2current_end))) return IntervalSet(result_intervals) # 对每一条顾客轨迹应用此函数 lingering_intervals {} for track_id, interval_set in customer_tracks_with_location.items(): long_stays get_continuous_intervals(interval_set, is_near_shelf) if long_stays: lingering_intervals[track_id] long_stays lingering_result IntervalSetMapping(lingering_intervals) print(f找到 {len(lingering_result)} 位顾客有长时间停留行为。)对于“拿起放下商品”和“顾客交谈”这类更复杂的行为需要结合动作识别模型如 SlowFast、TimeSformer的输出作为新的谓词以及轨迹之间的时空关系分析如meets表示动作紧接spatially_near结合face_orientation判断面对面。Rekall 的模块化设计允许你将这些不同的分析流水线检测、跟踪、动作识别、空间关系计算的结果统一到Interval的payload中然后用统一的查询语言进行筛选和组合这是其架构最精妙的地方。5. 性能优化与生产部署考量在原型验证后若想将 Rekall 用于处理大规模视频数据性能是必须跨越的关卡。5.1 模型推理加速视频分析的计算瓶颈主要在视觉模型的前向推理上。模型选择在准确度和速度间权衡。对于实时性要求高的场景YOLOv8 或 YOLO-NAS 是比 Faster R-CNN 更快的检测器选择。Rekall 支持替换后端模型你需要根据rekall.detect_objects的接口实现新的模型适配器。批处理Batch Inference不要逐帧进行模型推理。利用 GPU 的并行能力将多帧图片组成一个批次Batch一次性输入模型可以极大提升吞吐量。在编写自定义模型适配器时务必实现批处理逻辑。TensorRT 部署对于固定化的模型使用 NVIDIA TensorRT 进行推理优化和部署可以获得数倍的性能提升。这需要将 PyTorch 或 Detectron2 模型转换为 ONNX再转换为 TensorRT 引擎。5.2 查询执行优化谓词下推Rekall 引擎会尝试将过滤条件谓词尽可能早地应用到数据上减少后续需要处理的数据量。在编写复杂查询时尽量将最严格、最能过滤数据的条件放在前面。并行化处理对于多个独立视频或一个视频内可独立处理的片段可以利用 Python 的concurrent.futures或多进程库进行并行处理。Rekall 本身是单视频查询引擎并行化需要在外围脚本中实现。结果缓存如果需要对同一段视频进行多次不同的查询可以考虑将中间结果如物体检测轨迹、动作识别结果序列化到磁盘。后续查询可以直接加载这些中间结果避免重复运行昂贵的模型推理。Rekall 的IntervalSetMapping可以方便地通过pickle进行保存和加载。5.3 部署模式建议研究/原型阶段直接在 Jupyter Notebook 中使用利用其强大的交互性和可视化能力快速迭代查询逻辑。小规模批处理编写 Python 脚本使用命令行参数接收视频路径和查询配置文件在服务器上运行。可以使用tmux或screen管理长时间任务。大规模流水线需要设计一个生产系统。可以考虑将 Rekall 封装成gRPC或REST API服务例如使用 FastAPI接收视频 URL 和查询 JSON返回结果片段。视频解码和模型推理可以放在不同的 worker 队列中如使用 Celery Redis实现水平扩展。数据库用于存储原始视频、元数据和查询结果。6. 常见问题排查与实战心得在实际使用中我遇到了不少问题这里总结几个最具代表性的。6.1 安装与依赖问题问题ImportError: cannot import name ‘MetadataCatalog‘ from ‘detectron2.data‘。排查这几乎总是因为 Detectron2 版本与 PyTorch 版本不匹配或者 Detectron2 编译/安装不完整。解决严格对照 Detectron2 官方文档 中的版本兼容性表格。彻底清理环境 (pip uninstall detectron2 torch torchvision并删除build/和dist/目录)然后从头开始按照指定版本安装。如果从源码编译确保环境变量CUDA_HOME设置正确并且 GCC 版本符合要求。6.2 查询性能低下问题处理一个10分钟的视频需要1个小时以上。排查检查是否在 CPU 模式下运行。使用torch.cuda.is_available()确认 GPU 是否被 PyTorch 识别。使用nvidia-smi监控 GPU 利用率。如果利用率很低如长期低于30%可能是数据加载视频解码成为了瓶颈或者批处理大小Batch Size设置得太小没有喂饱 GPU。检查模型本身是否过于庞大如使用了 Mask R-CNN with ResNeXt-101。解决使用opencv-python-headless或PyAV进行更高效的视频解码并考虑将视频帧预提取到内存或高速 SSD 上。在模型适配器中增加批处理大小直到 GPU 内存占满为止。换用更轻量的模型如 YOLOv5s 或 MobileNet 变体。6.3 跟踪结果不稳定ID Switch问题同一个物体在视频中轨迹 ID 频繁跳变导致时空查询断裂。排查这是多目标跟踪领域的经典问题。原因可能是检测框抖动、物体外观剧烈变化、遮挡严重。解决检测层面适当提高检测模型的置信度阈值并使用非极大值抑制NMS来合并重叠框获得更稳定、更少的检测结果。跟踪层面尝试使用更强大的跟踪器如DeepSORT它结合了外观特征ReID 模型对遮挡和形变更鲁棒。Rekall 可以集成外部跟踪器结果。调整跟踪器参数如max_age丢失多少帧后删除轨迹和min_hits检测到多少次后才创建轨迹。后处理对 Rekall 产生的原始轨迹进行后处理例如对于时间上接近、空间位置连续且外观特征相似的、ID 不同的轨迹区间可以进行手工或基于规则的合并。6.4 复杂查询语义难以精确表达问题像“拿起放下”这种由多个子动作序列构成的行为用基础的谓词和关系组合写出来非常冗长且容易出错。解决封装高阶行为谓词。这是提升代码可复用性和可读性的关键。将“拿起放下”定义为一个函数内部封装对物体手或商品轨迹的速度、加速度、与货架区域相对位置变化的复杂判断。def picking_and_placing(track_interval_set, shelf_region, threshold_sec2.0): 判断一个轨迹是否完成了‘拿起-放置’动作。 简化逻辑物体进入货架区 - 短时间内离开货架区 - 短时间内再次进入。 # 1. 找出所有进入和离开货架区的时刻点状态变化点 # 2. 分析这些时刻点的时间序列寻找“进入-离开-进入”的模式且时间间隔小于 threshold_sec # 3. 返回符合该模式的 Interval 列表 # 此处省略具体的状态机实现代码 pass # 在查询中使用 all_hand_tracks ... # 获取所有手部检测轨迹 pick_place_actions {} for tid, track in all_hand_tracks.items(): actions picking_and_placing(track, shelf_polygon, 2.0) if actions: pick_place_actions[tid] actions6.5 个人心得从项目到产品化的关键一步Rekall 是一个强大的研究工具和原型构建框架但将其用于稳定、可维护的生产环境还需要做不少工作。第一数据管理。生产环境视频来源多样RTMP流、对象存储、本地文件格式编码各异。需要建立一个健壮的视频摄入层负责统一拉流、转码、切片和存储为后续分析提供标准化的输入如统一的 H.264 编码的 MP4 片段。第二模型管理。不同场景可能需要不同的检测/跟踪/识别模型。需要设计一个模型仓库和加载器能够根据视频元数据如场景类型室内、室外、交通或查询请求动态加载对应的模型而不是在代码里写死。第三查询的版本化与调度。业务方的查询需求会变化。需要将 Rekall 查询脚本版本化管理如存到 Git并设计一个调度系统能够定期或触发式地对新入库的视频执行一批定义好的查询任务将结果写入数据库或消息队列。第四结果的可解释性与可视化。仅仅返回时间戳和坐标是不够的。需要将查询结果与原始视频片段结合生成带标注框、轨迹线、标签的摘要视频或 GIF 动图并提供一个简单的 Web 界面供业务人员查看和验证。Rekall 的viz模块是一个很好的起点但需要集成到更大的应用框架中。踩过这些坑之后我的体会是Rekall 的价值在于它提供了一个极其优雅的、声明式的中间表示层将混乱的视频像素流和高级的行为语义查询连接了起来。它的最佳定位是作为视频理解流水线中的“查询引擎”而不是一个端到端的全栈解决方案。围绕它构建数据管道、模型服务和业务应用才能最大化其潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2620783.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…