Ollama-OCR:基于Ollama多模态大模型的端到端文档解析和处理

news2025/5/25 14:40:31

基本介绍

Ollama-OCR是一个Python的OCR解析库,结合了Ollama的模型能力,可以直接处理 PDF 文件无需额外转换,轻松从扫描版或原生 PDF 文档中提取文本和数据。根据使用的视觉模型和自定义提示词,Ollama-OCR 可支持多种语言,并且能把文档转换为特定的格式进行输出。

1. 支持多种视觉模型

在这里插入图片描述

可以从Ollama上选择最新的视觉模型:
● gemma3:来自谷歌的最新多模态模型
● llama4:Meta的多模态模型,中文能力有限
● qwen2.5vl:阿里千问团队最新的视觉语言模型

或选择其他更加适合特定任务的视觉模型

2. 多种输出格式,并且可自定义提示词

Ollama-OCR 提供多种输出格式以适应不同场景:
● Markdown:保留结构化格式,包括标题和列表
● 纯文本:提取干净、无格式的文本
● JSON:便于集成的结构化数据输出
● 结构化格式:提取并组织表格和层级内容
● 键值对:适合处理表单、发票和收据
● 表格:高效提取所有表格数据

使用方法

首先使用 pip 安装 Ollama-OCR:

pip install ollama-ocr

确保 Ollama 服务正在运行,并下载所需模型以获得最佳性能,如下载qwen2.5vl:

ollama pull qwen2.5vl

加载模型:

from ollama_ocr import OCRProcessor

# 创建一个实例并指定模型
ocr = OCRProcessor(model_name='qwen2.5vl:7b')

处理文档:

result = ocr.process_image(
    image_path="论文.pdf", # pdf文档路径
    format_type="text", # 文档类型
    language="zh", # 语言
    custom_prompt="请提取其中的文字" # 可选,可选择用自定义prompt或预设好的prompt
)

效果实测

选择了一篇学术论文,含有表格
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

提取文本

result = ocr.process_image(
    image_path="论文.pdf",
    format_type="text",
    language="zh",
    custom_prompt="请提取其中的文字"
)
Page 1:
图片中的文字内容如下:

---

**中国农业科学学报 20155 月 第 23 卷 第 5 期**

**Chinese Journal of Eco-Agriculture, May 2015, 23(5): 564-562**

**旱改水对水稻幼苗生长的影响及秸秆的改良作用**

**阎加力 李懋 双逢** 涂书新

(华中农业大学资源与环境学院 武汉 430070 中国)

**摘要** 本研究以江汉平原旱改水为研究背景,采用土壤盆栽试验和室内淹水培养相结合的方法,以多年水旱轮作土壤为对照,研究了多年旱作田改水后稻田土壤中生长和发育元素的含量以及对土壤氧化还原电位和有效铁、锰、锌的含量变化,为旱改水水稻品种选育提供参考。结果表明,稻田改水后,水稻根系生长速率明显降低且根系变短。其地上部干重和叶绿素含量分别约为未稻水处理的 30%和 20%。旱田水处理后土壤中 Fe 含量显著低于,而 Cu 和 Zn 含量则分别高于稻水处理。稻田土壤改水土壤氧化还原电位比原旱田土壤的低,而 DTPA-Fe 含量比原旱田土壤的高 7%左右,而 DTPA-Cu 和 DTPA-Zn 含量则分别比原旱田土壤的 1.4-2.5 倍和 1.6-1.8 倍。随着淹水时间的增加,稻田土壤改水土壤氧化还原电位逐渐增加,而 Fe、Cu 和 Zn 含量则先升高后降低趋势;到淹水处理的第 28 d,稻田土壤改水土壤氧化还原电位、铁、铜和锌含量与水旱田之间均呈负相关趋势。Fe 不足及 Cu 过量可能是导致旱改水水稻幼苗生长缓慢、根系变短的主要原因。旱田条件下添加磷钾肥可以降低土壤的 Fe 含量,提高土壤 DTPA-Fe 含量及氧化还原电位,DTPA-Cu 和 DTPA-Zn 含量。压茬种植和初春灌水均能有效降低叶绿素含量,但对根系生长量显著且直截了当。添加秸秆并不能完全补偿磷钾肥对水稻幼苗生长的作用。

**关键词** 旱改水 棉田 水稻 水稻幼苗 土壤氧化还原电位 铁 锌 铜

**中图分类号** S156.2, S344

**文献标识码** A 文献编号:1671-3990(2015)05-0554-09

---

**Effect of reclamining cotton field into paddy field and straw application on rice seedling growth**

**YAN Jiali, LI Mao, XIONG Shuanglan, TU Shuxin**

(College of Resources and Environment, Huazhong Agricultural University, Wuhan 430070, China)

**Abstract** In recent years, paddy deficiency of rice (Oryza sativa L.) characterized by black filaments/paleaules and disordered rice lemma and palea has caused significant yield loss of rice grown in uplands reclaimed into paddy lands in Hanzhong Plain, Hubei Province, China. Up to now, it remains unclear why rice paddy deficiency is prevalent in reclaimed paddy lands from uplands. However, studies have shown that paddy deficiency is largely related with soil characteristics. Using old paddy field as control, a pot soil experiment was carried out to investigate the effects of old cotton fields reclaimed into paddy fields and rice straw application on the growth of rice seedlings. The study also analyzed rice mineral elements uptake, soil pH, and soil available Fe, Mn, Zn, and Cu contents. Soil waterlogged incubation test was adopted to study the effects of straw application on dynamic changes of DTPA-Fe, DTPA-Mn, DTPA-Zn, and DTPA-Cu contents in the old paddy fields and paddy fields from cotton field. The results showed that rice seedlings in cotton fields reclaimed into paddy fields grow poorly and had symptoms of chlorosis, with dry weight and chlorophyll content of respectively 30% and 20% those of rice seedlings in old paddy fields. While Fe content was significantly lower, Cu and Zn contents were markedly higher in rice plants in cotton fields than in old paddy fields. As with prolonged inundation, DTPA-Fe content in cotton field soils gradually increased.

**Keywords** Reclamation of upland into paddy field, Rice seedling growth, Soil pH, Soil available Fe, Mn, Zn, and Cu, Soil waterlogged incubation test, Rice straw application

---

**国家自然科学基金项目(41401406)资助**

**联系人:** 阎加力,华中农业大学资源与环境学院,E-mail: xiaojiali@hau.edu.cn

**通讯作者:** 主要从事土壤与植物营养研究,E-mail: 261342995@qq.com

**收稿日期:** 2014-09-09 接受日期:2015-03-03

**http://www.ecoagri.ac.cn**

提取并保留为markdown格式

result = ocr.process_image(
    image_path="论文.pdf",
    format_type="text",        
    language="zh",
    custom_prompt="请提取其中的文字,并保留为Markdown格式"
)

丢失了摘要的英文部分

Page 1:
```markdown
**中国农业大学学报** 20155 月 第 23 卷 第 5 期

Chinese Journal of Eco-Agriculture, May 2015, 23(5): 564-562

DOI: 10.13930/j.cnki.ekjagri.140140

**旱改水对水稻幼苗生长的影响及秸秆的改良作用**

阎加力 李懋 双逢* 涂书新

(华中农业大学资源与环境学院 武汉 430070, China)

摘 要 本研究以江汉平原旱改水为研究背景, 采用土壤盆试验和室内淹水培养相结合的方法, 以多年水旱轮作土壤为对照, 研究了多年旱作田改水后稻田土壤中生长和发育元素的含量以及对土壤氧化还原电位和有效铁、锰、锌的含量变化, 为旱改水水稻品种选育提供参考。结果表明, 旱田改水后, 水稻根系生长速率明显出现显著下降的现象。其地上部干重和叶绿素含量分别约为未稻水处理的 30%和 20%。旱田改水处理后土壤 Fe 含量显著低于, 而 Cu 和 Zn 含量则分别高于稻水轮作处理。据土壤旱改水土壤质地比原质地()高而有机质含量低的特点, 该田土壤水土比为 1.5:1, 土壤 DTPA-Fe 含量是旱田水土比的 7%左右, 而 DTPA-Cu 和 DTPA-Zn 含量则分别比水轮作的 1.4-2.5 倍和 1.6-1.8 倍。随着淹水时间的增加, 土壤中水土比土壤氧化还原电位含量逐渐增加, 有机质增加, 铁铜和锌含量则先升后降低趋势; 到淹水处理的第 28 d, 据土壤旱改水土壤质地比原质地()高而有机质含量低的特点, 该田土壤水土比为 1.5:1, 土壤 DTPA-Fe 含量是旱田水土比的 7%左右, 而 DTPA-Cu 和 DTPA-Zn 含量则分别比水轮作的 1.4-2.5 倍和 1.6-1.8 倍。随着淹水时间的增加, 土壤中水土比土壤氧化还原电位含量逐渐增加, 有机质增加, 铁铜和锌含量则先升后降低趋势; 到淹水处理的第 28 d, DTPA-Fe 含量显著高于水轮作处理的 2 倍, DTPA-Cu 和 DTPA-Zn 含量则分别比水轮作的 1.4-2.5 倍和 1.6-1.8 倍。随着淹水时间的增加, 土壤中水土比土壤氧化还原电位含量逐渐增加, 有机质增加, 铁铜和锌含量则先升后降低趋势; 到淹水处理的第 28 d, DTPA-Fe 含量显著高于水轮作处理的 2 倍, DTPA-Cu 和 DTPA-Zn 含量则分别比水轮作的 1.4-2.5 倍和 1.6-1.8 倍。Fe 不足及 Cu 过量可能是导致旱改水水稻幼苗生长缓慢、叶黄变黄的主要原因。旱田改水条件若不添加有机肥可降低土壤的 Fe 含量, 提高土壤 DTPA-Fe 含量及有效铁含量。添加有机肥并不能完全补充旱改水对水稻幼苗生长的抑制作用。

关键词 旱改水 棉田 水稻 水淹 土壤氧化还原电位 铁 锰 锌

中国分类号: S156.2, S344 文献标识码:A 文章编号:1716-3990(2015)05-0554-09

* 国家自然科学基金项目(31401406)资助

* 联系作者: 阎加力, 现主要从事为农田重金属污染及农产品安全。E-mail:xiaojial@hau.edu.cn

通讯作者: 主要从事土壤与植物营养研究。E-mail:261342995@qq.com

收稿日期:2014-09-09 接受日期:2015-03-03

http://www.ecoagri.ac.cn

提取表格

result = ocr.process_image(
    image_path="论文.pdf",
    format_type="text",
    language="zh",
    custom_prompt="请提取其中的表格,并以markdown格式进行展示"
)
print(result)
Page 1:
很抱歉,您提供的图片内容是一篇学术论文的全文,但并未包含任何表格。如果您有其他关于这篇论文的问题,我会很乐意帮助您解答。
Page 2:
```markdown
| pH | 有机质含量 | 可供氮 | 可供磷 | 可供钾 | 全氮 | 全磷 | 全钾 | 总铁 | 总锰 | 总铜 | 总锌 | 总砷 | 品牌 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 水稻土 | Taihe field Soil | 7.51 | 18.63 | 70.26 | 11.4 | 0.04 | 0.17 | 391.44 | 28.67 | 74.76 | 24.54 | 81.24 | 10.54 |
| 棉籽土 | Catten field Soil | 7.40 | 11.39 | 88.25 | 11.63 | 0.55 | 0.56 | 588.13 | 34.54 | 81.24 | 16.54 |
Page 3:
```markdown
| Treatment | 生物量 (Mg·ha⁻¹) | 平均株高 (cm) | 叶长 (cm) | 叶宽 (cm) | 种子 SPAD |
| --- | --- | --- | --- | --- | --- |
| 原茬 | 34.74 ± 0.56 | 37.16 ± 1.04 | 15.31 ± 0.54 | 0.73 ± 0.01 | 36.70 ± 0.18 |
| P15 | 34.74 ± 0.56 | 37.16 ± 1.04 | 15.31 ± 0.54 | 0.73 ± 0.01 | 36.70 ± 0.18 |
| P15+ | 37.42 ± 0.54 | 38.15 ± 0.54 | 15.82 ± 0.54 | 0.76 ± 0.02 | 37.94 ± 0.18 |
| C15 | 37.42 ± 0.54 | 38.15 ± 0.54 | 15.82 ± 0.54 | 0.76 ± 0.02 | 37.94 ± 0.18 |
| C15+ | 38.24 ± 0.41 | 38.84 ± 0.17 | 16.25 ± 0.25 | 0.84 ± 0.05 | 41.05 ± 0.08 |
| P15 | 37.42 ± 0.54 | 38.15 ± 0.54 | 15.82 ± 0.54 | 0.76 ± 0.02 | 37.94 ± 0.18 |
| P15+ | 37.42 ± 0.54 | 38.15 ± 0.54 | 15.82 ± 0.54 | 0.76 ± 0.02 | 37.94 ± 0.18 |
| C15 | 37.42 ± 0.54 | 38.15 ± 0.54 | 15.82 ± 0.54 | 0.76 ± 0.02 | 37.94 ± 0.18 |
| C15+ | 38.24 ± 0.41 | 38.84 ± 0.17 | 16.25 ± 0.25 | 0.84 ± 0.05 | 41.05 ± 0.08 |
Page 4:
```markdown
| 处理 | 本试验一号 | 珍珠 | 本试验一号 | 珍珠 | 本试验一号 | 珍珠 |
| --- | --- | --- | --- | --- | --- |
| P | 22.15±0.68 | 27.15±0.12 | 3.14±0.35 | 3.18±0.26 | 27.70±0.26 |
| P+5 | 23.93±0.28 | 28.97±0.76 | 3.75±0.11 | 3.38±0.08 | 29.10±0.36 |
| C | 23.12±0.76 | 28.93±1.44 | 3.31±0.35 | 3.66±0.16 | 29.74±0.40 |
| C+5 | 20.75±1.20 | 22.41±1.61 | 3.35±0.89 | 3.47±0.10 | 27.24±0.66 |

提取图片

result = ocr.process_image(
    image_path="论文.pdf",
    format_type="text",
    language="zh",
    custom_prompt="请提取其中的图片"
)
print(result)

无法直接提取图片

Page 1:
很抱歉,我无法直接提供图片内容。不过,我可以帮助你解读图片中的文字信息。请将图片中的文字内容复制粘贴到对话框中,我会尽力帮助你提取和理解其中的信息。
Page 2:
很抱歉,您提供的图片内容是文字,而不是图片。如果您需要提取图片中的文字,可以使用OCR(光学字符识别)技术。如果您有具体的图片内容需要帮助,请上传图片,我会尽力帮助您。
Page 3:
很抱歉,我无法直接提供图片内容。不过,我可以帮助你解读图片中的文字信息。请将图片中的文字内容复制粘贴到对话框中,我会尽力帮助你理解图片中的内容。
Page 4:
很抱歉,我无法直接提供图片内容。您可以通过上传图片或描述图片内容来获取帮助。
Page 5:
很抱歉,我无法直接提供图片内容。不过,我可以帮助你解读图片中的文字信息。请将图片中的文字内容复制粘贴到对话框中,我会尽力帮助你理解图片中的内容。
Page 6:
很抱歉,我无法直接查看或提取图片内容。您提供的图片内容似乎是一篇学术论文的页面,包含图表和文字。如果您需要提取图片中的特定信息或数据,可以描述您需要提取的内容,我会尽力帮助您。例如,您可能需要提取图表中的数据点、特定段落的文字内容等。请告诉我您具体需要提取什么信息。
Page 7:
很抱歉,您提供的图片内容是一个文本文件,而不是一张图片。如果您需要提取图片中的内容,可以使用OCR(光学字符识别)技术。如果您需要提取图片中的内容,请上传图片,我会尽力帮助您。
Page 8:
很抱歉,您提供的图片内容是一篇学术论文的页面,包含大量的文字信息,但并未包含图片。如果您需要提取图片中的内容,可以使用OCR(光学字符识别)技术来识别图片中的文字。如果您需要提取图片中的内容,请提供图片,我会尽力帮助您。
Page 9:
很抱歉,您提供的图片内容是一篇中文的学术论文,包含大量的文字信息,而并非图片。如果您需要提取图片中的文字信息,可以使用OCR(光学字符识别)技术。如果您需要提取图片中的文字信息,请上传图片,我会尽力帮助您。

结论

利用多模态大模型,结合Ollama-OCR可以实现端到端PDF文档解析和问答,在一定程度上可以抛弃版面分析、表格识别等传统模型,节省开发成本。解析效果和输出的格式与大模型能力相关,因此可根据实际需求选择不同能力的模型。

随着大模型能力越来越强,以后大模型的发展趋势是会融合推理能力和多模态能力,这对于AI开发者来说可以减少开发的工作量,将主要精力集中在核心功能的开发上来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2385404.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenCV CUDA 模块中图像过滤------创建一个拉普拉斯(Laplacian)滤波器函数createLaplacianFilter()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 cv::cuda::createLaplacianFilter 是 OpenCV CUDA 模块中的一个函数,用于创建一个 拉普拉斯(Laplacian)滤波器…

图论学习笔记 3

自认为写了很多,后面会出 仙人掌、最小树形图 学习笔记。 多图警告。 众所周知王老师有一句话: ⼀篇⽂章不宜过⻓,不然之后再修改使⽤的时候,在其中找想找的东⻄就有点麻烦了。当然⽂章也不宜过多,不然想要的⽂章也不…

【将WPS设置为默认打开方式】--突然无法用WPS打开文件

1. 点击【开始】——【WPS Office】——【配置工具】; 2. 在出现的弹窗中,点击【高级】; 3. 在“兼容设置”中,将复选框勾上,点击【确定】。

电子人的分水岭-FPGA模电和数电

为什么模电这么难学?一文带你透彻理解模电 ——FPGA是“前期数电,后期模电”的典型代表 在电子工程的世界里,有两门基础课程让无数学生“闻之色变”:数字电路(数电) 和 模拟电路(模电&#xff0…

(6)python爬虫--selenium

文章目录 前言一、初识selenium二、安装selenium2.1 查看chrome版本并禁止chrome自动更新2.1.1 查看chrome版本2.1.2 禁止chrome更新自动更新 2.2 安装对应版本的驱动程序2.3安装selenium包 三、selenium关于浏览器的使用3.1 创建浏览器、设置、打开3.2 打开/关闭网页及浏览器3…

Python之两个爬虫案例实战(澎湃新闻+网易每日简报):附源码+解释

目录 一、案例一:澎湃新闻时政爬取 (1)数据采集网站 (2)数据介绍 (3)数据采集方法 (4)数据采集过程 二、案例二:网易每日新闻简报爬取 (1&#x…

✨ PLSQL卡顿优化

✨ PLSQL卡顿优化 1.📂 打开首选项2.🔧 Oracle连接配置3.⛔ 关闭更新和新闻 1.📂 打开首选项 2.🔧 Oracle连接配置 3.⛔ 关闭更新和新闻

python+vlisp实现对多段线范围内土方体积的计算

#在工程中,经常用到计算土方回填、土方开挖的体积。就是在一个范围内,计算土被挖走,或者填多少,这个需要测量挖填前后这个范围内的高程点。为此,我开发一个app,可以直接在autocad上提取高程点,然…

APM32小系统键盘PCB原理图设计详解

APM32小系统键盘PCB原理图设计详解 一、APM32小系统简介 APM32微控制器是国内半导体厂商推出的一款高性能ARM Cortex-M3内核微控制器,与STM32高度兼容,非常适合DIY爱好者用于自制键盘、开发板等电子项目。本文将详细讲解如何基于APM32 CBT6芯片设计一款…

对象存储(Minio)使用

目录 1.安装 MinIO(Windows) 2.启动minio服务: 3.界面访问 4.进入界面 5.前后端代码配置 1)minio前端配置 2)minio后端配置 1.安装 MinIO(Windows) 官方下载地址:[Download High-Perform…

yolov11使用记录(训练自己的数据集)

官方:Ultralytics YOLO11 -Ultralytics YOLO 文档 1、安装 Anaconda Anaconda安装与使用_anaconda安装好了怎么用python-CSDN博客 2、 创建虚拟环境 安装好 Anaconda 后,打开 Anaconda 控制台 创建环境 conda create -n yolov11 python3.10 创建完后&…

知识宇宙:技术文档该如何写?

名人说:博观而约取,厚积而薄发。——苏轼《稼说送张琥》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 目录 一、技术文档的价值与挑战1. 为什么技术文档如此重要2. 技术文档面临的挑战 二、撰…

技嘉主板怎么开启vt虚拟化功能_技嘉主板开启vt虚拟化教程(附intel和amd开启方法)

最近使用技嘉主板的小伙伴们问我,技嘉主板怎么开启vt虚拟。大多数可以在Bios中开启vt虚拟化技术,当CPU支持VT-x虚拟化技术,有些电脑会自动开启VT-x虚拟化技术功能。而大部分的电脑则需要在Bios Setup界面中,手动进行设置&#xff…

Java 并发编程高级技巧:CyclicBarrier、CountDownLatch 和 Semaphore 的高级应用

Java 并发编程高级技巧:CyclicBarrier、CountDownLatch 和 Semaphore 的高级应用 一、引言 在 Java 并发编程中,CyclicBarrier、CountDownLatch 和 Semaphore 是三个常用且强大的并发工具类。它们在多线程场景下能够帮助我们实现复杂的线程协调与资源控…

PT5F2307触摸A/D型8-Bit MCU

1. 产品概述 ● PT5F2307是一款51内核的触控A/D型8位MCU,内置16K*8bit FLASH、内部256*8bit SRAM、外部512*8bit SRAM、触控检测、12位高精度ADC、RTC、PWM等功能,抗干扰能力强,适用于滑条遥控器、智能门锁、消费类电子产品等电子应用领域。 …

线性代数中的向量与矩阵:AI大模型的数学基石

🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C, C#, Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C、C#等开发语言,熟悉Java常用开…

打卡第27天:函数的定义与参数

知识点回顾: 1.函数的定义 2.变量作用域:局部变量和全局变量 3.函数的参数类型:位置参数、默认参数、不定参数 4.传递参数的手段:关键词参数 5.传递参数的顺序:同时出现三种参数类型时 作业: 题目1&a…

python训练营day34

知识点回归: CPU性能的查看:看架构代际、核心数、线程数GPU性能的查看:看显存、看级别、看架构代际GPU训练的方法:数据和模型移动到GPU device上类的call方法:为什么定义前向传播时可以直接写作self.fc1(x) 作业 复习今…

人工智能在医疗影像诊断上的最新成果:更精准地识别疾病

摘要:本论文深入探讨人工智能在医疗影像诊断领域的最新突破,聚焦于其在精准识别疾病方面的显著成果。通过分析深度学习、多模态影像融合、三维重建与可视化以及智能辅助诊断系统等关键技术的应用,阐述人工智能如何提高医疗影像诊断的准确性和…

塔能节能平板灯:点亮苏州某零售工厂节能之路

在苏州某零售工厂的运营成本中,照明能耗占据着一定比例。为降低成本、提升能源利用效率,该工厂与塔能科技携手,引入塔能节能平板灯,开启了精准节能之旅,并取得了令人瞩目的成效。 一、工厂照明能耗困境 苏州该零售工厂…