图片压缩工具 | 图片生成PDF文档

news2025/6/8 4:15:30

OPEN-IMAGE-TINY,一个基于 Electron + VUE3 的图片压缩工具,项目开源地址:https://github.com/0604hx/open-image-tiny

ℹ️ 需求描述

上一版本发布后,有用户提出想要将图片转换(或者说生成更为贴切)PDF文档,于是有了今天要分享的内容。
功能概述:将用户选择的文件,预处理(如裁剪、旋转)后,绘制到新的 PDF 文件内。

📄 关于PDF

PDF(Portable Document Format,便携式文档格式)是当今最广泛使用的电子文档格式之一,几乎成为数字文档交换的代名词。它的发展历程涉及技术创新、商业竞争和标准化演进。

📜发展简史

  • 1991年,Adobe 联合创始人 John Warnock 提出 “Camelot” 计划,目标是创建一种 跨平台、固定布局的电子文档格式,确保在任何设备上都能正确显示。
  • 1993年,Adobe 正式发布 PDF 1.0,配套推出 Acrobat 1.0(用于创建和阅读 PDF 的工具)。
  • 2008年,Adobe 将 PDF 提交给 ISO(国际标准化组织),使其成为开放标准(ISO 32000-1)。

🚀技术演进

版本发布时间重要改进
PDF 1.01993基础文本、图像支持
PDF 1.52003支持 JPEG2000、图层、增强压缩
PDF/A (2005)长期存档标准适合法律、档案存储
PDF/X (2001)印刷出版标准确保颜色、字体精确输出
PDF 2.0 (2017)最新 ISO 标准强化安全、标签化结构

🌍PDF 的现状(2020s+)

1. 无处不在的应用

  • Web 浏览器:Chrome、Firefox 内置 PDF 阅读器。
  • 移动端:iOS/Android 原生支持 PDF 预览。
  • 云服务:Google Drive、Dropbox 直接解析 PDF。
  • 开发者工具:如 pdf-libPDF.jsApache PDFBox

2. 现代 PDF 生态

  • 可编辑 PDF(Adobe Acrobat、Foxit)。
  • PDF 表单(交互式字段,支持电子签名)。
  • OCR 技术(将扫描件转为可搜索文本)。
  • 3D PDF(嵌入三维模型,用于工程图纸)。

3. 竞争对手

  • Office Open XML(DOCX, PPTX):微软的开放文档格式。
  • EPUB:更适合电子书。
  • Web 技术:HTML + CSS 逐渐替代简单 PDF(如在线报告)。

🧑‍💻 技术实现

pdf-lib 库

pdf-lib 是一个强大的 JavaScript/TypeScript 库,用于 创建、修改和操作 PDF 文档。它完全在 Node.js 和浏览器环境中运行,不依赖任何外部服务或原生依赖(如 PDFtk 或 Ghostscript)。

主要功能

  • ✅ 创建新的 PDF 文档
  • ✅ 修改现有的 PDF(如添加文本、图片、水印)
  • ✅ 合并多个 PDF 文件
  • ✅ 提取 PDF 页面
  • ✅ 添加表单字段(如文本框、复选框)
  • ✅ 支持嵌入字体(包括自定义字体)
  • ✅ 支持加密和权限控制

基本用法

创建一个简单的 PDF 文档

import { PDFDocument, rgb } from 'pdf-lib';

async function createPdf() {
  // 创建一个新的 PDF 文档
  const pdfDoc = await PDFDocument.create();
  const page = pdfDoc.addPage([550, 750]); // [width, height]

  // 添加文本
  page.drawText('Hello, PDF-Lib!', {
    x: 50,
    y: 700,
    size: 30,
    color: rgb(0, 0, 0), // 黑色
  });

  // 保存 PDF
  const pdfBytes = await pdfDoc.save();
  return pdfBytes; // 可写入文件或发送给客户端
}

createPdf().then(pdfBytes => {
  // Node.js 写入文件
  const fs = require('fs');
  fs.writeFileSync('output.pdf', pdfBytes);
});

优缺点

✅ 优点

  • 纯 JavaScript,跨平台(Node.js 和浏览器均可运行)
  • API 直观,文档完善
  • 支持现代 PDF 功能(如嵌入字体、表单)
  • 不需要外部依赖(如 PDFtk、Ghostscript)

❌ 缺点

  • 处理超大 PDF 时可能较慢
  • 不支持 PDF 渲染(仅修改结构,不能像 PDF.js 那样显示 PDF)
  • 某些高级 PDF 功能(如 OCR)不支持

核心代码

安装依赖:

pnpm i pdf-lib
const sharp = require('sharp')
const { statSync, writeFileSync } = require('node:fs')
const { PDFDocument } = require('pdf-lib')

/**
 * 图片转换为PDF
 * @param {sharp.Sharp} img
 * @param {String} target
 */
const toPdf = async (img, target)=>{
    const pdf = await PDFDocument.create()
    const page = pdf.addPage()

    const pdfImg = await pdf.embedJpg(await img.toBuffer())
    const { width, height } = pdfImg.scale(1)
    page.setSize(width, height)
    page.drawImage(pdfImg, { x:0, y:0, width, height })

    const pdfBytes = await pdf.save()
    writeFileSync(target, pdfBytes)
}

效果预览

未来展望

能够合并所选图片到一个 PDF 文档。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2403711.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VSCode - VSCode 放大与缩小代码

VSCode 放大与缩小代码 1、放大 点击顶部菜单栏【查看】 -> 点击外观 -> 点击【放大】 或者,使用快捷键:Ctrl # 操作方式先按住 Ctrl 键,再按 键2、缩小 点击顶部菜单栏【查看】 -> 点击外观 -> 点击【缩小】 或者&#x…

11-Oracle 23ai Vector Embbeding和ONNX

Embedding (模型嵌入)是 AI 领域的一个核心概念 一、Embedding(嵌入)的含义 Embedding 是一种将 非结构化数据​(如文本、图像、音频、视频)转换为 数值向量的技术。 其核心是通过 嵌入模型​(…

OpenCV 图像色彩空间转换与抠图

一、知识点: 1、色彩空间转换函数 (1)、void cvtColor( InputArray src, OutputArray dst, int code, int dstCn 0, AlgorithmHint hint cv::ALGO_HINT_DEFAULT ); (2)、将图像从一种颜色空间转换为另一种。 (3)、参数说明: src: 输入图像,即要进行颜…

Amazing晶焱科技:电子系统产品在多次静电放电测试后的退化案例

在我们的电子设计世界里,ESD(静电放电)问题总是让人头疼。尤其是当客户面临系统失效的困境时,寻找一个能够彻底解决问题的方案就变得格外重要。这一次,我们要谈的是一个经典案例:电子系统产品在多次静电放电…

C# 快速检测 PDF 是否加密,并验证正确密码

引言:为什么需要检测PDF加密状态? 在批量文档处理系统(如 OCR 文字识别、内容提取、格式转换)中,加密 PDF 无法直接操作。检测加密状态可提前筛选文件,避免流程因密码验证失败而中断。 本文使用 Free Spire…

华为云Flexus+DeepSeek征文| 华为云Flexus X实例单机部署Dify-LLM应用开发平台全流程指南

华为云FlexusDeepSeek征文| 华为云Flexus X实例单机部署Dify-LLM应用开发平台全流程指南 前言一、相关名词介绍1.1 华为云Flexus X实例介绍1.2 Dify介绍1.3 DeepSeek介绍1.4 华为云ModelArts Studio介绍 二、部署方案介绍2.1 方案介绍2.2 方案架构2.3 需要资源2.4 本…

Python: 操作 Excel折叠

💡Python 操作 Excel 折叠(分组)功能详解(openpyxl & xlsxwriter 双方案) 在处理 Excel 报表或数据分析时,我们常常希望通过 折叠(分组)功能 来提升表格的可读性和组织性。本文将详细介绍如何使用 Python 中的两个主流 Excel 操作库 —— openpyxl 和 xlsxwriter …

IBM官网新闻爬虫代码示例

通常我们使用Python编写爬虫,常用的库有requests(发送HTTP请求)和BeautifulSoup(解析HTML)。但这里需要注意的是,在爬取任何网站之前,务必遵守该网站的robots.txt文件和相关法律法规&#xff0c…

视觉SLAM基础补盲

3D Gaussian Splatting for Real-Time Radiance Field Rendering SOTA方法3DGS contribution传统重建基于点的渲染NeRF 基础知识补盲光栅化SFM三角化极线几何标准的双目立体视觉立体匹配理论与方法立体匹配的基本流程李群和李代数 李群和李代数的映射李代数的求导李代数解决求导…

Vue-3-前端框架Vue基础入门之VSCode开发环境配置和Tomcat部署Vue项目

文章目录 1 安装配置VSCode1.1 安装中文语言插件1.2 主题颜色1.3 禁用自动更新1.4 开启代码提示设置1.5 安装open in browser插件2 安装配置nodejs2.1 配置环境变量2.2 npm与maven的区别2.3 使用npm避坑3 创建Vue项目3.1 两种创建方式3.2 package.json3.3 安装新的依赖3.4 运行…

“一代更比一代强”:现代 RAG 架构的演进之路

编者按: 我们今天为大家带来的文章,作者的观点是:RAG 技术的演进是一个从简单到复杂、从 Naive 到 Agentic 的系统性优化过程,每一次优化都是在试图解决无数企业落地大语言模型应用时出现的痛点问题。 文章首先剖析 Naive RAG 的基…

My图床项目

引言: 在海量文件存储中尤其是小文件我们通常会用上fastdfs对数据进行高效存储,在现实生产中fastdfs通常用于图片,文档,音频等中小文件。 一.项目中用到的基础组件(Base) 1.网络库(muduo) 我们就以muduo网络库为例子讲解IO多路复用和reactor网络模型 1.1 IO多路复用 我们可以…

1、Go语言基础中的基础

摘要:马士兵教育的Go语言基础的视频笔记。 第一章:走进Golang 1.1、Go的SDK介绍 1.2、Go的项目基本目录结构 1.3、HelloWorld 1.4、编译 1.5、执行 1.6、一步到位 1.7、执行流程分析 1.8、语法注意事项 (1)源文件以"go&qu…

buuctf——web刷题第二页

[网鼎杯 2018]Fakebook和[SWPU2019]Web1没有,共30题 目录 [BSidesCF 2020]Had a bad day [网鼎杯 2020 朱雀组]phpweb [BJDCTF2020]The mystery of ip [BUUCTF 2018]Online Tool [GXYCTF2019]禁止套娃 [GWCTF 2019]我有一个数据库 [CISCN2019 华北赛区 Day2…

MVC与MVP设计模式对比详解

MVC(Model-View-Controller)和MVP(Model-View-Presenter)是两种广泛使用的分层架构模式,核心目标是解耦业务逻辑、数据和界面,提升代码可维护性和可测试性。以下是它们的对比详解: MVC 模式&…

二叉树的遍历总结

144.二叉树的前序遍历(opens new window)145.二叉树的后序遍历(opens new window)94.二叉树的中序遍历 二叉数的先中后序统一遍历法 public static void preOrder(BiTree root){BiTree p root;LinkedList<BiTree> stack new LinkedList<>();while(p ! null ||…

win32相关(远程线程和远程线程注入)

远程线程和远程线程注入 CreateRemoteThread函数 作用&#xff1a;创建在另一个进程的虚拟地址空间中运行的线程 HANDLE CreateRemoteThread([in] HANDLE hProcess, // 需要在哪个进程中创建线程[in] LPSECURITY_ATTRIBUTES lpThreadAttributes, // 安全…

[Spring]-AOP

AOP场景 AOP: Aspect Oriented Programming (面向切面编程) OOP: Object Oriented Programming (面向对象编程) 场景设计 设计: 编写一个计算器接口和实现类&#xff0c;提供加减乘除四则运算 需求: 在加减乘除运算的时候需要记录操作日志(运算前参数、运算后结果)实现方案:…

agent 开发

什么是 agent&#xff1f; Agent智能体&#xff08;又称AI Agent&#xff09;是一种具备自主感知、决策与行动能力的智能系统&#xff0c;其核心在于模仿人类的认知过程来处理复杂任务。以下是其关键特性和发展现状的综合分析&#xff1a; 一、核心定义与特征 #‌## 自主决策…

Golang——5、函数详解、time包及日期函数

函数详解、time包及日期函数 1、函数1.1、函数定义1.2、函数参数1.3、函数返回值1.4、函数类型与变量1.5、函数作参数和返回值1.6、匿名函数、函数递归和闭包1.7、defer语句1.8、panic和recover 2、time包以及日期函数2.1、time.Now()获取当前时间2.2、Format方法格式化输出日期…