使用java实现word转pdf,html以及rtf转word,pdf,html

news2025/5/31 14:24:27

word,rtf的转换有以下方案,想要免费最靠谱的是LibreOffice方案,

LibreOffice 是一款 免费、开源、跨平台 的办公软件套件,旨在为用户提供高效、全面的办公工具,适用于个人、企业和教育机构。它支持多种操作系统(Windows、macOS、Linux 等),并能兼容微软 Office(如 DOCX、XLSX、PPTX 等)及其他常见文件格式,是替代商业办公软件的理想选择。

LibreOffice不仅能实现rtf转word,还能实现rtf转pdf,转html,word转pdf,转html,相当强大。

LibreOfficewindows安装很简单,linux安装有点复杂,以下是实现方法

方案优点缺点适用场景
Apache POI + RTF 解析免费、跨平台开发复杂,格式支持有限简单 RTF 转换需求
Jacob(COM 调用)高质量转换仅 Windows,依赖 Office企业内网环境(Windows + Office)
Aspose.Words高质量、跨平台、易用商业付费需高质量转换的商业项目
Free Spire.Doc免费(有限制)有水印限制非商业项目或测试用途
HTML 中间转换灵活格式丢失风险对格式要求不高的场景
LibreOffice 无头模式免费、跨平台、支持复杂格式依赖安装、资源占用高需免费处理复杂格式的场景

windows环境安装 

进入下载页:下载 LibreOffice | LibreOffice 简体中文官方网站 - 自由免费的办公套件

选择下载msi文件,下载好后直接安装就行了

java实现转换 

安装依赖包

implementation 'org.jodconverter:jodconverter-local:4.4.0'

代码实现 很简单,构建LibreOffice实例和jodConverter实例,然后就能转换了,jodConverter能够通过文件名后缀识别你想要转换的格式

// 构建并启动 LibreOffice 实例
OfficeManager officeManager = LocalOfficeManager.builder()
        .install()
        .build();
officeManager.start();
// 创建文档转换器
DocumentConverter converter = LocalConverter.builder()
        .officeManager(officeManager)
        .build();
//进行转换
converter.convert(new File("D:\\T_14_3_1_6.rtf")).to(new File("D:\\11.docx"))
        .execute();
officeManager.stop();

Linux安装LibreOffice

我的linux是centos7,核心比较老,只能选择一些老版本,如果你服务器版本新可以选择新版本

老版本下载地址:Index of /libreoffice/old/7.5.9.2/rpm/x86_64

下载安装包以及语言包

把下载好的包上传到/opt目录下,然后进入opt目录进行解压安装

安装LibreOffice

# 进入opt目录
cd /opt
# 解压
tar -zxvf LibreOffice_7.5.9.2_Linux_x86-64_rpm.tar.gz
# 进入解压后的RPMS目录
cd LibreOffice_7.5.9.2_Linux_x86-64_rpm/RPMS/
# 安装LibreOffice,如果你是新版本系统可以用dnf命令
yum localinstall *.rpm

 安装语言包,跟安装LibreOffice基本一致

cd /opt
tar -zxvf LibreOffice_7.5.9_Linux_x86-64_rpm_langpack_zh-CN.tar.gz
cd LibreOffice_7.5.9.2_Linux_x86-64_rpm_langpack_zh-CN/RPMS/
yum localinstall *.rpm

验证是否安装成功

libreoffice7.5 --version

 看到这个说明安装成功了

 

如果报错,说找不到xxx.so,说明缺失依赖库,先安装依赖库

sudo yum install libXinerama libXcomposite libXrandr cups-libs libSM libICE cairo

解决中文乱码

一般在windows下安装我们的LibreOffice成功后,转换中文都是正常的,但在linux上基本上都会出现乱码的问题。 因为linux中缺少一些中文字体导致的。这个时候我们需要把windos中的字体文件夹上传到linux上,同步一下字体信息。

1.打开windows电脑的C:\Windows,把Fonts压缩成zip包

2.把压缩包上传到 /usr/share/fonts目录下

# 安装解压工具
yum -y install unzip
cd /usr/share/fonts
# 解压
unzip Fonts.zip
yum -y install cups-libs fontconfig
# 给Fonts目录权限
chmod -R 755 /usr/share/fonts/Fonts
yum -y install ttmkfdir
ttmkfdir -e /usr/share/X11/fonts/encodings/encodings.dir
# 刷新字体
fc-cache
# 查看安装的字体
fc-list

报错处理

如果运行java时报java.lang.NullPointerException: officeHome must not be null,说明officeHome没有正确识别到,需要手动添加,如果你安装目录是/opt,则officeHome在/opt/libreoffice7.5

修改代码如下

参考博客:Linux Centos系统安装LibreOffice全过程详解_libreoffice安装教程linux-CSDN博客 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2391729.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用LSTM进行时间序列分析

LSTM(长短期记忆网络,Long Short-Term Memory)是一种特殊的循环神经网络(RNN),专门用于处理时间序列数据。由于其独特的结构设计,LSTM能够有效地捕捉时间序列中的长期依赖关系,这使得…

【密码学——基础理论与应用】李子臣编著 第十三章 数字签名 课后习题

题目 逐题解析 13.1 知道p83,q41,h2,g4,x57,y77。 我看到答案,“消息M56”的意思居然是杂凑值,也就是传统公式的H(M)。 选择k23,那么r(g^k mod p) mod q 51 mod 4110,sk(H(M)xr) mod q29 ws mod q17,u1(mw) mod q9,u2(rw) m…

k8s中kubeSphere的安装使用+阿里云私有镜像仓库配置完整步骤

一、实验目的 1、掌握kubeSphere 的安装部署 2、掌握kubesphere 使用外部镜像仓库; 2、熟悉图像化部署任务:产生pod---定义服务--验证访问 本次实验旨在通过 KubeSphere 平台部署基于自定义镜像(nginx:1.26.0 )的有状态副本集…

Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible

Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible

arcgis js 4.x 的geometryEngine计算距离、面积、缓冲区等报错、失败

在arcgis js 4.x版本中geometryEngine.geodesicArea计算面积时,有时会失败,失败的主要原因是,当前底图的坐标系不是WGS84大地坐标系(代号4326)或者web墨卡托投影(代号102113, 102100, 3857这三种之一&#…

SpringAI 大模型应用开发篇-纯 Prompt 开发(舔狗模拟器)、Function Calling(智能客服)、RAG (知识库 ChatPDF)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 大模型应用开发技术框架 2.0 纯 Prompt 模式 2.1 核心策略 2.2 减少模型"幻觉"的技巧 2.3 提示词攻击防范 2.4 纯 Prompt 大模型开发(舔狗模拟器) 3.0 Function Calling 模式 3.1 …

Unsupervised Learning-Word Embedding

传统的1 of N 的encoding无法让意义相近的词汇产生联系,word class可以将相近的词汇放到一起 但是word class不能表示class间的关系,所以引入了word embedding(词嵌入) 我们生成词向量是一种无监督的过程(没有label 自编码器是一种人工神经网络,主要用于无监督学习…

远控安全进阶之战:TeamViewer/ToDesk/向日葵设备安全策略对比

【作者主页】Francek Chen 【文章摘要】在数字化时代,卓越的远程控制软件需兼顾功能与体验,包括流畅连接、高清画质、低门槛UI设计、毫秒级延迟及多功能性,同时要有独树一帜的远控安全技术,通过前瞻性安全策略阻挡网络风险&#x…

变量的计算

不同类型变量之间的计算 数字型变量可以直接计算 在python中,数字型变量可以直接通过算术运算符计算bool型变量:True 对应数字1 ;False 对应数字0、 字符串变量 使用 拼接字符串 使用 * 拼接指定倍数的相同字符串 变量的输入:&…

深入了解linux系统—— 库的制作和使用

什么是库? 库,简单来说就是现有的,成熟的代码; 就比如我们使用的C语言标准库,我们经常使用输入scanf和输出printf,都是库里面给我们实现好的,我们可以直接进行服用。 库呢又分为静态库和动态…

《软件工程》第 13 章 - 软件维护

知识思维导图 13.1 软件维护与进化的概念 1. 核心概念 软件维护:软件交付使用后,为纠正错误、改善性能或其他属性而进行的修改过程软件进化:随着时间推移,软件系统为适应环境变化和用户需求而不断演变的过程 2. 维护类型&#…

2024 CKA模拟系统制作 | Step-By-Step | 12、创建多容器Pod

目录 免费获取题库配套 CKA_v1.31_模拟系统 一、题目 二、考点分析 1. 多容器 Pod 的理解 2. YAML 配置规范 3. 镜像版本控制 三、考点详细讲解 1. 多容器 Pod 的工作原理 2. 容器端口冲突处理 3. 资源隔离机制 四、实验环境搭建步骤 总结 免费获取题库配套 CKA_v…

python:selenium爬取网站信息

关注我,精彩不错过! 前言 使用python的requests模块还是存在很大的局限性,例如:只发一次请求;针对ajax动态加载的网页则无法获取数据等等问题。特此,本章节将通过selenium模拟浏览器来完成更高级的爬虫抓…

满天星之canvas实现【canvas】

展示 文章目录 展示Canvas 介绍【基础】简介兼容性关键特性注意事项应用场景:基本示例 满天星代码实现【重点】代码解释 全量代码【来吧,尽情复制吧少年】html引入JS代码 参考资源 Canvas 介绍【基础】 简介 Canvas是一个基于HTML5的绘图技术&#xff0…

【开源解析】基于PyQt5+Folium的谷歌地图应用开发:从入门到实战

🌐【开源解析】基于PyQt5Folium的谷歌地图应用开发:从入门到实战 🌈 个人主页:创客白泽 - CSDN博客 🔥 系列专栏:🐍《Python开源项目实战》 💡 热爱不止于代码,热情源自每…

在 Ubuntu 22.04 LTS 上离线安装 Docker

在 Ubuntu 22.04 LTS 上离线安装 Docker 一、准备工作 1.1 获取目标系统信息 在目标 Ubuntu 22.04 LTS 系统上,先执行以下命令确认架构信息: uname -m lsb_release -a一般返回如下信息: 1.2 需要一台可联网的机器 准备一台可以连接互联网…

python调用langchain实现RAG

一、安装langchain 安装依赖 python -m venv env.\env\Scripts\activatepip3 install langchainpip3 install langchain-corepip3 install langchain-openaipip3 install langchain-communitypip3 install dashscopepip3 install langchain_postgrespip3 install "psyc…

触控精灵 ADB运行模式填写电脑端IP教程

•ADB模式,如果你手机已经root则可以直接运行,无需安装电脑端。 •ADB模式,如果你手机没有root,那你可以windows电脑下载【极限投屏】软件,然后你的手机和电脑的网络要同一个wifi,然后把你电脑的ip地址填写…

uniapp|实现多端图片上传、拍照上传自定义插入水印内容及拖拽自定义水印位置,实现水印相机、图片下载保存等功能

本文以基础视角,详细讲解如何在uni-app中实现图片上传→水印动态编辑→图片下载的全流程功能。 目录 引言应用场景分析(社交媒体、内容保护、企业素材管理等)uniapp跨平台开发优势核心功能实现​图片上传模块多来源支持:相册选择(`uni.chooseImage`)与拍照(`sourceType:…

linux有效裁剪视频的方式(基于ffmpeg,不改变分辨率,帧率,视频质量,不需要三方软件)

就是在Linux上使用OBS Studio录制一个讲座或者其他视频,可能总有些时候会多录制一段时间,但是如果使用剪映或者PR这样的工具在导出的时候总需要烦恼导出的格式和参数,比如剪映就不支持mkv格式的导出,导出成mp4格式的视频就会变得很…