需求:某些合同,被制作成模板,以 Word 格式保存,输入相关的内容参数最终生成 Word 文档下载。这是企业级应用中很常见的需求。
解决方案:无非是模板技术,界定不变和变的内容,预留插值的标记,替换为期待的最终内容。Office Word 2003 版本以上,Word 可以以 XML 文本格式存储,——只有是文本格式才使得我们这项模板技术成为可能。例如下面一个简单的 Word 文档的结构。
<?xml version="1.0"?>
<w:wordDocument xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml">
   <w:body>
       <w:p>
        <w:r>
         <w:t>Hello World.</w:t>
        </w:r>
       </w:p>
   </w:body>
</w:wordDocument>
这个一个非常简单典型的 Word XML 结构,我们可以看到它具有 XML 文件的声明和命名空间。以 <w: 开始的标签则表示了其中为 Word 中的内容,不同的 body、p、r、t 等等属性方法表明了文档中不同的格式。可以用记事本创建一个文件,将上面的 XML 内容粘贴,并保存为 helloworld.xml,在Office Word中打开它,就能看到如上图所示的内容。
对此业界中常见的具体解决方案有:
- Apache POI,也是通过 XML 操控技术来对 Word 文档编辑的。这是大多数人使用的方案,但文本并采用这方案
- 利用后端的模板引擎技术,如 Freemarker 等。既然无非是模板,那么复用 Web MVC 上的模板技术理应没问题的,而现实中确实不少人那么做,完全可以不依赖 Web,只作纯粹的模板引擎,解析一切文本的模板。同时,那样就不用依赖 Apache POI 了。本文也是基于该原理,但不是基于 Freemark,而是传统的 JSP,那样的话连 Freemarker 都不用依赖了,更简单、轻量级
- 前端生成 Word 文档。后端提供内容数据和 Word 文档,让前端完成模板替换。这个在前端的技术好像不太靠谱,还是得要后端来完成比较好,参见我转载的文章《原来,这才是 HTML+CSS 导出 Word 最佳方式!》
总之,整个过程可以简述为:先制作一份 word 文档,预留好模板的插值符,然后让后台识别 word 为 jsp 文件(需改后缀名为 .jsp)。然后输入内容数据,让 Servlet JSP 解析、替换模板,最后一步,劫持 Servlet 输出流(ServletOutputStream),不是返回到前端的 Response,而是文件流2,保存到服务器的磁盘文件上,然后告诉前端可以下载该文件。
例如下面截图,直接便是在 Word 编辑插值符,如 ${xxxx}。

 我们定义的占位符是 ${placeholder} 格式,实际上这是 EL 表达式;除了这个还有 JSP <%……%> 也是支持的。
模板的几个问题:
- 将 Word 模板文件另存为 XML 格式,能够发现部分占位符不是作为一个整体存在,而是被分割到了不同的标签中,这样的话我们在处理文档对象、遍历文本的时候,就无法将其作为一个整体进行替换了。对此我们可以直接编辑 XML 文件,将被分割的占位符放到同一个 <w:t>标签中
- 如果需求需要插入图片也简单,在模板中找到图片标签的位置,然后将图片转成 base64 的字符串替换就好了
- 模板虽然是 docx 格式的,但给 Sevlet 解析 JSP 就必须是 .jsp后缀名了,要改下名
其中关键的技术点是 JSP 输出的“劫持”,不是输出到浏览器响应,而是保存到文件。达成这一技术点的是 ServletOutputStream 几个 write() 方法,我们可以继承父类 ServletOutputStream 覆盖 write() 方法来完成我们希望的逻辑。实际上笔者之前做过的代码生成器,就是使用这种技术的。
完整 ByteArrayServletOutputStream 类如下:
import java.io.ByteArrayOutputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import javax.servlet.RequestDispatcher;
import javax.servlet.ServletException;
import javax.servlet.ServletOutputStream;
import javax.servlet.WriteListener;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import javax.servlet.http.HttpServletResponseWrapper;
/**
 * 自定义响应对象的输出流
 * 
 * @author sp42 frank@ajaxjs.com
 *
 */
public class ByteArrayServletOutputStream extends ServletOutputStream {
	/**
	 * 创建一个 ByteArrayServletOutputStream 对象
	 */
	public ByteArrayServletOutputStream() {
	}
	/**
	 * 输出流
	 */
	private OutputStream out = new ByteArrayOutputStream();
	/**
	 * 
	 * 创建一个 ByteArrayServletOutputStream 对象
	 * 
	 * @param out 输出流
	 */
	public ByteArrayServletOutputStream(ByteArrayOutputStream out) {
		this.out = out;
	}
	@Override
	public void write(byte[] data, int offset, int length) {
		try {
			out.write(data, offset, length);
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
	@Override
	public void write(int b) throws IOException {
		out.write(b);
	}
	/**
	 * 
	 * @param _out
	 */
	public void writeTo(OutputStream _out) {
		ByteArrayOutputStream bos = (ByteArrayOutputStream) out;
		try {
			bos.writeTo(_out);
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
	public OutputStream getOut() {
		return out;
	}
	@Override
	public boolean isReady() {
		return false;
	}
	@Override
	public String toString() {
		return out.toString();
	}
	@Override
	public void setWriteListener(WriteListener writeListener) {
	}
	/**
	 * 解析 JSP 模板到服务器磁盘上
	 * 
	 * @param req
	 * @param resp
	 * @param tplJsp
	 * @param saveTo
	 */
	public static void toDisk(HttpServletRequest req, HttpServletResponse resp, String tplJsp, String saveTo) {
		RequestDispatcher rd = req.getServletContext().getRequestDispatcher(tplJsp);
		try (ByteArrayServletOutputStream stream = new ByteArrayServletOutputStream();
				PrintWriter pw = new PrintWriter(new OutputStreamWriter(stream.getOut(), "UTF-8"));
				OutputStream out = new FileOutputStream(saveTo);) {
			rd.include(req, new HttpServletResponseWrapper(resp) {
				@Override
				public ServletOutputStream getOutputStream() {
					return stream;
				}
				@Override
				public PrintWriter getWriter() {
					return pw;
				}
			});
			pw.flush();
			stream.writeTo(out);
		} catch (IOException | ServletException e) {
			e.printStackTrace();
		}
	}
}
可见只有区区 120行代码即可完成,根本不需要 Apache POI、Freemarker “劳师动众”。
调用例子,我们写一个 Servlet 来测试下:
import java.io.IOException;
import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
/**
 * Servlet implementation class DownloadContract
 */
@WebServlet("/DownloadContract")
public class DownloadContract extends HttpServlet {
	private static final long serialVersionUID = 1L;
	/**
	 * @see HttpServlet#HttpServlet()
	 */
	public DownloadContract() {
		super();
		
	}
	/**
	 * @see HttpServlet#doGet(HttpServletRequest request, HttpServletResponse
	 *      response)
	 */
	protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
		HttpServletRequest req = (HttpServletRequest) request;
		HttpServletResponse resp = (HttpServletResponse) response;
		req.setAttribute("foo", 88888888); // 内容数据
		ByteArrayServletOutputStream.toDisk(req, resp, "/doc_tpl.jsp", "c:\\temp\\s.docx");
		response.getWriter().append("Served at: ").append(request.getContextPath());
	}
}
换成 Spring Boot 也是差不多的。至于最终下载的代码,这里就不给了,读者可以自行补上。最后,分享两个相关的开源项目,挺有意思的:
- 如何用800行代码实现类似poi-tl的可视化Word模板
- WordGO - 让Java生成word文档更容易


















