pdfbox是一個主要用于處理PDF文檔的Java工具,該工具支持多種語言和平臺的PDF工具,而且操作簡單,可以從PDF和XFDF格式中導(dǎo)入或?qū)С霰韱螖?shù)據(jù)。
【功能介紹】
1、文本提?。簭腜DF文檔中提取文本。
2、合并&分割:可以把多個PDF文檔合并成單個,也可以把單個PDF分拆成多個PDF文檔。
3、表單填充:可以從PDF表單中提取數(shù)據(jù),或者是填充PDF表單。
4、PDF/A驗證:驗證PDF文檔是否滿足PDF/A ISO標準。
5、PDF打?。喊裀DF文檔輸出到打印機——利用了Java的打印API。
6、PDF轉(zhuǎn)換:可以把PDF文檔轉(zhuǎn)換成映像文件。
7、PDF創(chuàng)建:可以從頭創(chuàng)建新的PDF文檔。
8、集成Lucene搜索引擎:Lucene搜索引擎與PDF索引相集成。
【更新內(nèi)容】
V2.0.6:
這個版本是基于 2.0.5 版本的增量式 bug 修復(fù)版本,包含了幾個修復(fù)和小改進,更新如下:
Bug 修復(fù)
[PDFBOX-3313] - Java 9 InaccessibleObjectException
[PDFBOX-3318] - IllegalArgumentException in PDPageTree constructor: root cannot be null
[PDFBOX-3347] - COSName parsing doesn't handle ISO-8859-1 encoded bytes