import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.PdfReader;
import com.itextpdf.kernel.pdf.canvas.parser.PdfTextExtractor;
import java.io.File;
import java.io.IOException;
public class PDFReaderExample {
public static void main(String[] args) {
// 定义PDF文件路径
String pdfPath = "example.pdf";
// 创建PdfReader对象,用于读取PDF文件
try (PdfReader reader = new PdfReader(pdfPath);
PdfDocument pdfDoc = new PdfDocument(reader)) {
// 获取PDF文档的总页数
int totalPages = pdfDoc.getNumberOfPages();
System.out.println("Total Pages: " + totalPages);
// 遍历每一页并提取文本
for (int i = 1; i <= totalPages; i++) {
String pageContent = PdfTextExtractor.getTextFromPage(pdfDoc.getPage(i));
System.out.println("Page " + i + ":\n" + pageContent);
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
PdfReader类读取PDF文件。PdfDocument类打开PDF文档。getNumberOfPages()方法获取PDF文档的总页数。PdfTextExtractor类从每一页中提取文本内容,并打印出来。确保你已经在项目中正确配置了iText库,否则代码将无法编译和运行。
上一篇:java 获取当前小时
下一篇:java string 长度
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站