龙空技术网

福利!使用Aspose.Words在Java中将Word格式转换为PDF完整指南

慧都科技 260

前言:

而今看官们对“java提取word文档的所有文字”可能比较看重,你们都想要了解一些“java提取word文档的所有文字”的相关文章。那么小编在网摘上搜集了一些关于“java提取word文档的所有文字””的相关文章,希望小伙伴们能喜欢,大家一起来学习一下吧!

在共享文档之前,通常使用Word到PDF的转换。可以使用各种在线Word到PDF转换器,可以转换单个或有限数量的Word文档。但是,随着新兴的MS Word自动化和报告生成解决方案,Word到PDF的自动转换已成为系统的重要组成部分。同时,需要自动完成DOC / DOCX到PDF的批量转换,以减少时间和精力。

在这种情况下,本文将展示如何使用Aspose.Words自动以Java 编程方式将Word(DOC / DOCX)文档转换为PDF的过程。如果你还没有用过Java版Aspose.Words可以点击文末“了解更多”下载最新版测试。

在本文中,我们将使用Aspose.Words在Java中执行以下Word到PDF的转换:

用Java将Word文档转换为PDF。用Java将Word DOC / DOCX的选定页面转换为PDF。使用特定的PDF标准(例如PDF 1.5,PDF / A-1a等)将Word转换为PDF。使用Java中的图像/文本压缩将Word转换为PDF。使用Java的自定义JPEG品质将Word转换为PDF。

(本文篇幅略长,建议收藏阅读哟~)

①将Java中的Word(DOC / DOCX)转换为PDF

为了将Word文档转换为PDF,Aspose.Words for Java提供了Document类的save()方法。您可以简单地加载Word文档并通过以“ .pdf”扩展名指定输出文件名来调用此方法。以下代码示例显示了如何在Java中将Word DOC转换为PDF。

// Load the Word document from diskDocument doc = new Document("word.docx");// Save as PDFdoc.save("output.pdf");

Word文件

转换后的PDF文档

②在Java中将Word DOC / DOCX的选定页面转换为PDF

如果只想将Word的选择性页面转换为PDF,可以使用PdfSaveOptions类来实现。可以通过指定起始页面的索引来转换前N页或页面范围。以下代码示例显示了如何在Java中将Word DOC / DOCX的选定页面转换为PDF。

// Load the Word document from diskDocument doc = new Document("word.docx");PdfSaveOptions options = new PdfSaveOptions();// Convert 3 pages starting from index 1 where 0 is the first page's index options.setPageIndex(1);options.setPageCount(3);// Save Word as PDFdoc.save("output.pdf", options);
③将Word DOC / DOCX转换为Java中的特定PDF标准

PDF文档可能符合各种PDF标准,例如PDF / A-1a,PDF 1.5等。如果要将Word文档转换为特定的PDF标准,则可以使用PdfCompliance进行指定 。下面的代码示例演示如何使用Java中的特定PDF标准将Word DOCX转换为PDF。

// Load the Word document from diskDocument doc = new Document("word.docx");// Set PDFSaveOption compliance to PDF15PdfSaveOptions options = new PdfSaveOptions();options.setCompliance(PdfCompliance.PDF_15);// Convert Word to PDFdoc.save("output.pdf", options);

④使用Java中的文本或图像压缩将Word转换为PDF

可以通过压缩Word文档中的文本或图像来减小生成的PDF文档的大小。也可以使用Aspose.Words for Java将 Word中的以下压缩应用于PDF转换。

文字压缩选项

Aspose.Words for Java为 PdfTextCompression 类提供了以下文本压缩选项:

None: 无文本压缩。Flate: Flate(ZIP)压缩。

影像压缩

图像压缩选项在PdfImageCompression类中可用。

自动:API自动为文档中的每个图像选择最合适的压缩率。Jpeg:压缩为JPEG图像(不支持透明)。

下面的代码示例演示如何使用Java中的文本和图像压缩将Word转换为PDF。

// Load the Word document from diskDocument doc = new Document("word.docx");PdfSaveOptions options = new PdfSaveOptions();// Text and image compressionoptions.setTextCompression(PdfTextCompression.FLATE);options.setImageCompression(PdfImageCompression.AUTO);// Save Word as PDFdoc.save("output.pdf", options);

⑤在Java中以JPEG品质将Word转换为PDF

同样,还可以在Word到PDF的转换中自定义和控制JPEG质量。所述PdfSaveOptions.setJpegQuality 用于设置JPEG质量可以是从0(与最大压缩质量最差)到100(与最小压缩最好的质量)。以下代码示例显示了在Java中将Word DOCX转换为PDF时如何指定JPEG质量。

// Load the Word document from diskDocument doc = new Document("word.docx");// Set Jpeg qualityPdfSaveOptions options = new PdfSaveOptions();options.setJpegQuality(100);// Convert Word to PDFdoc.save("output.pdf", options);

如果您有任何疑问或需求,请随时加入Aspose技术交流群(642018183),我们很高兴为您提供查询和咨询。

标签: #java提取word文档的所有文字