Word处理控件Aspose.Words功能演示:在 Java 中将 DOCX 转换为 JSON

翻译|使用教程|编辑:胡涛|2022-08-10 14:58:14.960|阅读 36 次

概述:本文提供了一个简单指南,说明如何在 Java 应用程序中将 DOCX 文档中的文本转换为 JSON 格式。您还将学习如何以编程方式将受保护的 DOCX 文档转换为 JSON

# 31款JAVA开发必备控件和工具 # 热门开发工具JetBrains系列产品限时优惠中>>

相关链接:

Java 中 Word 中的目录

在某些情况下,您需要以编程方式将 Word DOCX 的内容导出到 JSON 文件。为此,本文提供了一个简单指南,说明如何在 Java 应用程序中将 DOCX 文档中的文本转换为 JSON 格式。您还将学习如何以编程方式将受保护的 DOCX 文档转换为 JSON。因此,让我们继续在 Java 中将 DOCX 转换为 JSON。

Aspose.Words 最新下载

如何在 Java 中将 DOCX 转换为 JSON

要将 DOCX 文档转换为 JSON 格式,我们需要执行以下步骤:

  • 加载 DOCX 文档。
  • 将其转换为 HTML 格式。
  • 以 JSON 格式保存 HTML 文件。

让我们看看如何在 Java 中以编程方式执行这些步骤。为此,您需要安装下一节中提到的两个库。

将 DOCX 转换为 JSON 的 Java 库 - 免费下载

Aspose.Words for Java是一个强大的库,允许您创建和处理 MS Word 文档。我们将使用这个库将 DOCX 文件的内容导出为 HTML。然后,我们将使用Aspose.Cells for Java将 HTML 内容保存为 JSON 文件。您可以下载这两个库的 JAR 或使用 Maven 配置安装它们。

通过 Maven 安装

<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-cells</artifactId>
<version>22.7</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
</repositories>
在 Java 中将 DOCX 转换为 JSON

以下是在 Java 中将 DOCX 转换为 JSON 的步骤。

  • 使用com.aspose.words.Document类加载 DOCX 文档。
  • 使用Document.Save()方法将 DOCX 文档保存为 HTML 。
  • 使用com.aspose.cells.Workbook类加载 HTML 文件。
  • 使用Workbook.Save()方法将文档转换为 JSON 格式。

以下代码示例展示了如何将 DOCX 文档转换为 Java 中的 JSON。

// Load Word document using Aspose.Words
Document doc = new Document("sample1.docx");

// Save as HTML
doc.save("html_output.html", SaveFormat.HTML);

// Load the saved HTML file using Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Save HTML as JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
Java 将受保护的 DOCX 转换为 JSON

您还可以使用密码加载受保护的 DOCX 文档并将其转换为 JSON 格式。以下是将受保护的 DOCX 文档转换为 Java 中的 JSON 的步骤。

  • 使用com.aspose.words.Document类加载 DOCX 文档。
  • 使用com.aspose.words.LoadOptions类指定 DOCX 文档的密码。
  • 使用Document.Save()方法将 DOCX 文档保存为 HTML 。
  • 使用com.aspose.cells.Workbook类加载 HTML 文件。
  • 使用Workbook.Save()方法将文档转换为 JSON 格式。

以下代码示例展示了如何将受保护的 DOCX 文档转换为 Java 中的 JSON。

// Load Word document using Aspose.Words
Document doc = new Document("sample1.docx", new com.aspose.words.LoadOptions("MyPassword"));

// Save as HTML
doc.save("html_output.html", SaveFormat.HTML);

// Load the saved HTML file using Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Save HTML as JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
结论

在本文中,您学习了如何在 Java 中将 DOCX 转换为 JSON。此外,您还了解了如何以编程方式将受密码保护的 DOCX 文档转换为 JSON。此外,您可以访问Aspose.Words for Java和Aspose.Cells for Java的文档以探索其他功能。


欢迎下载|体验更多Aspose产品

获取更多信息请咨询慧都在线客服 或 加入Aspose技术交流群(761297826

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至hey@evget.com


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
在线咨询
联系我们

客服热线
023-68661681

QQ客服

意见反馈


添加微信获专业服务

TOP
在线客服系统
live chat