java - java如何在不安装 Office Office 和使用互操作库的情况下读取服务器中的文件?

  显示原文与译文双语对照的内容

互操作库很慢,需要安装 Office 。 很多时候你不希望在服务器上安装 Office 。

我想使用 Apache,但是我在. NET. 上

我只需要提取文件的文本部分,而不是在 Office 文件中创建或者"存储信息"。

我需要告诉你我有一个非常大的文档库,我不能将它转换为更新的XML文件。

我不想为二进制文件编写解析器。 像Apache这样的库为我们这样做。 不幸的是,它只针对Java平台。 也许我应该考虑在Java中编写这个应用程序。

我还没有在. NET 中找到开源的开源替代方案,我想我将在Java中编写自己的应用程序。

时间: 原作者:

查看 Aspose组件 。 它们被设计用来模拟互操作功能,而无需在服务器上安装完整的Office 安装。

原作者:

由于新的tftp格式本质上是基于XML的文件,你可以使用标准 XML DOM技术以编程方式创建和操作它们。

这些文件基本上是zip档案,有一个备用文件扩展名。 使用 System.IO.Packaging 命名空间访问文件的内部元素,然后将它们打开到 XmlDocument 中执行操作。

这里有一些可以用的示例,并且 Office 开放的XML项目可以能值得注意。

对于老的二进制格式,这些是专有的,唯一可以从内部获取内容的方式是 Office 对象模型( 需要 Office 安装)/解析器。

不幸的是,.NET 平台上没有第一方和本地用户可以使用这些文件。

原作者:

你需要对那些文件做什么? 如果只想将它们流到用户,那么基本文件流就很好了。 如果要创建新文件( 可能基于模板) 以发送给用户,用户可以在 Office 中打开,则有多种或者工作 arounds 。

如果你在 Office 文档中保存数据供网站使用,则会对它的进行错误的处理。 Office 文档,即使是Excel电子表格和访问数据库,也不是一个适合于交互式网站的选择。

原作者:
...