xml - 比较数以百计的XML文档进行模式相似性

  显示原文与译文双语对照的内容

我在做一个项目,我们有几百个旧的xml文档。 我们认为,这些xml文档使用了大约 60种不同的模式,但不知道这些模式是什么。

有什么工具可以用来做这种类型的工作? 如果不是什么最好的方法去进行编程比较?

时间: 作者:

我先做一些即席查询。 假设你拥有一个目录中的所有文档,并且你可以使用 collection() 函数读取目录中的所有文档。


<xsl:for-each-group select="collection('dir?select=*.xml')" group-by="node-name(*)">
 <e name="name(*)" count="count(current-group())"/>
</xsl:for-each-group>

若要查看是否使用顶级元素名称对它们进行分组,请执行下列操作:。

然后可以为每个顶级元素名称选择一个代表文档,并使用工具生成该文档的模式,然后运行类似的查询来验证该组中的所有文档,以验证该架构是否符合该架构。

( 以氧为中心的大多数ide包括一个从实例生成模式的工具) 。 但我不知道可以编程方式调用的工具。

在这之后,这取决于你发现了什么。

作者:
...