ChatGPT解决这个技术问题 Extra ChatGPT

在 C# 中使用具有默认命名空间的 Xpath

我有一个带有默认命名空间的 XML 文档。我正在使用 XPathNavigator 使用 Xpath 选择一组节点,如下所示:

XmlElement myXML = ...;  
XPathNavigator navigator = myXML.CreateNavigator();
XPathNodeIterator result = navigator.Select("/outerelement/innerelement");

我没有得到任何结果:我假设这是因为我没有指定命名空间。如何在我的选择中包含命名空间?

请参阅类似的问题 stackoverflow.com/questions/4271689/…,其中包含一些紧凑的示例作为 unittest

M
Marc Gravell

首先 - 你不需要导航器; SelectNodes / SelectSingleNode 就足够了。

但是,您可能需要一个命名空间管理器 - 例如:

XmlElement el = ...; //TODO
XmlNamespaceManager nsmgr = new XmlNamespaceManager(
    el.OwnerDocument.NameTable);
nsmgr.AddNamespace("x", el.OwnerDocument.DocumentElement.NamespaceURI);
var nodes = el.SelectNodes(@"/x:outerelement/x:innerelement", nsmgr);

注意:将别名设置为空白字符串 (nsmgr.AddNamespace("", el.OwnerDocument.DocumentElement.NamespaceURI);) 使其成为默认命名空间。然而,遗憾的是,这并不意味着您可以在不使用前缀的情况下使用 XPath(例如 var nodes = el.SelectNodes(@"/outerelement/innerelement", nsmgr);)。只有您可以使用 nsmgr.DefaultNamespace 看到这一点。更多信息在这里:stackoverflow.com/a/4271875/361842。如果希望避免使用前缀,则添加注释以节省其他时间;即你不能。
还有一个技巧,如果你只是用 xmlns:p 替换 xmlns=,其中 p 可以是任何有效的前缀,你的代码应该可以正常工作。
我试过你的代码,但 Visual Studio 说 XElement does not contain a definition for OwnerDocument...,你能看一下吗? imgur.com/a/TPHVeoM
a
adrianbanks

您可能想尝试一个 XPath Visualizer 工具来帮助您完成。

XPathVisualizer 是免费的,易于使用。

https://i.stack.imgur.com/2iZl8.png

重要提示:如果您使用的是 Windows 7/8 并且没有看到文件、编辑和帮助菜单项,请按 ALT 键。


不知道这是否适用于XP。如果您只是获取二进制文件,它可能会。我没有XP,所以无法测试。我不知道其他工具。
1.2 版在 Windows XP 下工作 - xpathvisualizer.codeplex.com/releases/view/42941
链接挂了……
M
Mitselplik

对于任何寻求快速破解解决方案的人,尤其是在您了解 XML 并且不需要担心名称空间等所有情况的情况下,您可以通过简单地将文件读取到字符串和替换攻击属性:

XmlDocument doc = new XmlDocument();
string fileData = File.ReadAllText(fileName);
fileData = fileData.Replace(" xmlns=\"", " whocares=\"");
using (StringReader sr = new StringReader(fileData))
{
   doc.Load(sr);
}

XmlNodeList nodeList = doc.SelectNodes("project/property");

当我处理单个文件时,我发现这比所有其他需要默认命名空间前缀的废话更容易。希望这可以帮助。


这太棒了。关于处理 XmlNamespaceManager 的所有其他 BS 都是无用的。 10,000 次中有 9999 次您知道 XML。
唯一的缺点是,正如预期的那样,选定的 XML 项位于 null 命名空间中。虽然我真的很喜欢这种 hack,但如果命名空间是您工作的必要条件,那么这不符合要求。
“废话”与单个文件无关——它与命名空间标签有关。如果您可以控制 XML,那么您不必使用命名空间(标签将存在于空命名空间中)。如果您无法控制,那么您正在为需要 1/2 代码的解决方案创建一个 hack。 Timothy 是否指出,现在您将有两种不同的解决方案,具体取决于您是否可以抓住不重复标签的机会。因为您想保存两行并使用 4 行来做到这一点。
@Gerard - 我并没有试图深入任何人的皮肤。我的帖子更多地与 KISS 有关,而不是嘲笑。无论如何:(1)我将我的解决方案称为 hack,暗示它不是“正确”的方法; (2) 无论我的听众是否能够控制 XML,我明确指出,如果您了解 XML 并且不需要担心名称空间,这只是一个很好的解决方案。 (3) 虽然它可能确实只需要几行额外的行来包含一个管理器并指定名称空间,但 XPath 字符串本身最终看起来非常混乱,所有额外的名称空间噪音把它们弄得一团糟。
这个不错的正则表达式 string filter = @"xmlns(:\w+)?=""([^""]+)""|xsi(:\w+)?=""([^""]+)"""; fileData = Regex.Replace(fileData, filter, ""); 我在这里找到 techoctave.com/c7/posts/113-c-reading-xml-with-namespace
T
Tomek Szpakowicz

在带有命名空间的 XML 上使用 .NET 中的 XPath(通过导航器或 SelectNodes/SelectSingleNode)时,您需要:

提供您自己的 XmlNamespaceManager

并显式地为 XPath 表达式中的所有元素添加前缀,这些元素位于命名空间中。

后者是(从下面链接的 MS 源解释):因为 XPath 1.0 忽略了默认命名空间规范 (xmlns="some_namespace")。因此,当您使用不带前缀的元素名称时,它假定为空命名空间。

这就是 XPath 的 .NET 实现忽略 XmlNamespaceManager 中带有前缀 String.Empty 的命名空间并且总是使用空命名空间的原因。

有关详细信息,请参阅 XmlNamespaceManager and UndefinedXsltContext don't handle default namespace

我发现这个“功能”非常不方便,因为您不能通过简单地添加默认命名空间声明来使旧的 XPath 命名空间感知,但这就是它的工作原理。


您编写了 XPath 1.0 忽略默认命名空间。那是错误的。如果您使用 /root/child,您将忽略它,因为无前缀 QName 测试会选择 按定义 为空或 null 命名空间下的元素。
正确地说,QName 是(命名空间 URI、本地名称、前缀)的元组。所以,这个元素 <el xmlns="URI"/> 有一个 QName ('URI','el','') 等价于另一个元素 <pre:el xmlns:pre="URI"/> ('URI','el','pre') 但与最后一个元素 { 3} ('','el','')
@Alejandro:经过考虑,我决定删除我的评论,因为我觉得这个讨论毫无意义。如果我的回答不够准确,请写一个更好的。如果我的回答不正确,请提供显示它的工作示例。
它不会忽略默认命名空间。您只是不能指定默认命名空间。巨大的差异。并且差异是有道理的——任何给定标签的默认命名空间可能不同; xpath 应该去一个明确的标签。除非您使用标签名称,否则您可以这样做。但它会找到所有使用默认命名空间定义的标签;您只需在 xpath 表达式中使用标记指定该名称空间。
@GerardONeill 我之前对 user357812(又名 Alejandro)的评论仍然适用。此外,我认为您将 XML 文档中包含的名称空间规范与适用于 XPath 表达式本身的名称空间规范混淆了。我的回答是关于后者。
B
Bartosz Węgielewski

您可以使用 XPath 语句而不使用 XmlNamespaceManager,如下所示:

...
navigator.Select("//*[ local-name() = 'innerelement' and namespace-uri() = '' ]")
...

这是在定义了默认命名空间的 XML 中选择元素的简单方法。重点是使用:

namespace-uri() = ''

它将在不使用前缀的情况下找到具有默认命名空间的元素。


namespace-uri='' 对我不起作用,但它给了我动态创建 xpath 表达式的想法,如下所示: doc.SelectNodes(String.Format("//*[local-name()='innerelement'和 namespace-uri()='{0}']", doc.DocumentElement.NamespaceURI));那行得通
K
Kent

我的回答扩展了 Brandon 之前的回答。我使用他的示例创建了一个扩展方法,如下所示:

static public class XmlDocumentExt
{
    static public XmlNamespaceManager GetPopulatedNamespaceMgr(this System.Xml.XmlDocument xd)
    {
        XmlNamespaceManager nmsp = new XmlNamespaceManager(xd.NameTable);
        XPathNavigator nav = xd.DocumentElement.CreateNavigator();
        foreach (KeyValuePair<string,string> kvp in nav.GetNamespacesInScope(XmlNamespaceScope.All))
        {
            string sKey = kvp.Key;
            if (sKey == "")
            {
                sKey = "default";
            }
            nmsp.AddNamespace(sKey, kvp.Value);
        }

        return nmsp;
    }
}

然后在我的 XML 解析代码中,我只添加了一行:

XmlDocument xdCandidate = new XmlDocument();
xdCandidate.Load(sCandidateFile);
XmlNamespaceManager nmsp = xdCandidate.GetPopulatedNamespaceMgr();  // 1-line addition
XmlElement xeScoreData = (XmlElement)xdCandidate.SelectSingleNode("default:ScoreData", nmsp);

我真的很喜欢这种方法,因为它在从源 XML 文件加载名称空间方面是完全动态的,并且它并没有完全忽视 XML 名称空间的概念,因此它可以与需要多个名称空间以消除冲突的 XML 一起使用。


我注意到与@Brandon 的解决方案相比,您将空白(“”)键替换为“默认”。 Brandon 添加了“”键和带有“默认”键的第二个版本。
B
Brandon

我遇到了空白默认命名空间的类似问题。在这个 XML 示例中,我混合了带有命名空间前缀的元素,以及一个没有:

<src:SRCExample xmlns="urn:some:stuff:here" xmlns:src="www.test.com/src" xmlns:a="www.test.com/a" xmlns:b="www.test.com/b">
 <DataBlock>
  <a:DocID>
   <a:IdID>7</a:IdID>
  </a:DocID>
  <b:Supplimental>
   <b:Data1>Value</b:Data1>
   <b:Data2/>
   <b:Extra1>
    <b:More1>Value</b:More1>
   </b:Extra1>
  </b:Supplimental>
 </DataBlock>
</src:SRCExample>

我尝试使用在 XPath Visualizer 中工作的 XPath,但在我的代码中不起作用:

  XmlDocument doc = new XmlDocument();
  doc.Load( textBox1.Text );
  XPathNavigator nav = doc.DocumentElement.CreateNavigator();
  XmlNamespaceManager nsman = new XmlNamespaceManager( nav.NameTable );
  foreach ( KeyValuePair<string, string> nskvp in nav.GetNamespacesInScope( XmlNamespaceScope.All ) ) {
    nsman.AddNamespace( nskvp.Key, nskvp.Value );
  }

  XPathNodeIterator nodes;

  XPathExpression failingexpr = XPathExpression.Compile( "/src:SRCExample/DataBlock/a:DocID/a:IdID" );
  failingexpr.SetContext( nsman );
  nodes = nav.Select( failingexpr );
  while ( nodes.MoveNext() ) {
    string testvalue = nodes.Current.Value;
  }

我将其缩小到 XPath 的“DataBlock”元素,但无法使其工作,除非通过简单地通配 DataBlock 元素:

  XPathExpression workingexpr = XPathExpression.Compile( "/src:SRCExample/*/a:DocID/a:IdID" );
  failingexpr.SetContext( nsman );
  nodes = nav.Select( failingexpr );
  while ( nodes.MoveNext() ) {
    string testvalue = nodes.Current.Value;
  }

经过多次头疼和谷歌搜索(这让我来到这里),我决定直接在我的 XmlNamespaceManager 加载器中处理默认命名空间,方法是将其更改为:

  foreach ( KeyValuePair<string, string> nskvp in nav.GetNamespacesInScope( XmlNamespaceScope.All ) ) {
    nsman.AddNamespace( nskvp.Key, nskvp.Value );
    if ( nskvp.Key == "" ) {
      nsman.AddNamespace( "default", nskvp.Value );
    }
  }

所以现在“default”和“”指向同一个命名空间。一旦我这样做了,XPath "/src:SRCExample/default:DataBlock/a:DocID/a:IdID" 就会像我想要的那样返回我的结果。希望这有助于为其他人澄清这个问题。


S
SO User

如果外部元素和内部元素的命名空间不同

XmlNamespaceManager manager = new XmlNamespaceManager(myXmlDocument.NameTable);
                            manager.AddNamespace("o", "namespaceforOuterElement");
                            manager.AddNamespace("i", "namespaceforInnerElement");
string xpath = @"/o:outerelement/i:innerelement"
// For single node value selection
XPathExpression xPathExpression = navigator.Compile(xpath );
string reportID = myXmlDocument.SelectSingleNode(xPathExpression.Expression, manager).InnerText;

// For multiple node selection
XmlNodeList myNodeList= myXmlDocument.SelectNodes(xpath, manager);

S
SpikeDog

在我的情况下,添加前缀是不切实际的。太多的 xml 或 xpath 是在运行时确定的。最终我在 XmlNode 上扩展了方法。这尚未针对性能进行优化,它可能无法处理所有情况,但到目前为止它对我有用。

    public static class XmlExtenders
{

    public static XmlNode SelectFirstNode(this XmlNode node, string xPath)
    {
        const string prefix = "pfx";
        XmlNamespaceManager nsmgr = GetNsmgr(node, prefix);
        string prefixedPath = GetPrefixedPath(xPath, prefix);
        return node.SelectSingleNode(prefixedPath, nsmgr);
    }

    public static XmlNodeList SelectAllNodes(this XmlNode node, string xPath)
    {
        const string prefix = "pfx";
        XmlNamespaceManager nsmgr = GetNsmgr(node, prefix);
        string prefixedPath = GetPrefixedPath(xPath, prefix);
        return node.SelectNodes(prefixedPath, nsmgr);
    }

    public static XmlNamespaceManager GetNsmgr(XmlNode node, string prefix)
    {
        string namespaceUri;
        XmlNameTable nameTable;
        if (node is XmlDocument)
        {
            nameTable = ((XmlDocument) node).NameTable;
            namespaceUri = ((XmlDocument) node).DocumentElement.NamespaceURI;
        }
        else
        {
            nameTable = node.OwnerDocument.NameTable;
            namespaceUri = node.NamespaceURI;
        }
        XmlNamespaceManager nsmgr = new XmlNamespaceManager(nameTable);
        nsmgr.AddNamespace(prefix, namespaceUri);
        return nsmgr;
    }

    public static string GetPrefixedPath(string xPath, string prefix)
    {
        char[] validLeadCharacters = "@/".ToCharArray();
        char[] quoteChars = "\'\"".ToCharArray();

        List<string> pathParts = xPath.Split("/".ToCharArray()).ToList();
        string result = string.Join("/",
                                    pathParts.Select(
                                        x =>
                                        (string.IsNullOrEmpty(x) ||
                                         x.IndexOfAny(validLeadCharacters) == 0 ||
                                         (x.IndexOf(':') > 0 &&
                                          (x.IndexOfAny(quoteChars) < 0 || x.IndexOfAny(quoteChars) > x.IndexOf(':'))))
                                            ? x
                                            : prefix + ":" + x).ToArray());
        return result;
    }
}

然后在你的代码中使用类似的东西

        XmlDocument document = new XmlDocument();
        document.Load(pathToFile);
        XmlNode node = document.SelectFirstNode("/rootTag/subTag");

希望这可以帮助


我使用了这段代码,它就像一个魅力,直到我今天遇到了问题。它不处理使用管道的 xpath 表达式。由于我发现原始代码难以阅读,因此我使用正则表达式重写了它,我觉得这更容易(请参阅下面的答案)
D
Dan

我使用了上面 SpikeDog 描述的 hacky 但有用的方法。它工作得非常好,直到我向它抛出了一个使用管道组合多个路径的 xpath 表达式。

所以我用正则表达式重写了它,并认为我会分享:

public string HackXPath(string xpath_, string prefix_)
{
    return System.Text.RegularExpressions.Regex.Replace(xpath_, @"(^(?![A-Za-z0-9\-\.]+::)|[A-Za-z0-9\-\.]+::|[@|/|\[])(?'Expression'[A-Za-z][A-Za-z0-9\-\.]*)", x =>
                {
                    int expressionIndex = x.Groups["Expression"].Index - x.Index;
                    string before = x.Value.Substring(0, expressionIndex);
                    string after = x.Value.Substring(expressionIndex, x.Value.Length - expressionIndex);
                    return String.Format("{0}{1}:{2}", before, prefix_, after);
                });
}

当路径表达式具有属性时,此版本存在问题。例如,“element/@id”应该是“p:element/@id”时被转换为“p:element/p:@id”。
Z
Zak

或者,如果有人应该使用 XPathDocument,比如我:

XPathDocument xdoc = new XPathDocument(file);
XPathNavigator nav = xdoc.CreateNavigator();
XmlNamespaceManager nsmgr = new XmlNamespaceManager(nav.NameTable);
nsmgr.AddNamespace("y", "http://schemas.microsoft.com/developer/msbuild/2003");
XPathNodeIterator nodeIter = nav.Select("//y:PropertyGroup", nsmgr);

C
Corto

1] 如果您有一个在命名空间中没有任何前缀的 XML 文件:

<bookstore xmlns="http://www.contoso.com/books">
…
</bookstore>

你有这个解决方法:

XmlTextReader reader = new XmlTextReader(@"C:\Temp\books.xml");
// ignore the namespace as there is a single default namespace:
reader.Namespaces = false;
XPathDocument document = new XPathDocument(reader);
XPathNavigator navigator = document.CreateNavigator();
XPathNodeIterator nodes = navigator.Select("//book");

2] 如果您在命名空间中有一个带有前缀的 XML 文件:

<bookstore xmlns:ns="http://www.contoso.com/books">
…
</bookstore>

用这个:

XmlTextReader reader = new XmlTextReader(@"C:\Temp\books.xml");
XPathDocument document = new XPathDocument(reader);
XPathNavigator navigator = document.CreateNavigator();
XPathNodeIterator nodes = navigator.Select("//book");

当然,如果需要,您可以使用命名空间管理:

XmlTextReader reader = new XmlTextReader(@"C:\Temp\books.xml");
XPathDocument document = new XPathDocument(reader);
XPathNavigator navigator = document.CreateNavigator();
XmlNamespaceManager nsmgr = new XmlNamespaceManager(reader.NameTable);
nsmgr.AddNamespace("ns", "http://www.contoso.com/book");
XPathNodeIterator nodes = navigator.Select("//book", nsmgr);

我认为这是使代码在大多数情况下工作的最简单方法。

我希望这有助于解决这个微软问题......


i
ivebeenlinuxed

这个一直困扰着我。我现在已经做了一些测试,所以希望我可以帮助你。

This is the source from Microsoft, which is the key to the problem

重要的段落在这里:

XPath 将空前缀视为空名称空间。换句话说,只有映射到命名空间的前缀才能在 XPath 查询中使用。这意味着如果您要查询 XML 文档中的命名空间,即使它是默认命名空间,也需要为其定义前缀。

本质上,您必须记住 XPath 解析器使用命名空间 URI - 前缀可互换的设计。就是这样,在编程时,您可以分配我们想要的任何前缀 - 只要 URI 匹配。

为了清楚起见,示例:

示例 A:

<data xmlns:nsa="http://example.com/ns"><nsa:a>World</nsa:a></data>

这有一个 NULL 默认 URI(未定义 xmlns=)。因为这个 /data/nsa:a 返回“世界”。

示例 B:

<data xmlns:nsa="http://example.com/ns" xmlns="https://standardns/"><nsa:a>World</nsa:a></data>

此文档有一个命名的默认前缀 https://standardns/XPathNavigator.Execute/data/nsa:a 因此不返回任何结果。 MS 认为 data 的 XML namespace uri 应该为 NULL,而 data 的命名空间 URI 实际上是“https://standardns/”。本质上,XPath 正在寻找 /NULL:data/nsa:a - 尽管这不起作用,因为您不能将 NULL URI 称为“NULL”作为前缀。 NULL 前缀是所有 XPath 中的默认值 - 因此是问题所在。

我们如何解决这个问题?

XmlNamespaceManager result = new XmlNamespaceManager(xDoc.NameTable);
result.AddNamespace("DEFAULT", "https://standardns/");
result.AddNamespace("nsa", "http://example.com/ns");

这样,我们现在可以将 a 称为 /DEFAULT:data/nsa:a

示例 C:

<data><a xmlns="https://standardns/">World</a></data>

在此示例中,data 位于 NULL 命名空间中。 a 位于默认命名空间“https://standardns/”中。根据 Microsoft 的说法,/data/a 应该不起作用,因为 a 在 NS https://standardns/ 中,而 data 在命名空间 NULL 中。 <a> 因此被隐藏(除非通过奇怪的“忽略名称空间”黑客)并且不能按原样选择。这本质上是根本原因——你不应该选择没有前缀的“a”和“data”,因为这会假设它们在同一个命名空间中,而它们不是!

我们如何解决这个问题?

XmlNamespaceManager result = new XmlNamespaceManager(xDoc.NameTable);
result.AddNamespace("DEFAULT", "https://standardns/");

这样,我们现在可以将 a 称为 /data/DEFAULT:a,因为数据是从 NULL 命名空间中选择的,而 a 是从新前缀“DEFAULT”中选择的。在这个例子中重要的是命名空间 prefix 不需要保持不变。在您的代码中引用具有不同前缀的 URI 命名空间是完全可以接受的,这与您正在处理的文档中所写的内容有关。

希望这可以帮助一些人!


C
Cerebrus

在这种情况下,问题的原因可能是名称空间解析,但也可能是您的 XPath 表达式本身不正确。您可能想先评估它。

这是使用 XPathNavigator 的代码。

//xNav is the created XPathNavigator.
XmlNamespaceManager mgr = New XmlNamespaceManager(xNav.NameTable);
mgr.AddNamespace("prefix", "http://tempuri.org/");

XPathNodeIterator result = xNav.Select("/prefix:outerelement/prefix:innerelement", mgr);