我有一个带有默认命名空间的 XML 文档。我正在使用 XPathNavigator 使用 Xpath 选择一组节点,如下所示:
XmlElement myXML = ...;
XPathNavigator navigator = myXML.CreateNavigator();
XPathNodeIterator result = navigator.Select("/outerelement/innerelement");
我没有得到任何结果:我假设这是因为我没有指定命名空间。如何在我的选择中包含命名空间?
首先 - 你不需要导航器; SelectNodes / SelectSingleNode 就足够了。
但是,您可能需要一个命名空间管理器 - 例如:
XmlElement el = ...; //TODO
XmlNamespaceManager nsmgr = new XmlNamespaceManager(
el.OwnerDocument.NameTable);
nsmgr.AddNamespace("x", el.OwnerDocument.DocumentElement.NamespaceURI);
var nodes = el.SelectNodes(@"/x:outerelement/x:innerelement", nsmgr);
您可能想尝试一个 XPath Visualizer 工具来帮助您完成。
XPathVisualizer 是免费的,易于使用。
https://i.stack.imgur.com/2iZl8.png
重要提示:如果您使用的是 Windows 7/8 并且没有看到文件、编辑和帮助菜单项,请按 ALT 键。
对于任何寻求快速破解解决方案的人,尤其是在您了解 XML 并且不需要担心名称空间等所有情况的情况下,您可以通过简单地将文件读取到字符串和替换攻击属性:
XmlDocument doc = new XmlDocument();
string fileData = File.ReadAllText(fileName);
fileData = fileData.Replace(" xmlns=\"", " whocares=\"");
using (StringReader sr = new StringReader(fileData))
{
doc.Load(sr);
}
XmlNodeList nodeList = doc.SelectNodes("project/property");
当我处理单个文件时,我发现这比所有其他需要默认命名空间前缀的废话更容易。希望这可以帮助。
string filter = @"xmlns(:\w+)?=""([^""]+)""|xsi(:\w+)?=""([^""]+)"""; fileData = Regex.Replace(fileData, filter, "");
我在这里找到 techoctave.com/c7/posts/113-c-reading-xml-with-namespace
在带有命名空间的 XML 上使用 .NET 中的 XPath(通过导航器或 SelectNodes/SelectSingleNode)时,您需要:
提供您自己的 XmlNamespaceManager
并显式地为 XPath 表达式中的所有元素添加前缀,这些元素位于命名空间中。
后者是(从下面链接的 MS 源解释):因为 XPath 1.0 忽略了默认命名空间规范 (xmlns="some_namespace")。因此,当您使用不带前缀的元素名称时,它假定为空命名空间。
这就是 XPath 的 .NET 实现忽略 XmlNamespaceManager 中带有前缀 String.Empty 的命名空间并且总是使用空命名空间的原因。
有关详细信息,请参阅 XmlNamespaceManager and UndefinedXsltContext don't handle default namespace。
我发现这个“功能”非常不方便,因为您不能通过简单地添加默认命名空间声明来使旧的 XPath 命名空间感知,但这就是它的工作原理。
/root/child
,您将忽略它,因为无前缀 QName 测试会选择 按定义 为空或 null 命名空间下的元素。
<el xmlns="URI"/>
有一个 QName ('URI','el','') 等价于另一个元素 <pre:el xmlns:pre="URI"/>
('URI','el','pre') 但与最后一个元素 { 3} ('','el','')
您可以使用 XPath 语句而不使用 XmlNamespaceManager,如下所示:
...
navigator.Select("//*[ local-name() = 'innerelement' and namespace-uri() = '' ]")
...
这是在定义了默认命名空间的 XML 中选择元素的简单方法。重点是使用:
namespace-uri() = ''
它将在不使用前缀的情况下找到具有默认命名空间的元素。
我的回答扩展了 Brandon 之前的回答。我使用他的示例创建了一个扩展方法,如下所示:
static public class XmlDocumentExt
{
static public XmlNamespaceManager GetPopulatedNamespaceMgr(this System.Xml.XmlDocument xd)
{
XmlNamespaceManager nmsp = new XmlNamespaceManager(xd.NameTable);
XPathNavigator nav = xd.DocumentElement.CreateNavigator();
foreach (KeyValuePair<string,string> kvp in nav.GetNamespacesInScope(XmlNamespaceScope.All))
{
string sKey = kvp.Key;
if (sKey == "")
{
sKey = "default";
}
nmsp.AddNamespace(sKey, kvp.Value);
}
return nmsp;
}
}
然后在我的 XML 解析代码中,我只添加了一行:
XmlDocument xdCandidate = new XmlDocument();
xdCandidate.Load(sCandidateFile);
XmlNamespaceManager nmsp = xdCandidate.GetPopulatedNamespaceMgr(); // 1-line addition
XmlElement xeScoreData = (XmlElement)xdCandidate.SelectSingleNode("default:ScoreData", nmsp);
我真的很喜欢这种方法,因为它在从源 XML 文件加载名称空间方面是完全动态的,并且它并没有完全忽视 XML 名称空间的概念,因此它可以与需要多个名称空间以消除冲突的 XML 一起使用。
我遇到了空白默认命名空间的类似问题。在这个 XML 示例中,我混合了带有命名空间前缀的元素,以及一个没有:
<src:SRCExample xmlns="urn:some:stuff:here" xmlns:src="www.test.com/src" xmlns:a="www.test.com/a" xmlns:b="www.test.com/b">
<DataBlock>
<a:DocID>
<a:IdID>7</a:IdID>
</a:DocID>
<b:Supplimental>
<b:Data1>Value</b:Data1>
<b:Data2/>
<b:Extra1>
<b:More1>Value</b:More1>
</b:Extra1>
</b:Supplimental>
</DataBlock>
</src:SRCExample>
我尝试使用在 XPath Visualizer 中工作的 XPath,但在我的代码中不起作用:
XmlDocument doc = new XmlDocument();
doc.Load( textBox1.Text );
XPathNavigator nav = doc.DocumentElement.CreateNavigator();
XmlNamespaceManager nsman = new XmlNamespaceManager( nav.NameTable );
foreach ( KeyValuePair<string, string> nskvp in nav.GetNamespacesInScope( XmlNamespaceScope.All ) ) {
nsman.AddNamespace( nskvp.Key, nskvp.Value );
}
XPathNodeIterator nodes;
XPathExpression failingexpr = XPathExpression.Compile( "/src:SRCExample/DataBlock/a:DocID/a:IdID" );
failingexpr.SetContext( nsman );
nodes = nav.Select( failingexpr );
while ( nodes.MoveNext() ) {
string testvalue = nodes.Current.Value;
}
我将其缩小到 XPath 的“DataBlock”元素,但无法使其工作,除非通过简单地通配 DataBlock 元素:
XPathExpression workingexpr = XPathExpression.Compile( "/src:SRCExample/*/a:DocID/a:IdID" );
failingexpr.SetContext( nsman );
nodes = nav.Select( failingexpr );
while ( nodes.MoveNext() ) {
string testvalue = nodes.Current.Value;
}
经过多次头疼和谷歌搜索(这让我来到这里),我决定直接在我的 XmlNamespaceManager 加载器中处理默认命名空间,方法是将其更改为:
foreach ( KeyValuePair<string, string> nskvp in nav.GetNamespacesInScope( XmlNamespaceScope.All ) ) {
nsman.AddNamespace( nskvp.Key, nskvp.Value );
if ( nskvp.Key == "" ) {
nsman.AddNamespace( "default", nskvp.Value );
}
}
所以现在“default”和“”指向同一个命名空间。一旦我这样做了,XPath "/src:SRCExample/default:DataBlock/a:DocID/a:IdID" 就会像我想要的那样返回我的结果。希望这有助于为其他人澄清这个问题。
如果外部元素和内部元素的命名空间不同
XmlNamespaceManager manager = new XmlNamespaceManager(myXmlDocument.NameTable);
manager.AddNamespace("o", "namespaceforOuterElement");
manager.AddNamespace("i", "namespaceforInnerElement");
string xpath = @"/o:outerelement/i:innerelement"
// For single node value selection
XPathExpression xPathExpression = navigator.Compile(xpath );
string reportID = myXmlDocument.SelectSingleNode(xPathExpression.Expression, manager).InnerText;
// For multiple node selection
XmlNodeList myNodeList= myXmlDocument.SelectNodes(xpath, manager);
在我的情况下,添加前缀是不切实际的。太多的 xml 或 xpath 是在运行时确定的。最终我在 XmlNode 上扩展了方法。这尚未针对性能进行优化,它可能无法处理所有情况,但到目前为止它对我有用。
public static class XmlExtenders
{
public static XmlNode SelectFirstNode(this XmlNode node, string xPath)
{
const string prefix = "pfx";
XmlNamespaceManager nsmgr = GetNsmgr(node, prefix);
string prefixedPath = GetPrefixedPath(xPath, prefix);
return node.SelectSingleNode(prefixedPath, nsmgr);
}
public static XmlNodeList SelectAllNodes(this XmlNode node, string xPath)
{
const string prefix = "pfx";
XmlNamespaceManager nsmgr = GetNsmgr(node, prefix);
string prefixedPath = GetPrefixedPath(xPath, prefix);
return node.SelectNodes(prefixedPath, nsmgr);
}
public static XmlNamespaceManager GetNsmgr(XmlNode node, string prefix)
{
string namespaceUri;
XmlNameTable nameTable;
if (node is XmlDocument)
{
nameTable = ((XmlDocument) node).NameTable;
namespaceUri = ((XmlDocument) node).DocumentElement.NamespaceURI;
}
else
{
nameTable = node.OwnerDocument.NameTable;
namespaceUri = node.NamespaceURI;
}
XmlNamespaceManager nsmgr = new XmlNamespaceManager(nameTable);
nsmgr.AddNamespace(prefix, namespaceUri);
return nsmgr;
}
public static string GetPrefixedPath(string xPath, string prefix)
{
char[] validLeadCharacters = "@/".ToCharArray();
char[] quoteChars = "\'\"".ToCharArray();
List<string> pathParts = xPath.Split("/".ToCharArray()).ToList();
string result = string.Join("/",
pathParts.Select(
x =>
(string.IsNullOrEmpty(x) ||
x.IndexOfAny(validLeadCharacters) == 0 ||
(x.IndexOf(':') > 0 &&
(x.IndexOfAny(quoteChars) < 0 || x.IndexOfAny(quoteChars) > x.IndexOf(':'))))
? x
: prefix + ":" + x).ToArray());
return result;
}
}
然后在你的代码中使用类似的东西
XmlDocument document = new XmlDocument();
document.Load(pathToFile);
XmlNode node = document.SelectFirstNode("/rootTag/subTag");
希望这可以帮助
我使用了上面 SpikeDog 描述的 hacky 但有用的方法。它工作得非常好,直到我向它抛出了一个使用管道组合多个路径的 xpath 表达式。
所以我用正则表达式重写了它,并认为我会分享:
public string HackXPath(string xpath_, string prefix_)
{
return System.Text.RegularExpressions.Regex.Replace(xpath_, @"(^(?![A-Za-z0-9\-\.]+::)|[A-Za-z0-9\-\.]+::|[@|/|\[])(?'Expression'[A-Za-z][A-Za-z0-9\-\.]*)", x =>
{
int expressionIndex = x.Groups["Expression"].Index - x.Index;
string before = x.Value.Substring(0, expressionIndex);
string after = x.Value.Substring(expressionIndex, x.Value.Length - expressionIndex);
return String.Format("{0}{1}:{2}", before, prefix_, after);
});
}
或者,如果有人应该使用 XPathDocument,比如我:
XPathDocument xdoc = new XPathDocument(file);
XPathNavigator nav = xdoc.CreateNavigator();
XmlNamespaceManager nsmgr = new XmlNamespaceManager(nav.NameTable);
nsmgr.AddNamespace("y", "http://schemas.microsoft.com/developer/msbuild/2003");
XPathNodeIterator nodeIter = nav.Select("//y:PropertyGroup", nsmgr);
1] 如果您有一个在命名空间中没有任何前缀的 XML 文件:
<bookstore xmlns="http://www.contoso.com/books">
…
</bookstore>
你有这个解决方法:
XmlTextReader reader = new XmlTextReader(@"C:\Temp\books.xml");
// ignore the namespace as there is a single default namespace:
reader.Namespaces = false;
XPathDocument document = new XPathDocument(reader);
XPathNavigator navigator = document.CreateNavigator();
XPathNodeIterator nodes = navigator.Select("//book");
2] 如果您在命名空间中有一个带有前缀的 XML 文件:
<bookstore xmlns:ns="http://www.contoso.com/books">
…
</bookstore>
用这个:
XmlTextReader reader = new XmlTextReader(@"C:\Temp\books.xml");
XPathDocument document = new XPathDocument(reader);
XPathNavigator navigator = document.CreateNavigator();
XPathNodeIterator nodes = navigator.Select("//book");
当然,如果需要,您可以使用命名空间管理:
XmlTextReader reader = new XmlTextReader(@"C:\Temp\books.xml");
XPathDocument document = new XPathDocument(reader);
XPathNavigator navigator = document.CreateNavigator();
XmlNamespaceManager nsmgr = new XmlNamespaceManager(reader.NameTable);
nsmgr.AddNamespace("ns", "http://www.contoso.com/book");
XPathNodeIterator nodes = navigator.Select("//book", nsmgr);
我认为这是使代码在大多数情况下工作的最简单方法。
我希望这有助于解决这个微软问题......
这个一直困扰着我。我现在已经做了一些测试,所以希望我可以帮助你。
This is the source from Microsoft, which is the key to the problem
重要的段落在这里:
XPath 将空前缀视为空名称空间。换句话说,只有映射到命名空间的前缀才能在 XPath 查询中使用。这意味着如果您要查询 XML 文档中的命名空间,即使它是默认命名空间,也需要为其定义前缀。
本质上,您必须记住 XPath 解析器使用命名空间 URI - 前缀可互换的设计。就是这样,在编程时,您可以分配我们想要的任何前缀 - 只要 URI 匹配。
为了清楚起见,示例:
示例 A:
<data xmlns:nsa="http://example.com/ns"><nsa:a>World</nsa:a></data>
这有一个 NULL 默认 URI(未定义 xmlns=
)。因为这个 /data/nsa:a
返回“世界”。
示例 B:
<data xmlns:nsa="http://example.com/ns" xmlns="https://standardns/"><nsa:a>World</nsa:a></data>
此文档有一个命名的默认前缀 https://standardns/
。 XPathNavigator.Execute
和 /data/nsa:a
因此不返回任何结果。 MS 认为 data
的 XML namespace uri 应该为 NULL,而 data
的命名空间 URI 实际上是“https://standardns/”。本质上,XPath 正在寻找 /NULL:data/nsa:a
- 尽管这不起作用,因为您不能将 NULL URI 称为“NULL”作为前缀。 NULL 前缀是所有 XPath 中的默认值 - 因此是问题所在。
我们如何解决这个问题?
XmlNamespaceManager result = new XmlNamespaceManager(xDoc.NameTable);
result.AddNamespace("DEFAULT", "https://standardns/");
result.AddNamespace("nsa", "http://example.com/ns");
这样,我们现在可以将 a 称为 /DEFAULT:data/nsa:a
示例 C:
<data><a xmlns="https://standardns/">World</a></data>
在此示例中,data
位于 NULL 命名空间中。 a
位于默认命名空间“https://standardns/”中。根据 Microsoft 的说法,/data/a
应该不起作用,因为 a
在 NS https://standardns/
中,而 data
在命名空间 NULL 中。 <a>
因此被隐藏(除非通过奇怪的“忽略名称空间”黑客)并且不能按原样选择。这本质上是根本原因——你不应该选择没有前缀的“a”和“data”,因为这会假设它们在同一个命名空间中,而它们不是!
我们如何解决这个问题?
XmlNamespaceManager result = new XmlNamespaceManager(xDoc.NameTable);
result.AddNamespace("DEFAULT", "https://standardns/");
这样,我们现在可以将 a 称为 /data/DEFAULT:a
,因为数据是从 NULL 命名空间中选择的,而 a 是从新前缀“DEFAULT”中选择的。在这个例子中重要的是命名空间 prefix 不需要保持不变。在您的代码中引用具有不同前缀的 URI 命名空间是完全可以接受的,这与您正在处理的文档中所写的内容有关。
希望这可以帮助一些人!
在这种情况下,问题的原因可能是名称空间解析,但也可能是您的 XPath 表达式本身不正确。您可能想先评估它。
这是使用 XPathNavigator 的代码。
//xNav is the created XPathNavigator.
XmlNamespaceManager mgr = New XmlNamespaceManager(xNav.NameTable);
mgr.AddNamespace("prefix", "http://tempuri.org/");
XPathNodeIterator result = xNav.Select("/prefix:outerelement/prefix:innerelement", mgr);
不定期副业成功案例分享
nsmgr.AddNamespace("", el.OwnerDocument.DocumentElement.NamespaceURI);
) 使其成为默认命名空间。然而,遗憾的是,这并不意味着您可以在不使用前缀的情况下使用 XPath(例如var nodes = el.SelectNodes(@"/outerelement/innerelement", nsmgr);
)。只有您可以使用nsmgr.DefaultNamespace
看到这一点。更多信息在这里:stackoverflow.com/a/4271875/361842。如果希望避免使用前缀,则添加注释以节省其他时间;即你不能。xmlns:p
替换xmlns=
,其中 p 可以是任何有效的前缀,你的代码应该可以正常工作。XElement does not contain a definition for OwnerDocument...
,你能看一下吗? imgur.com/a/TPHVeoM