在 Xpath 中,我想选择等于特定值的元素。
示例 XML 数据:
<aaa id="11" >
<aaa id="21" >
<aaa id="31" ></aaa>
<bbb id="32" >
<aaa id="41" ></aaa>
<bbb id="42" ></bbb>
<ccc id="43" ></ccc>
<ddd id="44" >qwerty</ddd>
<ddd id="45" ></ddd>
<ddd id="46" ></ddd>
</bbb>
</aaa>
<bbb id="22" >
<aaa id="33" >qwerty</aaa>
<bbb id="34" ></bbb>
<ccc id="35" ></ccc>
<ddd id="36" ></ddd>
<ddd id="37" ></ddd>
<ddd id="38" ></ddd>
</bbb>
<ccc id="23" >qwerty</ccc>
<ccc id="24" ></ccc>
</aaa>
现在,使用 XPath:
//ccc[.='qwerty']
我得到了正确的预期结果:
Name Value
ccc qwerty
现在,使用 XPath:
//aaa[.='qwerty']
我得到了意想不到的结果:
Name Value
aaa
aaa qwerty
我特别感兴趣的是如何选择具有该值的任何元素
XPath:
//*[.='qwerty']
我得到了非常奇怪的意外结果:
Name Value
aaa
bbb
ddd qwerty
bbb qwerty
aaa qwerty
ccc qwerty
有人可以解释这些结果,以及如何修复我的 XPath 表达式以获得更多预期结果吗?
. =
不同于 XPath text() =
。请参阅 matching text nodes is different than matching string values 了解原因。
XPath 规范。将元素的字符串值定义为其所有文本节点后代的串联(按文档顺序)。
这解释了“奇怪的结果”。
使用以下表达式可以获得“更好”的结果:
//*[text() = 'qwerty']
以上选择文档中至少有一个值为'qwerty'的文本节点子节点的每个元素。
//*[text() = 'qwerty' and not(text()[2])]
上面选择了文档中只有一个文本节点子节点的每个元素,其值为:'qwerty'。
尝试
//*[text()='qwerty']
因为 .
是您的 current 元素
text()
是 XPath 中可能的 node-tests 之一,意思是“这是一个文本节点吗?”。其他节点测试是comment()
、processing-instruction()
或只是node()
。