xpath与nodejs解析xml

测试xpath的工具

http://www.freeformatter.com/xpath-tester.html#ad-output

http://www.xpathtester.com/test

教程

http://www.w3school.com.cn/xpath/xpath_syntax.asp

解析xml可以安装这个包 https://github.com/yaronn/xpath.js 支持xpath。使用方法大致如下:

首先安装这个包

npm install xpath.js

再安装下面这个

npm install xmldom

然后就可以使用牛逼的xpath查找xml了

    var select = require('xpath.js')
      , dom = require('xmldom').DOMParser

    var xml = "<book><title>Harry Potter</title></book>"
    var doc = new dom().parseFromString(xml)    
    var nodes = select(doc, "//title")
    console.log(nodes[0].localName + ": " + nodes[0].firstChild.data)
    console.log("node: " + nodes[0].toString())

xpath基本用法通过几个实例即可掌握

这里有一段xml

<root xmlns:foo="http://www.foo.org/" xmlns:bar="http://www.bar.org">
        <actors>
                <actor >Christian Bale</actor>
                <actor >Liam Neeson</actor>
                <actor >Michael Caine</actor>
        </actors>
        <foo:singers>
                <foo:singer >Tom Waits</foo:singer>
                <foo:singer >B.B. King</foo:singer>
                <foo:singer >Ray Charles</foo:singer>
        </foo:singers>
</root>

1. 选择文档节点

/


2. 选择root节点

/root


3. 选择所有是actors节点的子节点的actor节点

/root/actors/actor


4. 选择所有singer节点,不管他们在文档的什么地方

//foo:singer


5. 选择所有singer元素的id节点,不管他们在文档的什么地方

//foo:singer/@id


6. 选择第一个actor节点的文本

//actor[1]/text()


7. 选择最后一个actor节点

//actor[last()]


8. 选择第一个和第二个actor节点

//actor[position() < 3]


9. 选择所有带有id属性的actor节点

//actor[@id]


10. 选择所有id属性为3的actor节点

//actor[@id=’3′]


11. 选择所有id属性小于3的actor节点

//actor[@id<=3]


12. 选择所有singers节点的子节点

/root/foo:singers/*


13. 选择文档中所有节点

//*


14. 选择所有actor节点与singer节点

//actor|//foo:singer


15. 得到文档中第一个节点的节点名

name(//*[1])


16.得到第一个actor节点的id属性的数量

number(//actor[1]/@id)


17. 得到第一个actor节点的id属性的字符串表示

string(//actor[1]/@id)


18. 得到第一个actor节点内文本的长度

string-length(//actor[1]/text())


19. Select the local name of the first ‘singer’ element, i.e. without the namespace.

local-name(//foo:singer[1])


20. 计算singer节点的数量

count(//foo:singer)


21. Select the sum of the ‘id’ attributes of the ‘singer’ elements.

sum(//foo:singer/@id)

from:http://ju.outofmemory.cn/entry/73154