xpath 定位节点
表达式 | 说明 |
---|---|
nodename | 选中该元素 |
/ | 从根节点选取、或者是元素和元素间的过渡 |
// | 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置 |
. | 当前节点 |
.. | 父节点 |
@ | 属性 |
text() | 选取文本节点 |
* | 通配符 |
[@attr] | 选取具有给定属性的所有元素 |
- 案例
//nav/ul/li/a/@href
节点的修饰语法
修饰语法 | 说明 |
---|---|
nodename[@attr] | 选取具有给定属性的所有元素 |
nodename[@attr=’value’] | 选取具有给定属性和值的所有元素 |
nodename[@attr=’value’ and @attr2=’value2’] | 选取具有给定属性和值的所有元素 |
nodename[@attr=’value’ or @attr2=’value2’] | 选取具有给定属性和值的所有元素 |
nodename[not(@attr=’value’)] | 选取具有给定属性和值的所有元素 |
nodename[@attr=’value’ and not(@attr2=’value2’)] | 选取具有给定属性和值的所有元素 |
//title[@lang=”eng”] | 选择lang属性值为eng的所有title元素 |
/bookstore/book[1] | 选取属于 bookstore 子元素的第一个 book 元素。 |
/bookstore/book[last()] | 选取属于 bookstore 子元素的最后一个 book 元素。 |
/bookstore/book[last()-1] | 选取属于 bookstore 子元素的倒数第二个 book 元素。 |
/bookstore/book[position()<3] | 选取最前面的两个属于 bookstore 元素的子元素的 book 元素。 |
//book/title[text()=’Harry Potter’] | 选择所有book下的title元素,仅仅选择文本为Harry Potter的title元素 |
/bookstore/book[price>35.00]/title | 选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00。 |
/bookstore/book[contains(text(),”下一页”)] | 包含的语法。 |
//div[@class=”paginator”]
https://movie.douban.com/chart
找出分数较高的电影
//div[@class=”pl2”]/div[span[2]>7.5]
//div[@class=”pl2”]/div[span[2]>7.5]/../a/text()
//a[contains(@class,”titl”)]
选取未知节点
修饰语法 | 说明 |
---|---|
* | 匹配任何节点元素 |
@* | 匹配任何属性元素 一般用不到 |
node() | 匹配任何类型的节点 一般用不到 |
或
使用 | 处理
- 例如 //td/a|//h2/a
0则评论给“xpath”