因此,對路徑的基本了解(描述了您感興趣的元素的位置)是您學習的第一個也是最重要的事情。 讓我們使用 Cheapflights.co.uk 上的此頁面。 Cheapflights.co.uk 上的頁面 當我編寫 XPath 查詢時,請看一下它(暫時忽 馬耳他 電話號碼庫 略建議的元素!)。 xpath 請求範例 gif 我使用的工具是——刮刀來自 Chrome 線上應用程式商店。
它是一個簡單但快速的工具,用於建立和最佳化 XPath 表達式。我用它來編寫幾乎所有的 XPath 表達式,然後將它們移到我的清理工具中。您可以使用 Chrome 開發者工具來評估和驗證 XPath 和 CSS 選擇器。 位置路徑 在上面的範例中,我的 XPath 表達式是透過 / 從根節點(元素)取得的。
這實際上會選擇整個文檔,正如您將在預覽中看到的那樣。 如果我新增 /html 則不會發生任何變化,因為 html 元素是根節點。 如果我新增 /html/head,則僅選擇 head 元素的內容。 如果我添加 /html/head/title 我將獲得 title 元素的內容。 「逐個節點」的表達方式通常不是我們寫 XPath 的方式,但它對於解釋它的工作原理很有用。
因此,為了提取特定元素(在我們的範例中為標題)的內容,//title。 正是這樣: 位置路徑xpath表達式 技術位://在縮寫語法中,短的後裔或自我,這意味著當前節點或其下面的任何節點。表達式的這一部分稱為軸,它根據節點在文件樹中的位置(例如上、下、父節點、子節點等)指定要選擇的節點。
屬性提取 如果你想從頁面上的所有元素中提取href屬性怎麼辦? 用法: //a/@href //@href 將為您提供任何頁面來源字串的所有 href 屬性,包括指向 css 檔案、JavaScript 等的連結。 您可以獲得相同的結果//*/@href。 您想對您的網站進行全面分析嗎? 網址 謂詞 謂詞與在 XPath 表達式中建立 if/then 語句非常相似。