進階蜘蛛腳本指南
步驟 - 網址生成
步驟 - 整合結果
步驟 - 編碼
步驟 - 简 -> 繁轉換
步驟 - 參數
區域級蜘蛛
參數用途廣泛,可用於請求用戶輸入,制作互動式腳本。
此步驟會將定義好的參數配合字串模板 ( Template String ),輸出字串。
如上圖,字串模板 https://www.example.com/{0}/{1}
會分別對應下面的 及 的參數,並輸出 https://www.example.com/1234/5678 。
這東西的輸出很容易理解,但由於參數的特性,讓製作好的腳本甚至無需再次經過編輯器修改,便可以抓取其它文章!
現階段 ( v1.8.0t / 1.3.2b ) 參數有四個模式,分別是「定義」、「用戶輸入」、「沿用」及「反饋」。
參數模式:定義
定義模式是一般模式,「傳入的參數」會將上一個步驟的輸出導入至字串模板上面。其餘情況則傳入「參數」裏面。
參數模式:用戶輸入
用戶輸入模式就是讓用戶輸入相對參數後,將其對應至字串模板並輸出至下一個步驟:
參數模式:沿用
讓「參數」的值沿用上一個「參數」步驟的值,不但可以跨步驟,還能穿透異步子進程。
參數模式:反饋
這是一個特別的模式,步驟只會在「反饋迴路」中運行,否則會穿透上一個步驟。詳情請參閱「列表生成」章節。
範例
那麼再次拿我的 blog 來開刀,這次繼「 網址生成 」的範列,讓抓取的部分能通過用戶輸入。
- 編輯網址生成:選取「傳入的參數」
- 於網址生成前面,新增「參數」
字串模板: https://blog.astropenguin.net/article/{0}/latest
模式:
標題:
{0}: |
完成!
附上完成版腳本:
斟酌 鵬兄
Tue Sep 20 2016 16:25:59 GMT+0000 (Coordinated Universal Time)
Last modified: Sun Apr 10 2022 10:03:05 GMT+0000 (Coordinated Universal Time)