區域級蜘蛛

目錄


wenku10 現在的蜘蛛是針對抓文章而做的。在腳本做好了之後,這個腳本一般都會通用於整個網站。但通用歸通用,終究還是需要修改部分參數,這很麻煩。

我得先複製腳本,再進入編輯器裏面修改參數,説起來好像又不怎麼麻煩……可是有些人連參數是什麼都不知道,以我所知現時為止成功利用蜘蛛製作腳本的就只有一個人。其它的不是沒興趣就是沒時間 ( 覺得很麻煩 ) ……可是那個人的感想是「很有趣」,唔唔,也就是説如果肯嘗試的話就會發現其實並不怎麼難?

不過重點不在這裏,我常去網站閲覽小説時我都會從列表開始逛,也就是説我先得打開這該死又吃電的慢吞吞 Microsoft Edge 在網站查看,看中了之後再記下相對的參數修改,這個過程才是最討厭的,而且手機上很難使用編輯器,所以我得打開電腦用 PC 版製作,上載至平台再從手機下載回來。

分享平台雖然方便,但這需要用戶積極參與,製作、分享及討論,平台才會開花結果。可是這怎麼説也太難了,因為我討厭廣告,也不喜歡宣傳,這東西也許會沒人用,久而久之就沒落了吧。

關於用戶數量問題先放一邊,我獨自一個人玩 Minecraft 自 high 就好,悶了丟一邊,想起來又再 high,人生何等美妙。

區域級:列表蜘蛛 ( Zone Spider )


廢話説夠了,所以這是有關區域級蜘蛛的提案!其實早在剛開始製作蜘蛛的時候,這東西的目的就是根據安排好的指示挖取資源,也就是説只要指示正確,什麼東西都可以抓回來。

而列表也是一種資源。

定義步驟

列表需要兩個步驟,一個是處理用戶的輸入,另一個則是輸出文章列表。

步驟:參數
參數
0
1
2



參數的作用是提示用戶輸入所需資訊,然後輸出字串。這個步驟還可以整合網址列表。

請輸入搜尋條件

步驟:列表
列表
項目對應
▪■


這個步驟有點像「標籤」,作用是對應列表的項目。

運作流程

由於列表的載入用的是 Progressive loading ( Google Tranlate 説中文是遂行加載 ) ,所以腳本執行時得從上一次所得的頁面確認下一頁是否存在,整個腳本就是一個 Feedback loop ( 反饋迴路 ) ,下圖:



好,這個概念行得通。下一步就是想想要怎麼整合到 app 裏面。
Tag(s): spider wenku8
Profile picture
斟酌 鵬兄
Sat Sep 03 2016 13:57:10 GMT+0000 (Coordinated Universal Time)
Last modified: Sun Apr 10 2022 09:59:18 GMT+0000 (Coordinated Universal Time)
Comments
No comments here.
Do you even comment?
website: 
Not a valid website
Invalid email format
Please enter your email
*Name: 
Please enter a name
Submit
抱歉,Google Recaptcha 服務被牆掉了,所以不能回覆了