Image may be NSFW.
Clik here to view.
之前經歷「Blogger 網誌被刪除」事件,為了救回被刪除的一列相關網站,開發了網站救援工具,可以從網路現存的備份頁面,爬取文章相關內容。
由於處理了相當多網站,此工具已可作為一項服務,有需要網站救援的話請用文末聯絡表單與本站聯繫。
(圖片出處: unsplash.com)
site:網址 :
然後試著從搜尋結果,看看有沒有提供快取頁面了。
Clik here to view.
爬完的資料會儲存在 Google 試算表,上圖為文章相關資料。
Image may be NSFW.
Clik here to view.
上圖為爬取留言的紀錄
2. RSS 閱讀器及瀏覽器如果能在 RSS 閱讀器找到訂閱備份的話,本站也有工具可以爬取所有文章內容。
不過 RSS 閱讀器的缺點為,無法紀錄標籤及留言,所以經由此管道的話,只能備份文章內容。
3. 瀏覽器快取如果要從瀏覽器快取取的文章備份,缺點是必須每個頁面逐一手動複製內容,這件事沒辦法程式化。
如果能在瀏覽器快取找到備份頁面,本站可提供工具,簡化手動複製的時間,快速一鍵取得相關內容。
4. 製作部落格匯入檔在 Google 試算表儲存的所有備份資料,可以依照不同平台的需求,來製作匯入檔,例如:
Clik here to view.

一、救援管道
網站救援跟硬碟救援的概念有點像又不太一樣,硬碟資料不見了,必須用工具從硬碟磁區想辦法將檔案碎片拼湊回來。而網站若是被刪除,想要救回所有文章的話,得想辦法從整個浩瀚的網路上,看看是否有哪些地方曾經備份過你的文章資料。 如果網站很冷門,沒有任何其他網站想要收集,那麼在沒有任何網路備份的情況下,將沒有任何救援的機會。這也就是說,除非網路上能找到曾蒐集你文章的蛛絲馬跡,才能把各處的文章碎片收集起來,盡可能恢復原本的網站內容。 過去我們痛恨某些抄襲網站直接複製貼上我們的文章內容,但此時反而要感謝他們幫我們進行異地備份。以下列舉一些能找回文章碎片的管道:- Wayback Machine:最主要的網路備份服務
- RSS 閱讀器:有人曾訂閱網站的話就能找到備份
- 瀏覽器快取:從瀏覽器快取有機會找到近期的快取頁面內容
- 瀏覽器搜尋:搜尋自己的文章標題或內容,或許能從抄襲網站找到內容
二、Wayback Machine
「Wayback Machine」( 網站時光機)這個網路服務備份了世界上多數網站的內容,也是主要的救援管道。如果你的網站越熱門,這個服務備份的內容也會越頻繁、越多,可以說是目前最強的網頁救援武器。 但他並非營利網站,所以伺服器的運作會有優先工作排程,不可能即時備份所有網站的文章,這也就是說可能會有時間差,例如以目前 2024 這個時間點,他最多只能備份到 3 個月前的文章。將來網站更多、伺服器更累的情況,能備份到什麼程度誰也說不准。 總之這是個佛心也是最強的網站備份服務,然而終究無法備份所有的內容。但我多次需要靠此服務救援客戶文章,所以已經 donate 多次,未來如果有需要本站協助救援的話,費用的一部分也會包含對此網站的捐獻。三、RSS 閱讀器及瀏覽器
1. RSS 閱讀器如果網站夠熱門的話,在許多 RSS 閱讀器可能會有讀者訂閱,那麼就能找到完整的文章備份,例如「Feedly RSS 閱讀器」。 那麼跟「Wayback Machine」相比,「RSS 閱讀器」可能是唯一能夠找回所有文章的管道。但若是沒有任何讀者訂閱的話,RSS 閱讀器也將找不到半篇文章的蹤跡。 2. 瀏覽器快取由於 Google 已經宣佈「不再提供"網頁庫存"服務」,那麼只能從其他瀏覽器的快取試著尋找蛛絲馬跡了,例如在這些瀏覽器輸入四、救援工具說明
1. Wayback Machine本站救援工具主要會爬 Wayback Machine 的資料,並儲存以下內容:- 文章 HTML 內容
- 標籤
- 留言
Clik here to view.

Clik here to view.

- Blogger
- WordPress
五、聯絡表單
如您需要網站救援的話,請填寫下面的表單與我聯繫:更多「資訊安全」相關文章: