過去サイトを収集したWayback Machineの使い方徹底解説!保存や削除方法

Wayback Machine

過去のWEBサイトはもう見ることはできない?

「うちが10年前に作ったWEBサイトってどんなのだっけ?」
「あの情報が載ってるサイトってもう消えちゃったよね……。」

何年も前に消えてしまった過去のサイトやWEBページは、さすがにもう見ることはできない……というわけではありません。

確実ではありませんが、見ることができないと諦める前にWEBアーカイブサービスを使ってみましょう。

WEBアーカイブサービスとは、過去のWEBサイト(WEBページ)情報を収集して、アーカイブとして残しているサービスのことです。これらのアーカイブは、そのサービスが終了しない限り半永久的になくなることはありません(と言われています)。

今回は、そんな過去サイトの情報を収集するWEBアーカイブサービスの使い方についてお話したいと思います。

WEBアーカイブサービスの種類

WEBアーカイブサービスは世界中にいくつもありますが、わたしたちが普段利用して意味があるのは「Wayback Machine」と「WARP」くらいでしょう。

Wayback Machine(ウェイバックマシーン)

Internet Archive: Wayback Machine

WEBアーカイブサービスと言えば、Wayback Machineがもっとも有名です。Wayback Machineは、20年で3600億ページ以上のWEBアーカイブを続けています。

また、アーカイブはWEBページ(HTML、CSS、Javascript)だけでなく、PDFや音楽、動画、ソフトウェアなども含まれます。

WARP(ワープ)

国立国会図書館インターネット資料収集保存事業

WARPは、日本の国立国会図書館が行っているWEBアーカイブサービスです。

アーカイブ対象は日本国内のWEBサイトのみで、国の機関、都道府県、政令指定都市、市町村、市町村合併の法定合併協議会、独立行政法人や特殊法人等の法人・機構、大学、イベントなどの資料を保存しています。

その他のWEBアーカイブサービス

他にも、日本語のアーカイブは少ないものの、アメリカ議会図書館が提供している「Library of Congress」、スタンフォード大学が提供している「Stanford Web Archive Portal」、英国議会が提供しているUK Parliament Web ArchiveなどWEBアーカイブサービスはいくつもあります。

では、Wayback Machineによる過去のWEBページの閲覧方法やアーカイブの保存方法などをご紹介します(他のWEBアーカイブサービスは使わないと思います)。

Wayback Machineで過去ページを閲覧する方法

見たい過去ページを検索する

閲覧したいWEBページ、またはWEBサイトのURLを画面上部の検索ボックスに入力して、「エンター」を押します。

Wayback Machineで過去ページ閲覧方法01

いつのページを見たいか選択する

画面上部に年表、画面下部にがカレンダーが表示されます。年表を見ると、Wayback Machineでアーカイブしたもっとも古い情報がいつなのかがわかります。

Wayback Machineで過去ページ閲覧方法02

カレンダーに移動すると、青丸がいくつもあります。この青丸はWayback Machineがアーカイブを取得した日です。2014年7月31日に取得されたアーカイブを閲覧します。日付をクリックしてください。

Wayback Machineで過去ページ閲覧方法03

過去ページが表示される

無事に過去のWEBページを閲覧することができました。もう5年も前の記事なので、なかなか懐かしく感じます。

404が出ているのは、FacebookのPage Pluginですね。静止画でアーカイブするのではなく、HTML(css、Javascript)で保存するため、データベースから取得するものは表示されません。もちろん、リンクをクリックすることもできます。

Wayback Machineで過去ページ閲覧方法04

当時のURLを知っていれば、WEBサーバーに残っていないページも閲覧できます。以下は、2013年7月26日に取得されたアーカイブです。この記事は削除済みですが、Wayback Machineがアーカイブしていたため、全文を閲覧できました。

Wayback Machineで過去ページ閲覧方法05

Wayback Machineで現在のページをアーカイブする方法

Wayback Machineは、自動でボットが回ってきてWEBページをアーカイブするのですが、保存したいWEBページを指定することもできます。もちろん、自分が管理するWEBサイト以外も可能です。

まず、トップページ下部にある「Save Page Now」にURLを入力して、「SAVE PAGE」をクリックします。

Wayback Machineで現在ページ保存方法01

先程閲覧したWEBページの現在のバージョンが、今日の日付でアーカイブされました。

Wayback Machineで現在ページ保存方法02

Wayback Machineで過去ページを保存する方法

Wayback Machineでは、アカウントを作成するとアーカイブされている過去データを保存(ブックマーク)することができます。

アカウントを作成する

まず、アカウントを作成しましょう。アカウント作成は通常のWEBサービスと同じで、メールアドレス、ユーザーネーム、パスワードを入力して作成してください。アカウントを作成したら、ログインして、アーカイブを検索してください。

Wayback Machineのアカウント作成

過去ページの右上のアイコンをクリックする

保存(ブックマーク)したい過去ページがあったら、画面右上のウィンドウアイコンをクリックしてください。

Wayback Machineで過去ページを保存する方法01

すると、小さく「success」と表示されます。これで保存完了です。

Wayback Machineで過去ページを保存する方法02

保存内容を確認する

Wayback Machineのトップページに戻り、ベージ上部のマイページ(ユーザーネームが表示されている)をクリックします。

Wayback Machineで過去ページを保存する方法03

マイページの「WEB ARCHIVES」をクリックすると、保存(ブックマーク)したWEBページが表示されます。リンクをクリックすると、保存したWEBページが表示されます。

Wayback-Machineで過去ページを保存する方法04

過去WEBページの削除方法

Wayback Machineに保存されている過去ページのアーカイブを削除したい場合は、「wayback@archive.org」宛に英語で削除依頼のメールを送るしかありません。

削除依頼を送る際は、削除したいドメインのメールアドレスを使って送ることで、所有者証明になります。その際、ログインに使っているメールアドレスも書いておくとわかりやすいでしょう。

Wayback Machineから、私のWEBサイト”https:wakarukoto.com”を削除して下さい。
わたしのメールアドレスはxxxxxxx@xxxです。よろしくお願い致します。

Please remove the my website “https:wakarukoto.com” from Wayback Machine.
My email address is xxxxxxx @ xxx. Thank you.

WEBアーカイブサービスを使いこなそう

Wayback Machineは、1年に数回使う程度ですが、過去のWEBサイトを閲覧できるのは非常に便利です。

しかも、意外とアカウントのことを知らない人が多く、作っておくだけで過去のWEBサイトをブックマークしておけるので、より使い勝手が良くなります。

ただ、自分が過去に管理していたWEBサイトや個人のWEBサイト、そこには後から読み返すと恥ずかしい文章がびっしりと書いてある……など、場合によっては黒歴史を発見してしまうこともあります。

まぁ、さすがに過去の個人的なWEBサイトに誰かがアクセスすることはないと思いますが、気が向いたら削除しておくと、気持ちがスッキリします。

今は、自分でもWEBサイトの必要な情報を取得して残しておくことができるサービスも増えました。

もっとも有名なサービスは「Evernote(エバーノート)」ですね。デスクトップなどのローカル環境と同期しておけば、あなたの手元に取得したWEBサイトの情報はずっと残り続けます。

WEB上には多くの資産がありますが、それらは気付いたらどんどん消えていきます。WEBアーカイブサービスを利用して、たまには思い出してあげてください。