Wayback Machine(ウェイバックマシン)とは?使い方から基本知識までを解説
過去に公開されていたあのサイトが見たい!間違って削除してしまったブログの記事を復活させたい!と考えた経験のあるかたも多いと思います。
この記事では、そうした希望に役に立つWayback Machine(ウェイバックマシン)というツールサービスを紹介します。
基本的な使い方から応用的な使い方、競合サイトの調査といった活用方法まで詳しく解説していますので是非参考にしてみてください!
まずは、Wayback Machineがなんなのか?といった所から解説を始めていきます。
無料で簡単インストール。
オープンソースのメールフォームCMS
「EasyMail(イージーメール)」を使ってみませんか?
改変でも、再配布でも、商用利用でも、有料販売でも、
自由に無料でつかうことができるメールフォーム!
目次
Wayback Machine(ウェイバックマシン)とは?
Wayback Machineはシンプルに説明すると、“過去ページを閲覧&保存できる無料ツールサービス”です。
なぜそんな便利なサービスが無料で使えるのかと言うと、Wayback Machineの運営資金は寄付でまかなわれているため、ユーザーは無料で使用することができるのです。運営元のInternet Archiveは、アメリカのサンフランシスコで1996年に発足した非営利団体で、WEBサイトのトラフィック情報を独自に収集するAlexa Internetの協力を得ながら、インターネット上にある莫大なデータをクローリングしてデータベースに保存しています。
保存しているデータは約6,400億ページ以上あり、WEBサイトだけでなく、Twitterや書籍、音楽、映画などといったデータも保存されています。
Wayback Machineには以下のURLからアクセスすることができます。
Wayback Machineのデータ保存数の確認方法
Wayback Machineに対象のURLやキーワードに対して、どれくらいのデータが保存されているのかを確認する方法を解説します。
結果が表示されると、画面内に「Saved 〇〇times between 〇〇 and 〇〇」と表示があるので、この部分がデータの保存数になり、以下の画像を参考にすると
「Saved 235,576 times between November 20, 1996 and December 29, 2021.」と書かれており、1996年11月20日から2021年12月29日の間に 235,576のアーカイブデータを保存しているという意味になります。
こちらはYahoo!のサイトを調べたのですが、こうした大規模なWEBサイトの場合であっても、Wayback Machineは膨大なアーカイブデータを保存し、無料で簡単に閲覧することができます。
Wayback Machine(ウェイバックマシン)の使い方(基本編)
それでは実際にWayback Machineの使い方について解説していきます。使い方は非常に簡単ではあるのですが、色々な使い方のパターンがあるので、ここでは主に2つの方法で検索するパターンと検索結果から過去のWEBサイトを閲覧する方法について図を使って説明していきます。
URLから検索する
Wayback Machineのサイトにアクセスして検索窓に調べたいURLを入れます。この入力するURLはサイトのTOPページのURLだけでなく、記事単位でのURLでも問題ありません。
調べたいページが特定されている場合はページを指定してURLを入れてあげるとよいでしょう。大規模サイトになると、TOPページのURLだと結果が表示されるまでに時間がかかる場合があります。
キーワードから検索する
Wayback Machineのサイトにアクセスして検索窓に調べたいキーワードを入れます。すると、キーワードに関連するサイトの一覧が表示されるので、一覧に表示されたサイトのURLかサイトのサムネイルをクリックすると選択したサイトの情報を見ることができます。
検索窓に入力するキーワードは「野球」のような単ワードだけでなく「野球 試合結果」のように掛け合わたキーワードでも検索することが可能です。
過去のWEBサイトを見る
結果が表示された後に過去のWEBサイトを閲覧する方法について解説します。今回は使用する機会が多いと思われる、URLから検索したあとの流れについて解説します。
まず、上記で説明したように検索窓に調べたいサイトのURLを入力します。すると以下画像のような年度毎の棒グラフが表示されるので、調べたい年を選択しましょう。
次に、調べたい年を選択すると、その年のカレンダーが表示されます。色付きの丸い円がある日付がアーカイブデータがある日付なので、調べたい日付を選択します。
日付によって丸い円の色が違いますが、円の色によって意味に違いがあり、以下4パターンの色があります。それぞれの色については、アーカイブした際のWEBサーバーのリクエスト結果によって異なります。
- 青色:200番台・・・リクエストに成功すると青色になります。基本的には青色が理想です。
- 緑色:300番台・・・リクエストがリダイレクトされると緑色になります。
- オレンジ色:400番台・・・クライアントエラーの場合はオレンジ色になります。
- 赤色:500番台・・・サーバーエラーの場合は赤色になります。
基本的には青色の日付を閲覧するのがベストですが、まれに赤色の日付でもアーカイブ情報を閲覧できる場合があるので、色に関わらずアーカイブされた日が複数ある場合はいくつかアーカイブ情報を確認してみるとよいでしょう。
その上で、調べたい日付を選択すると、ポップアップ表示でアーカイブ時刻の一覧が表示されるので、その中から希望のアーカイブ時刻を選択しましょう。
すると、指定した時期にアーカイブされたサイトの情報が表示されます。
Wayback Machine(ウェイバックマシン)の使い方(応用編)
基本的な使い方に関して説明しましたが、この項目ではWayback Machineの応用した使い方について解説します。
WEBサイトページをアーカイブさせる方法
Wayback Machineでアーカイブをさせる方法については、2つの方法があります。自身のサイトや競合サイトをアーカイブしておけば、後から振り返ってサイトを確認する時にも役立ちますので参考にしてみてください。
自動保存する
Wayback Machineは基本的に自動でアーカイブをしてくれますが、必ず自身のサイトをアーカイブしてくれるかや、アーカイブしてくれる日時を指定するといったことができません。
そのため、運営するサイトのアーカイブ結果を調べてみて、過去のアーカイブ状況が1ヶ月に1回程アーカイブされているということであれば、今後も同じくらいのペースでアーカイブされる可能性があります。(ただし、絶対ではありません)
そこで、確実にアーカイブをしておきたいという場合は次の手動保存する方法を試してみてください。
手動保存する
Wayback MachineのTOPページに以下画像のSave Page Nowという項目があるので、その検索窓に手動保存したいURLを入力してアーカイブ保存された最新ページに移動したら対応完了です。
非常に簡単な方法なので、自動保存の頻度が少ない場合は定期的に手動保存をしておきアーカイブした情報を残しておくのもよいでしょう。
アーカイブされたWEBサイトページの削除方法
Wayback Machineにアーカイブされた過去の情報を削除したいという場合は、Wayback Machineの運営元であるInternet Archiveにアーカイブ削除依頼のメールを送る必要があります。
宛先のメールアドレスは「info@archive.org」で、メール本文には削除したいURLとサイト運営者であることが証明できる内容を記載してメールを送信します。
ただし、運営元のInternet Archiveはアメリカに拠点がある団体ですので、メールのやり取りは全て英文でおこなうため、注意が必要です。
アクセスを制限する方法
削除まではしなくても、今後はWayback Machineにアーカイブされたくないといった場合は、クローラーのアクセスを制限してアーカイブさせないようにすることが可能です。
どういうことかと言うと、Wayback Machineはクローラーと呼ばれるロボットプログラムが24時間365日インターネット上を巡回し、WEBサイトのページデータをアーカイブ保存することで、過去のページを閲覧することができるようになります。
つまりWayback Machineのクローラーをサイトにアクセスさせないようにすれば、物理的にアーカイブができなくなります。
「robots.txt」と言われるクローラーのアクセス管理をするための命令文が記述されたファイルを使用するのですが、いくつかやり方があるので、それぞれのやり方については以下で解説します。
作業に慣れていない方は、必ず作業前にバックアップデータを保存しておくようにしましょう。
ドメインでアクセス制限
「robots.txt」に以下の命令文を記載してテキストファイルを保存し、サイトデータを保存しているデータサーバー内の一番上の階層であるディレクトリ(ルートディレクトリ)の中にアップロードして保存します。
1 2 |
User-agent: ia_archiver Disallow: / |
この対応で、ドメイン単位でWayback Machineのクローラーアクセスを制限することができます。
ディレクトリでアクセス制限
先ほどは、ドメイン単位でしたが、次はディレクトリ単位でアクセスを制限したい場合は「Disallow: /」以下にディレクトリ名を記載してルートディレクトリの中に「robots.txt」ファイルを保存します。
命令文は以下になります。
1 2 |
User-agent: ia_archiver Disallow: /ディレクトリ名/ |
制限したいディレクトリが複数ある場合は、以下のように制限したいディレクトリを追加していくイメージになります。
1 2 3 4 |
User-agent: ia_archiver Disallow: /ディレクトリ名A/ Disallow: /ディレクトリ名B/ Disallow: /ディレクトリ名C/ |
指定ページでアクセス制限
最後に指定したページでアクセス制限したい場合は、以下の命令文を「robots.txt」ファイルに記載してルートディレクトリの中に保存をします。
1 2 |
User-agent: ia_archiver Disallow: /ディレクトリ名/ページファイル名 |
ディレクトリ名が「seo」でページファイル名が「waybackmachine.html」の場合は以下のようになります。
1 2 |
User-agent: ia_archiver Disallow: /seo/waybackmachine.html |
Wayback Machine(ウェイバックマシン)の活用方法
最後にWayback Machineを使った活用方法を紹介します。運営しているサイトの過去のアーカイブ情報を閲覧するだけでなく、その他の使い方もあるので是非参考にしてみてください。
拡張機能
Wayback MachineにはChromeやFirefoxで使用できる拡張機能が用意されています。
Chromeの拡張機能はこちら
https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak?hl=ja
毎回Wayback Machineのサイトにアクセスしなくても拡張機能のボタンをクリックするだけで済むので、頻繁にWayback Machineを使用する方にはおすすめです。
SEO対策
公開した記事の順位に応じてリライト(コンテンツ内容の追加や削除、書き換え等をすること)をする機会も多いと思います。
リライトによって順位が改善する場合もありますが、順位低下になってしまう場合もあります。Googleのアルゴリズムはその時のトレンドであったり、重視する評価ポイントも日々変化しています。
そのため、何が要因で順位が上位化したのかや、順位が低下したのかがわかりにくいという状況は日常茶飯事です。そうした状況下でも仮説検証を繰り返しSEO対策をしていく必要があります。
そうした際に、Wayback Machineを使い過去のコンテンツ内容と比較することで「上位化されていた時は○○の要素が含まれていたけれど、順位が低下した時は○○の要素が削除されてしまっていた」といったような分析をすることができます。
Googleの検索エンジンはユーザーの利便性が高いサイトを上位化するようなアルゴリズムになっているため、状況に合わせて文字を追加するだけのリライトではなく、画像や動画の追加といったテキスト以外のリライトもより重要な要素になっています。
競合サイト調査
上記のSEO対策と同様に、競合サイトの過去コンテンツと現コンテンツの比較をすることで、どんな対策をしたのかといったことを把握することができます。
SEOの視点だけに限らず、競合サイトのLP(ランディングページ:ユーザーが初めてアクセスするページ)を遡って確認していけば、どういった改善をおこなっているかといったマーケティング要素の視点からも競合サイトの調査をすることができます。
例えば、競合サイトでは購入ボタンのサイズやデザインがアーカイブデータ毎に変わっている場合はCVR(Conversion Rate:コンバージョン率)の改善をしている可能性があります。
あくまでも一例ではありますが、こういった使い方もWayback Machineでは可能になります。
Wayback Machineとは?まとめ
Wayback Machineは過去のアーカイブ保存されたサイト情報を遡って無料で閲覧することができます。
運営しているサイトだけでなく、競合サイトの情報を閲覧することもできるので、競合サイト調査にもおすすめのツールです。
使い方や活用方法も多岐にわたるので、自身の状況に合わせて最適な使い方を見つけてみるのもよいでしょう。