追跡のいくつかの形式は明らかです。たとえば、Webサイトは、ログインしている場合にあなたが誰であるかを認識します。しかし、追跡ネットワークは、時間の経過とともに複数のWebサイトにわたるブラウジングアクティビティのプロファイルをどのように構築しますか?
トラッキングは通常、広告ネットワークでピンポイントの広告ターゲティング用の詳細なプロファイルを作成するために使用されます。ビジネスのウェブサイトにアクセスし、後で他のウェブサイトでそのビジネスの広告を見たことがあれば、それが実際に動作しているのを見たことがあるでしょう。
IPアドレス
あなたを識別する最も基本的な方法はあなたのIPアドレスによるものです。あなたのIPアドレスはインターネット上であなたを識別します。最近では、コンピュータが家やオフィスにある他のネットワークデバイスとIPアドレスを共有している可能性があります。 Webサイトは、IPアドレスから、大まかな地理的位置を特定できます。通りのレベルまでではなく、一般的には都市や地域です。あなたの場所を言及することによって合法的に見せようとするスパム広告を見たことがあれば、これが広告のやり方です。
IPアドレスは変更される可能性があり、複数のユーザーによって使用されることが多いため、1人のユーザーを長期にわたって追跡するのに適した方法ではありません。それでも、IPアドレスを他の手法と組み合わせて、地理的な場所を追跡することができます。
HTTPリファラー
リンクをクリックすると、ブラウザはクリックしたWebページをロードし、Webサイトにアクセス元を通知します。たとえば、How-To Geekで外部のWebサイトへのリンクをクリックすると、外部のWebサイトにあなたがアクセスしたHow-ToGeekの記事のアドレスが表示されます。この情報は、HTTPリファラーヘッダーに含まれています。
HTTPリファラーは、Webページにコンテンツをロードするときにも送信されます。たとえば、ウェブページに広告またはトラッキングスクリプトが含まれている場合、ブラウザは広告主またはトラッキングネットワークに表示しているページを通知します。
小さな1ピクセルずつ見えない画像である「Webバグ」は、HTTPリファラーを利用して、Webページに表示されることなくユーザーを追跡します。また、メールクライアントが画像を読み込んでいると仮定して、開いたメールを追跡するためにも使用されます。
クッキーと追跡スクリプト
クッキーは、ウェブサイトがブラウザに保存できる小さな情報です。それらには多くの正当な用途があります。たとえば、オンラインバンキングのWebサイトにサインインすると、Cookieがログイン情報を記憶します。 Webサイトの設定を変更すると、Cookieはその設定を保存するため、ページの読み込みやセッションの間も保持できます。
Cookieは、ユーザーを識別し、Webサイト全体のブラウジングアクティビティを追跡することもできます。これは必ずしも大きな問題ではありません。ウェブサイトは、ユーザーエクスペリエンスを微調整できるように、ユーザーがアクセスするページを知りたい場合があります。本当に有害なのはサードパーティのCookieです。
サードパーティのCookieにも正当な用途がありますが、複数のWebサイトでユーザーを追跡するために広告ネットワークでよく使用されます。多くのWebサイト(ほとんどのWebサイトではないにしても)には、サードパーティの広告または追跡スクリプトが含まれています。 2つの異なるWebサイトが同じ広告または追跡ネットワークを使用している場合、両方のサイトの閲覧履歴が追跡およびリンクされる可能性があります。
ソーシャルネットワークのスクリプトは、追跡スクリプトとしても機能します。たとえば、Facebookにサインインしていて、Facebookの「いいね」ボタンを含むWebサイトにアクセスした場合、FacebookはそのWebサイトにアクセスしたことを認識します。 Facebookはログイン状態を保存するためにCookieを保存するため、「いいね」ボタン(実際にはスクリプトの一部)はあなたが誰であるかを認識します。
スーパークッキー
ブラウザのCookieをクリアすることができます—実際、私たちは ブラウザのCookieをクリアするためのガイド 。ただし、Cookieをクリアすることが必ずしも解決策であるとは限りません。「スーパーCookie」がますます一般的になっています。そのようなスーパークッキーの1つは evercookie 。 evercookieのようなスーパーCookieソリューションは、Cookieデータを複数の場所に保存します。たとえば、Flash Cookie、Silverlightストレージ、閲覧履歴、HTML5ローカルストレージなどです。特に巧妙な追跡方法の1つは、新しいユーザーがWebサイトにアクセスするたびに、数ピクセルに一意の色の値を割り当てることです。さまざまな色が各ユーザーのブラウザキャッシュに保存され、ロードして戻すことができます。ピクセルの色の値は、ユーザーを識別する一意の識別子です。
スーパーCookieの一部を削除したことにウェブサイトが気付くと、その情報は他の場所から再入力されます。たとえば、Flash CookieではなくブラウザのCookieをクリアすると、WebサイトはFlashCookieの値をブラウザのCookieにコピーします。スーパークッキーは非常に弾力性があります。
ユーザーエージェント
また、ブラウザは、Webサイトに接続するたびにユーザーエージェントを送信します。これにより、ブラウザとオペレーティングシステムがウェブサイトに通知され、保存して広告のターゲティングに使用できる別のデータが提供されます。ユーザーエージェントの詳細については、の説明をご覧ください。 ブラウザユーザーエージェントとは 。
ブラウザのフィンガープリント
ブラウザは実際にはかなりユニークです。 Webサイトでは、オペレーティングシステム、ブラウザのバージョン、インストールされているプラグインとそのバージョン、オペレーティングシステムの画面解像度、インストールされているフォント、タイムゾーン、およびその他の情報を確認できます。 Cookieを完全に無効にした場合、それはブラウザを一意にするもう1つのデータです。
電子フロンティア財団の Panopticlick Webサイトは、この情報の使用方法の例です。 110万人に1人だけが私と同じブラウザ構成を持っています。
ウェブサイトがあなたを追跡できる他の方法は確かにあります。そこには多額のお金があり、人々は毎日追跡する新しい方法をブレインストーミングしています。その証拠については、上記のevercookieをご覧ください。
できるだけ匿名でサーフィンするには、 Torブラウザバンドルを使用する 。
ブラウザのプライバシー設定を微調整し、各設定が正確に何を行うかを判断する方法については、最適化のガイドをご覧ください。 グーグルクローム 、 Mozilla Firefox 、 インターネットエクスプローラ 、 サファリ 、または オペラ 最大限のプライバシーのために。
画像クレジット: FlickrのAndyRoberts