在线用户数据是企业了解目标受众并改善与潜在客户和现有客户的互动的重要来源。浏览器指纹识别是网站用于各种目的的用户识别方法之一,例如网页个性化、欺诈检测、定向广告等。然而,在利用该技术之前,我们建议深入了解它,因为它对用户隐私有影响。
为此,我们精心编写了这篇文章,解释浏览器指纹识别的概念、工作原理以及如何对抗浏览器指纹识别
浏览器指纹识别,也称为在线指纹识别,是网站发起的一种跟踪技术,用于从访问者的 IP 地址收集无害数据。
当您访问网站时,您的设备会向目标网站发送连接请求以显示网站内容。目标网站可以访问和收集您的浏览器发送的有关您设备的信息。网站可以使用浏览器指纹识别技术收集有关用户设备的大量信息,以便为访问者提供个性化推荐。例如,根据您的浏览器类型,网站可能会在未经您同意的情况下收集有关您的以下信息:
网络浏览器(Chrome、Mozilla、Firefox 等)
HTTP 标头(有关您的浏览器和操作系统的信息)
首选语言
时区
屏幕分辨率
插件和扩展
如果您访问的网站使用指纹识别技术,它将能够检测和跟踪您的浏览器。当您返回同一个网站时,它可能会记住您的数字指纹并将您识别为回访者。您可以通过访问amiunique.org来了解浏览器指纹中的内容以及您的浏览
通过向下滚动 amiunique.org,您可以看到您的浏览器在未经您同意的情况下共享了多少有关您的数据(例如您的操作系统、浏览器版本等)。
每次向网站发出连接请求时,您都会向目标网站提供您的设备信息。假设您使用手机访问电子商务网站。当您点击链接访问电子商务网站时,您的浏览器会向目标 Web 服务器发送连接请求。然后,Web 服务器将访问您设备上的一小部分数据,例如 IP 地址、浏览器类型、用户代理等等。在这种情况下,您的用户代理将通知 Web 服务器您正在使用 Safari 从手机发出连接请求。网站将根据提供的用户代理信息显示其内容。
该网站会在您浏览网站页面时跟踪您的行为和活动,以分析您对网站的使用情况。每次您访问电子商务网站时,该网站都会根据您的浏览器指纹识别您的设备。
Canvas 指纹识别是一种用于跟踪在线用户的浏览器指纹识别方法。Canvas 指纹识别强制用户的设备在用户不知情的情况下绘制隐藏图像以提取数字指纹(见图 2)。这种指纹识别方法主要使用 HTML5 Canvas 元素来显示有关用户机器的信息,例如操作系统、浏览器类型等。当用户访问网页时,浏览器会在页面上呈现图像/文本内容以自动显示内容。
图 2:演示画布指纹识别的过程
例如,如果您访问的网站使用画布指纹识别技术,该网站将指示您的浏览器绘制不可见的图像或文本。在此过程中,HTML5 画布元素将显示有关您的机器的信息,例如背景颜色设置、字体大小/样式、显卡和其他独特功能(见图 3)。由于不同的设备渲染图像的方式不同,画布指纹识别将分析设备如何渲染图像/文本,从而为每个用户的设备分配一个唯一的 ID。
图 3:画布字体指纹脚本示例
WebGL 指纹识别技术与画布指纹识别技术类似,通过强制浏览器渲染图像或文本来公开有关设备图形驱动程序和屏幕分辨率的信息。该技术根据用户的图形驱动程序和屏幕分辨率来区分用户,并创建唯一的指纹识别。
音频指纹识别测试您的设备如何播放声音(见图 4)。音频指纹识别的工作原理与画布和 WebGL 指纹识别类似。由于每台设备都会产生一组独特的声波,因此音频指纹识别可以根据设备(例如声音硬件和软件)产生的音频信号来识别用户。
图 4:浏览器指纹识别的工作流程
网站可以使用浏览器指纹识别技术检测欺诈性用户行为。当网站检测到欺诈性用户活动时,它会在登录过程中添加额外的身份验证步骤,以防止未经授权的访问和合法用户帐户的盗窃。
真实世界的浏览器打印示例:
例如,浏览器指纹识别可用于在用户登录在线银行系统时对其进行身份验证。金融服务公司Wachovia为其客户的设备创建了独特的指纹识别,以便通过唯一标识符验证其身份并阻止恶意用户。
您可以在 Web 浏览器上删除并阻止 Cookie 历史记录。Google、Firefox、Safari 和 Microsoft Edge 等 Web 浏览器允许用户在其 Web 浏览器中禁用 Cookie。与Cookie不同,浏览器指纹很难阻止。这就是为什么浏览器指纹识别是一种更有效的广告技术,可以跟踪用户在网络上的行为和活动。
网站使用指纹识别来跟踪和分析访客的活动和行为,以根据访客的行为和活动创建个性化的体验。例如,当您请求网站显示其内容时,该网站可以通过跟踪您的 IP 指纹来显示您的地理位置。这使电子商务网站能够向其在线访客推荐本地相关内容和附近的商店。网站可以使用浏览器指纹技术访问有关其访客的以下信息:
用户的当前位置。
用户使用的设备类型,例如台式机、平板电脑或手机。
流量来源,流量来源,用户可以通过不同的方式访问您的网站,例如直接、社交媒体、推荐和付费流量。
真实世界的浏览器指纹示例:
10% 的人使用画布指纹识别技术1 Alexa 排名前 100K 的网站,用于反广告欺诈和潜在的跨站跟踪。研究团队使用 FP-INSPECTOR 检测排名前 100K 的 Alexa 网站上的浏览器指纹行为。
图 5:使用浏览器指纹识别技术的 Alexa 排名前 100K 的网站分布
来源:指纹识别:学习检测浏览器指纹识别行为
网站使用浏览器指纹识别来保护自己免受恶意机器人的攻击。浏览器指纹识别会检查浏览器发送的 HTTP 标头,以区分网络机器人流量和常规浏览器流量。
浏览器指纹技术通过分析客户端信号来识别网络爬虫,这些信号基于机器人检测属性,例如请求数量、请求频率、异常高的页面浏览量、长会话持续时间等。它收集可疑浏览器的指纹并将其与常规浏览器进行比较,以根据指纹比较来检测网络机器人。
赞助
Bright Data 的 Web Unlocker可帮助个人和企业通过屏蔽客户的原始设备指纹和 IP 地址来克服浏览器指纹识别的挑战。它可防止抓取工具被检测到,从而 帮助企业进行数据收集。
轮换代理服务器还可以帮助用户更改网络请求的感知来源。查看顶级代理服务器提供商的简要概述。
GDPR 和 CCPA 等隐私法规并未明确解决在线指纹识别问题。但是,有法规可以跟踪互联网用户的活动。与可识别个人相关的任何信息均受 GDPR 约束。欧盟的《通用数据保护条例》(GDPR)要求公司在跟踪用户的在线活动之前征得用户的同意。只要您不在未经用户同意的情况下收集和处理个人身份信息,跟踪和收集在线用户的活动就是无害且合法的。
然而,
不受 CCPA 或 GDPR 约束的网站可能会在未经用户同意的情况下收集这些数据
受 GDPR 约束的网站可以根据“合法利益”条款收集部分此类数据,前提是它们认为需要这些数据来运营网站。此类行动的合法性取决于这些数据对企业运营的重要性。
浏览器唯一性越高,被网站识别和追踪的可能性就越大。很难避免浏览器指纹识别。不过,你可以降低浏览器的唯一性。
例如,当您连接到某个网站时,您的计算机会向 Web 服务器发送 HTTP 标头编码的连接请求以禁用内容。这些标头包含特定于计算机的信息,例如您的用户代理(浏览器名称、版本等)、位置、语言、时区、浏览器插件和其他浏览器属性。我们建议您匿名化或降低浏览器的唯一性,以避免被网站轻易识别。
您可以使用代理服务器或无头浏览器在浏览时保持匿名。例如,共享代理是一种高度匿名的选项,可用于对抗浏览器指纹识别技术。由于多个用户同时与您共享同一个 IP 地址,因此很难被网站服务器检测到。它会将您的机器与许多其他用户的机器混合在一起(见图 5)。由于您使用的配置不太独特,网站将很难定位您的机器。