JavaScript和Cookie对GA的影响有多大?

20 二月 2010 28 Comments

【导言】我们都知道Google Analytics监测代码在客户端的正常运行依赖于两个技术设置,其一是客户端浏览器要允许JavaScript执行,其二是浏览器要能够允许创建cookie。不过,JavaScript和cookie在客户端被禁用的情况屡见不鲜,这种情况有多常见?对Google Analytics的监测影响有多大?本文讨论这个问题。本文的英文版请见:How much influence of JavaScript and Cookie disabled to Web Analytics?

【正文】

  Sidney给大家拜年了!祝大家虎年事业虎虎生风!家庭虎虎生气!身体虎虎生威!

  过年前后有不少收获,先是Karen邀请看了赖声川的《宝岛一村》,笑中带泪,很娱乐,也很让人感动唏嘘,谢谢Karen!然后弄了一台投影仪在家里放起了电影,效果相当惊人。再然后是跟自己的外公外婆用Skype视频聊天庆祝新年,虽隔千里之外却如咫尺之间,不得不感慨互联网对生活带来的无比益处。最后是无意间发现了一个很不错的国内的网站监测工具,就是我们这个文章要提到的。对了,还看了一个电影,乔治·克鲁尼的《在云端》,很喜欢。

  另外,和朋友合作的另一个博客:www.soloists.org也搭建好了,只等内容。这是个开放的博客,给文艺青年的,以后我会做专门的介绍,欢迎任何感兴趣的朋友加入我们。

  好了,跟大家分享了过年的乐趣,言归正题,你们有被问过JavaScript和Cookie对网站分析监测的影响吗?这是一个容易被忽略的问题,但有时候也容易被放大,被误认为是网站分析的“软肋”,或是认为它们会影响Google Analytics数据的准确性(关于网站分析数据的准确性的讨论,请看我的这篇文章:网站分析——我们的数据准确吗?)。现在我们看看它们到底如何影响网站分析的数据,影响程度又如何。

[版权归Sidney Song(宋星)所有,欢迎转载,但请事先告知作者并注明出处]

  • 禁用JavaScript的影响

  在页面中加入JavaScript代码是利用页面标记法做网站分析的最主流方法。监测代码如同图中红色的一小块,实际上是一段可以被浏览器执行的JavaScript程序语句,放在页面的HTML源文件中。这样,当页面被下载到客户端的浏览器的时候,这段页面标记JavaScript程序就会被执行,如同星际争霸中的寄生虫上身,或是摄像头被打开,开始记录数据。

JavaScript-for-WA

图:JavaScript对于网站分析具有重要的作用

  页面标记的JavaScript代码被执行之后,就会如实的把访问者在页面上的互动访问行为不间断的发送给这个页面标记所对应的网站分析工具的服务器,这与摄像头把拍摄到的图像传送给图像存储服务器是完全一样的。网站分析工具服务器收到数据后,会进一步处理这些数据,并且把数据翻译成人们能够阅读和分析的图形、表格以及数据文件,然后呈现在一个漂亮的用户界面上。

  目前,中国大约有5%左右的客户端浏览器禁用JavaScript,这些浏览器访问页面的数据全部或者一部分不能被采用页面标记法的工具所获取。值得安慰的是,5%并不是一个很大的比例,而且浏览器禁用JavaScript的比例其实逐年在下降,这一方面是因为越来越多的客户端应用需要JavaScript的支持,另一方面是因为互联网从一个“学院派”的工具,越来越成为普罗大众的日常工具,而越是普通用户越不会去禁用JavaScript。

  下图显示了全球浏览器用户JavaScript禁用比例逐年下降的趋势。

image

图:w3schools的数据表明了JavaScript被禁用的情况逐年下降

[版权归Sidney Song(宋星)所有,欢迎转载,但请事先告知作者并注明出处]

image

图:Dennis R. Mortensen的数据也说明了类似的情况

  那么中国的情况怎么样呢?

image  我在互联网找了很久,但是没有发现非常权威的数据,仅有的数据有很大的差异,但是很幸运的是我找到了一个工具:JYC统计。这是一个很好的工具,有很多Google Analytics不具备的功能,提供免费的7天试用,大家可以试试。这里要用到的是他们提供的客户端参数分析报告,如左图。

  在这个分析报告中,JYC统计提供了JavaScript状态的统计,以及cookie状态统计,是研究我们这个课题会用到的。

  Google Analytics里面是不能对客户端的JavaScript状态进行统计的,不过这个工具做了很好的补充。

  我用我自己的博客http://www.chinawebanalytics.cn做实验,我相信这个博客的用户都具有相当不错互联网知识和浏览器使用技能。所以,假定关注我博客的读者的浏览器禁用JavaScript的比例要略大于全国网民的平均水平。7天的数据揭晓,不太令人吃惊。如下图:

image

图:3.58%的JavaScript禁用比例

  JavaScript被禁用的比例仅有3.58%,我以为会有5%。这个数据让我觉得愉悦,越低的JavaScript禁用,会有更准确的Google Analytics监测数据。不过,数据样本本身有点儿少,春节7天上网的朋友大大减少了,因此这个数据存在被继续修正的余地。但我相信,我们国家网友禁用JavaScript的比例应该不会超过5%。

[版权归Sidney Song(宋星)所有,欢迎转载,但请事先告知作者并注明出处]

  JavaScript被禁用统计的另一个作用在于,帮助网站设计者了解有多少用户无法使用使用页面上的JavaScript互动。所以这个统计功能实际上是很有意义的。

  • 禁用Cookie的影响

  大多数的网站分析工具需要通过cookie来辨识独立访问者,例如Google Analytics利用的是第一方cookie。

  尽管有些网站分析工具能够在cookie被禁用时利用访问者的IP地址来辨识访问者,但Google Analytics在cookie禁用的时候不工作,所以cookie对GA是必须的。

  网站分析工具使用的cookie一般分为两种:第一方cookie(1st party cookie)和第三方cookie(3rd party cookie),使用第一方cookie是目前常用的方法,也是目前公认的最佳实现方式,而第三方cookie则被少部分页面标记法的工具所采用。

  无论是哪一种cookie,都存在被一定比例的浏览器默认禁用的情况。相对而言,第三方cookie被禁用的可能性更大,因为一部分的浏览器默认对第三方cookie有严格的限制,例如IE8。但是对于第一方cookie,大多数浏览器则比较接受,大部分浏览器都默认开放了第一方cookie,除非你手动把浏览器的安全级别提高,第一方cookie才会被禁用。这也是为什么第一方cookie更加适用于页面标记法网站分析工具的原因。

image

图:IE8默认的安全级别是中级,对第一方cookie没有太多限制,但对第三方cookie有很严格的限制

[版权归Sidney Song(宋星)所有,欢迎转载,但请事先告知作者并注明出处]

image

图:Firefox3.5默认接受第三方cookie

  关于有多少比例的第三方cookie被禁用,业界很难找到统一口径的数据。IAB(Interactive Advertising Bureau,互动广告局:http://www.iab.net)在2006年的研究表明,大约有12%左右的互联网用户会禁用第三方cookie,而DoubleClick在2009年则认为大约只有不到7%的用户禁用第三方cookie(DoubleClick数据仍需验证,Sidney注)。

  相对于第三方cookie的境遇,第一方cookie被禁用的情况不普遍。我博客的读者中大概只有不到1%禁用了第一方cookie,而总体看一般只有不到5%的互联网用户禁用了第一方cookie。因此采用第一方cookie记录网站分析数据的页面标记法工具相对只会损失非常少的数据。

  下图显示了JYC统计记录的我的博客www.chinawebanalytics.cn的读者浏览器cookie(第一方)被禁用的情况:

image

图:只有不到0.5%的第一方cookie禁用比例

  这个数据可以说是大大出乎我的意料,我原以为大概有5%的用户会禁用第一方cookie。在国外这个数据应该会高不少,在国内这么低的原因可能是互联网用户不认为cookie会侵犯他们的隐私或者会带来安全隐患。当然,这个数据只是我的博客的,如果考虑到国内相当的互联网用户是在网吧内上网,cookie禁用的比例肯定会提高。

  不过总体看来,第一方cookie问题在国内对网站分析构成的威胁很小。第三方cookie因为IE的默认限制,肯定会有更多的禁用,因此使用第一方cookie进行网站数据的记录更保险,也更准确。

[版权归Sidney Song(宋星)所有,欢迎转载,但请事先告知作者并注明出处]

  • 删除cookie的影响

   用户删除cookie是另一种影响网站分析数据监测且无法避免的问题。与cookie被禁用的情况相反,用户删除cookie一般会造成访问者计数的偏大。用户删除cookie的原因主要是为清空浏览器的记录,或者是出于保护自己的隐私的目的。

  用户删除cookie的比例和频率也存在颇多争议,JupiterResearch在2005年研究认为有40%的互联网用户会在一个月内至少删除一次cookie,而2007年ComScore的数据认为这一数据为31%(http://www.liesdamnedlies.com/2007/06/more-on-the-com.html)。这是一个非常令人吃惊的数字,也意味着因此而造成的一个月的独立访问者计数可能会偏大30%以上。

  随着PC硬件性能的提高,客观上会降低cookie被删除的比例,因为相当情况下cookie是随浏览器脱机文件被用户一起删除的,而更好的硬件会降低用户删除脱机文件的倾向。因此,与JavaScript被禁用的比例逐年减少类似,cookie被删除的比例也有随时间而降低的趋势。

[版权归Sidney Song(宋星)所有,欢迎转载,但请事先告知作者并注明出处]

  国内删除cookie的情况没有找到数据,很遗憾。有没有朋友能够提供或是给我提供一些线索?谢谢!

  总体看,JavaScript禁用和cookie禁用对目前我们使用Google Analytics进行监测影响非常小,但是cookie删除情况的影响相对较大。所以,更值得我们关注和研究的是cookie被删除的比例和频率,我会在未来继续对这一领域跟踪关注。

  谢谢大家!祝大家新年快乐!

::...
免责声明:
当前网页内容, 由 大妈 ZoomQuiet 使用工具: ScrapBook :: Firefox Extension 人工从互联网中收集并分享;
内容版权归原作者所有;
本人对内容的有效性/合法性不承担任何强制性责任.
若有不妥, 欢迎评注提醒:

或是邮件反馈可也:
askdama[AT]googlegroups.com


点击注册~> 获得 100$ 体验券: DigitalOcean Referral Badge

订阅 substack 体验古早写作:


关注公众号, 持续获得相关各种嗯哼:
zoomquiet


自怼圈/年度番新

DU22.4
关于 ~ DebugUself with DAMA ;-)
粤ICP备18025058号-1
公安备案号: 44049002000656 ...::