Direct Traffic真的是直接流量吗?如何辨识真正流量来源?

20 七月 2009 25 Comments

   Direct Traffic(直接流量)是一种非常特殊的流量来源,我们对它又爱又恨。我们喜爱它,是因为这种流量的质量通常是很高的,它似乎属于各种流量中的贵族;我们“恨”它,是因为这是一种难以作出有效分析的流量,它无法被继续细分,我们也无法知道这些流量到底是访问者做了什么样的行为产生的。

  因为无法被继续细分,所以Direct Traffic的真面目其实被蒙蔽了,而Google Analytics对于Direct Traffic的解释又无疑加深了这种误解。我们先看看GA是怎么解释的: How do the people who clicked a bookmark to come to your site or typed your site URL into their browser compare to the "average" visitor to your site? Direct traffic can include visitors recruited via offline (i.e. print, television) campaigns.(Direct Traffic用来衡量那些通过收藏夹或者在地址栏中输入网站URL的访问(者),以及这部分访问(者)跟网站其他访问(者)之间的差异。直接流量能够包括那些通过线下营销宣传找到网站的访问者)。

  这个解释明确的告诉我们,Direct Traffic是来自“收藏夹”和“地址栏”的流量,但事实真的如此吗?

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  • Direct Traffic不仅仅是直接流量

   这么说的原因很简单,Direct Traffic的意思是,所有那些没有预先做好标记,而且网站分析工具也没有能够获得流量源头DNS服务器信息的那些流量。在浏览器的地址栏中直接输入网址或者是通过收藏夹来实现的访问当然属于这一类,但是除此之外,因为种种原因网站分析工具没能获得流量源头的信息的话,这些流量也都可能会被计入Direct Traffic。

  大家可以做一个小小的实验。这个实验感谢Actionable Analytics的Jonny(也是他启发了我写这个文章)。

  首先,打开任何一个知名的门户,比如新浪。新浪的首页上有各种广告,建议大家每一个都点击一下。然后会打开多个厂商的页面。现在,请大家在每一个页面的地址栏中输入:“javascript:alert(document.referrer)”然后按回车,大家会看到什么?

  每个网页都会弹出一个窗口,有的窗口中间有显示:http://www.sina.com.cn,有些则完全是一个白板,如左图所示。

  如果弹出窗口中间显示了URL,那就表明,新打开的页面的referrer已经被记录了下来,这样在网站分析工具中的referrer报告中,也就能够显示它的正确流量源头;可是,如果弹出窗口是一个白板的话,那就说明referrer信息没有被记录下来,网站分析工具很可能就会把次访问的来源记为Direct Traffic。

  如果你在不同的浏览器中尝试不同的网站的广告,你会发现,出现白板窗口的几率是非常大的,而且似乎没有什么规律可言。这说明,网站分析工具中的Direct Traffic可能存在很大的不确定性,而GA的定义是不准确的。

  的确,如果大家使用过Omniture的话,会发现Omniture中,并没有用Direct Traffic表示直接流量,而是用unspecified这个词替代了。也就是说,Omniture不默认这些流量一定就是Direct的,而是认为它们可能属于Direct,但更确切的应该属于那些无法辨识来源的(Unspecified)流量。如下右图所示:

  因此,如果我们认为GA中间的Direct真的完全是直接流量的话,是不准确的,而且会影响到我们对于那些真正的直接流量的研究。

  那么,如何能够保证在Google Analytics中的Direct Traffic完全是真正意义上的直接流量呢?

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  由于流量来源本身的不确定性,保证Direct Traffic 100%名副其实是非常困难的。有经验的站长都知道,总有一些流量是莫名其妙的,我们很难分析,而它们有的确客观存在。尽管如此,我认为,我们能够通过一些有效的方法来降低非直接流量混入Direct Traffic中间,或者把那些本来不是Direct Traffic的流量标识出来。这样,可以帮助我们尽量降低误差。

  那么,如何能够辨识这些非Direct Traffic真正的流量来源呢?目前我常用的方法,有三种,至于是否好用,在什么情况下使用,依据具体的条件不同,可能回答很不一样。另外,跟我以前的讨论帖一样,我的三个方法提出后,也希望大家能说出自己的好方法。

  • 1. 在流量源头上做标签(标记)

   这种方法是我们最常使用的方法。这个方法对于那些特别依赖于网络推广的网站尤其有用。如果大家使用Google Analytics,那么大家可以使用UTM标签,方法简单,操作方便,而且数据直接显示在报告中,会让你非常有成就感。嗯,具体的方法嘛,请看我的这个帖子:用Google Analytics的Link Tag深入了解流量来源(广告)的质量,内容很详细。

  除了Google Analytics,Omniture也使用了类似的方法,不过,毕竟是收费工具,标签上能够包含的信息量比Google Analytics要多了太多了,这样更有助于我们根据不同的维度来做细分研究。另外Omniture的这种标签(tag)是可以自定义的,有些朋友在使用形如"?cid="这种格式的saint tag标签,还有些朋友则在使用jumpid的标签,但是本质上是一样的。当然,我非常推崇saint tag标签。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  有了saint tag,当你做好标记后,Omniture的报告能够显示的维度多达20多个(如下图所示),而且还能够根据你的特殊需求定制化的增加。正常需求不在话下,变态需求应该也没问题了。功能的强大、可定制以及极为细化是为什么Omniture尽管不免费,却仍然占有极高市场的原因之一。

图:Omniture可以极为细致的细分网站流量的来源

  • 2. 利用多个首页或多个域名

  在某些情况下,你的网站不是靠网站推广,而是靠线下推广,或者是靠互联网自发的引用和朋友推荐等。这时你已经不再可能为每个源头都做好标记,我们该怎么辨别那些自发的流量?

  一个好的方法是利用多个首页或者域名来标识。例如,如果我要做我的网站的线下推广,我会呼吁那些看到我线下广告的朋友通过域名“www.wac.cn”来访问我的网站(www.chinawebanalytics.cn),你会发现这两个URL是不同的。如果我有多个线下推广的渠道,比如电视,杂志以及楼宇广告,我会分别给他们不同的域名:“www.wac.cn/1; www.wac.cn/2; www.wac.cn/3”来招呼他们——这样尽管我在网站分析工具中的traffic source报告中不能细分他们,但我可以通过top landing page报告来细分他们,尽管不一定是100%纯净,但是已经能够做到相当精确的细分了。这种方法,不但能够帮我们打开Direct Traffic的黑盒子,也是帮助我们间接衡量线下推广的一个好方法。

图:线下推广用简单的URL,并且编号区别于其他的推广方式。注:图片仅是例子,请大家不要访问这个臆造的网址

  同样,即使是线上推广,这样的方法也是可以尝试的。例如,你可以设置一个小程序,在网页上生成一个收藏按钮,并且把被收藏的URL设置为一个与当前网页URL不同的另外一个(当然,前提是你得保证两个URL都能正常打开你的网页),这样就能够获知一部分direct traffic中真实的收藏了你的网站的访问者了。此外这个方法也能用在朋友推荐、文章引用以及交换链接等领域,你需要做的是给各种情况不同的landing page URL。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  当然,这种方法并不足以精确探知Direct Traffic的构成,毕竟互联网的流量来源很混杂,而且长尾原理已经告诉我们想要搞清楚长尾里面厘米都是些什么是很困难的。但是,这个方法至少能够帮助我们相当程度的降低Direct Traffic的不可知性,并帮助我们根据数据的趋势进行优化。因此,我仍然认为这是一个好方法,如果你不怕copy多个首页或是建立多个URL的麻烦的话。

  •  3. 利用DoubleClick等工具的Post-Click Activity功能

  这个方法需要除了网站分析工具之外的广告监测工具,可能很多朋友无法尝试。但是就这个方法本身而言,是一种网络营销推广极为常用的流量监测方法,而且我认为是最为精确的。

  以DoubleClick为例,目前DoubleClick使用FloodLight(Spotlight的升级版工具)作为Post-Click Activity的监测工具。这种工具的原理是在广告点击之后的登陆页面,以及登陆页面之后的所有页面或是Flash中加上代码,然后这个代码能够和DoubleClick的广告代码协同工作,记录不同广告访问每个页面(Flash)的情况。

 

图:FloodLight工具的一个截图片段,最右边的(Expected URL)是所有能够被Track流量源头的页面

  FloodLight的代码与GA的代码添加方法比较相似,但是代码的内容更加简单,功能也很单一——就是记录广告流量进入网站之后在各个页面的穿梭情况。不过,也正是因为这种简单的代码和单一的功能,使它在监测广告流量方面非常准确。另外,与Google Analytics的Traffic Source功能相比,FloodLight的优势在于能够知道每一个页面(甚至Flash中每一个点击)的流量是从源于哪个广告或是流量源头,而且数据十分准确;但是Google Analytics则只能使用Content ->Top Content -> Entrance Sources报告来辨识具体到页面级别的流量源头,而且数据很可能只是sample值(取样值),这样准确度就大大降低了。

图:GA的取样值,Entrance Sources的准确性大大降低

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

   FloodLight的另外一个无可比拟的功能,是能够直接嵌入Flash文件中,监测每一个Flash互动的流量源头。这一点Google Analytics要做到也非常困难,但是FloodLight就十分容易了。根据不同的Flash的版本,在Flash中嵌入FloodLight的相应代码,所有的flash的互动来自于什么广告/流量源都会被记录下来,这对于优化广告以及其他网络的推广是非常有帮助的。

  好了,3个方法说完了。大家有没有更好的主意?或者文章中有什么不正确的,以及你的任何其他想法,都请——给我留言吧!

::...
免责声明:
当前网页内容, 由 大妈 ZoomQuiet 使用工具: ScrapBook :: Firefox Extension 人工从互联网中收集并分享;
内容版权归原作者所有;
本人对内容的有效性/合法性不承担任何强制性责任.
若有不妥, 欢迎评注提醒:

或是邮件反馈可也:
askdama[AT]googlegroups.com


点击注册~> 获得 100$ 体验券: DigitalOcean Referral Badge

订阅 substack 体验古早写作:


关注公众号, 持续获得相关各种嗯哼:
zoomquiet


自怼圈/年度番新

DU22.4
关于 ~ DebugUself with DAMA ;-)
粤ICP备18025058号-1
公安备案号: 44049002000656 ...::