由于近期可能会启动网站分析图书翻译共享计划,因此,准备了这一篇工具介绍文章。

一、Google Translator Toolkit概述

Google Translator Toolkit(谷歌翻译工具包简称GTT)是Google提供免费翻译工具,它的主要优势有:

1、支持多种文件格式的全文翻译。支持的文件格式(可惜不支持PDF)如下:

AdWords Editor Archive (.aea)

HTML (.html)

Microsoft Word (.doc)

OpenDocument Text (.odt)

Plain Text (.txt) Rich Text (.rtf)

SubRip (.srt)

SubViewer (.sub)

2、支持术语库和记忆库保持专有数据和翻译风格的一致性

术语库

3、中英文对照,翻译起来很方便,同时各种格式也会以GTT的形式保留,比如超链接是{0}文字{/0}。 Continue reading “翻译利器Google Translator Toolkit介绍” »

 

你是否遇到过多个维度的交叉细分数据需求?比如查看来自百度organic对某一类页面(比如说URI中包含a)的分关键词分日浏览量。如果你没有用高级过滤器或_trackPageview方法重写URI的话,那么从这篇blog中相信你可以找到答案。

首先,先分析一下这个需求:

查看的数据的维度是两个:关键词和日

需查看的细分是来自百度organic,并且URI包含a

看到这个细分条件,你可能想到使用高级细分,构建一个下面的高级细分: Continue reading “高级过滤器+二次交叉细分在信息中心中保存自定义的复杂查询” »

 

  书的进度很慢,先放出一个残本,因为仅包含英文版的前三部分,缺少第四部分“用访问者数据驱动网站改进”。

  新浪文档下载

  声明:Cloga翻译的《使用Google Analytics的高级网站分析》为非官方的译本,非商业用途,仅为兴趣。如果您喜欢请支持官方版本。

  

 

标记着陆页的URL区分来自同一推介网站的付费与免费链接是这种技术最常见的应用。原理和过程很简单——在URL的末尾添加Google Analytics参数。
下面是标记着陆页在百度付费搜索中应用的两个例子(这将详细的讨论):
标记静态着陆页
原始着陆页URL:

http://www.cloga.info

标记后的着陆页URL:

http://www.cloga.info/?utm_source=Baidu&utm_medium=cpc&utm_term=%E4%BD%BF%E7%94%A8GA%E7%9A%84%E9%AB%98%E7%BA%A7%E7%BD%91%E7%AB%99%E8%AE%A1%E9%87%8F%E5%AD%A6&utm_content=%E7%BD%91%E7%BB%9C%E8%AE%A1%E9%87%8F%E5%AD%A6&utm_campaign=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90

标记动态着陆页
原始着陆页URL:

http://www.cloga.info?p=1

标记后的着陆页URL:

http://www.cloga.info?p=1&utm_source=Baidu&utm_medium=cpc&utm_term=%E4%BD%BF%E7%94%A8GA%E7%9A%84%E9%AB%98%E7%BA%A7%E7%BD%91%E7%AB%99%E8%AE%A1%E9%87%8F%E5%AD%A6&utm_content=%E7%BD%91%E7%BB%9C%E8%AE%A1%E9%87%8F%E5%AD%A6&utm_campaign=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90

注:你不需要手动标记Google AdWords广告系列。这是自动完成的(见第6章“获得AdWords数据:链接到你的AdWords账户”)
无论你想要跟踪PPC网络、banner、文件中的链接还是email,都是以这种简单的方式应用相同的变量。你可以从下面两步开始:
第1步:仅标记你所需要的
一般来说(AdWords是个例外),你需要标记你的所有付费关键词链接,比如百度、搜狗、banner及其他形式的在线广告。你也应该标记email信息中的链接——甚至你的签名及DOC、XLS和PDF等数码文件中的嵌入链接。
如果你不标记这些,访问者的点击访问仍会被跟踪。但是,推介信息是未知的,因此,会与其他来源混杂在一起。例如,来自百度的一个为标记的付费链接将显示为来自百度的自然搜索链接——即,在你的报告中显示为“baidu(orgenic)”。同样,在email信息及数码文件中未标记的链接将显示为“direct”访问——即与那些在浏览器中直接输入你的网站地址或点击以前保存的书签或收藏的访问者分为一组。很显然,营销人员希望区分这些访问的推介网站。
你不需要标记某些链接。例如,你不应该标记来自搜索引擎的自然搜索(非付费)链接,也不需要标记来自免费列出你的链接的推介网站的链接,比如门户网站。另外,你不要试着标记标记内部链接(网站内的链接)的URL。这样做将覆盖现有推介网站的广告变量,这将导致数据不准确。
不要为了SEO的目的使用广告系列跟踪
为了搜索引擎优化(SEO)的目的,重要的是不要对那些搜索引擎机器人可见的链接使用广告系列跟踪。你不会希望搜索引擎索引这些URL,因为,这些链接被视为有相同内容的不同URL,因此对搜索引擎来说是重复的——这被认为是搜索引擎作弊。
除了被处罚为作弊而损害你的页面排名之外,也没有必要这样做。Google Analytics将默认跟踪任何包含到你的网站的链接的网站,并且将记录推介网站信息。如果你的情况特殊,那么你可以通过重写过滤器自定义一个特定的推介网站。过滤器的创建将在第8章讨论。
第2步:使用Google的工具网址建构器(tinyurl.com/urlbuilder)
如前所示,广告系列链接由一个带有一个?(或&,如果你已经有其他参数存在的话)URL地址,后面是两个或更多的广告系列变量,如表7.3所述。

添加这些变量后,Google Analytics就能区分访问者——例如,区分来自百度自然搜索和付费搜索,或者区分直接访问者与点击email链接。
因为,最多允许5个变量,所以URL看起来很复杂。为了避免担心语法,请使用Google工具网址构建器http://www.google.com/support/analytics/bin/answer.py?hl=cn&answer=55578,更好记的地址是tinyurl.com/urlbuilder。
工具网址构建器为你创建标记后的链接——你只需要复制和粘贴生成的URL作为广告的着陆页(百度推广中为访问URL,AdWords中为目标网址)就可以了。一旦你理解了标记URL的结构,你可以使用电子表格将这些标记好的链接上传到你的PPC账户或其他管理系统中。
注:如果你使用第三方广告跟踪系统来跟踪网站的点击,那么访问者将通过重定向URL进入。如果这与你的情况相同,那么请务必测试你所标记的着陆页URL,因为重定向会破坏它们。你能通过点击产生的最终链接(广告跟踪链接+标记的广告系列链接)来测试。更多细节请看第六章“启用自动标记后的测试”。

 

接下来,你需要做的是在页面上放置GATC。如果你有一个只有为数不多页面相对较小的网站,那么,你可以将GATC复制粘贴到HTML中。或者,如果你使用模板或内容管理系统(CMS)建立自己的网站,那么你只需将GATC复制到主模板或顶部文件中。最佳位置是部分的底部,刚好在标签的前面。(Cloga:老版的ga.js的建议位置是刚好在</body>标签的前面)。
标记好页面之后,你应该能在4个小时内看到你的数据。但是,对于一个新账户,可能需要等24小时,因此,请保持耐心!
部署GATC的一个重要方面是必须将其粘贴到所有页面中。如第2章 “现有的方法及其准确性”中所述,遗漏页面标签是令人怀疑你的数据准确性的主要原因。除了不正确的访问者及综合浏览量之外,你还会发现,你的网站自身成为了引荐网站,完全丢失引荐网站信息,有一个明显过长或过短的网站停留时间和页面停留时间,不正常的跳出率及其他奇怪的现象。
遗漏页面标签的比率越大,准确性越差。作为指南,我以98%的GATC部署率为目标。即,你的页面的98%应有GATC,以保证报告的效度。低于这一指标就需要研究。如果你的部署率低于90%,那么不要用你的报告打扰我——先解决这个问题。表6.1,列出了可用于GATC部署问题的工具。附录B列出了其他的问题排查工具。

尽管拥有CMS是插入GATC的可靠方法,你仍需要确定GATC包含在所有新建页面中——不要经常认为这些是默认的——以及那些没有使用标准模板的页面。如果你没有内容管理系统,有许多替代的方法可以自动标记页面。这些方法中的两个是Apache的mod_layout及PHP的auto_append_file。
mod_layout是Apache web服务器加载的一个模块(原则上与插件类似)。如果你使用Apache,那么让你开发团队或托管业务提供商从http://tangent.org安装mod_layout的可加载模块。实施成功后,Apache web服务器将自动在它所服务的每一个页面插入GATC。注意,这意味着每一个页面都实施了GATC,因此,你应该将那些不需要GATC的页面添加到排除规则中,比如robots.txt, cgi-bin文件等。
mod_layout的完整介绍超出了本书的范畴,但是,下面的代码段给出了一个httpd.conf文件的设置例子。在这个例子中,忽略了两个文件类型(*.cgl和*.txt),utm_GA.htm(GATC的内容——如图6.2)的文件内容将被插入在HTML页面中</head>标签的前面:

#mod_layout directives
LayoutMergeBeginTag</head>
LayoutIgnoreURI *.cgi
LayoutIgnoreURI *.txt
LayoutHeader /var/www/html/mysite.com/utm_GA.html
LayoutMerge On

提醒:如果你的页面使用CAPTCHA方法(Cloga:学名叫全自动区分计算机和人类的图灵测试,超长超拗口,简称验证码,见http://baike.baidu.com/view/538168.htm?fr=ala0_1_1)产生的安全图片来保护网站避免自动表格提交,请检查你的安全图片仍能加载。如果无法加载,你可能需要从mod_layout排除调用安全图片的嵌入文件。
如果你的页面是由PHP产生的(文件名以.php结束),那么,你能使用auto_append_file指令。这个指令自动指定在主文件后解析的文件名。该文件就像调用了irequire()函数一样。这个指令能被包含在php.ini配置文件中(因此,应用到所有文件,并且保存在服务器上),或者更具体的说,在网站服务器根目录的.htaccess文件中,如下:

<IfModule mod_php5.c>
php_value include_path “.:/usr/local/lib/php”
php_value auto_append_file “/home/www/utm_GA.html”
</IfModule>

用这种方法,文件utm_GA.html,包含GATC的文件,将被自动添加到PHP网站所有页面的标签的前面。请注意,定义utm_GA.html位置使用了完整路径。使用这种方法,没有其他设置的话所有的子目录也将受到GATC。如果你希望避免这种情况,请设置相对路径。
注:因为auto_append_file仅适用于PHP文件,所有你不需要排除非PHP文件比如robots.txt。如果其他的文件类型需要GATC,你需要手动添加。你也没必要担心其他include的PHP文件收到两个页面标签。例如<?include(“/includes/navigation.php”);?>,如果你在页面中使用来构建你的导航栏,这些页面不会被标记。
如果你是一个Wordpress用户,有一些可用的插件能帮你在页面中自动插入GATC。见:http://wordpress.org/extend/plugins/search.php?q=google+analytics。

 

基准化其实并不是常查看的报告——更可能一个季度一次甚至是一年一次。但是,在这里我提到它是因为它包含了一些有趣的信息,特别在评估你的网站初始阶段的性能时。
所有网站所有者都面对的一个问题是如何量化成功。例如,每天获得10000次访问与相似规模的网站相比是好还是坏?34%的平均跳出率与你的同行相比是低还是高?这些是难以回答的问题,因为大多数人,特别是你的竞争对手,都希望把这些信息保密。但是,如果你选择匿名与Google和其他网站共享你的网站数据,那么Google Analytics确实有针对这一问题的解决方案。
图5.7显示了六个高层次的指标与网站规模相似的其他Google Analytics用户相比如何。通过打开目录列表链接选择行业来获得更具体的比较。所选的类别是基于用户的。即,每一个Google Analytics用户都能选择一个比较的行业类别,尽管你不能通过地理缩小这一点。你能改变随时改变选择,比较结果是实时更新的。

图5.7 基准化报告的例子

当Google Analytics在新行业类别中的用户数达到临界值后,这个新类别将自动添加到列表中。这保证了样本的数量足够大,能够做出有效比较,并且能够保护参与者的身份(小样本你能推断出身份)。这里强调的是,所有分享的数据是匿名的——你无法知道哪个网站的比较报告中,不显示收入或转化数据。
注:数据分享选项和设置将在第8章“最佳配置指南”中讨论。基准的考虑将在第10章讨论。

 

表格过滤器

标签E:网站有大量的数据。即使一个小型的、中等活跃的blog也能每个月产生几千的访问,从而,产生几万个数据,如图4.4所示,来源媒介报告的总行数是50——见表格底部的页脚行。尽管,在前面的部分介绍了,扩展并改变数据窗口能有一些帮助,但是,浏览表格的每一行肯定不是你想定期做的(或你的乐趣!)。

你能通过使用表格过滤器迅速获得一行数据(或一组数据),避免这一繁杂的工作。表格过滤器有两种——包含或排除两种匹配模式的简单过滤器和高级过滤器。

简单过滤器只作用于第一个指标列(表格序号列后的那一列)。在图4.13中,这是设置了仅包含来源/媒介匹配“goolge”或“direct”数据的来源/媒介这个指标。“direct”这个词是指在浏览器中直接输入网站网址或使用之前保存的书签的访问者。过滤器也可以反过来,即设置为排除“google”和“direct”访问或其他的匹配模式。当这一块空着时,没有使用过滤器。

图4.13 快速查找某一匹配模式数据的简单表格过滤器

图4.14的高级过滤器是前面标准过滤器的扩展。即,指定多个过滤条件。在这里,制定了平均网站停留时间大于等于1秒与(AND)每次访问页数大于等于3页。请注意,目前高级过滤器只支持AND(与)逻辑运算符。因此,图4.14表格中的数据同时满足以上这些条件。

图4.14 高级过滤器的复杂表格过滤

使用表格过滤器是通过指定简单或复杂的过滤条件,在大量数据中下钻有效方式。尝试不同的例子及组合,来熟悉这些。

注:图4.13和4.14使用了模式匹配的简单正则式。附录A包含使用正则式的概述。你能指定部分匹配作为过滤条件——例如,“whitepaper”将匹配“Accuracy Whitepaper”、“Whitepaper for SEO”等等。过滤器不区分大小写。

选项卡式报告菜单

标签F:报表的上方是一组选项卡菜单。选项卡菜单可以被视为是表格宽度的扩展——即,与其为了包含所有的访问指标而使表格过宽,不如将表格分为更容易管理、更短的选项卡。实际上,选项卡用来隐藏扩展的表格。

你可能注意到网站使用率选项卡通常在这个报告中显示(也在许多其他报告中显示)。这个报告提供了访问数、每次访问页数、平均网站停留时间、新访问次数百分比及跳出率等重要指标。你能否看到额外的选项卡取决于你的设置。例如,如果你设置了目标(20个分成5个集合),使用了电子商务交易跟踪或者使用AdWords或AdSence,那么,所有这些指标将在各自独立的选项卡中显示。如果你没有设置这些,那么这些选项卡将不显示。

事实上,在选项卡之前切换与在大数据表格间切换一样。如果你在网站使用率报告发现了有趣的数据点,你可能至少还希望看一下在目标转化及电子商务选项卡中是否也是这样。例如,Twiffer的大量引入是否会伴随着来自这一来源的目标转化或收入的增加。

小技巧:理想的情况下,你可能想要在一个长的、连续的行中看到所有数据。但是,这在你的浏览器中绝无法整洁!如果你确实想要那样,那么,把你的数据导出为CSV格式(或XML或TSV),用Excel或类似的电子表格程序查看。导出的数据包含所有的选项卡菜单。

细分视图

标签G:正如你将在本书中读到或自己用报告做实验所发现的,在Google Analytics中有许多方法细分数据。最简单的例子是细分视图。你能用这个下拉菜单比较两组数据。

我用访问者>地图覆盖图>china来更好的解释这一功能,如图4.15。例子所展示的是:显示来自中国的访问者的不同推介来源,即,通过地理位置和来源正交细分访问者。

图4.15细分视图的例子

图表模式

标签H:你能通过点击随时间变化的数据图的下拉菜单,选择你希望显示的指标。尽管可选择的指标很多,但是通常默认的是访问数。除了改变标注的指标之外,你也可以同时比较两个指标。每一个指标以不同的颜色标注,刻度标注在Y轴的左侧或右侧,如图4.16所示。

图4.16 不同图表模式

另一个图表模式是与“网站”进行比较。对于单一的指标来说,这个选项添加了一个网站平均数的曲线。当你下钻到报告中,与网站进行比较是有必要的。例如,当你仅查看来自直接流量的数据时,选择与“网站”进行比较显示了直接访问与全站数据的相对关系。如图4.17所示,你能看到网站访问的大多数是直接流量。没有与“网站”进行比较选项,这种信息,特别是如何随时间变化,将不那么明显。

注:除非你下钻到报告中,否则,与“网站”进行比较选项的数据将直接覆盖在目前数据之上。这是因为,默认情况下,报告数据并不细分。

图4.17 比较直接流量与网站平均值

数据导出和电子邮件功能

标签I:数据可以以五种行业标准格式导出:PDF、XML、CSV、和制表符分隔值(TSV)。选择每个报告顶部的导出,将数据导出为PDF(可打印的报告)、CSV、制表符分隔值(可导入Excel或其他电子表格应用程序)或者XML(可导入第三方应用程序的开源标准)。

注:另外的适用于Excle的CSV格式是为了更好的处理Google Analytics所使用的UTF-8编码。UTF-8编码通常是为了确保非ASCII字符集在网页内处理正常。Google Anaytics使用这种编码是因为需要提供25种语言的报告。但是,UTF-8编码导入Excel并不十分顺利,于是这种略加修改的格式应运而生。

手动导出数据对数据的进一步计算或创建呈现给你的团队的一次性报告很有益。一旦你选择了那些对你的利益相关者很重要的数据,那么你可能希望通过e-mail特意或定期将数据发给他们。要做到这一点,选择导出按钮旁边的Email按钮。可以定制每天、每周、每月或每季度发送一次报告,如图4.18。

图4.18 定制(调度)email导出报告

如果你希望把一组报告添加到现存的email定制中,请使用添加到现有的,如图4.19所示。

图4.19 向现存的Email调度中添加报告

Email调度(定制)设置

每个用户与配置文件共同决定Email调度(定制)的设置。因此,查看相同配置文件的两个不同用户能设置它们各自调度的email。

定制后,所有时间都是美国加州山景城的时间(Google总部)。尽管未指定精确时间,但是,在早上发送的日报告有时实际上是欧洲用户的下午。

数据导出是Google Analytics的有效功能,你能有效的利用你的访问者数据。如果数据导出是你网站分析的一个关键需求,那么也请考虑一下Google Analytics导出API所提供的自动导出选项——在第12章“Google Analytics数据与第三方应用程序的集成”。

导出多于显示的最大行数的数据

用户界面中所能显示的最大报告行数是500。Google Analytics的导出功能也有这个限制。为了避免这一限制,增加导出的数据行数,可以使用下列技巧:

在你的浏览器地址栏显示的URL后面添加&limit=5000(或者任何你需要的行数)。敲回车重新加载报告。例如:https://www.google.com/analytics/reporting/all_sources?id=2097117&seg0=-1&pdr=20090101-20090131&cdr=20081201-20081231&cmp=average&gdfmt=nth_day#lts=1258641047453&limit=5000

这并不改变用户界面的显示,但是,你可以导出更多行的数据。选择导出标签(标签I),选择CSV或TSV格式(不是适用于Excel的CSV格式)。

目前导出的限制是20000行。如果你需要更多行,那么,先导出前20000行,然后,查看第20000行(通过图4.4的标签D),然后再导出。

标签I的其他选项添加的控制台(英文语言版还会显示可视化)将在第5章“报告解释”讨论。

PS:V5的GA更加强大,通过修改页面参数也会修改界面上显示的条目。

 

  先庆祝一下我的独立博客诞生~~花了几个小时搞啊搞啊~原来是最初看到的教程里没有说明需要修改数据库地址,导致500错误~~浪费我宝贵的学习时间。

© 2012 Cloga与网站分析 Suffusion theme by Sayontan Sinha
//Google +1

无觅相关文章插件,快速提升流量