社交网络分析工具介绍

尽管Facebook的股价表现差强人意,新浪微博的商业化也遥遥无期,但是,社交网络分析仍然是数据分析中的一个热门话题。我也一直在关注这类内容,下面就为大家介绍一下我所接触到的社交网络分析工具。

一、web工具篇

让我们先来看一下市面上比较成熟的产品。

1、微博风云榜

微博风云榜

微博风云榜

微博风云榜菜单

微博风云榜菜单

 

 

 

 

 

 

 

 

 

 

从菜单栏可以看到微博风云榜提供了传播分析,舆情监测,内容发布,数据报告等全面的社交分析服务。同时也提供了数据接口,尽管目前只有两个接口,用户信息接口和高级搜索接口,这两个接口就应该可以满足大部分数据服务商的数据需求。

此外,微博风云榜也有自己的社交影响力查询,可以用于比较不同微博账号的影响力,有点国内的Klout的味道。

总的来说,微博风云榜其实已经不仅仅是一个社交分析工具,它集成了社交传播分析,粉丝分析,舆情监测,内容发布等与社交网络运营管理相关的内容,如果再加上Social CRM就更加完美。

2、知微

知微

知微

与微博风云榜相比,知微则更专注于微博的传播的分析,普通版即支持转发数小于1000条的微博的传播分析。知微提供了传播分析全面的数据,包括传播路径图,转发层级,转发内容的词云,水军识别,地域分布……… Read More …

用Python的simpleHttpServer搭建本地GA测试环境

数码林(没有网站也能玩转Google Analytics)和郑杰同学(如何本地测试Google Analytics跟踪脚本)都介绍过本地搭建GA测试环境的方法,前者使用的是Apache,后者使用xampp。我这里介绍使用Python的simpleHttpServer搭建GA本地测试环境的方法。

首先,你要安装python。如果你使用的是OS X或者Linux,那么,Python应该已经安装上了,如果你用的是Windows,那么你需要去http://python.org 下载Python2.7并安装。

安装好Python后,你需要创建一个放置要测试文件的目录(比如说test)。

在命令行下到达这个目录。这里你会用到cd命令,如果你在Windows且test的完整路径是d:\program\test,那么你需要在Windows的CMD中执行下面三行命令。 Read More …

获取GA数据的R包-RGA 简介

RGA是在R中实现的GA API,可以直接将GA数据读入到R中,Coursera的Data Analytics的课程中Jeff也提及过。

RGA的使用非常方便,将GA的API方法都封装成R的语句。

RGA的安装

由于RGA没有放在CRAN上,因此没法直接用install.packages安装,当然我们可以下载 zip或tar.gz然后手动进行安装。此外,我们还可以用devtools来进行安装。

install.packages("devtools")#安装devtools
library(devtools)#载入devtools包
install_github("rga", "skardhamar")#安装rga

 RGA的使用 Read More …

计算GA归因模型数据的小工具

归因建模工具是GA的Premium版本和测试中的UA的一个新增功能。通过现在版本GA中热门转化路径数据也可以自行计算首次交互,最后交互和线性模型这三种模型的数据。比如Lunametrics最早提供了在Excel中完成计算的方法胡力同学也提供了类似的解决方案

这里我给出一个python做的exe小工具,点击MCF计算小工具

使用方法如下: Read More …

网络分析与图简介

Friend Visualization

Friend Visualization

前面有介绍过使用Gephi来制作传播图,图是Social Network分析最常用的表现形式和方式,这篇文章介绍一下基本的相关知识。点击查看原始文档

Graph的相关基本概念

图(Graph):图是用来表示一组物体之间的关系的方式。

节点(Node):节点是指要分析的物体,每一个物体就是一个节点,比如在Social Network中每个人就是一个节点。

边(Edge):Graph中两个节点间的连线,用于表示两个节点的关系。比如在Social Network中两个人的关注关系,微博传播中转发关系。

度(Degree):节点的度是指与其相连的边数,如果一个节点有3个边,那么这个节点的度就是3。

有向图(Directed Graph):边代表的关系具有方向的图。比如微博的关注关系,就是有方向的。

输入度(In-degree):有向图中一个节点收到的边。

输出度(Out-degree):有向图中一个节点发出的边。

无向图(Undirected Graph):边代表的关系没有方向的图。

Direct Graph

Direct Graph

Read More …

美化一下Gephi生成的微博传播图

新浪微博传播路径图的制作中介绍了微博传播图的制作。

微博传播图-未美化前

微博传播图-未美化前

直接将DOT文件导入Gephi中并使用Yifan Hu Layout进行计算后会得出上面的图。在Gephi中进行一些简单的操作可以得到如下的图。

微博传播图-美化后

微博传播图-美化后

Read More …

新浪微博传播路径图的制作

微博传播图

微博传播图

经常在微博上看到微博传播路径图。其实只要会一点Python、GVEdit和Gephi,你也可以自己动手制作新浪微博的传播路径图。这篇文章就和大家讲讲如何制作这类传播路径图。下面的内容会涉及到新浪API,Python,GVEdit,Gephi这些工具或知识。

通过Python调用新浪API

新浪微博开放平台注册账号,创建应用。

创建应用

创建应用

Read More …

在GTM中指定Tag的依存关系

Google Tag Manager便利了网站分析师的工作,我一直认为它有一个局限性:一个Container中的Tag是异步加载的,各个Tag之间没有顺序,因此,如果一些Tag之前有依存关系,即如果B tag必须要在A Tag执行之后执行才有效。比如GA触发Beacon的Tag(trackPageview,trackEvent等),必须要在定义了跟踪器对象及各种参数之后执行才有效,不然轻者造成数据丢失,重则造成数据异常。关于这一点纪杨同学的文章中也有提到,昨天我也有和Rokie同学聊到这一点,并且在他那里找到了一个相对完美的解决方案(话说他的项目都有够复杂,Minisite用到虚拟电子商务跟踪有木有~)。

解决方案的思路是这样利用GTM的Data layer为A Tag的触发指定一个Event,B Tag的触发条件定义为这个事件。OK,很精巧的一个逻辑,不需要很复杂的东西。

以我的Blog为例,首先你需要在页面上放置GTM的Data Layer,很简单,只需要在页面的Body部分放置:

<script>
  dataLayer = [];
</script>

我将定义GA跟踪器参数的那一堆Tag(不包含trackPageview等触发Beacon的Tag)定义为GAS-GTAC,我用的是cardinal path的插件,跟踪器名称有一些小小的差异。同时要在这个Tag的最底部指定一个Event:

dataLayer.push({'event': 'gatc'});

这样在这个tag执行之后就在data layer中产生一个event,而这个event可以用于其他tag的触发规则,这样就保证其他的tag是在这个tag执行后触发。 这个tag的触发规则为:

All Pages Rule

All Pages Rule

Read More …

用Python写简单爬虫

Python提供了许多Module,通过这些Module,可以很简单的做一些工作。比如,要获得cloga这个词在百度搜索结果页中的排名结果(排名结果+URL),这就是一个很简单的爬虫需求。

首先,要通过urllib2这个Module获得对应的HTML源码。

import urllib2
url='http://www.baidu.com/s?wd=cloga'
content=urllib2.urlopen(url).read()

通过上面这三句就可以将URL的源码存在content变量中,其类型为字符型。

接下来是要从这堆HTML源码中提取我们需要的内容。用Chrome查看一下对应的内容的代码(也可以用Firefox的Firebug)。

Java Console

Java Console

可以看到url的信息存储在span标签中,要获取其中的信息可以用正则式。

import re
urls_pat=re.compile(r'<span class="g">(.*?)</span>')
siteUrls=re.findall(results_pat,content)

Read More …

Google Tag Manager简介

Google在10月1日发布了免费的Tag Management Tool:Google Tag Manager。这对Tag Manager工具提供商来说是一个冲击,一方面Google进入这个领域,表明这个领域存在的巨大潜力,另一方面,免费的策略意味着目前的工具提供商必须要提供有价值的差异化服务才能向用户收费。就像2005年,Google通过收购Urchin进入网站分析领域一样,一方面,由于GA这款免费但不失优秀的工具,使整个网站分析业获得快速的发展,从最初不到三分之一网站使用网站分析工具,到目前几乎所有的网站都使用网站分析工具;同时网站分析行业也进行了大清洗。感兴趣的同学可以看一下Tag Management的工具提供商近期的Blog,比如,

What Google Tag Manager Means to the Tag Management Industry

WELCOME TO THE PARTY GOOGLE

基本上都是将Google进入Tag Management领域既看作是机遇也是挑战。

在介绍Google Tag Manager之前,我们先来看一下关于Tag Management的一些基本问题。

什么是Tag Management Tool?为什么要用到Tag Management Tool?

目前的主流网站分析工具都是用Page Tag的方式,这种方式的一个优势是对IT资源的需求量大幅减少,但是,在工作中由于一些原因对Tag的修改或新增仍需要借助于IT同事的力量。对于大中型企业来说,某些情况下,添加一个转化跟踪代码所需要的流程和时间成本,要远超这件事情本身。而Tag Management Tool就是在这样的背景下诞生的。Tag Management Tool顾名思义,是用来管理页面上Tag的工具。从本质上来说,Tag Management Tool是一个用来承载多种Tag的一个容器。在这个容器中你可以放置多种Tag,比如GA的Pageview,Event,Adwords转化跟踪,百度统计,DFA的Flood Light等等。Tag Management Tool的出现,为网站分析师以及外部的Agency提供了极大的便利,其实也是IT同学的福音。

在为网站分析师带来便利的同时,一些风险和责任也同时让渡了过来。主要集中在两点:一是由于涉及到页面上Tag的一些改动,所以QA的工作也自然而然的落到的网站分析师的身上,不然由于你的Tag改动,造成整体页面功能失灵就不好玩了,为此,所有的Tag Manager工具都提供了Debug模式,正式发布之前进行测试是必不可少的环节,而在以前这部分工作是IT同学的职责。此外,由于网站分析师要与页面上的Tag打交道,甚至操作DOM及JS变量,因此,对网站分析师的HTML及JS正则式的基础知识提出了新的要求。

下面让我们来具体看一下Google Tag Manager。 Read More …

无觅相关文章插件,快速提升流量