Google如何数据跟踪、分析
本文目录
大数据分析需要哪些工具
稍微整理了下常用到的大数据分析工具,看下能不能帮到你
1.专业的大数据分析工具
2.各种Python数据可视化第三方库
3.其它语言的数据可视化框架
一、专业的大数据分析工具
1、FineReport
FineReport是一款纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具,只需要简单的拖拽操作便可以设计复杂的中国式报表,搭建数据决策分析系统。
2、FineBI
FineBI是新一代自助大数据分析的商业智能产品,提供了从数据准备、自助数据处理、数据分析与挖掘、数据可视化于一体的完整解决方案,也是我比较推崇的可视化工具之一。
FineBI的使用感同Tableau类似,都主张可视化的探索性分析,有点像加强版的数据透视表。上手简单,可视化库丰富。可以充当数据报表的门户,也可以充当各业务分析的平台。
二、Python的数据可视化第三方库
Python正慢慢地成为数据分析、数据挖掘领域的主流语言之一。在Python的生态里,很多开发者们提供了非常丰富的、用于各种场景的数据可视化第三方库。这些第三方库可以让我们结合Python语言绘制出漂亮的图表。
1、pyecharts
Echarts(下面会提到)是一个开源免费的javascript数据可视化库,它让我们可以轻松地绘制专业的商业数据图表。当Python遇上了Echarts,pyecharts便诞生了,它是由chenjiandongx等一群开发者维护的Echarts Python接口,让我们可以通过Python语言绘制出各种Echarts图表。
2、Bokeh
Bokeh是一款基于Python的交互式数据可视化工具,它提供了优雅简洁的方法来绘制各种各样的图形,可以高性能地可视化大型数据集以及流数据,帮助我们制作交互式图表、可视化仪表板等。
三、其他数据可视化工具
1、Echarts
前面说过了,Echarts是一个开源免费的javascript数据可视化库,它让我们可以轻松地绘制专业的商业数据图表。
大家都知道去年春节以及近期央视大规划报道的百度大数据产品,如百度迁徙、百度司南、百度大数据预测等等,这些产品的数据可视化均是通过ECharts来实现的。
2、D3
D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。
详细数据分析步骤(一)-数据获取
数据分析师如今风靡全网,那么什么是数据分析呢?此合集将会对数据分析的框架做一个细致解析并推荐相关文章以便入门学习。
一、数据获取
现如今大数据时代已经到来,企业需要数据来分析用户行为、自己产品的不足之处以及竞争对手的信息等,而这一切的首要条件就是数据的采集。常用的数据获取手段有数据仓库和操作日志,监测与爬取(即爬虫),填写、埋点和计算
1、数据仓库和操作日志
数据仓库(Data Warehouse,DW)长期储存在计算机内,有组织、可共享的数据集合,是为决策支持系统提供基础数据的分析型数据库。
数据仓库有几个定义特征,即:
推荐阅读:一、数据仓库-架构艺术-博客园
日志和数据仓库具有相同的作用,但相比之下日志的记录比数据仓库精简,且在出现故障时更容易定位问题。
2.监测与爬取
爬虫是指:通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。
根据使用场景,网络爬虫可分为通用爬虫和聚焦爬虫两种。
通用爬虫是捜索引擎抓取系统(Baidu、Google等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。简单来讲就是尽可能的;把互联网上的所有的网页下载下来,放到本地服务器里形成备分,再对这些网页做相关处理(提取关键字、去掉广告),最后提供一个用户检索接口。
聚焦爬虫,是"面向特定主题需求"的一种网络爬虫程序,它与通用搜索引擎爬虫的区别在于:聚焦爬虫在实施网页抓取时会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。
推荐阅读:爬虫(爬虫原理与数据抓取)- lclc-博客园
爬虫- Z-J-H-博客园
3.填写、埋点
这两个都是对用户行为进行记录。
填写是指用户在注册时填写信息或者对相关问卷进行填写。通过问卷调查、抽样调查获取的数据是有限的,并且有时也不能够保证真实性。
埋点主要指 APP或网页埋点,跟踪app或网页被使用情况,以便优化。通常记录访客、页面查看、跳出率等等页面统计和操作行为)。直接记录用户与网络产品的交互过程,几乎可以复现,从而获得用户的行为模式,购买记录、搜索习惯等。这些数据都是用户自己产生的,可以保证数据的真实性。
推荐阅读:6大步骤:快速学会如何进行数据埋点
4.计算
很多数据无法直接获取,需要通过已有数据计算得到。例如企业的投入产出比。
最后,需要强调的是进行数据分析的数据必须真实、准确且具有时效性。数据获取后使用个人信息要遵守以下5大原则:
(1)合法、公开原则。
(2)目的限制原则。
(3)最小数据原则。
(4)数据安全原则。
(5)限期存储原则。
下一篇文章将会对数据分析中的数据预处理做一个简单梳理
如何使用GoogleAnalytics来分析外贸网站的SEO效果
一、统计非HTML的文件点击在网页文件中跟踪某一个链接,可以通过在链接<a>标记中添加onClick属性来实现,实例如下:<ahref="代码前面,最好<body>的下面。二、跟踪AdwordsGoogle
Analytics官方已经直接支持跟踪Adwords,详细步骤请参看“如何将GoogleAnalytics(分析)帐户链接到AdWords
帐户?”。另外,vdgraaf也提供了一个手动修改代码的方法,也可以实现同样功能,修改的例子是:_uacct=
"**-******-*";//yoururchincodegeneratedbyGoogleAnalyticsif(
document.referrer){if(document.referrer.indexOf('google')!=
-1){varurlPattern=/(?|&)q=([^&]*)/;var
aMatches=urlPattern.exec(document.referrer);if(aMatches!=
null){urchinTracker('/query/'+aMatches[2]);}
else{urchinTracker();}}else{
urchinTracker();}}else{urchinTracker();}
然后在“内容优化”-“内容效果”-“内容细目”里查看目录query的信息,好可以将其内容与“优化市场营销”-“搜索引擎营销”-“按点击付费与
自然转化”-Google比较一下Adwords数据。三、跟踪Adsense点击
我们以前介绍过的Adsense追踪软件只是将用户点击记录下来,并不具备统计功能,如果我们想要对以往的广告点击进行统计,那么可以直接利用
GoogleAnalytics来实现统计功能。实现的大致方法是:在Google的Adsense广告下面增加如下语句
<scripttype="text/javascript">functionlog(){
urchinTracker('/adsense');}varelements2;elements2=
document.getElementsByTagName("iframe");for(vari=0;i<
elements2.length;i++){
if(elements2[i].src.indexOf('googlesyndication.com')>-1){
elements2[i].onfocus=log;}}</script>
修改好了以后,请大家不要点击Google广告进行测试,那样会被Google锁定帐户的,大家只要慢慢等待Google
Analytics的统计信息即可。另外seobook也介绍了一个方法,原理是基本类似的。四、跟踪所有点出链接
使用下面语句可以跟踪所有点出链接。window.onload=setAdsLinks;function
setAdsLinks(){varLinks=document.getElementsByTagName('A');
for(vari=0;i<Links.length;i++){Links[i].onclick=
function(){urchinTracker(this.href);}}}
注意,使用这个代码需要将Google
Analytics的统计代码放在页面的最前端,另外这种统计有一个副作用,就是如果网页的超级链接非常多的话,这些语句会影响浏览器的性能,甚至引起
“假死”的状态。五、显示完整的反向链接统计来源的时候,Google
Analytics只显示域名信息,我们可以通过修改统计代码,实现GoogleAnalytics显示完整的反向链接_uacct=
"**-******-*";//这些是GoogleAnalytics产生的代码//用下面的代码替换原有的代码。if(
document.referrer){urchinTracker(document.referrer);}else
{urchinTracker();}六、不修改代码显示完整的反向链接
Google官方提供了一个不修改代码也可以显示完整来源的方法,就是在“优化市场营销”-“访问者群体细分效果”-“造访来源”,选中来源地址左边
的图标,点“跨群体效果”,再点“内容”即可返回来源具体静态URL的数据,这个方法用于静态地址的来源,动态地址(例如搜索结果)用这个会不好用。