主页 > 佛学

数据分析工具浅解

时间:2019-10-09 来源:熊猫流量小王子

计数工具

分析数据问题

1:统计日志记录访问的量

在应用服务器中使用shell脚本或者直接命令行工具进行 awk gerp netstate等命令都可以很好的协助我们进行数据的统计分析

如何进行简单的pv,uv量的统计

简单的分析下:access log 记录了哪些用户,哪些页面以及用户浏览器、ip和其他的访问信息

201.158.69.116 - - [03/Jan/2013:21:17:20 -0600] fwf[-] tip[-] 127.0.0.1:9000 0.007 0.007 MX pythontab.com GET /html/test.html HTTP/1.1 "200" 2426 "http://a.com" "es-ES,es;q=0.8" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.97 Safari/537.11"

以一条为例子:

可以看到访问的ip,url地址,访问时间,用户地理位置代码,来源页面,用户浏览器其他信息,浏览器版本、浏览器类型等

一些关键的信息指标 进行分析整合统计即可得到业务上计数需要

我们可以关注哪些页面别哪些人访问的最多

哪些用户经常登录我们的系统

哪些接口响应时间长需要优化

哪些合适seo进行优化以及改进

哪些异常状态多次出现需要进行注意等

数据统计及分析

  • 接口请求频次:分接口、按天和小时分别统计。了解网站的运行情况,每个接口的请求频次,用户的行为习惯等。

  • 响应时间:一天的平均响应时间、分接口的平均响应时间、分接口按小时统计平均响应时间。响应时间过长的请求可能说明服务性能上存在缺陷,就需要对相应的接口进行优化了。

  • 异常分析:状态码非200的请求、响应时间超过一定域值的请求。大量的404不利用SEO,应该尽量避免。

  • 具体参数统计:对于动态页面,一个接口通常带有多个参数,其中某个或者某几个参数特别重要,可以进一步细化,产生接口对应的参数的统计结果

  • ip来源的统计:可以统计出网页访问的ip来源,进一步通过ip定位,可以产生网站按地域的访问情况,同时对ip的统计,也可以对一些可能的攻击或者黑客行为进行识别。

  • 抓取情况分析:搜索引擎的爬虫通常会设置agent字段,通过分析agent字段,可以得到网站一天被百度、谷歌等搜索引擎抓取的次数,以及哪些网页经常被spider爬过,这也是SEO的基础。


2:一些BI统计工具

目前市面上一些开源的工具可以使用,比如metabase报表统计工具,可以直接进行转化为图形化类型,行行统计分析等。

业务分析方面还没有任何基础的公司来说,Metabase 也许是一个不错的开始



流量导向的业务

主要分析的是:用户是谁,用户从哪里来,来了之后做什么操作,有没有达到用户的目的。

工具可以选择 谷歌分析 百度统计

百度统计为例:

1:用户是谁?受众分析,对用户有一个整体的分析

找到适合业务的数据

受众的特征:用户画像,年龄地域使用型号职业兴趣分布,这部分数据不止是自己业务的数据,也有来自于百度的数据相结合的。

     根据用户使用的浏览器和手机型号和分辨率等,方便技术对系统的更新提供一个优先级的参考,更能好的优化系统。


2:用户从哪里来?

   内容来源,渠道来源。

   直接访问,自然搜索,引荐流量,社交流量等

截图中是最重要的数据分析,来源媒介所统计出来的用户数。

更精准的网站流量来源,更清楚用户的来源。

3:用户来了之后做了什么?

事件行为分析

可以在后台关键节点进行埋点进行统计

对页面的一些交互行为进行埋点分析等。

页面分析:着陆页,退出页等

页面路径(行为流):可以看到用户的整体转化,页面的流失率等

使用习惯:使用频率 访问深度 使用时长 使用间隔等

4:有没有达到用户的期望


分析用户在使用应用时的核心路径转化效果,需要监控转化漏斗的每个关键步骤的用户流量,分析步骤之间的流转关系,通过尽可能提升每个步骤的转化率,实现产品核心转化的整体提升


内容导向


以质量为第一要位

主要解决的问题集中在:

我目前哪些资源正在被消费

哪些人在消费

我内容的表现质量如何

也可以使用百度统计

每个内容的浏览量 浏览质量 停留的时长

可以针对某一个具体的页面进行分析,来展示和内容有关的指标数据

针对页面的访问数据,优化内容的质量,从被消费的角度来解决内容导向的数据。



用户导向的工具

主要来解决什么?

    单个用户来了要干什么?用户的留存问题?用户在哪流失的?用户是什么样子的?

1:工具mixpanel。

Mixpanel是一家数据跟踪和分析公司,允许开发者跟踪各种用户行为,比如用户浏览的页面数,iPhone应用分析,Facebook应用互动情况,以及Email分析。从今天开始Mixpanel将允许开发者和公司向自己的客户提供Mixpanel的分析数据。 MixPanel平台实际上给网站用户提供了一个即插即用分析功能。开发者在网站中插入几行代码,然后用户就可以访问MixPanel的各种即时分析数据。该平台可以跟踪用户的评论数、订阅者数、like次数、分享次数、页面浏览数量等

主要方法就是track,一个用户的活动信息流

单个用户很清晰的信息流可以=明确用户的路径

单个用户单个行为留存的影响,可以具体到明确的节点观察用户的行为。

同一行为用户的不同场景不同时间段的用户行为

转化漏斗查看流失情况

用户画像



mixpanel主要是针对单个用户更详细的行为分析,百度统计中也有用户的行为,用户的留存和用户的转化率行为,则主要侧重于整体的统计分析


工具主要是辅助行为,可以在业务的基础上多种工具相辅助。


2:工具appsee,inspectlet

主要屏幕录像和行为序列观察

可以完整的观看用户使用app和web的时候的录像

形象直观

可以更好的记录用户的行为轨迹。



业务导向的工具

随着互联网业务的发展,更多的开始倾向于业务的发展,同时也有更多的工具开始关注业务本身的发展


业务导向更多的关注三个问题:

业务流程是否顺畅

业务规模/频次如何

异常原因何在?


工具可以使用神策数据

关注我们的业务流程是否顺畅,在一些关键的节点进行分析转化,比如神策中可以添加时间分析的节点来让我们可以有一个直观的显示。


例如互金平台的关于投资人的一系列流程中:注册--开户--绑卡--充值--投资--回款查询的流程中可以针对埋点进行我们后续的业务分析。进行一个全局的查看

当我们需要对摸一个业务流程进行查看时,针对流程的转化率时候就需要使用漏斗分析

漏斗就是一个串行事件,只有发生了第一步才会有第一步发生,所以此时只要设定好条件,进行事件的设定,就可以进行分析

比如一个理财购买的流程,针对一个转化期,在业务流程中设计转化的步骤,设定触发条件,根据业务的实际场景进行设计。



在业务的真实的场景下,我们也可以查看某些用户的真实路径(用户路径),通常是设定一个起始路线,从开端让下延伸,可以看到一些用户比如老用户经常查看的路径选择,这样我们就可以针对行为来进行精准的推荐。


于此同时我们也可以看到

一个业务指标可以从不同的维度进行分析,从不同的角度分析问题,分析数据背后所隐藏的业务含义,分析背后的逻辑,这也是数据分析的一个魅力。