标点符(钱魏 Way)

实时统计到底有多重要?

最近的一个项目把先前数据清洗工作从原先的1小时清洗一次,处理成每10分钟处理一次。汇报的时候被问到实时数据到底带来了哪些价值?这。只能说是个值得思考的问题。

对于任何一个关注数据的人来说,总是期望越实时越好,更有甚者,期望可以预知未来(IBM就在通过数据研究未来20分钟内将会发生什么)。每个人或多或少存在一定的控制欲,他们期望能够对网站的当前状况了如指掌,知道每个小时甚至每十分钟的变化情况,这样的心理无可厚非,并不是说有需求我们就有做项目的原因。除了需求我们更需要关注的是项目的价值。项目的投入产生。

首先要说的是投入,说到实时数据肯定需要更多的资源,点击流的数据不能直接用来呈现,重要的是中间的计算过程,对数据进行分类汇总和技术,然后形成指标和报告。要在短时间内完成这些操作一定需要一定技术能力的服务器或服务器群组。带来成本上的上升。

再说产出,有了实时数据你很可能觉得一些很炫的功能可以实现,比如可以制作实时的趋势图。这是一个很能证明技术人员能力的技术活,很多技术人员也欣然的会去做这方面工作。有了实时的趋势图我们能做什么呢?比如你知道今天的这个时间节点网站的访问说突然下降了?我们可以采取什么方式去调整呢?我们有啥预案呢?还是久这么让他这样吧,知道总比不知道好。(另外网站的实时访问量的数据可能从运维那了解更加方便)。所以产生几乎为0.

另外从另一个角度来说,数据之所以重要是因为最终的分析,而实时数据大部分只是用来统计,起不到分析的效果。所以对于分析实时与否关系度不高。置于拿实时数据来做营销,我也觉得不太现实。

关于实时数据到底有没有用?他是否会带来负面的营销《Web Analytics: An Hour a Day 》这本书数也有描述。其中作者的观点为:

  1. 不要一味追求数据的量,更应该注重数据的质,并通过有效的分析来体现数据的价值;
  2. 不符合10/90的原则,实时数据在获取上的成本显然无法和分析价值达成1:9的比例;
  3. 过多地关注实时数据会在分析工具的选择上造成拘束,无法使用真正优秀的网站分析工具;
  4. 技术上的系统资源占用、任务调度以及复杂的流程;
  5. 在某种程度上可能增加数据的不准确性。

对于实时数据,当一个公司真的具有快速的分析能力快速的决策能力快速的执行能力时,那么实时的数据才能创造其价值。如果只是为了看实时数据而进行实时统计,而不是根据实时数据做出相应的action,那么实时数据就是华而不实的表现。

有的人可能会说实时数据可以利用在相关推荐上,其实不然,目前的大多数相关推荐只是做到实时匹配,后端的推荐内容都是通过历史数据事先生成好的。目前我唯一遇到的一个使用实时数据的是来自于一个统计工具,当我访问其网站的时候主动弹出对话框询问购买事宜等。

参考:http://webdataanalysis.net/personal-view/real-time-data/ 

码字很辛苦,转载请注明来自标点符《实时统计到底有多重要?》

评论

  1. 关注统计分析 #1

    非常同意bdf的观点实时统计的意义最重要在于“根据实时数据做出相应的action”,最关心的比如:1.及时与客户沟通,促成销售。2.网站的实时访问负载情况,对运行状态实时监控 3.网站的健康状态情况,一旦出现问题及时发现并解决。4.用于广告个性化推荐。等等。。。

    回复
    2012-11-9
  2. 关注统计分析 #2

    对于《Web Analytics: An Hour a Day 》中
    “3.过多地关注实时数据会在分析工具的选择上造成拘束,无法使用真正优秀的网站分析工具;
    5.在某种程度上可能增加数据的不准确性。 ”
    表示并不苟同:是否使用实时统计完全确定于用户自身对数据所要达到的目标需求。和是否使用真正优秀的分析工具无关。难道做到实时的统计就一定不是优秀的分析工具?
    另外,实时的统计在哪种程度上增加数据的不准确了?非实时的统计其实更可能增加数据的不准确性,呵呵。

    回复
    2012-11-9