数据分析中常用的数据模型

0 sec read

一、抽样分析模型

建模方法

首先确定统计的时间段,暂定为15天;从数据库中随机抽取若干名用户作为分析样本建立分析模型,模型图中假定抽样人数为100人,15天内最高使用量为200最少为15,在横坐标轴依次画出每人的使用量立柱图;然后向右侧画出最高点和最低点的水平引线;然后垂直划线连接水平线,得到上下交点之间的线段,分别在线段的中点和三分点处水平画出“中分线”“上分线”“下分线”。

分析方法

根据立柱图的分布比率确定哪条线为“多”“少”的分割线;

  1. 高柱和低柱比较均衡,则以中分线为分割线;
  2. 普遍偏高,少量低柱,则以上分线为分割线;
  3. 普遍偏低,少量高柱,则以下分线为分割线;

优点:统计建模方便快捷;

缺点:不能获得准确的宏观数据,仅获得近似的参考数据。

二、数据区间对比分析模型

建模方法

假定统计时间段为15天,抽取10000人,分别统计他们的使用量,假定最多使用量为200,最少使用量为0;模型的横坐标为使用量,纵坐标为发送人数;在横坐标上,以10条为量级,从少到多依次画出不同数量区间的发送人数立柱图,连接主图顶部重点,得到人数波动曲线。

分析方法

  1. 波动曲线的顶点和与顶点最近的最低点,即为使用量“多”和“少”的分水岭,连接两点,取中点画垂直线,即得到二分法的临界线,左侧为非活跃用户,右侧为活跃用户。如图示
  2. 根据柱状图在不同量级的分布状况,也可以采用多分法细分用户类型,如图示。

三、对比分析模型曲线类型分析

利用“数量区间对比模型”分析,不仅能得到分类用户量级标准、人数、和使用量数据,通过分析使用量曲线类型,可以得到产品和运营的宏观印象。以下对四种典型的曲线类型进行分析。

常见状态(产品研发和市场发展的初期)

  1. 有基本稳定的用户群
  2. 缺少优质用户,拔高乏力
  3. 缺少高粘度产品(功能)
  4. 基本功能还行,除了基本功能,别的不爱用

维持状态(市场发展中后期)

  1. 通过若干时间的经营,产品有一定影响,同时拥有少量fans
  2. 对初级用户的引导不够,致使中间用户空虚
  3. 产品本身或有某种缺陷,不为多数人接受,只有少数人突破瓶颈,习惯产品才成长成高级

理想状态(初、中、后期)

  1. 市场发展势头良好,用户上手快,越用越熟练,越用越喜欢
  2. 证明产品功能,用户教育俱佳
  3. 需加大对潜在用户的宣传力度,扩大用户数

严峻状态(初、中、后期)

  1. 市场发展形势不客观,用户浅尝辄止,流失严重
  2. 产品存在重大缺陷或基本功能设计实现欠佳,无法留住用户
  3. 宣传引导力度不够
打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

KNN算法实战:验证码的识别

识别验证码的方式很多,如tesseract、SVM等。前面的几篇文章介绍了KNN算法,今天主要学习的是如何使用
3 min read

阿里实时计算Blink核心技术

实时计算in阿里巴巴 实时计算在阿里巴巴内部应用广泛。随着新经济体的出现与发展,技术的革新和用户需求的提升,人
1 min read

京东图计算系统JoyGraph

图计算简介 图计算中的图英文是Graph,用英文完整的表达就是Graph Computing。图计算是研究客观
1 min read

发表评论

电子邮件地址不会被公开。 必填项已用*标注