数据分析中常用的数据模型

0 sec read

一、抽样分析模型

建模方法

首先确定统计的时间段,暂定为15天;从数据库中随机抽取若干名用户作为分析样本建立分析模型,模型图中假定抽样人数为100人,15天内最高使用量为200最少为15,在横坐标轴依次画出每人的使用量立柱图;然后向右侧画出最高点和最低点的水平引线;然后垂直划线连接水平线,得到上下交点之间的线段,分别在线段的中点和三分点处水平画出“中分线”“上分线”“下分线”。

分析方法

根据立柱图的分布比率确定哪条线为“多”“少”的分割线;

  1. 高柱和低柱比较均衡,则以中分线为分割线;
  2. 普遍偏高,少量低柱,则以上分线为分割线;
  3. 普遍偏低,少量高柱,则以下分线为分割线;

优点:统计建模方便快捷;

缺点:不能获得准确的宏观数据,仅获得近似的参考数据。

二、数据区间对比分析模型

建模方法

假定统计时间段为15天,抽取10000人,分别统计他们的使用量,假定最多使用量为200,最少使用量为0;模型的横坐标为使用量,纵坐标为发送人数;在横坐标上,以10条为量级,从少到多依次画出不同数量区间的发送人数立柱图,连接主图顶部重点,得到人数波动曲线。

分析方法

  1. 波动曲线的顶点和与顶点最近的最低点,即为使用量“多”和“少”的分水岭,连接两点,取中点画垂直线,即得到二分法的临界线,左侧为非活跃用户,右侧为活跃用户。如图示
  2. 根据柱状图在不同量级的分布状况,也可以采用多分法细分用户类型,如图示。

三、对比分析模型曲线类型分析

利用“数量区间对比模型”分析,不仅能得到分类用户量级标准、人数、和使用量数据,通过分析使用量曲线类型,可以得到产品和运营的宏观印象。以下对四种典型的曲线类型进行分析。

常见状态(产品研发和市场发展的初期)

  1. 有基本稳定的用户群
  2. 缺少优质用户,拔高乏力
  3. 缺少高粘度产品(功能)
  4. 基本功能还行,除了基本功能,别的不爱用

维持状态(市场发展中后期)

  1. 通过若干时间的经营,产品有一定影响,同时拥有少量fans
  2. 对初级用户的引导不够,致使中间用户空虚
  3. 产品本身或有某种缺陷,不为多数人接受,只有少数人突破瓶颈,习惯产品才成长成高级

理想状态(初、中、后期)

  1. 市场发展势头良好,用户上手快,越用越熟练,越用越喜欢
  2. 证明产品功能,用户教育俱佳
  3. 需加大对潜在用户的宣传力度,扩大用户数

严峻状态(初、中、后期)

  1. 市场发展形势不客观,用户浅尝辄止,流失严重
  2. 产品存在重大缺陷或基本功能设计实现欠佳,无法留住用户
  3. 宣传引导力度不够
打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

使用Prophet进行时间序列预测

Prophet是Facebook开源的预测工具,相比ARIMA模型,Prophet真的是非常的简单。只要读入两
1 min read

采用时间序列预测股价变化

时间序列简介 在数学上,随机过程被定义为一族时间随机变量,即{x(t),t∈T},其中T表示时间t的变动范围。
5 min read

SARIMAX:季节性ARIMA

在先前的使用Python创建季节性ARIMA模型中,出现了SARIMAX模型。在上一篇的文章中并没有讲清楚SA
18 sec read

发表评论

电子邮件地址不会被公开。 必填项已用*标注