即使不会高深莫测的机器学习,你照样可以利用统计学来预测用户流失。 什么是用户流失率?我们为什么需要关注用户流失率? 简单来说,用户流失率是指用户的流失数量与全部使用/消费产品(或服务)用户的数量的比例,是用户流失的定量表述,以及判断用户流失的主要指标,直接反映了产品的市场接受程度如何,以及运营工作的好坏。
一般来说,这个指标用在“订阅型产品”的情形居多,如信息订阅类App“锤子阅读”、绝大多数的在线SaaS产品,甚至传统的牛奶订购。由于留住当前的用户要比获取新用户来的划算,所以预测流失率的目标在于: 预测用户将会在哪个时间点离开(在订阅期结束前),在合适的时间点对这些用户施加影响,挽留他们,如通过短信、邮件或APP,利用超低价商品吸引回访或者专属优惠券等,这些策略对于一些流失用户是很有效的! 接下来,笔者将利用简单的统计学知识,介绍一种基于用户不活跃记录的用户流失预测模型。该模型在不使用机器学习算法的情况下,可以给出一个容易理解的用户流失预测,以便我们对将要离开的用户有一个相当准确的洞察。 废话不多说,进入正题吧~ 1 用户活跃的操作性定义 在我们正式开始预测用户流失率之前,我们需要记录用户的历史活跃情况。做这个的目的在于,了解用户是否在使用我们的产品或服务。那么,问题就来了,用户的“活跃”该做怎样的操作性定义(即根据可观察、可测量、可操作的特征来界定变量含义的方法)?实际上,“用户活跃”的定义取决于你的业务背景,跟产品或者服务具体场景密切相关,不同类型的产品对“用户活跃”有不同的定义。 以新浪微舆情的“信息监测”为例,它是一款订阅型的社会化大数据产品,用户通过设置各种关键词组合来检索相关信息,然后选择邮件或者客户端订阅,通过自定义的接收频次来准时收取订阅信息。
对于这款大数据产品来说,“用户活跃”可以这样定义---如果一个用户是活跃的,那么,ta在指定时间段内(分析的时间单位取决于分析者对业务的理解,可以是天、周、月、季度或年),应该包含如下付费、使用或者互动行为: 该用户对“信息监测”的订阅尚未过期; 该用户在web端或者移动端登录产品页面; 该用户使用了产品的部分或全部功能,如基于信息源或者地域的定向监测功能; 该用户在此期间产生了一定消费,如文本数据下载、订阅续费、定制报告等; 该用户在此期间对该产品有各种反馈,包括投诉… 对于这款产品来说,以月份为单位来分析用户行为是很有意义的---因为该产品最短的订阅期是一个月,最长的订阅期是一年。 一旦清晰的界定了“用户活跃”的定义,我们就可以用这些操作性定义来对每个月份的用户(不)活跃情况进行编码,利用二进制值(0,1)---假如在X月份,用户是活跃的,将ta的活跃值设定为1,否则设定为0。 2 建立“用户不活跃档案” 现在,对于每位用户,我们有了一个以月为单位的“活跃标记”,接下来我们以此为基础,建立起“用户不活跃档案”。这意味着,对于每个用户,笔者想对他们连续不活跃的月份数进行计数统计。 在这里,笔者选择了一年的“分析窗口”(也就是把12个月作为分析的时间范围),将“活跃档案”和“不活跃档案”以表格的形式呈现---蓝色表单显示每位用户在各个月份上的活跃记录,绿色表单则显示用户的不活跃记录。根据用户在此时间段内可能出现的活跃情形,笔者枚举出3种典型用户,如下表所示:
用户A:该用户在刚进入“分析窗口”时是活跃的,然而在5月变得不活跃(也就是说,5月份是第一个不活跃的月份)。接下来,这个用户的不活跃状态持续到了12月,也就一直持续到了“分析窗口”的末尾。因此,从5月到12月,“用户不活跃档案”对用户连续不活跃的月份进行逐月累加的计数统计。 (责任编辑:admin) |