商务服务
06 用户画像效果评估&迭代
2024-11-02 20:54
,大数据时代老生常谈且又长久不衰的话题,公司都在搞,文章满天飞,在这个人人都喊“数据驱动业务”的时代,你不懂用户画像,不搞用户画像,你都不好意思跟别人聊(chui)业(niu)务(pi)。但是,用户画像是不是一定要搞?为什么要搞?不搞可不可以?如果一定要搞,用户画像耗时耗力,怎么才能把它真正落地到业务?而不是开发了N多的标签,放在数仓里吃灰?搞之前多问几个为什么,你会发现落地的可能性就大了很多。在写这篇文章之前,我也拜读了不少用户画像相关的文章,但是很可惜,很多文章可能搞错了一点,那就是用户画像是业务,不是技术!用户画像一定是来源于业务,并且最终落地到业务上去的。那些不管业务需求、标签体系,上来就是用户画像怎么实现的,这无异于吃饭点了一盘土豆丝,大厨埋头给你搞了一道佛跳墙,然后跟你巴拉巴拉扯做佛跳墙牛叉的108步骤,呵呵,只能说,技术自嗨,最为致命,一切不以需求为出发点的应用,都是在耍流氓。这也是写这篇文章的初衷,用户画像是什么?一般在什么场景下会用?我们的业务场景是不是真的需要这个费时费力的大家伙?如果真的需要,业务需求是什么样的?标签体系如何搭建和开发?开发后如何使用和进一步迭代优化?只有把这一步步想清楚做仔细,才能最终落地到实际的业务中,发挥用户画像真正的价值。

06 用户画像效果评估&迭代

用户画像是指根据用户的基本属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。每一个标签及标签权重是表征用户偏好的一个向量,一个用户可以理解为多个偏好向量(标签)的和。–来自某度的看不懂的解释

说人话!!!用户画像是基于你在互联网上留下的种种数据,将这些数据在你知情或者不知情的时候,通过数据加工,产生的一个个刻画你兴趣偏好的标签组,这就是用户画像。

那么接下来的问题就是:用户画像的使用场景有哪些?

分群运营是用户画像最常用的场景,通过用户画像的标签筛选,筛选出不同的用户群,通过push或弹窗配置平台,对不同的用户群实现精细化运营。

比如我们可以把过去30天购买金额大于500、活跃天数大于10天、最近一次活跃间隔在5天以内的用户定义为高付费潜力用户群,进而对这部分高潜用户进行精细化运营。

分层越来越精细,用户群的粒度会越来越小,最后会小到一个个体。我们针对每个个体去做push或者弹屏,运营效率还是太低了。基于用户画像的自动化触达就发挥了作用。比如针对上一步我们创建的高付费潜力用户群,我们通过App Push的方式发送一张满200减40的优惠券。

以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,可以有效提升转化率。我们先看一下用户画像的用户偏好表存储表(用户画像有很多这种标签,下面我们会详细展开具体讲解):

当我们购买完成一个带有标签1,标签2,标签3的商品后,一般在购买完成页会有交叉销售场景,我们通过用户偏好表的标签及权重,基于用户相似或商品相似的协同过滤算法,推荐用户可能喜欢的其他商品。

根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用量、分布,分析不同用户画像群体的分布特征和走势等。

另外,还可以通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析。比如我们经常听到马爸爸拿一些标签,说这个地方人喜欢买什么?为什么喜欢买?那个地方人都是买什么型号?

大学刚毕业时,初到一家互联网公司做数据运营,某天领导突然给我一个任务:做一个APP用户画像报告。当时我有点懵,一是我以前确实没接触过用户画像,概念不太清楚;二是接到领导的任务后我只知道要做一个用户画像,至于这个用户画像到底用来做什么我并不清楚。

在这个情况下,我查阅各种资料,问同学、问朋友,还找了一些高大上作图工具,最后总算是完成了任务,得到了公司认可。但用户画像到底给公司带来了什么价值,给运营决策起到了什么作用并不清楚,这其实就是典型的随大流,为了做而做。

这种面子工程非常常见,大家可以看看自己公司的情况对号入座,因为大家都在谈论用户画像,于是很多领导也开始要求做用户画像,别人有我们不能没有,但用户画像到底为了解决什么问题并不清楚,自然而然就没有落地的可能性,更不可能产生价值。

所以为了解决这个问题,在最开始的时候就要想清楚,我们是否真的需要用户画像?只要想清楚一下三个问题,就可以得到答案。

1、我们业务中是否有能用到用户画像的场景?比如用户分层、智能触达和个性化推荐。

2、如果有使用场景,是否一定要通过用户画像实现?用户画像本身是一个非常浩大的工程,十分耗时耗力,我们有没有其他替代的方案?

3、如果必须要搞,那我们给用户打了标签进行分层后,我们有没有对应的产品服务或运营方案?分层后没有对应的action,用户画像还是难以落地闭环。

以上问题如果没有想清楚,就盲目搞用户画像,结果很可能就是弄出来的用户画像远离业务,没有实用价值、无干货,被业务部门讥讽为“大而无用”的鸡肋产品。

所以,在规划用户画像平台时,一定要有目的性和场景感,不能只做表面文章,而不重视实际应用价值。

这里需要强调的一点是:不是因为我有了用户画像,才能驱动和提高业务。而是为了驱动和提高业务,才需要去建立用户画像。这是很容易犯的因果倒置的错误!

以上问题没有想清楚,千万不要动手开发,如果以上的问题想清楚后,还是要搞,那我们就要认真筹划,用户画像怎么做才有价值。

已经确定要搞用户画像,接下来就要思考:怎么搞才能业务落地?怎么搞才能产生价值?

刚开始做用户画像的时候,业务部门摇头晃脑的说:“我们要基于用户画像,详细深入的了解用户,比如用户性别,年龄,地域,喜好,消费习惯,……这样我们就能精细化决策了”。然后数据部门夯吃夯吃搞了几个月,打了30000个用户标签,还得意洋洋的跟领导汇报:“我们的用户画像大数据建设取得长足进步”。

然后项目第一期汇报会上,数据部门得意洋洋的讲到:

我们的用户男女比例6:4华南地区占比30%华东25%购买A产品占比50%巴拉巴拉巴拉

业务部门一个白眼抛过来,

我早知道了!我们的用户都是这样的呀!然后呢?你做这有啥用?

当然还有更惨的,

就是你贴个“忠诚用户”的标签,业务方说:哦,既然那么忠诚,就不做啥动作了。结果丫下个月不消费也不登录了!你贴了“A产品爱用者”的标签,业务方推了A产品,丫没有买!业务方怒气冲冲找来算账:“这用户画像一点都不精准嘛!”

于是,项目彻底凉凉。问题到底出在哪里呢?你丫的根本没有了解业务的需求啊,业务方想吃个简单的酸辣土豆丝,你吭哧吭哧跟业务方扯佛跳的108道工艺,或者虽然你了解了业务方的需求,但是这个标签你打的不准啊,我要的是酸辣土豆丝,不是青椒土豆丝

所以要想用户画像能落地,以下几个步骤尤为关键。

在规划用户画像时,一定要有目的性和场景感,不能只做表面文章,而不重视实际应用价值。再次强调:不是因为我有了用户画像,才能驱动和提高业务。而是业务有需求,才需要去建立用户画像!

第一步也是最为关键的一步,一定要搞清楚业务方的需求是什么?要解决的问题是什么?

举个栗子,一个内容型社区近期准备上线一个知识付费模块,通过该模式进行商业变现,想通过用户画像将精准的内容推荐给精准的人,进而促进付费变现。基于此,可以把业务目标和要解决的问题梳理如下:

需要选择哪些标签?为什么要选择这些标签?其他的标签为什么不可以?选择标签有哪些误区?

我们都知道有用户基础属性的标签,也有用户的各种行为标签,我们需要在这个大的框架下不断细分完善标签体系。但是为什么要选择这些标签,比如用户的购买行为标签中,为什么选择新、老用户这个标签呢?因为我们的店铺针对未消费的新用户会有新人红包进行引导消费,所以要区分新老。对于老用户,我们为什么要选择最近一次购买时间,购买频次和交易金额作为标签呢?因为可以通过RFM对用户价值进行分层,进而进行精细化运营。

具体的标签体系搭建步骤我们会在第三部分中具体介绍,这里先不展开。

不同标签将用户划分为不同的用户群,但只有对不同的用户群制定针对性的运营策略,用户画像才能落地有价值。

举个栗子,在RFM模型中,有的同学不清楚用户交易金额M如何确定阈值,进而划分为高和低呢?是消费1000元算高还是10000元算高,有些同学因为这个纠结不已,为什么不反过来想呢?阈值设为1000或者2000我对应策略是什么?如果没有对应的策略,我划分了高低有何用处呢?这个时候不妨问问产品和运营的同学,你会发现运营上为了促进价格敏感的低客单价用户有满1000减200的满减活动,对于购买能力较强的金主爸爸,有满2000送独家定制的钻石会员卡,可以享受超级VIP待遇,以终为始,这个时候用户画像是不是更容易落地了?

已经明确了业务需求以及不同画像用户的对应策略,下面就可以开始用户画像

的构建了,主要分为标签体系搭建和标签权重计算,简单来说,就是用哪些标标签表征用户,用户在各个标签上的偏好程度如何。

理解用户画像,最直接的方式便是将画像信息标签化。信息标签化是用户画像系统用信息化手段刻画用户全貌的手段,也是用户画像系统中最核心的环节之一。我们通过构建丰富的标签,获取相关的标签数据,才能够刻画和洞察用户的兴趣和偏好。

1)标签体系的构建方法

构建标签体系的主要有两种方法:

方法一:结构体系化构建(常用)。通过划分标签类别和维度,从刻画用户的完整维度出发构建维度体系。这样的划分方式结构清晰、逻辑性强,能够比较全面的梳理出所有的信息维度,但受限于实际数据,落地较困难。

方法二:场景效果化构建。结合人群定向的实际需求,通过用户在不同行业领域或平台上的行为记录,对用户的心理需求和倾向性进行描述。这种方式目的性强,人群定向也较为精准,容易跟实际应用场景接轨,落地到具体的业务目标,跟实际数据结合较好,但标签会跟随消费趋势、娱乐热点等的变化波动。

2)标签维度的设计思路

标签维度设计上不仅需要清晰直观,还需要考虑多个场景化使用需求,同时兼顾多种产品运营需求及商业化投放需求。

标签设计上需要在了解业务方规划前提下,对标签的使用上有前瞻性的设计。

画像数据的来源一般有:用户调研、用户行为数据获取、客户端/服务端数据内容上报、第三方数据平台、基础数据及爬取第三方数据等。

ps:此处需要特别关注以下两个方面:

标签粒度:粒度过粗不利于运营使用推广,很容易脱离业务本身,对行为数据进行过度提炼造成信息丢失;而粒度过细则会导致标签覆盖率过低、耦合运营业务推广。

标签数据:标签数据的获取直接关系到实际使用价值,需要在可获取的数据范围内进行,扩宽数据源难度较大,通常需要优先进行数据可行性的统计。

3)标签体系的基础框架

不同业务的画像标签体系并不相同,需要我们针对性的提炼出来。有一种比较简易的方式是:我们可以先找出一些通用类画像标签,然后再根据实际场景和需求补充业务类画像标签。这样得到的标签体系会相对比较完整,也能够随业务变动及时调整优化。

通用类画像标签体系(参考):

业务类画像标签体系(以某电商公司为例,参考):

按照以上的框架将用户画像信息标签化,能更好的根据实际需求去获取相关的用户画像数据。但是,需要注意的,产品用户画像的分析并不是要用到所有的标签数据,并且越是完整的标签体系,落地是越是困难。而且,更大的难度在于如何精准描述用户特征。因为只有用户特征描述越精准,我们得到的用户画像才会越清晰,在实际应用过程中的帮助越大。所以如何精确计算出用户的标签的权重就成为重中之重。

用户在不同标签上的偏好是通过权重来反映的,权重越高,说明用户在该标签上的偏好越强,反之亦然。而且,这个权重会随着时间变化而变化,标签权重的计算主要通过TF-IDF算法。

1)TF-IDF算法思想

用户标签权重,是由该标签对用户本身的重要性(TF-IDF权重)与该标签在业务上对用户的重要性(业务权重)两者共同决定的,

即:用户标签权重 = 业务权重* TF-IDF权重。

TF-IDF权重是通过TF-IDF计算得到的,业务权重是通过用户对标签的行为来决定的,

即:业务权重=行为类型权重 * 行为次数 * 时间衰减

2)简单理解

就是用户对一个标签的重要程度,会用不同行为来表达,不同的行为有不同的难度,比如:对于电商用户的行为难度来说,支付>收藏加购>分享>浏览>点击。不同行为就会有不同的权重,行为越难代表越喜欢,权重越高,同理行为次数越多也代表越喜欢。

标签对这个用户来说越稀有代表越喜欢,喜欢程度会随着时间的增加而逐渐降低,通过这个公式计算标签权重。

3)行为类型权重

用户浏览、点击、搜索、收藏、分享、下单、购买等不同行为对用户而且有不同重要性,一般根据业务经验或者使用层次分析法定义一个基本行为权重。

4)行为次数

这里的行为次数表示每一种行为的次数。

5)时间衰减

时间衰减是指用户的行为会随着时间的流逝,用户偏好会不断减弱。在建立与时间衰减相关的函数时,我们可套用牛顿冷却定律数学模型。

牛顿冷却定律:较热物体的温度F(t)是随着时间t的增长而呈现指数型衰减,其温度衰减公式为:

F(t)=T*exp(-α*t)。T:初始温度α:衰减常数即冷却系数,是自己定义的数值,一般通过回归可计算得出t:时间间隔

冷却系数如何计算呢?

冷却系数是自己定义的数值,一般通过回归可计算得出。例如:初始偏好设置为1,1天后的偏好为0.85,即 0.85=1*exp(-α*1),求得α=0.16,这个就是标签的冷却系数。

在这里我们用Python语言来模拟一下这个冷却曲线:

import numpy as npimport matplotlib.pyplot as pltimport matht = np.arange(0,100)

plt.plot(t,1*np.ma.exp(-0.16*t))

plt.title(‘偏好度冷却趋势’)

plt.ylabel(‘偏好度’)

plt.xlabel(‘时间(天)’)

plt.show()

6)举个栗子

用户“小美”,对于标签“口红”的权重计算:假设我们之前定义冷却系数α=0.16,基于业务经验或通过层次分析法假设行为类型权重:点击(0.1)、浏览(0.2)、分享(0.5)、收藏加购(0.6)、支付(0.9)。

小美的每日行为表:

2021-05-01:

2021-05-02:

2021-05-03:

用户“小美”对标签“口红”每天的权重:

2021-05-01:2*0.1+2*0.2+3*0.6+1*0.5+1*0.9=3.8

2021-05-02:3.8 *exp(-α*1)+1*0.1+1*0.2+2*0.6+1*0.5+0=5.06

2021-05-03:5.067718*exp(-α*1)= 4.32

这样算下来是不是就很清晰了。

在初步形成了用户画像后,并不能直接交给运营、业务人员直接使用,还需要评估用户画像的准确性,以及交付使用后不断迭代用户画像,以获得更加精准的用户画像。

评估方式主要分为3种:逻辑验证、A/B test、用户回访。

逻辑验证:也叫做交叉验证,在完整的用户画像标签体系中,一些标签往往会存在一些相关性;比如用户的累计在线时长越长,订单量通常会越高;比如购买3C产品的用户群中,男性用户数通常大于女性用户数;另外,如果公司购买了第三方机构的数据,也可用于交叉验证。

A/B test:也叫做灰度测试,以上述的忠诚度为例,保证对照组、实验组的流量相同;对实验组的用户,进行提升忠诚度的运营策略(促销活动、积分奖励等);如果实验组的用户,忠诚度相比对照组用户,有一定提升,则可以认为用户画像比较精确。

用户回访:最朴实的评估方法,比如用户画像系统,定义了10万用户为低忠诚度用户;此时从中随机抽取1000人,交给客服,进行回访。根据回访结果,判断用户画像结果是否准确;甚至可以对回访结果进行文本挖掘,形成词云,查看消极词的占比。

本文很长,所以最后还是要做个总结,区别于其他文章单纯阐述如何构建用户画像,这篇文章系统而全面的分析了用户画像是什么?是否一定要搞?怎么搞?层层递进地说明了:什么是用户画像?→ 什么场景会用到用户画像?→ 我们是不是真的需要用户画像?→ 用户画像怎么搞才能落地?→ 能落地的用户画像的构建步骤 → 用户画像的效果评估&迭代。

    以上就是本篇文章【06 用户画像效果评估&迭代】的全部内容了,欢迎阅览 ! 文章地址:http://keair.bhha.com.cn/news/42.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 康宝晨移动站 http://keair.bhha.com.cn/mobile/ , 查看更多   
最新文章
5款文案自动生成器,高质量创意文案一键为你生成
  在当今竞争激烈的内容创作领域,每一个字、每一句话都承载着巨大的价值。对于创作者而言,文案自动生成器的出现
SEO搜索引擎优化怎么做?全面指南让你快速上手!
在当今的数字化时代,SEO(搜索引擎优化)已经成为企业和个人提升在线存在感和吸引目标用户的关键手段。无论你是初学者还是有经
Apple 苹果 iPhone 13系列 A2634 5G手机 256GB 绿色
iPhone 13 边缘采用平坦设计、配备独家超瓷晶面板,支持 IP68 抗水性能,拥有绿色、粉色、蓝色、午夜色、星光色和红色可选择。屏
【A6搜狗手机输入法下载】海尔A6搜狗手机输入法12.1.1免费下载
搜狗输入法,拥有超大中文词库,输入更加精准,智能。搜狗智能旺仔带你用表达,斗图,妙语,输入更加有趣。******特色功能******
制氧机十大品牌排行榜:吸氧机技术排名TOP 3
制氧机是一种重要的医疗设备,用于治疗呼吸系统疾病。随着科技的不断发展,市场上出现了众多品牌的制氧机,伴随着人们对健康的重
【瑕疵检测】基于matlab GUI OTSU织物疵点检测【含Matlab源码 860期】
⛳️座右铭:行百里者,半于九十。 更多Matlab图像处理仿真内容点击👇 ①Matlab图像处理(进阶版ÿ
微信公众号文章信息(阅读量、在看、点赞数)获取
  实现这一个功能主要用到了selenium、mitmproxy和wechatarticles,利用selenium可以实现脚本模拟浏览器访问,mit
上海九院口腔科怎么样?医生排名名单、技术特长介绍、真人种牙术后评价~
此价格信息为当地市场参考价,通过用户反馈大数据整理仅供参考!机构实际价格以到院面诊为准!
'智能AI文章生成器:海外脚本与一键创作工具'
在数字化时代的浪潮中人工智能技术正以前所未有的速度改变着咱们的工作和生活途径。智能文章生成器的出现无疑为内容创作者们打开
微信推文重复率
论文免费查重庞大的数据库支持,论文免费查重拥有全球最大的比对库资源。其比对库拥有超过1亿篇的学术期刊和学位论文、1000多家的
相关文章