首页  ·  知识 ·  大数据
用户画像技术及方法论
姚凯飞  DataFunTalk  实践应用  编辑:阿里努亚   图片来源:网络
用户画像也是近几年比较热的一个词,不过很多小伙伴对于画像的认知还只是标签化的层面,或者只是利用其做一些简单的分群分析;如何全面地认知并做系统性地尝试,背后有非常多的点需要我们深思挖

用户画像也是近几年比较热的一个词,不过很多小伙伴对于画像的认知还只是标签化的层面,或者只是利用其做一些简单的分群分析;如何全面地认知并做系统性地尝试,背后有非常多的点需要我们深思挖掘。

image.png

首先我们来看一下什么是互联网公司的核心。鄙人的浅见是围绕商品、供应链、物流、营销活动等的整个购物旅程背后的用户体验

image.png


既然用户体验非常重要,那如何去度量和优化整个流程呢,那就是站在用户角度收集其在各个模块的数据,并利用统计、概率思维建模分析;在产品运营、增长过程中找到雪球效应的撬动点施以影响,最终建立起良性的闭环。

image.png

作为互联网从业人员,其实我们常有一些困惑,产品的用户是谁?他们是否满意?产品是否健康?有哪些问题?如何才能服务好我们的用户,并且让彼此的收益最大化?

如何去构建起更多用户使用的产品,如何创作一个更多用户喜欢的课程?就像小破站(B站)的成长中一直在解决问题,如何突破二次元的定义,如何将用户圈层拉开,如何让尽量多的人能在B站找到自己喜欢的内容,如何做到存量用户保有及增量用户拉取。当然肯定不存在每个人都满意的产品和课程,但是如何在现有体系下去最大化满意度呢?这个我觉得是大家希望得到答案的根本。

image.png

那其中的一个手段就是以增量用户拉取,存量用户数量和价值的保有为目标,利用大数据技术精准用户画像,并结合商品画像,解构用户及商品,精细化耕作,最终在重点目标客户群体上形成突破。比如电商猜你喜欢中的个性化推荐技术,万能的淘宝上有海量的商品几乎可以满足每个人的采购商品需求,但是如何让一个用户可以精准快速地找到是大问题,个性化是其根本,用户画像和塑造则是个性化的根本,希望可以让用户感受到产品为ta而造的满足感。

如何解构用户呢,举一个例子就是说当你很了解某一个人的时候,你跟ta一起去吃饭,你如果在之前历次跟ta的进餐中收集了ta喜欢及不喜欢吃什么(用户动态数据),然后ta的性格是怎么样的(比较犹豫)(用户数据),是不是喜欢吃辣(用户数据),然后你再结合有哪些菜、是不是辣的(商品静态数据),两端做匹配就可以提供更好的体验了。所以不是单单用户画像,商品画像或其它维度也是需要,最重要的是匹配。

image.png

然后我们来看看目录,第一部分是说what,就是什么是用户画像;第二部分是说why,为什么我们需要用户画像以及精细化运营;然后第三部分是how,我们如何构建商品和用户画像;第四部分是举例,是一些方法论的介绍;最后,我们做一个整体的总结。

image.png

01


什么是商品/用户画像


image.png

首先我们来看一下什么是用户画像,根据维基百科的定义,用户画像就是与该用户相关联的数据的可视化的展现,一句话来总结就是用户信息标签化。从用户海量的信息里面去找到一些标签,为用户去贴上这些标签,当然这些标签的来源就是一些用户的行为。

image.png


举个范冰冰的例子,客户这个实体通过客户信息的收集,映射到一个客户的画像,最终通过这些画像来建立认知,比如说范冰冰是一个演员,是一个女性,有参加过哪些电影节等。当然你会问那上面的这些标签有什么用呢?这会根据具体的业务场景来定,有些标签在X场景下它是没用的,在Y场景下则可能非常有用,当然这也提前说明了画像构建的过程肯定是需要与业务结合的展开。

image.png

image.png

比较常见的画像是我们需要建立平台客户群体化认知时,我们需要借助可视化的标签,我们看一下京东的一个食品用户画像。对于食品这个业务场景,平台上购买的用户他们是长成什么样的?比如性别比例,蓝领与白领占比,评价敏感的人的占比等,通过拉平垂类偏好用户画像与全站的对比,来寻找差异点和优化点。

image.png

举个例子来说,你是抢购秒杀频道的运营负责人,你通过类似的上述分析,找到了秒杀频道和全站的用户画像差异点,那有什么用呢?比如我们发现秒杀频道女性用户或者大龄女性用户,相对于全站占比高很多,然后我们通过全站分析出这类用户喜欢购买的品类是A、B、C;但是频道内我们发现几乎没有A、B、C这些品类的商品,或者A、B、C这些类目的价格段高了很多,甚至是大量的男性商品。那我们马上就找到了一个优化点,是否可以在该场景做一些品类和商品的调整进行一些测试,可能就会在测试中找到明显的提升。

再比如食品品类下的商品运营如何去拓宽自己的流量池,通过类似上述的分析,比如在一个某个频道发现有非常多的18-30岁的男性,并他们在平台有非常多的电子类产品的购买,结合你的专家知识,你的碳酸饮料是否可以考虑进入这个频道呢。

上面的是较直观的应用,进一步其实我们可以借助算法挖掘群体偏好(没有算法基础的可以略过),对频道内商品做进一步改造。比如我们通过算法可以对近N天频道内的用户,通过算法进行商品召回和排序生成全站他们购买的商品,再通过用户在频道的活跃度和频道LTV对这些商品通过embeding后的向量进行归约,形成最终的300或者500个商品池,这些商品是你典型用户的一个集合,可以与你现有的商品集合进行融合测试,会有不错的收益。用户消费购物非常复杂,需要根据具体的业务场景去展开的,上述方法不一定适用所有的业务,不同的业务场景需要做调整和适配。

image.png

顺便介绍一下什么是商品画像,可以简单的理解为商品画像如同用户画像一样,可以简单理解成是商品海量数据的标签,根据商品的特征、设计、功能、口味、波次、价位段、流行度、销售状况、促销力度、销售渠道差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、特点、场景、统计学要素等描述。

image.png

image.png

其实商品和用户画像有很多交集和互相交互的,比如商品有个标签是适用人群,比如女性或者男性,可能就是有很多女性用户经常购买,或者说用户经常购买某个品类或者某种颜色的商品,那用户就可以贴上类似的标签。商品有了标签,运营在做活动的时候,就可以根据活动首页和分会场人群定位,去选品、氛围塑造,比如时尚会场的商品池选取,比如对于履约不好(拒收、退货、低评分)的、高点击&低转化商品的控制。

02


为什么需要商品/用户画像


为什么需要用户画像呢?其实在用户使用产品的过程中,如果我们做了对的事情让用户的体验非常棒,然后其实我们就可以有不错的收益。但如果我们做了用户体验较差的事情,损失会非常巨大。

image.png

如何在企业商业化过程中与用户达成双赢是需要逐步来探索的,一种途径是通过数据去驱动决策,做到利益最大化,也就是这里分享的。通过用户和商品画像找到并更好地服务为你产品买单的那一群人。

image.png

image.png

通过初期形成的产品,形成了我们平台的一些忠实的客户,对于这部分群体的解读,就可以驱动产销配一体化。需求(用户)与供给(商品)两端的匹配GAP的存在,可以推动精准的供给体系构建,比如C2M、C2B的可能尝试。

image.png

image.png

宏观和微观上我们看看画像的作用,微观上主要是精细化,比如推荐、搜索、精准营销、定向投放、风控、定量和定性的分析、数据化的运营用户分析。宏观上来说就是具象化对于用户的认知,在探索用户足迹的过程中,建立市场细分和用户分群。

image.png

这里顺便讲一下商品画像的作用,商品画像的前台作用更多是在流量分发上与用户画像的match,关联后的一些推荐、精准推送等。比如用户标签为a类目的价格段偏好,然后商品画像也有价格段的标签,比如说用户偏好的是30-50人民币的连衣裙,然后这个商品是连衣裙并且正好是在30-50人民币的,所以可能相对其它价格段的商品而言,在这一维上更合理;接着再结合其它维度的商品和用户标签的match就可以构建更多的匹配维度。

而偏后端一些的维度,商品画像也可以带来非常多的帮助,可以去驱动后端的供应链。通过商品画像的历史情况(近期曝光、点击、订单、转化等),可以去做销量预估,进行备货、采购、越库、生产物流等等环节的优化。

image.png

对于统一建模预测分析,首先如果有了人口属性细分,比如说一些性别,年龄段等等,就可以去明确用户是谁,他在平台上面买了什么,为什么买;有了购买行为细分以后,可以去明确市场机会,市场规模等关键信息;再次是产品需求的细分,提供根据差异化的竞争的产品规格和业务价值,可以去做更加差异化的竞争,不做海量的库存,而是更精准、成本更可控;最后是兴趣态度的细分,通过用户画像可以去做不同的渠道的策略,定价的策略,产品的策略,品牌策略;比如渠道策略,我们可以通过分渠道归因并捞取对应用户群体,并观察各个渠道群体的差异,比如类目偏好、价格段偏好等的差异,在投放过程中进行商品池和投放策略的优化。

image.png

image.png

总结一下就是商品和用户画像很重要,两者是相辅相成的,在整一个用户体验过程中非常重要。


03


如何构建商品/用户画像


——以用户画像为例——


image.png

那到底如何构建用户和商品画像呢,这里可以提一个概念叫侧写师,电影中经常有一些概念就是侧写师通过观察和收集犯罪现场的信息(数据收集),去想象作案人的心理和案发时的动作(预测),并最终为破案带来机会(实施),构建用户画像的方法论与其类似。

image.png

第一步是收集数据,图中方法比较多,各有优缺点,不过目前主流的还是通过用户静态数据结合海量的平台用户行为数据的方式。通过埋点,我们可以看到用户在我们平台上看了什么商品,点了什么商品买了什么商品,将这些数据串起来,可以作为入口去理解用户,更进一步,通过一些统计、概率知识进行建模,比如说用户细分、生命周期划分、流失用户研究等,做深层次的挖掘。接下来我们来解构用户画像。image.png

主要是人口统计学属性、消费需求、购买能力、兴趣爱好、社交属性等。

image.png

用户画像的粒度简单来讲,比如年龄标签是20-30岁和21岁,这两个就是明显不同粒度的标签


image.png

image.png

再次就是可以从层级的角度来看,用户基本属性和行为标签为浅层用户画像,这些标签画像主要是收集就行,比如年龄,性别。第二层是稍作处理的汇总层,比如手机端大概什么时间活跃,经常购买的品类等。第三层是基于前2层可以做到营销的敏感度,社交关系,上网时间的预测;最后一个是更深层的,需要结合业务知识去做定制。比如保险领域的高中低价值、贷款需求程度,风险高低等。

image.png

网上找了一个金融领域的例子,比如根据活跃情况,可以区分活跃用户和流失用户,再根据时间窗口维度可以拆为48小时活跃和不活跃用户。简单的统计就可以为用户贴上各类的标签,比如过去12个月内累计订单超过20次为界限,可以划分为高低频用户等。不过多展开,可以自行阅读上图。

image.png

image.png

当然用户画像依赖的商品基础标签是必不可少的,比如用户服装偏好下有颜色偏好(白色),这个是通过用户历史的点击、加购、收藏等行为关联的商品所带标签的聚合,那其实底层商品的颜色标签是必不可少的。

接下来介绍的是一个构建方法论,但不是唯一方法论。

image.png

先从大维度来说,划分为动态和静态两类。比如说人口统计学的性别、年龄、地域、收入、生活习惯,是相对静态的,性别一般都不会变,年龄的话一年就涨一岁,然后地域的话也很少有大的变动,收入职业所处行业也不会有突然的变化,这些都可以划分到静态标签。而像用户访问设备、用户的48小时是否活跃、内容&商品消费偏好等属于时常在发生变动的,这些可以划入动态特征。

image.png

静态和动态的划分,其实是根据某个维度来定的,或者是在某个时间窗口内的。静态画像一般是实时性弱更新慢;动态画像变化相对更快一些,可以再时效性、空间上有差异。

image.pngimage.png不同的行业,不同的业务,也会有不一样的构建目标和方式。在这个过程中,通过业务应用的要素分析,去驱动标签维度的扩展,然后通过标签维度的扩展。然后我又可以去驱动业务。image.pngimage.pngimage.pngimage.pngimage.png上述图片介绍了常用的偏好标签建模的思路,不做过多展开,有兴趣的小伙伴可以私信交流。image.png那系统化的标签生产如何来做呢,可以参考上图,上图元素和参考了很多美团的做法,由于篇幅限制,这里不过多展开,后续的分享可以专门来将构建的细节。image.pngimage.png重点是结合业务,构建闭环,用数据来提升业务理解,通过业务理解来快速构建画像相关的数据体系。image.png

04


商品/用户画像的应用


第四部分我们来介绍一些画像的应用。

image.png

第一个我们介绍一下通过用户画像来做与竞品对比分析,在大维度战略调整和选择的时候,可以有差异化市场定位。根据用户标签进行市场细分和群画像分析,输出分析报告;帮助企业理解用户的人群特征、人生阶段、消费偏好等;帮助企业分析和友商用户群的异同,优化市场定位和差异化产品策略。这部分数据有自己内部的数据,竞品数据可以通过第三方等间接获取。

比如今天shein作为跨境快时尚平台做得不错,如果同类型的平台是否可以考虑在年龄段标签上做差异化,比如他们切的是18-35岁的年轻女性,那是否可以考虑35-50岁的中年女性作为用户群,在运营过程中做调整,反而在利基点上有不错的收益。

另一个方向的思考是,如果我们在部分用户标签维度差异较大,如果我们就是希望拿下这部分用户,那就说明我们可能有做的不对的地方,通过数据去排查问题,比如是我们投放的过程中渠道选择带来这样的差异?货是不是有问题,价格过高?品类深度不够?认识到了这种差异,可以进一步深挖分析或者用户访谈,来对我们的产品给用户的心智营造做调整。

image.png通过画像数据的对比,可以去确定一件事情,就是说我们的竞品到底是谁。真正的竞品突然在你眼前,画像跟你高度重合的那个,而不是我们假想的那个。如果你发现原来被认为是竞品的典型用户群体是在30到50岁之间,而你们的群体在20岁到35岁了,那至少在当前情况下,你们是弱竞争关系。

image.png

定位了不同的人群,并结合数据做一定划分后,我们也可以根据情况针对性做投放和媒体选取。在广告营销推广的时候,我们结合画像对用户进行划分,区分为大盘->成交->高价值用户,然后我们通过某些标签进行数据分析,如上图中的性别维度,我们对比中发现其实女性用户比例在高价值用户中与大盘用户中刚好反过来 。

那接下来就有几个动作,可以对投放渠道、商品进行分析,是引流的问题?还是货品上对于男性用户天然不高?商品运营有没有问题?如果不做调整,是否后期的投放渠道可以选取女性标签会更精准?

image.png我们希望根据不同的媒体目标覆盖率高低进行一个预算的分配,在平台上人群通过标签进行拆分。上面的问题,我们拆分了性别,是否有其它的维度可以进一步拆分,比如通过用户上报的APP安装列表,在平台上高价值用户有多种购物类APP和金融类APP的安装,那在投放过程中可以根据渠道的差异进行筛选,或者在投放过程中选取对应的一些标签词进行尝试。image.png上面的例子是结合用户画像做不同渠道的选择,逐步测试和优化。而对于商品的定位调整,可以结合商品生命的周期,尝试做一些品类深度与宽度的运营。image.png对于不同生命周期内的用户,其实数据和画像的丰富度也会有差异,在精细化运营过程中可以根据情况做差异化的运营。这里再讲一个其他案例,在用户分析维度,初期会通过用户调研访谈进行初期的产品定位,在投放扩量过程中,结合用户站内的情况作出效率分析,新用户有什么特征?核心的用户属性是否有变化?前后一年内获客可能会有很大差异,这种差异时常去关注,可能会了解到产品的变化是否符合预期。image.pngimage.png在精准营销领域的的一些尝试,可以参考上图。分析历史某个时间窗口内的用户,哪些方面是有特性的,比如年龄段,性别,地域,收入,偏好等,有了这样的分析,可以选择相应的人群投放。输出到媒体广告,做预算看效果,然后将效果数据回流,再去迭代,以提高进一步的准确率。通过某个特性找人,再去分析这些潜在用户,找到可以触达他们的渠道。image.pngimage.png上图也跟前面介绍的有点类似,作用类似,就是通过筛选已有用户中的核心用户,结合这群用户的标签,进行投放标签的初步筛选。在成本需要控制的情况下,可以通过核心人群标签投放->强相关人群标签投放->一般用户标签投放,这里也需要结合不同人群经常交互的商品进行商品池选取。image.png在看一个金融领域的应用案例,根据职业、年龄、存款等进行筛选,并结合历史理财的偏好等进行基金推荐。image.pngimage.pngimage.pngimage.pngimage.png再讲一个概念就是CRM,业界有很多探讨,其中也有一些问题点,如上图,后面分享我们对CRM可以专门展开。image.pngimage.png

有几个注意点也需要大家去注意的,其实我们有时候现有的用户不等于目标用户。在产品运营过程中,会发现平台上用户画像是这样的,但是结合战略以及竞品的一些情况,更大的去做差异化的竞争。重合的那部分是高价值用户,所以应该投入更多人力去做?结合用户画像去做更细粒度扩人群,是A人群还是B人群还是C人群?

然后第二点,构建什么样的用户画像,比如说用户是男性还是女性,她工资多少,喜欢什么样的商品。这些标签可能是没有意义的,如果要说有意义的地方是这些标签如何去影响决策,如何为用户带来更好的体验,带来更高的留存、复购。


05

回顾/总结

实践出真知,我们需要结合具体业务场景,做尝试。

image.png我们要结合业务场景去分析,然后去不要单看画像,而是要做一些对比,通过前后对比,跟竞品的对比,跟频道内与大盘的对比等手段去分析,发现不足和优势,做纠正和调整。通过数据反馈形成数据的闭环,最终在产品的迭代过程中拿到更好的业务结果。总结一下,做画像要有目标要有数据,也不拘泥于技术细节,大胆的尝试,然后先粗粒度,后细粒度。

本文作者:姚凯飞 来源:DataFunTalk
CIO之家 www.ciozj.com 微信公众号:imciow
   
免责声明:本站转载此文章旨在分享信息,不代表对其内容的完全认同。文章来源已尽可能注明,若涉及版权问题,请及时与我们联系,我们将积极配合处理。同时,我们无法对文章内容的真实性、准确性及完整性进行完全保证,对于因文章内容而产生的任何后果,本账号不承担法律责任。转载仅出于传播目的,读者应自行对内容进行核实与判断。请谨慎参考文章信息,一切责任由读者自行承担。
延伸阅读