国美在线CTO于斌平:基于用户画像的精准营销

编辑时间: 2016-08-30 14:30:41    关键字:

 


1、关于大数据的理解

作为一个互联网的技术从业者,之前从事过多年的传统数据仓库方面的工作。随着技术的进步,互联网时代的大数据解决了原来未解决好的很多问题,主要表现在两个方面:第一是技术上的进步使得大数据的成本大大缩减,降低了使用门槛。原来主要依赖Oracle等数据仓库,以二维表为基本元素,动辄使用大的存储设备和小型机,而现在做大数据主要是使用HDFS等分布式系统及内存技术替代传统的IOE。但数据分析的思路和原理跟原来是一样的,得到原始数据后,进行数据清洗,再依据目标进行数据建模,建立各种数据集市,最后以报表的形式呈现结果。第二是数据的容量、速度、多样性及价值(即 所谓的“4V”)不一样了。尤其是具备了多样性,原来主要是结构化的数据,现在则可以有非结构化的数据,如日志、用户行为,甚至图片、声音文件等,这些非结构化的数据可以很快地与结构化的数据相关联,快速分析出结果,极大地解放了人们的思想,所有发生的故事都可以用大数据来关联分析,极大解放了数据,给数据很大的价值。


2、用户画像体系

精准营销应用具体包括以下几个方面:

一是个性化搜索,通过国美在线平台搜索“手机”,不同的人搜出的结果是不一样的,因为不同的人喜好是不同的,比如有人使用的是苹果,有人使用的是三星,也有的人使用的是小米或者其它手机,系统会基于用户的行为来猜测用户想搜什么。传统的搜索,若要搜手机就只出现手机,然后加上一个业务权重,如果最近要推广苹果手机,就会把苹果的权重往上加,搜出来的结果就主要是苹果手机。个性化推荐搜索不仅直接推荐用户想要的,也会推荐猜测用户想要的结果,这就是搜索推荐,相当于一个店小二或者门店促销员的角色。

二是社交传播,以微信广告为例,微信广告不是所有的广告向所有人推送。微信台会有一个分析系统,它分析出有些人经常看汽车,就会给这些人推汽车广告,有些人经常浏览衣服,就会给这些人推衣服广告。所以看到自己收到的广告,周围人不一定都收到,这就是基于用户画像来推荐的广告。

三是热力图工具。热图工具是内部使用的基于大数据结果分析的工具,主要是显示哪些地区热度高、哪些品类用户比较关注等实时状态的工具。

四是会员营销。传统意义上理解的会员营销主要是发送短信、发送邮件、发放宣传单等方式,这些其实都是会员营销的一个结果应用,其实前面讲到的几点也是基于大量数据分析的会员营销。

五是智能选品。当打开国美在线网站或者登陆手机App时,一个页面或者一个手机登录页上面,哪些东西呈现在前面,哪些东西呈现在后面,这就是智能选品,也是根据用户画像来做的,甚至包括采购的定价也是智能定价。

六是DSP广告。DSP广告就是需求方的广告平台,简单的讲就是用户主动看过什么就会给用户推相应的广告。比如,某用户在国美在线看了一个杯子,接下来你去浏览新浪、搜狐、微博等门户网站时,就会看到杯子的广告。

七是个性化推荐。现在网站到处都有推荐,个性化推荐跟这些差不多,不太一样的地方在于它是实时的。电商行业的转化率平均值是3%。国美在线的个性化推荐转化率达到17%-18%,有时候能达到20%,已经算是很高。转化率高反映的是推荐比较准确,核心就是用户画像比较准确。

精准营销的核心是用户画像,而用户画像的核心是标签。那么,标签是什么呢?具体来讲,某些用户喜欢健身,那就给他打个标签“喜欢健身、阳光”;或者某些用户穿的衣服是修身型的,就可以给他打个标签“修身”,这就是标签。若系统得出了这个结论,那么等他下次来的时候,系统就会为他推这类产品,比如健身器材、修身的衣服这类产品。

标签怎么来呢?来自大量用户的基本数据。比如在网上浏览的行为数据,包括用户在门户网站甚至其他电商网站上浏览的数据。主要包括用户数据、行为数据、消费数据、商品数据、行为数据和客服数据等,任何跟用户有关系的数据都可以作为数据源。数据源这部分可能会涉及到“数据交换”,即从其他网站等渠道通过一定方法拿到需要的数据。然后是数据管理平台,管理平台的核心是做标签的管理,包括定义、编辑、审核、查询等等,及对应的分析工具。在此基础上再来建立各种模型,包括用户购买力模型、群体画像模型、购买兴趣模型、促销敏感度模型等。通过系列模型得出的结果就是用户的标签,包括用户DNA、品类偏好、品牌偏好、促销偏好、价格偏好等。截止去年底,国美在线大概有600多个不同门类的标签,包含季节、价格档次等。


3、用户标签体系

用户画像的核心是标签,标签可以分为以下几类:

第一类是基础属性,比如“所在城市”、“会员等级”、“生命周期”、“会员网龄”等基本信息,其中生命周期是按照曾经访问的频次,把用户区分为活跃的会员、沉睡的会员或者沉闷的会员,或者网上叫死粉、僵尸粉等。

第二类是消费能力,购买力、消费等级、累计消费金额、消费频率等。

第三类是行为偏好,时段、访问方式、品类偏好、品牌偏好等。访问的方式、时段数据的分析可以用于决定采用哪一种方式给用户推广告,例如,有些人喜欢晚上访问网站,或者喜欢看视频,那我们通过跟视频网站合作,在视频中的广告对这些用户进行推荐。

第四类是购物偏好,购物时段、偏好品牌等。

第五类是客户服务,用户评价等级、退换货次数(金额)等,这里包括两层含义,有些人经常退货或者拒收,有些人买一件东西时会下两个单,货到后挑一挑,收一个退一个,对于这两类用户的成本是非常大的,通过分析定位这类用户。电商行业还有一个概念叫“占单”,比如说iphone7马上要推出,有可能几千个库存刚放出来几分钟就没有了,其中有些是被正常用户买了,有些可能是被竞争对手战术性的占住了,还有些是用机器下单给恶意占住了。正常一个订单,需要24小时之内支付的,超过24小时不支付,订单就取消。如果分析出的这一类用户,就可以给他们限定10个小时或者半个小时甚至10分钟不支付就取消订单。

第六类是业务场景,用户DNA和用户特权等标签。前面提到的订单取消是用户特权的一个特例,负向的特权。对于分析出正向标签的,贡献额比较大的用户,比如国美在线用户等级从G1到G5,一个G5用户,有可能就给免邮或者会员生日礼物等特权。


4、规则与模型

标签是基于规则和模型出来的,而基本的规则是根据时段偏好、站点偏好、访问偏好(用手机APP,还是用微信,还是用PC)、消费周期,然后基于基本的生成购买力算法、用户群体画像算法、促销敏感度算法等生成标签。这些出来的标签会不断地形成一个标签体系,同时,加上一些业务、营销的因素,或者加一些其他的权重来人工干预更新标签,从而建立起基于数据规则和算法模型的标签。


另一种方法就是通过用户采样进行标签扩散,对于经常去浏览、购买的老用户,通过大量采集用户数据进行分析,然后是标签抽取和用户行为建模及以生成标签规则。对第一次登录国美在线或者就来过一次的用户,可以推荐什么商品呢?这时就需要统计学中的采样来进行标签扩散,就是拿出了其中某一类用户或者某几个用户的行为标签,作为这一类人的公共行为标签。所以大家会发现,第一次登录或者只登陆过一次的用户,最终推荐的商品,可能有些跟这个用户的上次浏览相关,有些就不相关,其中不相关的这类推荐,就是基于采样把用户归到一类里面,据此来做的推荐。


5、推荐

国美在线上“猜你喜欢”个性化应用,包括网站的底部、列表页、搜索页还有首页等页面位置。首页是在正中的位置,转化率非常高,另外不同的人登录APP,每个人获得的推荐商品都不一样的。


在国美在线APP“用户中心”的界面,通过用户的购物行为,推出用户DNA的页面,会给用户打上基本的标签,例如喜欢什么类型的商品,经常“海淘”的用户可能就有“海淘达人”的标签,这样建立了每个用户的购物圈画像和商品专属推荐。


还可以基于气候与天气进行推荐,例如深圳,天气比较热时,页面上会推荐“空调”等类似的消暑商品;若出现“雾霾”天气时,则会推荐“空气净化器”。这类规则不复杂,而且天气数据都是公开可以拿到的,只要在原来的基础是增加一些标签。


关于视觉的推荐,也就是基于图片的搜索,目前使用的还比较少。当用户输入一张图片,结果会根据这个图片给出相关的推荐。比如逛街的时候,看到别人穿的衣服或者拿的东西不错,可以直接拍下照片,通过相应的图片计算和搜索算法,相关的商品就可以搜索出来。

前面介绍了推荐系统的应用,那推荐系统的技术架构是怎样的呢?大数据平台的底层是各种数据平台,数据源包括会员数据、商品数据、订单数据等结构化的数据,以及行为日志等是非结构化的数据,包括浏览日志、点击日志、客户和客服的对话记录等。数据源上面是数据同步,通过“Sqoop”、“Flume”、“Kafka”等技术来实现,它的特点是存储的数据和交换的数据比较多。然后是数据存储,用的比较多的是“MySQL”、“Hbase”等。接着是计算框架,如“MapReduce”、“gome_realtime”、“spark”和“sparkstreaming”等。再接着数据平台之上就是算法引擎和推荐引擎,通过许多的算法模型,如“协同过滤”、“关联规则”、“矩形分解”,形成用户画像,结果可以是数据形式,报表形式、或者Excel表形式等。最后是各种应用端,“网站”、“APP”、“WEB”或其他营销应用端。


 

6、广告

DSP广告系统连接广告主和用户两端,以前的广告是购买广告位,现在基于DSP广告系统,可以做到不同人、不同时段在同一个位置看到的广告是不一样的,或者,同一个时间点,同一个位置,不同人看到的广告也是不同的。比如有100个商家的广告需求和素材,整个DSP平台的过程,首先是不同用户的行为日志进行分析,把用户的URL请求和用户cookie相关的记录传过,在中间Ad Exchange上基于统计规则和算法模型等进行计算,并将计算结果反馈给广告主,广告主根据用户画像的结果通过实时竞价系统RTB进行竞价,最后结合计算和竞价结果给不同的用户展示不同的广告。


国美在线通过很多外部和内部媒体实现DSP广告的个性化投放。金融理财产品也像其他商品一样根据客户的标签进行推荐,效果非常好。


关于比价,跟精准营销有一些关系,但主要是大数据方面。比价平台需要实时地把同行各电商网站的数据爬下来,爬下来之后做一个比对,再帮助用户划分好类别,如果消费者通过这个比价平台看到的价格基本上是比同行低的,而且是他们想要的商品,购买转化率就比较高。



热力图工具主要是内部使用的一个工具,针对网站的首页,实时的把首页的每个资料位,有多少点击,流量是增加还是减少,后面的转化是怎么样的,会实时的展示出来,从而实现智能化的选品和智能化的运营,帮助业务调整买品和价格。商品销量不理想或者库存告急的商品是需要更换,热销商品要是太靠后了,就要往上放一下。这些通过热力图工具页面就可以显示出来。


其实后台的标签系统做好之后,可以有很多其他的应用,例如,将标签应用API接口,给其他应用端提供支持,可以与推荐、搜索、广告和第三方新闻等对接;或者是跟营销去对接,提供可视化的分析,城市的人群分布,不同性格的人群分布,成果实时的生成等。

推荐热图

合作推荐

2010-2018 可思数据版权所有 About SYKV | ICP备案:京ICP备14056871号