.

推荐策略产品经理构建标签体系的二三事人

北京中科白癜风怎么走 https://jbk.39.net/yiyuanfengcai/video_bjzkbdfyy/
编辑导语:如今在这个大数据时代,标签已经成为了很多平台必不可少的一个功能,最常见的比如购物网站,会增加一些标签方便用户查找,避免无用功;本文作者分享了关于构建标签体系的一些经验方法,我们一起来了解一下。一、标签体系:definitioneffect1.什么是标签体系?什么是标签体系呢?简单说就是标签体系就是分类,而且是对全集的分类,“把内容或者用户依据统一的规则分到不同的类别中去,类与类之间彼此有联系,这就构成了标签体系”。通过分类的对象是用户还是内容,基本将标签体系分为两种:两者的区别主要体现在分类后使用上,在确立分类体系的时候并无根本性的区别,故在后文不做区分。2.标签体系有什么用?仔细思考一下,用标签与类别代表群体,将个体抽象化,这是为了什么?我觉得最大的作用是运用于“个性化”和“精准化”的事项,因为个体体征被高度抽象,就有了可使用的价值;比如一个短视频,划分到搞笑-鬼畜视频的分类中,就可以专门针对性地推荐给喜欢看鬼畜的用户,内容与内容之间、用户与用户之间、内容与用户之间的对应,背后全都是标签在其作用。你接收到的商品推荐、视频网站推荐给你的猜你喜欢、地图软件给你推荐的出行方式,交友软件给你推荐的心动嘉宾,这些都是标签之间的一一对应。比较典型的应用场景有:精细化运营策略的制定、客户关系系统CRM、广告推送的方式、个性化推荐系统推送系统的搭建。标签帮助平台更好地了解平台里的内容特性、也更了解平台中的用户特征,而更充分的了解,也意味着更好的满足用户需求。二、标签体系:how1.按照MECE原则制定标签体系在标签系统运用之前,PM最早起到作用且关乎到后续标签体系整体效果的重要一步就是制定标签划分的体系与标准。在制定标签体系的时候,一般依据MECE原则进行(全称MutuallyExclusiveCollectivelyExhaustive,中文意思是“相互独立,完全穷尽”),也就是我们常说的“不重不漏”。在处理分类事情的时候,很多时候是存在灰色地带的,有些既可以划分到A类,又可以划分到B类,好的分类体系可以减少这种情况出现的频次,这就是尽量“不重”。同样在分类的时候,因为内容和用户的复杂性,也会出现有些无法划分到当前分类体系中去的情况,在构建分类体系的时候也需要我们尽量做到“不漏”。在构建标签分类体系的时候,有三点经验可以供参考:1)以竞品体系为根基,做适配性修改参考竞品所做的标签体系,再结合自己的业务特点进行修改,可以先用竞品的分类体系抽样对自己产品的内容/用户进行分类标注,可以快速发现哪些标注分类是缺少的,哪些存在分类不清的问题,再进行针对性的改动,不断迭代自己的体系。2)明确业务导向,标签需要为业务目标服务这是指比如你建设视频的二级分类标签体系,是为了更好的给用户做个性化推荐,那么需要思考,哪些内容在推荐上具有共性;比如游戏内容,二级分类分到游戏攻略,这是很难给用户做推荐的。因为显然没有用户对游戏攻略这个分类内容感兴趣,而如果划分为角色扮演游戏,这是可以推荐给喜欢RPG游戏的用户的。3)标签分类附解释与case因为PM不是直接进行数据标注的人,实际进行标注的一般是外包标注人员,在信息传达的时候难免有损耗,如果不将标签的具体含义以及相应的case附上,很容易造成PM单方面自嗨,实际标注效果不尽如人意的情况。2.设置合理的标注与检验流程在标签体系初步制定之后,就该进行到下一步,实际标注了,从我自己的实际上手体验来看,这部分是坑最多,最容易出现问题的部分,需要PM和标注人员进行反复的沟通,反复的迭代,最后才能交付较好的标注数据,供训练模型使用。在这里给出两种标注流程,具体使用哪种需要根据自身业务特性与人员配置来决定。第一种是单层的,高级标注人员负责任务下发、抽检、人员培训,这种适合高级标注人员素质过硬,且能力较强,优点在于中间流程较少,信息传递不容易出现偏差,整体时间也偏长。单层标注流程第二种是双层的,在高级和初级标注之间增加一层中级,负责标注质检和确定部分不确定case,这种优点在于每个人负责的事情相对较少,不容易出现差错,且责任到人,对个人能力要求相对较低。双层标注流程双层中,具体各方职责如下([T]中T代表当天,T+1代表第二天):PM:负责数据抽取[T]对齐高级标注人员不确定的case[T+1]评估标准的更新与修正高级标注人员:负责标注任务的拆解与下发[T]对齐中级标注人员不确定的case,自主判断给出分类,如果个人无法确定,再与PM对齐[T+1:下班前对齐]标准更新,对齐标准的传达与人员培训[T+1]中级标注人员:收束每天初级标注人员标注中不确定case,自主判断给出分类,无法确定再与高级标注人员对齐[T+1:先进行这部分,T+1下午3点前对齐]负责抽检初级标注标注确定的部分(抽取比例需讨论)[T+1:后进行这部分,T+1结束前完成]初级标注人员:负责完成高级标注人员下发的标注任务,对于确定的case进行标注,对于不确定的给出初步判断,并提供给中级标注人员[T]3.标签体系的优劣衡量在对标注结果进行数据验收的时候,更多的是采用准确率和召回率指标,准确率对应不重、召回率对应不漏,即“分的准+有的分”。一般来说,准确率能达到85%以上,召回率能达到90%,整体数据可用性就达到要求了,如果标签体系建立的合理且优秀,执行也很出色的话,部分可以做到90%以上的准确率。在标注过程中,有两个准召情况(更多看准确率)需要重点


转载请注明:http://www.abachildren.com/xgyy/8142.html