阿里首次对外解密“商品大脑”
经常网购的人都知道,只要在淘宝输入“斩男色”(一种口红颜色)或“××明星同款”,就能一键搜索到自己想要的商品。事实上,这项技术背后是阿里巴巴的知识图谱技术,它也是阿里平台治理背后的最强“商品大脑”,能从近20亿件商品中捞出对应商品。昨天,阿里平台治理部首次向外界解密三万亿平台成交额背后的“商品大脑”。
“阿里知识图谱就是一个‘超级大脑’,包含百亿条信息实体和百亿条信息关联。”阿里巴巴平台治理部资深总监钱磊介绍,“商品大脑”由智能识别引擎、智能推理引擎和商品知识三部分组成,运行原理类似人体大脑。“智能识别引擎从信息中提取语义,类似于人脑的感知系统;智能推理引擎可以利用已有知识做推理;而商品知识类似于人脑的记忆系统,是知识存储的单元。”
钱磊举例说,“商品大脑”理解输入的过程,比如说买家输入“我需要一件漂亮的真丝丝巾”,“商品大脑”会通过语法词法分析来提取语义要点“一”“漂亮”“真丝”“丝巾”这些关键词,从而帮买家搜索到合适的商品。
在导购中为让发现更简单,“商品大脑”还学习了大量的行业标准,比如说全棉、低糖、低嘌呤等。“先进的大脑还有与时俱进的优点。”据钱磊介绍,“商品大脑”可以从公共媒体、专业社区的信息中识别出近期热词,跟踪热点词的变化,由运营确认是否成为热点词,这也是为什么买家在输入“斩男色”“禁忌之吻”“流苏风”等热词后,马上就能出现自己想要的商品。
此外,智能的“商品大脑”还能通过算法识别出场景。“比如我输入‘海边’,结果中就会出现泳衣、游泳圈、防晒霜、沙滩裙等商品。”
目前,“商品大脑”可以24小时对平台上的近20亿件商品进行管控。钱磊说,在商品上架阶段,平台可以每秒审核5000条商品信息,发现那些假货、山寨、滥发和品牌堆砌的商品,比如说“2016小香家同款高仿”这样的商品描述。即使卖家把文字PS进商品图片中也能识别,管控体系可以每秒扫描2.2万张商品图片,发现图上的“牛皮癣”。 |