书城小说买时代:消费创造新世界
11597400000004

第4章 长尾词

主笔 葛维樱

24小时随时可以下单购物,这是我们当下的消费新景。可是,海量的物与人,你如何找到你要的那款物件?或者说,卖家又如何迅速识别你的需求?

你冥思苦想认为足以把想要之物描述清楚的词汇之中,有一个不那么显眼却至关重要的词叫作“长尾词”。这是网络消费的关键。

简单讲,在网络世界里,卖家与买家都在茫茫人海里寻找彼此,如何找到对方?在搜索里,你用一个特别显眼的词当然会吸引眼球,比如“连衣裙”,但结果大家发觉,“连衣裙”搜出了1900万个结果。如何在如此庞大的数据里选择?这是不可能的任务。可以,如果你为这个词加上“尾巴”——“夏天连衣裙文艺复古”,结果大为缩小,只有4000多个答案。所以,你的“尾巴”越丰富,你寻找到需要的物件的可能性越大。

一个行业说法是,一件物品的关键词库至少有500个。因而,对于卖家来说,你得随时更新和有效变换,导致找出能卖掉货物的词,这是卖家的长尾制胜法宝。微小市场累积起来就会占据市场中可观的份额——这就是长尾的思想。这其间的巧妙就是,在热词与热词的衍生物之间,你的选择不是前者而是后者。比如,一件不怎么样的商品用了竞争力很大的热词“韩版”,那么引擎搜到它之后,会被毫不留情地排除掉。但如果使用一个会和最热的词产生关联的“长尾词”,比如“韩国优雅奢华代购”,那么这件商品就很有可能变成一笔成功的交易。

所谓“长尾词”,它是关键词选词矩阵SEM(结构方程模型)的术语,也就是搜索引擎营销的方法论。它有两个特点:细和长。细,说明是份额很少的市场,甚至是不被重视的市场;长,说明这些市场虽小,但数量众多。一旦找到,好像得到一把开启大门的钥匙,就能进入一个消费的隐秘花园。使用一个长尾词来描述商品,是在基本属性之外,缩小集中、优化搜索结果。

真正指引我们购买的咒语是什么呢?长尾词类似买家和卖家在互相破招。中心关键字通常很难把一个商品送上主页,即便能做到,也不会安稳,容易被其他货品挤下去,需要投入很多的人力物力去保护。所有的商家都希望第一时间出现在你搜索栏的结果中?不,答案绝没有这么简单。数据表明,前六页搜索结果购买率并不高。阿里巴巴DT战略的第一步,是要在全球最大的电商公司中,实践“数据化运营”。事实上淘宝首页和引导频道的不断变化和推陈出新,全部都是大数据运算的结果。“天猫‘双十一’,你看到的一切,几乎都是由算法决定的。”天猫数据挖掘专家李博介绍,哪些商品能进入“双十一”,出现在哪些用户的页面和什么位置,都有算法在背后支撑。这就像一场游戏,数据是变量,算法就是游戏规则,设定什么样的游戏规则,将决定游戏最终的结果。

这个算法是长尾词背后的大数据支撑。长尾词看起来非常难以捉摸,可能是淘宝主推的,即将火爆,也可能是有意打击竞争对手做出来的,更有可能只是商家心血来潮的一时灵感,关键在于只要有卖点,任何词都可以成为“热词”。针对长尾词现在已经出现了非常多的“采集器”软件,教卖家用软件来挖掘真正根据网站变化的长尾词,最终得以挤上搜索排序前列位置,并且转化为真正的消费。

长尾词指向的排序结果和购买成功率,乍一看是个语文问题,实际上是一个数学问题。“阿基米德排序”是2010年7月8日上线的淘宝搜索结果排序方法。当时淘宝把“店铺服务质量”作为重要因素加入到搜索中来影响排序,在消保优先、相关性、橱窗推荐的三大前提下,在一定时间范围内,按照店铺服务质量权重排序。具体参数包括:是否违规、是否作弊、退款率、超时退款率、发货速度、响应速度、滞销商品率……参数有几十个,只是权重不一样。

引擎由两名斯坦福大学理学博士拉里·佩奇和谢尔盖·布林发明于1996年。不再像往日抄写符号代码地址,而是以“最相关”来直接告诉你答案。这个“最相关”,在消费数据里远远比网络世界容易实现。“谷歌和百度没能完成的,可能会由淘宝引擎来完成。”卖家最害怕的一个词是“跳出率”,就是好容易用长尾词吸引进来的客人,都可能冷酷无情地走掉。数学是神奇的,程序算法会把客人鼠标停留时间短的商家降低排名,这就叫“跳出率”。一名没找到猎物的猎人绝不会游荡。智能手机让消费者拥有“秒关”的任性,整个互联网移动化时间比预期提前了5年。

在非购物类页面里,引擎只是把搜索页面里的关键字售卖给广告主。而一大排长尾词的用意在于告诉搜索引擎,“我有什么,快来搜我”。长尾词部署的理想状态,是每个页面都能非常快速地被搜索引擎承认,当长尾词得到排名提升的时候,每个具备长尾词的页面都会成为流量的引入入口,使每个页面都发挥其作用。一个具体页面长尾关键词部署三个之内,如果能根据长尾关键词以扩展编辑,这是最好的表现形式。

无限制的长尾词,对于消费者实际上给搜索提供了最大限度的可选择自由。网络消费的决胜之处其实不在于技术实力,而在于用户的需求是否真实,数据是否足够大。2014年11月6日阿里巴巴宣布,其大数据团队自研的实时数据计算平台Galaxy,目前每秒可运算数据超过500万条,预计“双十一”当天每秒运算量将超过1000万条,日处理消息数将超过1万亿条。针对每一笔交易数据,系统将实时反复检测70余次以保证数据质量。

自由的另一点不确定性有趣之处在于,网购时没有人知道你要买什么。我们在网购时可以按照地域(这决定了你的收货速度、运费,但也限制了你的搜索范围)、天猫(这决定了你是否需要品牌)、全球购(是否走海外代购渠道)、价格排序(特定商品很有效果,因为价格真的相差甚远)等条件筛选结果。在“热点”里,还会有非常多的标签式的词语出现,“小香风”“学院风”这些词仿佛魔咒一般,我们甚至可以只写“设计师款”而不写到底买什么,来试试搜出来的外套、椅子、钟表和暖水壶哪个更吸引人。

数据和算法推演导致长尾词和它的目标永远都在变化。搜索引擎带给我们的消费品页面从来没有一致过。试试用同一台电脑,换着用自己的账号和别人的账号登录,再试试用同一账号,在PC、iPad和智能手机上登录。搜索网页目前引擎只能得到关于你所在地域的信息,但在一个电商购物平台里,你买故你在。“以往是淘宝制定排序规则,告诉卖家应该怎样做。在做了个性化排序之后,是卖家告诉淘宝网自己的用户特点,淘宝网就会将相应的消费者通过搜索平台匹配给卖家。”很明显你是一个上午10点到12点在办公室打开网购登录页面,下午17点到18点在交通工具上用手机登录,晚上23点左右又要用iPad登录的人。为什么9元包邮的体恤不会推荐给“高富帅”,过季的打折连衣裙也不会推荐给“白富美”,这是网络在“长尾词”之后,一个平台的整体性进步,即引擎会根据消费者的历史购物行为,学习和理解每个消费者的偏好,同时将“猜你喜欢”推荐给你。

李博表示,“双十一”当天的购物行为高度集中,如果每一个消费者看到的页面和推荐商品都一样,事实上将会压抑大量长尾的消费需求。要想让每个人看到的“双十一”都不一样,大数据就必须了解每个消费者喜好的商品的属性。

这个规则叫作搜索的“维度”。基于大数据的个性化搜索正在不断变换规则和复杂化。个性化排序并不是一个全新的排序方式,而是在以往“阿基米德排序”的基础上引入了个性化的维度。“现在搜索的考核权重包括相关性、下架时间、市场规则、卖家质量、商品质量、人气分、反作弊、个性化,与之前相比,只是多了个性化这个权重因素。”淘宝搜索产品“小二”说,动态评分对于搜索有很大的影响,下架时间在默认排序中的权重依然非常高。

“维度”包括性别、购买力、卖场、卖家规模、店铺、商品标签和品牌。搜索引擎带着所有联动的网站,正在不断优化,实现比人强大得多的信息收集能力。“未来还会不断增加新的维度,逐渐丰富对用户喜好的刻画。”

商品排序的后台人工干涉程度在下降,算法推演和随机性在上升。广告费可以购买直通车进入首页,但是实现销售依然不那么容易。拿“羽绒服”这个关键词来说,会在一段时间内从很小的基数,突然增加到很大的搜索量,可能这段时间天气变冷,购物网站把这个词变成主推词了。这一方面是消费者的需要,更重要的是网站和商家早就已经作好了各种准备。主推词会在存活时间上有特别的限定。可是这么激烈竞争的环境下,想要脱颖而出实现销售,不再是“爆款”的世界。一个好的网络电商平台的首页橱窗制作,比一本时尚杂志花费更多,要赏心悦目又紧跟潮流,浪费流量给一些“月销万件”的某一个廉价热销品的时代将一去不复返。

让有特色的店铺找到你这位特别严苛、审美特别挑剔的客人,这就是引擎带来的“主动”。引擎的个性化做得越细,对商品的要求也就越细,“小而美”的店铺有更多机会。为什么你总是买得过于宽松且色差也大,而她拥有精致的肩线和恰到好处的颜色配比?引擎是个非常善于讨巧的两面派,一方面它衡量买家,另一方面通过对商户的重要性作出客观评价,不断更新搜索结果。当然广告和访问量都很重要,但是访问量属于会被“刷”出来的门槛最低的技术手段,卖家可以购买流量作“直通车”。网络当然不完美,很多商户通过网络数据找到漏洞的方法,电商培训课是“教你14天上首页”之类,还有7天螺旋和14天螺旋的商业操作模型。但所有奥秘的终极指向还是,“产品质量才能真正实现盈利”。

2014年3月,阿里巴巴举办了首届大数据竞赛。第二赛季的优胜者实战参与天猫“双十一”的算法设计。他们是6个“90后”学生组成的团队。天猫将当天会场流量的10%到30%分配给学生团队,天猫自己的算法团队也用同样的流量进行算法比赛,如果学生团队胜出,那么他们6人将共同获得100万元比赛奖金。竞赛吸引了来自全球的7276支队伍共1万多人参赛,并在第二赛季开放了5.7亿条脱敏数据。这是中国网络里数据最丰富、维度最广的平台。数据足够大且规则一直在改变的情况下,事情变得更有趣了。

数据演算正在尽可能地把各种标着代购、设计、小众的衣服和搭配包包、模特示范穿着的商品排序给你。因为最近你搜一件羊绒大衣时,引擎后面已经有一双看不见的眼睛将你定位成经常浏览代购、喜欢小众店铺、价格区间偏高、退货率约等于没有、特别爱给好评甚至爱秀照片的买家了。

往年的“双十一”,哪些商品能够进入天猫“双十一”的会场,是由淘宝人工决定的。商家报给天猫运营“小二”10款畅销商品,“小二”再进行人工挑选。2014年引入大数据算法后,系统根据报名商品的过往销售量、细分行业趋势、消费者需求,来判断这些商品是不是最有热销潜质的款式。

为了实现更精准的推荐,大数据记录的商品标签越来越细致,长尾词越来愈多。以前搜索一双耐克球鞋,只会匹配两个标签,但今年就会细致到一双蓝色的36码耐克球鞋,价格、功能、面料、配色都会被打上标签。通过大数据人物画像,一个成熟的网购用户背后可能有上万个喜好标签,包括喜欢穿休闲裤还是牛仔裤,喜欢喝茶还是咖啡,喜欢豆豆鞋还是运动鞋。“给它一堆商品,和一群人,大数据就能判断出谁更喜欢哪个商品,匹配度是多少。”文本识别引擎将关键词过滤升级为语法语义分析,同时引入机器学习算法,取代了人工搜索和经验判断。在此基础上建立起来的信息排查平台,对全网10亿级的商品数据进行全量检索和处置,支持多达60个维度的组合条件筛选,每天消息处理量2亿以上。

担心自己看不到其他新鲜的商品?担心自己被定型成一个无趣的人?谁也不愿意社交网路被一些推送垃圾广告信息的店铺占领。“推送”的好感度在广告中排列最低,人们依然喜爱的是橱窗。算法和交互设计上当然首先考虑了这个问题,所以被网购平台捧红的偶像层出不穷,“切糕王子”的2015限量版切糕才能几小时立刻售罄,这可是一个长红不衰的网络小店,你能想象有多少人从此真正喜欢上了切糕这种食物吗?

网购平台提供开发工具意味着鼓励小前端自己创造,如果大平台只创造市场,让小前端来分抢现成大单,让成本领先者往往从中受益,导致趋同,就会让网购生态系统倒退。从苹果经验中就可以看出,开发工具水平的高低,往往直接决定多样性水平的高低。而那些你反复看又靠谱的商家,即使广告费少也会被网站排到前面。而给你推荐的各色稀奇古怪的店铺,不管是卖二手日本海报,还是一些完全没销量的代购北欧的盘盘碗碗,5个小时就会被放进大数据重新洗牌一次,然后你又会看到一个全然不同的新的消费世界。