在问题,或是算法模型、特征设计不合理,或是代码有BUG等原因,导致通过算法计算的搜索结果质量不高,一眼看过去就觉得难看。
这时候,一种简单的方法就是直接修改线上服务的代码逻辑,把一些公认的好结果硬插入搜索结果中,以此达到提高搜索质量的目的。
(一般是对于一些热门的搜索词,由于其曝光度高被用户重复搜索的次数足够大,进行人工干预能取得较大回报)
这种“硬改”和基于人的经验干预而非算法计算的操作就是“人工干预”。
举个例子,通过解读人的经验或偏好,再调整算法中模型参数或是特征组合,从而达到改变搜索结果排序的目的,这还算是通过“算法”进行调整的手段。
而为了让金主满意,把搜索结果中属于金主的项目排名人为调整到靠前位置,这就算人工干预。
前世2008年,谷歌搜索算法技术团队首席工程师阿米特·辛格尔于谷歌官方微博发表的文章中公布了谷歌搜索排名的三项原则:
第一,成为全球相关性最高的搜索引擎
第二,简洁性和易用性
第三,不得人工干预搜索结果。
阿米特·辛格尔人为人工干预有两大问题。
一是互联网是面向公众而非少数群体,搜索结果的最后排序只有由互联网社区的使用情况以及算法决定才足够公平,人工干预无法避免受到施加者的主观偏好的影响。
二是人工干预无法有效提升整体搜索质量,尤其是在互联网内容进入大爆炸阶段。
改进搜索算法不只是提高这一次搜索查询结果,而是要提高整体查询结果的质量,否则很难适应海量信息的检索要求。
但人工干预说白了是种“具体问题具体解决”的方法,对点而不对面,是无法最终提高全局搜索质量的。
陆道升不仅知道以上两点,还知道选择了人工干预的百度最终在搜索质量上和谷歌差了十万八千里。
所以,对于嘉盛的寻知搜索引擎,陆道升上来就不允许人工干预。
只不过,理想很丰满,现实超骨感。
谷歌不是一天就变强的,算法的精度也不是一上来就很好的,这导致目前寻知搜索引擎的搜索质量不如百度的好。
百度一是本身技术不落下风,二是不排斥进行人工干预。
结果现在搜索质量看着就比嘉盛好一些,这让搜索部的人心里有些失落。
不是没人和陆琦还有陆道升反应过,希望能加入人工干预,每一次都被陆道升残忍拒绝。
如果嘉盛的技术不行,解决不了算法的优化问题,那就当没寻知搜索引擎这个事儿。
依赖人工干预很容易滋生腐败(参考前世百度的情况),这个风险陆道升要坚决杜绝。
人性最好别去考验,陆道升笃信这个观点。
不许人工干预只是一个方面,另一个让搜索部门员工感到挫败的,则是高层对于启动MP3搜索的抗拒。
百度已经于一个多月前推出了MP3搜索服务,根据市场调研部门的报告,其流量正在疯涨。
自然,最近人提出寻知搜索引擎也展开MP3搜索服务。
结果还是被陆道升摁了下来。
看着眼前面色不佳的搜索部门成员们,陆道升知道,又需要统一思想了。
……
请收藏:https://m.lmveg.org
(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)