咨询热线:0898-08980898

天工AI搜索引领搜索引擎下一个十年

添加时间:2024-10-24 11:04:18

  2018年末,彼时已长期霸占全球搜索市占率第一的谷歌,在内部发出了一封深度机器学习将颠覆搜索行业的警告信:

  这封警告信前瞻性地提出,“无论是微软、百度、雅虎、亚马逊、苹果,还是某个初创公司”都可以开发出这样的深度机器学习系统,“5年内将实现”。

  这位谷歌工程师一语成谶。5年后,微软的New Bing在2023年2月将GPT能力注入搜索引擎,一时间风头无两,甚至有颠覆谷歌的说法。

  除了微软的New Bing之外,海外AI搜索引擎领域也动向不断。本轮大模型热潮的弄潮儿OpenAI正在这个领域进行布局。The Information 2月14日报道,OpenAI一直在开发一款网络搜索产品,以与谷歌进行更直接的竞争。

  2022年8月成立的AI搜索引擎创业公司Perplexity AI在一年时间获得了1000万用户,华尔街日报3月初的信息称,Perplexity AI时隔2月后正在进行新一轮的融资,估值翻倍将达到10亿美金,成为新的独角兽。此外,Andi Research、AI搜索引擎初创公司也都得到不错的发展。

  在国内,2023年8月,昆仑万维推出了中国第一款AI搜索引擎天工AI搜索,成为国内AI搜索鼻祖。

  随后,百度于2023年10月17日在百度世界大会上宣布,旗下“简单搜索”升级成为AI互动式搜索;2024年1月29日,360集团全新升级的大模型搜索产品“360 AI搜索”正式上架多个安卓应用商店;此外,、秘塔科技等科技企业也在进行相关产品布局。

  输入搜索问题,出来的链接一大堆,但是信息质量参差不齐、信息准确度真伪难辨、各类广告更是铺天盖地、用户隐私形同虚设。

  2023年,谷歌搜索引擎业务营收高达1750亿美元,占谷歌业务总营收的比重超过50%。国内巨头百度的搜索业务更是长期占据核心业务营收70%以上,直到近年增速放缓才下滑至60%左右。

  凭借着“竞价排名”等强大的搜索引擎商业化变现能力,多年来,搜索业务是“谷歌与百度们”的现金奶牛,支撑其在人工智能、虚拟现实等诸多领域的投入。

  高比例的广告营收,正在成为这些传统搜索引擎从信息搜索转型为答案搜索的“历史包袱”。哪怕用户对于搜索引擎使用的“怨言”已经越来越多,但他们依然难以实现自我革命。

  谷歌在2017年就发布了深度学习中的里程碑论文《Attention is All You Need》,标志着如今大模型领域最重要的Transformer模型诞生——然而,真正将Transformer的实力发挥到极致的企业,却是OpenAI。

  谷歌工程师在2018年就意识到,随着语言模型的发展,未来的搜索引擎可以直接理解网页的文本内容,给用户的检索提供直观的答案,而这会颠覆谷歌在搜索领域唯一霸主的地位……但是谷歌依然没有抓住技术领先者的机会。

  2023年2月,在ChatGPT震撼世人不久后,微软趁热打铁,与OpenAI联合推出具备AI搜索能力的New Bing,全面革新搜索引擎。

  而谷歌一直到5月才在I/O大会上宣布新计划:让用户体验AI服务的Google Search Labs平台,其中的一项新服务便是SGE(Search Generative Experience)。但SGE并非面向所有用户,使用名额存在限制,用户必须加入Google Search Lab的候补名单,等待获启用资格的通知。截至目前,该服务仅在印度和日本进行了落地尝试。

  除了微软、谷歌这类巨头之外,无数新兴玩家也不断冲击着这一市场。比如,Perplexity、Andi、Glean、这类海外的AI搜索引擎不仅引发了C端用户的积极讨论,更是获得了诸多投资人的格外青睐。

  2023年8月,昆仑万维推出了国内第一个AI搜索引擎——天工AI搜索,成为国内AI搜索领域的领跑者。此后,百度、360、搜狗、秘塔等纷纷入局。

  由于大模型与搜索引擎都跟语言紧密相连,有着强烈的地域特征,因此其对使用语言的数据积累要求极高。比如,在OpenAI的GPT-3模型训练过程中,只用到了0.1%的中文数据,英文数据占比高达92.65%。

  传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范围,并匹配可能符合用户意图的海量信息。这意味着,用户通过传统搜索获得的是无穷的可能性,因此需要将大量时间耗费在“寻找”和“筛选”上。

  以国内AI搜索鼻祖“天工AI搜索”为例。天工AI搜索是基于大模型的AI生成式搜索,用户通过自然语言清晰表达自己的意图,就能获得经过有效组织和提炼后的答案,不需再为冗余信息浪费时间。这让AI搜索第一次有能力为用户提供“知识”。

  2022年12月,昆仑万维发布了自研AIGC全系列算法与模型。2023年4月,昆仑万维正式发布了自研双千亿天工大语言模型。基于“天工”系列大语言模型的强大AI能力,天工AI搜索可以根据上下文语义与用户展开多轮次、深度的对话,从而实现对于复杂问题的深入研究。以天工AI搜索为例,其“追问”功能让用户可以就一个问题展开20轮次以上交互,能更好地应对开放式问题,帮助用户激发求知欲、探求新知识。

  在此基础上,AI搜索可以通过自然流畅的对话式交互体验,帮助用户获得精准、有效且个性化的答案。让用户在搜索上获得真正的“量身定做”和“千人千面”式体验。

  一些用户可能会担心AI搜索“一本正经胡说八道”的问题,这在New Bing刚推出时,也有过类似的翻车事件。以天工AI搜索为例,昆仑万维在所有回答中加入了信源索引,以保障AI生成的答案可追溯、可考证、可信赖。同时,用户可将每轮次的搜索结果留存在天工内,便于随时查阅回溯,也可一键分享给他人。这让AI搜索回答的可靠性得到保障。

  除了天工AI搜索外,昆仑万维还打造了面向C端用户的“天工AI智能助手”APP,这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用,其中集成了AI搜索、对话、画画、写作、识图、速读、数据分析等多项大模型功能,免费向用户开放。

  据点点数据报告,2024年1月20日当天,天工全平台的日活跃用户数(DAU)达到了34万,远高于此前的15-20万区间。这个数字甚至超过了同行业的竞争对手,如字节的“豆包”和百度的“文心一言”,它们的DAU分别为17万和27万。

  昆仑万维CEO方汉认为,大模型实现了人类有史以来最大的一次知识迁移,即大模型的知识来源是全球各种语种的知识,可以打破工业革命以来英文作为主要科研技术成果以及人类智慧的知识垄断,使全球任何语种的用户都能使用大模型来学习并进行知识迁移。

  AI时代,信息爆发,用户的痛点不再是找不到信息,而是找不到“需要的”信息。AI搜索成为新的答案。AI搜索不仅仅是把大模型加进搜索引擎里,而是用户需求的底层逻辑改变了。因此,搜索的整个商业模式也改变了。

  可以明确的是,在这个全新的市场空间,传统搜索时代行业头部的优势不再重要。

  Perplexity的联合创始人兼CEO Aravind Srinivas曾提及,“在Perplexity推出的最初几周,一位谷歌的资深前员工给我建议——不要担心在用户数量上与谷歌的竞争。我们正处于一个新的技术时代,其中无监督学习技术能够直接从互联网上的原始文本中学习,而不需要像谷歌那样依赖大量的用户点击流数据来构建搜索索引和排名系统。”

  谷歌早期在搜索领域崛起的决定性因素是采用了PageRank算法,该技术需要学习海量用户针对相似问题点击不同网页间的链接关系,来确定网页展示的重要性。这意味着用户量越大,谷歌搜索给出的答案越准确。

  但现在,AI搜索比拼的大模型的底层技术能力,谁能更好的理解用户的问题,并给出个性化的答案成为关键。技术迁移让谷歌积累的海量用户不足以成为新时代的壁垒。

  从广告商业模式看,头部搜索引擎公司要实现大模型技术下的商业模式重新布局,无异于大象转身,与之对比,新创立的AI搜索公司可谓是轻装上阵。

  以Perplexity AI为例,其核心产品是“Perplexity Ask”,一个由当前主流大模型提供支持的搜索界面和聊天工具。用户可以免费访问这个产品,也可以每月支付20美元,获得Perplexity Pro的服务。后者可以允许使用更强大的AI模型和功能,比如上传文件与大模型交互等。

  与之相比,要谷歌直接向用户收费将引起可预测的大规模用户抵抗。而谷歌此前通过投入巨额费用与手机等终端设备厂商签订协议成为“预装搜索”或“默认搜索”的模式,也在面临AI搜索的挑战。

  有报道称,在去年微软推出New Bing后,三星考虑将默认搜索引擎由谷歌改为Bing,这让谷歌近30亿美元年收入面临威胁。事实上,谷歌每年支付高达100亿美元的资金以确保其搜索引擎成为三星和苹果设备上的默认选项。但现在,这个模式也面临严重威胁。

  从用户的角度出发,AI搜索是全新的市场空间,用户将会给所有AI搜索产品机会,但只有满足用户需求的工具才能获得长足发展。

  一种观点是,未来的搜索市场可能不会出现像现在一家独大的情况,而是每个大语言模型聊天类产品里,搜索都是一部分,因而搜索引擎市场将更加分散。

  亚马逊创始人Elad Gil在3月5日分享的推文中指出,2000年代的搜索产品以事实为中心或者定向的帮助用户导航到特定网站,现在搜索越来越多的与大语言模型聊天产品相结合,目前的搜索引擎产品已经演变为3个类型:

  意见引擎(Opinion Engine)-由伦理团队输出认为用户应该相信的内容;

  答案引擎(Answer Engine)-让第三方对用户的查询进行基于事实的综合。

  而在他推文下的评论里,有网友说的第四个搜索引擎也得到了很多赞同——建议引擎(Advice Engine),即针对用户应该做什么提供建议的工具。

  大模型技术的落地让搜索市场焕发新的生机。在这里,传统搜索的行业头部不再具备绝对优势,新入场的企业也有广阔空间进行探索。

  在互联网时代初期,搜索引擎的出现标志着信息获取方式的重大变革,1990年代中期,随着互联网的迅速发展,网页数量激增,用户面临着如何在海量信息中找到内容的挑战。这时,搜索引擎应球速体育welcome运而生,成为了连接用户与信息的桥梁,也渐渐成为人们默认的网络入口。乘着这股东风,谷歌、百度等一众巨头崛起,引领了互联网产业的前二十年。