龙空技术网

大模型加持,搜索会更好用?

虎嗅APP 337

前言:

此时兄弟们对“模型搜索引擎”大概比较注重,你们都想要学习一些“模型搜索引擎”的相关知识。那么小编同时在网络上搜集了一些有关“模型搜索引擎””的相关文章,希望我们能喜欢,你们一起来学习一下吧!

题图|视觉中国

想从浩如烟海的互联网上找到自己所需的信息,对于现在的人而言,不是更简单,而是更难了。

2020年,全球数据总量达到了惊人的51 ZB(即51万亿GB),数字还在不断增长,据预测在2025年将达到175 ZB到180 ZB之间。

惊人的数据量与丰富的载体,都让找信息变成一件更难的事情。传统搜索引擎在满足用户信息获取需求上,显得越来越力不从心。

在传统搜索引擎瓶颈尽显时,大模型的出现带来了全新可能。

继4月17日发布天工通用大语言模型后,8月23日,昆仑万维正式推出国内第一款融入大语言模型的搜索引擎——天工AI搜索,并开启内测申请(内测地址:tiangong.cn)。

昆仑万维为天工AI搜索写下了如下时代注脚:“我们认为传统搜索已到了奇点时刻,陈旧的体验需要被颠覆、被改变。”

被阻塞的最后一公里

搜索是互联网时代人们最基础的需求。

由于互联网信息快速生产、繁殖的特性,搜索天然充当着用户触达数字化信息和服务的基础路径。因此,早在互联网诞生之前,第一代搜索引擎的鼻祖就已经在加拿大诞生。

表面上看,搜索只是为了解决某个问题,而实际上,每一个搜索请求背后都蕴藏着更为现实而具体的需求。一旦搜索能够更加准确、个性化的应答需求,相当于为用户打造了一个全知全能的超级入口。

然而,传统搜索引擎的典型使用场景是,用户键入若干关键词、浏览众多网页、自行摘取信息点、再把点连成线,才能最终得到想要的答案。

这是因为传统搜索依赖于关键词匹配,不具备综合分析和细致对话的能力,难以理解用户的真正意图,也就很难为用户提供深度和上下文相关的答案。

搜索引擎本是人类在数字化世界的导航和地图,如今地图过时了,人类需要尽快脱离信息的泥沼。

技术范式的突破为解决问题带来新的可能。

今年2月,微软宣布基于ChatGPT推出全新搜索引擎的Bing和Edge浏览器,5月,微软彻底打通Bing和ChatGPT之间的生态壁垒。被逼急了的谷歌很快在6月推出试验版AI搜索引擎Search Generative Experience防御。

资深巨头们再度下场贴身肉搏,带来的不仅是充满硝烟味儿的热闹,更探索出未来的方向——是的,颠覆了AI技术原有范式的大模型,不约而同成为行业颠覆传统搜索引擎的突破口。

大模型虽强悍,但也存在“一本正经的胡说八道”的短板。如果能将搜索的实时性和大模型的智能性结合起来,人类将获得迄今为止最趁手的“冲浪”工具。

国外的科技巨头刺刀见红、不断探索之时,国内的科技公司们也没闲着。

作为国内第一款应用级的落地产品,天工AI搜索为安定了多年的搜索行业扔下一颗重磅炸弹。这颗炸弹不仅想要打通信息高速公路与用户之间梗阻的最后一公里,更为大模型在C端的真正落地,辟出了一条路。

四个维度,全面升级

有了大模型的加持,搜索究竟会有什么改变?百闻不如一见,先来感受下我们的测试体验。

测试先从一个宽泛的问题开始,输入“新加坡好玩吗”之后,天工AI搜索开始整活:列出几个相关链接,提供了信息溯源,随后给出了一段完整的回答。

与传统搜索引擎根据关键词识别检索范围匹配海量信息不同,基于大模型能力的AI搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案,不用再一个个点链接、看网页,为冗余信息浪费时间。

因为天工AI搜索确实能“听懂”用户在说什么、用户想要什么,所以能给出完整而非碎片式信息的答案。用户不再需要通过关键词来适应搜索引擎的工作方式,而是自然语言式交互让搜索引擎以人性化方式来适应人类。

从寻找内容,到获取答案,天工AI搜索的革新性可见一斑。

突破了传统搜索引擎短板的局限外,天工AI搜索也补上了大模型的短板。

传统搜索的痛点之一,在于不同来源的海量信息带来的大量冗余和信息不一致;与此同时,大语言模型的生成机制,也无法完全规避“一本正经地胡说八道”现象。天工AI搜索在所有回答中加入了信源索引,以此保障答案可追溯、可考证、可信赖。同时,用户可将每轮次的搜索结果留存在天工内,便于随时查阅回溯,也可一键分享给他人。

上图“新加坡好玩吗”的答案中,天工AI搜索便列出了6个信息溯源点,给出的完整回答中,每一个信息点都关联到了相应的信息溯源点,确保了信息的真实、准确和有效。天工AI搜索的双重技术保障,让鱼龙混杂的信息变得可追溯可信赖。

一个简单测试,已经能够看出天工AI搜索的智能升维。为了进一步测试天工AI搜索的智能程度,我们进行了追问,加了一个限定条件“三天时间”,希望得到旅行建议。

天工AI搜索很快给出了相应的游玩安排,没有机械罗列景点,而是为每天定下相应主题,并安排上相关的游览路线。其中第二天行程主题是感受本地生活,非常贴近时下流行的city walk,已经是一份十分可行且非常个性化的旅行攻略了。

测试到这还没结束,我们进行了第二次追问,加上了“亲子友好”的限定条件。在这次追问中,我们并没有明确这个攻略要覆盖几天的行程,但天工AI搜索根据上下文的信息给出的是三天的行程攻略,顾及到了亲子友好的需求。不得不说,天工AI搜索是真的很“懂”。

从这个连环追问的表现来看,天工AI搜索对大模型技术的应用,使意图识别成为可能,用户完全可以通过自然流畅的对话式交互来清晰表达自己的意图,从而获得精准、有效且个性化的答案。用户可以在搜索上获得“量身定做”和“千人千面”式体验,搜索从模糊走向精确,从通用走向了个性。

上面测试的搜索需求比较生活化,为了了解天工AI搜索在专业领域的表现,我们又测试了一个更加专业的问题。

在输入了“目前电动汽车的电池有哪些技术流派”后,天工AI搜索依旧列出了6个信息溯源点,给出了经过总结和提炼的答案。这个回答不仅归纳了当前电池的主要类别,还介绍了市场主流的电池类型,以及更加前沿的电池技术。短短一段话,足以让用户对电池行业的现状有大致了解。

并且,天工AI搜索列出的推荐追问方向十分具体和专业。

当然,既然是测试必须要加大难度,所以我们追问的是“前沿电池技术哪个最有优势”,这是一个非常考验AI搜索理解、总结信息能力的问题。而天工AI搜索没有被难倒——没有一本正经的胡说八道,天工给出了明确的回答,和充足的论据,每一个论点都有据可依。

这个测试将AI搜索“可以根据上下文语义与用户展开多轮次、深度的对话,从而实现对于复杂问题的深入研究的能力”,展现得淋漓尽致。

据介绍,天工AI搜索的“追问”功能让用户可以就一个问题展开20轮次以上交互,以此展开深度探索。

此外,大模型使得AI搜索具备了整合、提炼、串联信息的能力,因此AI搜索能更好地应对开放式问题,在处理知识类以及创意类搜索时,其体验与效率将远胜于传统搜索引擎。

基于人类反馈强化学习(RLHF)进行训练的大语言模型,更进一步提升了AI搜索的答案对于人的价值。

这些都使得天工AI搜索实现了从信息到知识的跃升。

从寻找内容到获取答案;从鱼龙混珠到可追溯和信赖;从模糊到精确,从通用到个性;从信息到知识,与传统搜索引擎相比,天工AI搜索的升级是全方位的,可以说是升维打击。它是如何做到的?

1+1的化学反应

天工AI搜索跨越式进化的秘密,在于技术范式的突破。跳脱出了传统搜索引擎的技术路径,天工AI搜索采用了全新的技术框架。

与传统搜索引擎相比,天工AI搜索为用户省去了浏览、摘取、整理信息的过程,能直接给出完整的回答。相较大模型,天工AI搜索又可以实时获取互联网信息,能够利用最新的互联网信息回答需要实时信息的问题。

而且,天工AI搜索将支持多模态搜索,除了文字,AI搜索还支持图像、语音等多种输入方式,允许用户通过各种方式搜索信息。据了解,图片搜索会在多模态大模型下一个版本中上线。在全新的技术框架下,不同载体的信息都可以被天工AI搜索连接、理解并呈现。

用户终于不再需要在海量网页中辛苦的寻找答案了,天工AI搜索能为用户提供更高效、更个性化、交互更简单的搜索服务,人类在数字世界的信息迷宫里,终于有了一个全自动导航。

得以如此智能,离不开大模型技术的加持。同时,原有的搜索引擎技术还能修正大模型现有的不足。通过将大模型和搜索引擎结合,天工AI搜索既解决了大模型胡编乱造的问题,又能够分析用户的真实意图,具备比传统的搜索引擎更强的理解能力。

也就是说,大模型的智能与搜索引擎的及时被合二为一,天工AI搜索将人找信息的模式,切换到了“信息找人”的模式。

不再性感的搜索引擎被大模型注入了新想象,而搜索引擎也补足了大模型的短板,新旧技术范式产生的化学反应,造就了“天工”,也探出了大模型的下凡路。

以搜索这种用户最为习惯的应用形态为媒介,昆仑万维为大模型嵌入更多人的日常,铺平了道路。与搜索本身的迭代相比,这是更为重要的价值。

搜索引擎走出搜索

人机对话早已不是新奇玩意,AI赋能搜索也并不是新鲜话题,评估天工AI搜索的价值,既要看其技术框架,也要看其未来空间。

大模型是天工AI搜索实现跨代际搜索体验的功臣。有了大模型的助力,天工AI搜索才能真正“懂”了。

作为天工AI搜索背后的功臣,天工大模型本身就是一个狠角色。

天工大模型采用了双千亿级大语言模型,具备了更高级的自主学习和智能涌现能力。天工大模型背后还有国内最大的GPU集群之一,能够进行充分训练。

在此基础上,天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,这是天工在复杂任务和场景中能够快速且准确响应指令,让用户感受到其足够“聪明”、“通人性”的关键原因之一。

为了给天工最优质的燃料,天工团队投入大量资源从数十万亿的数据中清洗、筛选出了3万亿单词数据用于训练大模型。这使得天工天然“更懂中文”。

有了大模型的助力,“天工AI搜索”塑造“搜索链接一切”的边界能力,从人和服务拓展到任意需求和答案。真正做到了信息孤岛时代,降低搜索难度,实现知识迁移,对信息重新组织、整理、进行输出,最大程度降低时间成本,获取高质量信息,提高决策效率。这蕴藏着解码天工价值空间的关键线索。

无论技术如何进化,搜索本质上是一个工具,如果工具的能力更加丰富,自然会深入嵌入用户的日常生活。

现在,天工AI搜索将搜索引擎升级为解决方案输出者,搜索的边界和价值也迎来了重估时刻——无论是材料收集、文案撰写、科研学习、智力外脑,乃至为生活提供全天候服务的生活管家,小小的搜索框将成为用户的生产力助手。

可以推测,伴随AI搜索的智能化程度持续提升,天工AI搜索必将集聚更多用户和开发者,催生更为丰富立体的应用场景和产品。

比如,当用户搜索“孕晚期血糖偏高晚餐适合吃什么”时,天工AI搜索不仅能给出具体的建议,还能给出相关食品的购买链接,输出一体化解决方案。

当需求都可以通过一个搜索框解决,AI搜索作为大模型时代的应用端基础设施和超级流量入口的潜力也随之浮现。

尽管以搜索框的形态出现,很容易被人归类到工具中,但体验过之后就会明白,AI搜索是全然不同于传统搜索引擎的新物种,其具备成为AI时代超级入口的诱人前景。当前,天工AI搜索“小荷才露尖尖角”,但作为率先掌握并推出了AI搜索的玩家,天工已经为自己打开了全新的价值空间。

技术的进步从来不是一蹴而就,但关键的变化往往只取决于几个瞬间。天工AI搜索已经扇动了蝴蝶的翅膀,更大的风暴已在酝酿。

标签: #模型搜索引擎