龙空技术网

从通用到更专更精:百度祭出了一个“调教”大模型的平台

机器之心Pro 903

前言:

而今姐妹们对“c语言再挂”可能比较关怀,同学们都需要学习一些“c语言再挂”的相关文章。那么小编也在网络上搜集了一些有关“c语言再挂””的相关文章,希望各位老铁们能喜欢,朋友们快快来学习一下吧!

机器之心报道

编辑:杜伟

大模型赋能产业如何做到更高效、更方便?百度文心千帆大模型平台为企业解决获取大模型能力、挑选最合适的大模型服务提供了一条「捷径」。

自 OpenAI ChatGPT 开始,国内很多大企业陆续发布了自己的智能对话大模型和产品,效果有强有弱。通用和垂直领域的对话能力成为这些大模型和产品努力达成的重要目标。以百度文心一言为例,距离其发布时间过去了近两个月,目前已有 300 余家生态伙伴参与文心一言内测,在 400 多个企业内部场景取得测试成效。

随着大模型引发的 AI 再造产业趋势已经势不可挡,如何高效、低成本地获取大模型能力,如何挑选到最合适的大模型服务成为这些企业面临的最大难题。

5 月 9 日下午,百度智能云举行了文心大模型技术交流会,向在场的百家企业展示文心大模型在产品技术、场景研发、生态建设等领域的最新进展。其中最令人瞩目的是正在内测的「文心千帆大模型平台」,它是全球首个一站式的企业级大模型生产平台,不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链

百度智能云 AI 与大数据平台总经理忻舟。

未来,文心千帆将提供两种服务:一方面以文心一言为核心,提供大模型服务,帮助客户改造产品和生产流程另一方面,作为一个大模型生产平台,企业可以在文心千帆上基于任何开源或闭源的大模型,开发自己的专属大模型。未来将成为大模型生产和分发的集散地。

文心千帆:全球首个一站式企业级大模型生产平台

我们知道,文心一言是基于 AI 大底座开发的生成式对话大模型。C 端用户可以通过文心一言体验到生成式 AI 带来的各种最新的产品体验。B 端即企业客户则可以通过文心千帆大模型平台,将文心一言的核心能力集成到自己的各种应用中,从而赋能各行各业

作为一个企业级大模型开发平台,文心千帆利用文心一言的生成式 AI 能力,帮助更多企业在应用场景中实现更丰富的能力。

具体地,文心千帆大模型平台覆盖了大模型从生产到应用的全生命周期,包括海量数据处理、高质量数据标注、再训练 / 微调 / 强化学习、大模型评估及高效压缩、自动化 prompt 工程、快速应用编排

不仅如此,当企业得到了与自身业务结合良好的大模型之后,文心千帆还可以提供更多的大模型托管和大模型推理服务。这样一来,企业能够更好地利用大模型来赋能自身产品,为客户提供更好的产品体验。

从功能来看,文心千帆有六大显著特性,分别是「更易用、更全面、更安全、更高效、更开放和更扩展。」

首先更易用,文心千帆通过图形化的界面提供了非常好的大模型训练推理和应用平台。我们不需要了解代码,也不需要做命令行操作,只需要关注最核心的业务数据和应用,在该平台上进行各种训练和调优。

第二更全面,文心千帆覆盖了应用、开发、调优、反馈的整个生命周期。第三更安全,文心千帆在安全回复、安全输入和输出上做了很多工作,能够实时搜索更多信息,让回答更客观、更准确和更安全。

第四更高效,文心千帆提供了更加高效的模型训练和优化能力。第五更开放,文心千帆同时支持了文心一言和第三方大模型,涵盖更多不同领域和应用。

最后是更拓展,除了模型自身内化能力之外,文心千帆支持大模型通过插件机制和外挂应用的方式,更好地拓展大语言模型能力,使理解应用和反馈形成一个好的闭环,从而更好赋能应用产品。

目前,文心千帆大模型平台提供公有云服务和私有化部署两大交付模式。公私结合以满足各种类型客户的多样化大模型服务需求。

在公有云服务方面将提供推理(直接调用大模型的推理能力)、微调(通过高质量精标业务数据,高效训练出特定行业的大模型)和托管(将模型发布在百度智能云以实现更加稳定高效的运行)三种服务,大幅降低企业部署大模型的门槛。

在私有化部署方面将支持软件授权(提供在企业环境中运行的大模型服务)、软硬一体(提供整套大模型服务及对应的硬件基础设施)和租赁服务(提供机器和平台的租赁满足客户低频需求)三种方式。私有化部属能够满足对数据监管有严格要求的企业客户需求。

现场演示「大模型微调」全过程

百度智能云 AI 与大数据平台总经理忻舟在现场演示了如何微调大模型,这也是国内首次演示如何微调行业专属大模型的全过程。

首先文心一言被集成应用到了百度智能云 Sugar 智能数字可视化程序中,该程序旨在将数据通过可视化图表展现给用户,帮助更好地做商业分析。Demo 演示中的交互数据是一个虚构的简单销售表,包括了各种产品列表、子类别,客户姓名、客户种类代码。

最开始的几个指令如「为我展示一个各个地区的销售额」、「再统计一下各个省份的销售额」,文心一言都能顺利给出准确的可视化图表。不过,当输入「华北地区 2019 年 3 月到 5 月的销售额,用折线图表示」时,文心一言看起来没有理解这个更复杂指令的意思,显然也无法给出相应的结果。

难道这样就结束了吗?并没有。演示人员现场表演起了微调大模型,这就用到了文心千帆大模型平台。演示人员新建了一个微调数据集,并导入了一份数量在 100 条左右的精标数据。这些数据旨在教会大语言模型处理真正在行业应用和实际任务中要处理的问题。

从如下动图中可以看到,首先输入数据集名称,选择数据类型、创建并导入。导入完以后可以选择上传 Excel 文件,去重或不去重,点击确认,系统就会收到了这份训练数据。

导入完成之后,再次输入之前的「华北地区 2019 年 3 月到 5 月的销售额,用折线图表示」指令,这时系统顺利给出了可视化折线图。

未来,客户通过少量数据即可发起模型微调,最快几分钟就可获得自己的专属大模型。

文心千帆将助力包括百度搜索、新闻推荐、百度地图、如流和小度等在内的产品进行全面升级,进一步改善用户体验。

现场,文心千帆与14家生态伙伴签约,包括联想集团、用友、宝兰德等。未来百度智能云还将通过更广泛的生态建设来实现大模型的应用落地。

标签: #c语言再挂