AI 助理
备案 控制台
开发者社区 机器之心 文章 正文

以落地考验价值,大模型的产业大考来了

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 在今日举行的百度 WAVE SUMMIT+2022 深度学习开发者峰会上,百度产业级深度学习开源开放平台飞桨以及产业级知识增强大模型文心均迎来了重大升级,其中大模型的产业化路径和文心行业大模型的实践成为峰会的焦点。

从 BERT 和 GPT-3 发展至今,大模型已然成为当前 AI 发展的重要方向。大模型增强了 AI 的通用性,构筑了 AI 技术和应用的坚实基座。在这股不可阻挡的大模型发展潮流中,各家大厂纷纷投入大量资金、人才和配套服务,从数据、算法和算力多方面推进大模型的研制、训练和建设。


行业的投入使大模型迎来显著进展,千亿甚至万亿参数的大模型陆续出现,覆盖了 NLP、CV 和跨模态等领域。然而,只有落地才能实现大模型的价值。各家不断探索大模型落地的新方法、新模式,作为国内 AI 领域的领头羊,百度持续发力自身文心大模型体系,形成产业级和知识增强两大核心特性。


今年 5 月,百度提出了要构建更适配应用场景的模型体系,最亮眼的发布就是业界首发两个行业大模型 —— 国网 - 百度 · 文心和浦发 - 百度 · 文心。此后行业大模型成为文心着力的重点,7 月推出世界首个航天领域大模型 ——航天 - 百度 · 文心。近日又相继推出传媒行业大模型——人民网 - 百度 · 文心、影视行业智感超清大模型——电影频道 - 百度 · 文心、智慧城市领域大模型——冰城 - 百度 · 文心。


百度并没有止步于此,而是致力于将大模型应用拓展到更广泛的行业领域。在 11 月 30 日举行的 WAVE SUMMIT+ 2022 深度学习开发者峰会上,百度文心产业级知识增强大模型全景图迎来升级,在全新发布的 11 个大模型中,包括 5 个行业大模型,分别是泰康 - 百度 · 文心、深燃 - 百度 · 文心、吉利 - 百度 · 文心、TCL - 百度 · 文心以及辞海 - 百度 · 文心

image.png

在仅仅半年的时间里,百度文心行业大模型的数量已经达到了 11 个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,进一步丰富了行业大模型的应用场景,在产业化落地的过程中使大模型真正赋能千行百业。


更多行业大模型的发布彰显出百度文心大模型践行自身产业级特性的决心,无论是从如今行业大模型的数量还是覆盖行业范围而言,百度显然已经初步形成自身大模型产业化落地的行业布局。


在峰会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。


契合场景需求、加速 AI 落地,文心行业大模型不断壮大


大模型的发展从来不是一蹴而就的,从数据采集到模型开发、训练、推理部署再到最后的落地,关关难过但又必须过。在实现落地的最后一环上,研发契合场景需求的行业大模型成为业界采取的主要发展模式,而正是百度开启了先河。


文心行业大模型植根于文心大模型,在 NLP、CV 和跨模态等基础通用大模型掌握通识知识的基础上,对行业知识、数据、经验和任务进行更深入的了解,达到在特定行业、特定应用场景中的性能最优。文心行业大模型的打造,就是要解决大模型与应用场景之间的鸿沟。


百度通过联合头部企业和机构,秉持「从产业中来,到产业中去」,不断将大模型技术融入到更多行业和应用场景中。在这一过程中,文心行业大模型逐渐形成自己的核心特色 ——行业知识增强


一方面,基于通用的文心大模型挖掘特定行业应用场景中大量存在的行业特色数据和知识,进行大规模无监督的联合训练;另一方面,与行业专家一起探讨,引入行业实际业务积累的样本数据和特有知识,并在训练中结合业务经验,设计行业领域特色算法,使最终训出的行业大模型适配性更强,切实解决真实场景问题。


特定行业数据、知识以及经验的加入,使得通用文心大模型真正做到了与行业的融会贯通,其能力的发挥也更加地有的放矢。

image.png

对于合作企业、机构而言,加入行业特色数据与知识、精准匹配真实应用场景的行业大模型能够极大提升业务流程效率和水平。


以百度联合吉利发布的知识增强的汽车行业大模型 ——吉利 - 百度 · 文心为例,它基于文心 NLP 大模型 ERNIE 3.0,结合了吉利汽车专业领域行业数据(汽车领域媒体知识、客服工单、法律法规以及汽车售后维修手册)进行预训练,充分理解掌握汽车行业知识,得到性能更强、稳定性更高的汽车领域大模型。

目前,吉利 - 百度 · 文心已经应用于吉利的智能客服系统、车载语音系统和汽车领域知识库构建等业务场景中,实现显著的业务效率提升。随着将大模型等 AI 前沿技术应用于更多汽车业务中,双方还将以吉利 - 百度 · 文心大模型为通用底座,进一步支撑吉利在智能车机、知识资产管理和用户运营与智能营销等场景实现智能化升级。


image.png同样,其他四个新发布的行业大模型在对应的行业应用场景中也实现了任务效果的显著提升。但影响远不止此,文心大模型具备强泛化能力,因此除了适配已展示任务之外,将来可能针对更多相关领域任务进行训练微调,从而加速大模型在整个行业的落地,发挥更大的行业价值。


从开启先河到体系初成,文心行业大模型内外两手抓


随着业界越来越认可行业大模型的发展模式,趋同在所难免,因此发展自己的核心竞争力尤为重要。


在百度看来,行业大模型是结合行业落地过程中非常重要且有效的方式,今年以来陆续发布的 11 个行业大模型即是最好的例证。对于行业来说,它们得到 AI 技术力量的加持;对于文心大模型的建设来说,行业的反哺使得整个体系更强,基础通用大模型能力也得到提升。


至于百度文心行业大模型如何保持优势?我们可以从「内秀」和「外拓」这两个建设思路具体分析。


所谓「内秀」,即百度自身技术能力的持续积累。一方面,百度有自研的深度学习平台 ——百度飞桨,包括其上开发、训练、推理部署的能力、高效的工具与组件、广泛的硬件适配和生态等,所有这些为包括行业大模型在内的文心大模型提供支撑;另一方面,行业大模型自身也具有强沉淀性,它建模了大量的行业数据和知识,在整个应用过程中,又由应用反馈带来持续训练和进化,能力愈来愈强。


所谓「外拓」,即百度联合各行各业的头部企业、机构,不断寻找与产业场景需求高度契合的领域,拓展行业大模型可能产生助益的范围,在与合作伙伴的深入技术交流和合作中充分释放大模型的价值。


飞桨平台支撑文心大模型,加速产业智能化升级


在模型层,除了行业大模型之外,此次升级的百度文心大模型全景图中还新增了 5 个基础大模型,它们分别是知识增强轻量级大模型 ERNIE 3.0 Tiny、跨模态理解大模型 ERNIE ViL 2.0、跨模态生成大模型 ERNIE ViLG 2.0、文档智能大模型 ERNIE-Layout 和单序列蛋白质结构预测大模型 HelixFold-Single;1 个任务大模型,即代码大模型 ERNIE-Code。


全面释放大模型的效能、让开发者方便快捷地使用文心大模型,配套的开发套件、平台和 API 必不可少。因此,此次文心大模型在工具与平台层也进行了一系列更新,让大模型与使用者之间连接的更紧。


  • 开发套件全面升级,提供开箱即用的场景化建模工具,首发产业级行业大模型定制工具,提供更为丰富的模型精调工具,以及大模型可信学习工具;
  • 文心 API 服务支持多种模型尺寸的精调,体验专区提供更多可体验能力,同时基于大规模集群算力分布式推理加速能力,可满足大规模高性能产业级调用;
  • 飞桨企业版 EasyDL 零门槛 AI 开发平台和 BML 全功能 AI 开发平台,升级提供全流程开箱即用的大模型能力。EasyDL 零门槛 AI 开发平台预置了各种通用任务场景的大模型,使 AI 应用开发者获得更好的模型训练效果;BML 全功能 AI 开发平台实现大模型训练加速、场景建模、应用集成,让大模型的落地像流水线一样高效。


此前,为了充分开拓大模型的创意与探索空间,百度推出了基于文心大模型的创意社区 ——旸谷大模型创意与探索社区,将智能化能力带到各行各业以及所有人的面前。此次文心大模型在产品与社区层又收录了 2 个大模型应用产品,分别是文心一格和文心百中


文心一格是基于文心大模型的业界首个 AI 艺术和创意辅助平台,于今年 8 月推出。用户使用自然语言输入创想,即可完成别具一格的画作。文心一格在创作风格上多变,支持插画、科幻、动漫风以及中国风骨的画作。现在文心一格的能力又得到了更多升级,支持以图生图、支持可控的增删改等图片二次编辑、一键生成视频,进一步激发了用户的创造力,降低内容生产成本。


文心百中是百度搜索与文心大模型联合研制的基于大模型的产业级搜索系统,寓意为搜得准确,百发百中,具有极简、强大以及高效三大特性。首先与传统级联式的搜索系统不同,文心百中以文心大模型为支撑,在系统和应用方法上简约化;其次语义理解能力强大,采用大模型机制后在多词、转义等多个方面效果显著,并在问答、搜索等场景提升明显;最后高效表现在基于大模型的搜索系统大幅降低了人力成本和数据成本。


image.png

加强大模型技术突破,联合研制行业大模型,并建设配套的工具平台和应用,这是大模型产业实践过程中重要的一个方面。同时,支撑大模型开发、训练和推理部署的深度学习平台也在持续进化。


飞桨升级让大模型性能更强、应用更便捷


如果没有飞桨支持,文心大模型就成了「无源之水、无本之木」。作为产业级深度学习开源开放平台,飞桨集核心框架、产业级模型库、开发套件、工具组件以及学习和实训社区于一体,能够标准化、自动化地支撑模型生产和应用。在 WAVE SUMMIT+ 2022 峰会上,飞桨生态也带来了最新进展:截至目前,飞桨已凝聚 535 万开发者,服务 20 万家企事业单位,基于飞桨创建了 67 万个模型


今日飞桨平台也迎来升级,在技术创新、功能体验和生态建设三个方面持续发力,坚定平台的产业级特性,引领大模型训练和推理核心技术创新,联动上下游龙头企业共创繁荣生态,加速产业智能化升级。

image.png

具体地,飞桨开源框架推出最新的 2.4 版本,围绕开发、训练及推理部署进行创新。在开发训练方面,飞桨动静统一的开发范式以及自适应分布式架构实现了大模型的灵活开发和高效训练。


推理部署方面,飞桨支持大模型高效推理,并提供服务化部署能力。而为了适配更多场景、更苛刻环境和更极致推理性能,飞桨利用计算融合等方式进行全方位性能优化,并通过软硬协同的稀疏量化进一步加速。同时飞桨提供了蒸馏裁剪等丰富的压缩策略,将模型进一步小型化,实现高效部署。


新发布的全场景高性能 AI 部署工具 FastDeploy 解决大模型部署中的痛点问题。FastDeploy 覆盖多端、边和云场景的支持,加之大量简单易用的设计,在性能上做了极致优化。最核心的是将大模型的压缩能力和推理引擎的推理能力无缝衔接,实现压缩和推理的协同。

image.png

为了让大模型产业落地更高效便捷,飞桨提供全套的产业化工具与平台,支持大模型的多样化应用。


一方面新发布了大模型训推一体开发套件 PaddleFleetX,让大模型的全流程研发更加便捷高效。大模型的开发、训练、小型化和推理对框架有很多不同的要求,因此 PaddleFleetX 开发套件瞄准了大模型的全流程,与飞桨的核心框架层及一系列底层能力全面对接,打通整个流程,在体验上实现升级。


另一方面,飞桨企业版 AI 开发平台 EasyDL 和 BML 也围绕大模型的技术应用进行了全新升级。在 EasyDL 零门槛 AI 开发平台预置了各种通用任务场景大模型,可以让 AI 应用开发者获得更好的模型训练效果。在 BML 全功能 AI 开发平台上,端到端的并行训练优化方案大幅提升了大模型训练性能;预置的基于大模型的场景模型生产线,让开发者在主流的场景开箱即用,快速构建大模型场景应用;新增的自动化推理服务监控能力,及时感知变化和问题,驱动反馈和迭代,让 AI 应用的高效迭代闭环。


image.png

无论是文心大模型还是飞桨平台的升级,百度正朝促进产业智能化这一方向前进。王海峰博士曾发表观点称,深度学习正推进人工智能进入工业大生产阶段。此后得益于深度学习的突破以及自身飞桨平台的建设与发展,人工智能开始广泛实现产业落地,与产业结合的深度和广度不断拓展。同时随着大模型为人工智能发展带来新的机遇,开始引领深度学习平台的发展方向,并在今年迈入产业落地的关键年。


百度一方面持续升级飞桨平台,在技术、场景和生态领域齐头并进,逐渐打造成为中国最强的开源开放深度学习平台,为 AI 的产业化落地打下坚实的基础;另一方面推出产业级知识增强文心系列大模型,并与头部企业、机构合作打造行业大模型,在促进这些企业业务效率提升的同时,通过向相关领域更多业务的能力泛化,进而实现整个产业的智能化升级。


可以这么说,飞桨深度学习平台和文心大模型已经组成一个完整、体系化的基础平台,未来持续的升级与迭代必将为产业智能化升级提供全方位支撑。


正如王海峰博士所说,「深度学习平台 + 大模型的布局贯通从硬件适配、模型训练、推理部署到场景应用的 AI 全产业链,夯实产业智能化基座,进一步加速产业智能化升级。」



技术小达人
目录
相关文章
技术君
|
5月前
|
人工智能 前端开发 大数据
财务数智化,铸就企业稳健发展“金算盘”
财务数智化,铸就企业稳健发展“金算盘”
技术君
113 0
技术小达人
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(2)
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(2)
技术小达人
71 0
技术小达人
|
供应链 安全 数据处理
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(1)
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(1)
技术小达人
56 0
-开发达人-
|
机器学习/深度学习 数据采集 人工智能
以落地考验价值,大模型的产业大考来了
以落地考验价值,大模型的产业大考来了
-开发达人-
124 0
-编程工程师-
|
存储 人工智能 开发框架
爱数:以开源应对领域认知的普惠价值与百花齐放
爱数:以开源应对领域认知的普惠价值与百花齐放
-编程工程师-
142 0
开发者小助理
|
传感器 边缘计算 人工智能
数智洞察丨“曹县现象”背后,金融科技助力乡村振兴的三大维度
“曹县现象”狂扫网络之时,引发了人们对乡村振兴内核的重新思考。唯有产业发展,人才回流,金融服务整合各类资源提供覆盖全产业链的支持,这样的振兴才是全面、高质量和可持续的。
开发者小助理
766 0
数智洞察丨“曹县现象”背后,金融科技助力乡村振兴的三大维度
-编程工程师-
|
智能设计 Android开发 UED
智能硬件生态闭环 产品设计的价值正被低估
智能硬件生态闭环 产品设计的价值正被低估
-编程工程师-
298 0
云市场官方号
|
运维 安全 大数据
风口起落的背后,是谁支撑着中小企业
中小企业面临诸多挑战,如发展环境、融资难融资贵、企业核心竞争力难以提升到市场服务保障缺失等。作为国内最早关注企业服务的先发平台,阿里云云市场如何帮助中小企业跳出泥潭,稳健成长......
云市场官方号
1425 1
风口起落的背后,是谁支撑着中小企业
创峰会-江鑫恒
阿里巴巴张勇:世界的不确定性,考验创业者拥抱变化的能力
5月15日,首届“HICOOL全球创业者峰会暨创业大赛”在北京国际财富中心(通州)启动。
创峰会-江鑫恒
812 0
阿里巴巴张勇:世界的不确定性,考验创业者拥抱变化的能力
婧含
|
运维 安全 大数据
风口起落的背后,是谁支撑着中小企业?
作为国内最早关注企业服务的先发平台,阿里云云市场以优良的产品、成熟的技术、优秀的服务商以及完善的服务保障制度作为自己的核心力量护航中小企业,满足中小企业需求的同时,为中小企业打造健康优良的成长环境,帮助中小企业跳出泥潭,稳健成长。
婧含
3393 0
风口起落的背后,是谁支撑着中小企业?

热门文章

最新文章

  • 1
    SpringBoot前后端分离项目,打包、部署到服务器详细图文流程
  • 2
    表格存储新手指南:如何实现分页查询
  • 3
    Kubernetes全方位日志采集与管理的最佳实践 资料下载
  • 4
    高效运维之Docker持续部署图文详解
  • 5
    麒麟开源堡垒机安装部署测试及优缺点总结
  • 6
    5分钟构建API接口服务 | python小知识
  • 7
    阿里建“猫茂”线下购物中心,将实现新零售技术的真正落地
  • 8
    [20180202]脏块写盘问题.txt
  • 9
    通过扩展改善ASP.NET MVC的验证机制[实现篇]
  • 10
    下载后自动打开(更改IE下载文件后的默认处理方法)
  • 1
    14 款超赞的代码片段生成工具😍(程序员必备)
    28
  • 2
    Go语言项目高效对接SQL数据库:实践技巧与方法
    20
  • 3
    用来用去还是用回了ueditor-Vue富文本编辑器二次扩展
    21
  • 4
    uniapp uview扩展u-picker支持日历期间 年期间 月期间 时分期间组件
    20
  • 5
    electron-updater实现electron全量版本更新
    29
  • 6
    electron多标签页模式更像客户端
    22
  • 7
    UniApp低代码-颜色选择器diy-color-picker-代码生成器
    16
  • 8
    低代码开发工具-学生管理系统-老师管理增删改查实现
    13
  • 9
    Vue3商品SKU多规格编辑组件
    14
  • 10
    JavaScript中的面向对象编程(OOP) - 终极指南
    14
  • 相关课程

    更多
  • 大数据知识图谱—钱大妈数据中台建设最佳实践
  • 云生态人才需求现状与职业规划
  • 大数据知识图谱—数据中台的智能进化—阿里巴巴十二年数据平台发展历程
  • 云原生技术趋势与行业发展解读
  • 信息科技前沿技术及应用趋势
  • 重庆烟草2024年度全市系统网信素养能力提升轮训(第二期)暨数字创新培训班
  • 相关电子书

    更多
  • 技术创造新商业 云时代研发效能的机遇和挑战
  • 研发效能提升36计-开篇:互联网时代研发效能的挑战及应对之道
  • 滴滴稳定性建设实践
  • 相关实验场景

    更多
  • 奥运时刻!零代码生成奥运风格AI写真。
  • 【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
  • 倚天大数据电商数据分析快速实践
  • 基于阿里云DeepGPU实例,用AI画唯美国风少女
  • 使用计算巢AI应用,轻松定制个人数字形象
  • 5分钟轻松打造应对流量洪峰的稳定商城交易系统
  • 下一篇
    阿里云无影AI云电脑亮相 体验大幅升级

    深圳坪山网站建设公司网站首页加载优化郑州符合网站优化绵阳网站建设和优化服务汕头专业的网站优化seo价格汕头专业的网站优化seo价格福山个性化网站优化怎么看网站的优化词网站url优化是什么兴宁网站seo优化SEO优化网站优化工程师招聘兰州网站优化排名方案站优化佛山网站关键词优化咨询报价企业网站做seo优化关于网站优化公司怎么优化网站让百度靠前丰镇市网站优化推广惠州优化网站seo公司钟祥市网站关键词排名优化价格代购行业网站优化运营邵阳网站搜索优化方案朔州企业网站怎么优化seo优化网站外包公司网站关键词排名优化后付费湖州市网站优化南宁专业网站优化平台网站优化过程中注意事项邹平网站关键词优化效果怎么样临河网站优化哪家好上海公司网站排名优化兰州哪里有优化的网站香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

    深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化