前言:
目前咱们对“apachespark体系”大约比较关注,兄弟们都需要学习一些“apachespark体系”的相关文章。那么小编在网上收集了一些对于“apachespark体系””的相关知识,希望你们能喜欢,小伙伴们快快来学习一下吧!NVIDIA CEO 黄仁勋:我们正处于AI的 "iPhone时刻 ",生成式 AI推理工作负载已进入超速运行状态!
英伟达GTC 2023大会展示了该公司在加速计算和AI技术领域的领先地位,并凸显了其在推动全球可持续发展和数字化转型进程中的关键作用。随着越来越多的企业与英伟达展开合作,未来将见证更多的创新和突破!整场演讲真实感受到了——科技的力量是如此的强大!
一、场景:AI的“iphone时刻”已经到来
应用方向:汽车、电子、交通运输、医疗健康、制造业、金融服务、零售、服装、媒体和娱乐、电信以及全球顶尖的AI公司。
使用场景:机器人开发预训练多任务模型、合成数据生成、激光雷达云、数字孪生、虚拟工厂、巨型光学望远镜和光子计数CT、碳捕获与太阳能电池的材料科学、气候科学在Earth-2上所做的工作、AI+AV等
影响职业:翻译、动画转化、指令转化成行动、治疗师、梦想家、导航者、创造者、好帮手
翻译:文本转化为创造性发现
动画转化:动作转化为3D动画
指令转化成行动:
治疗师:探索人类组成基础-威胁发生前建模-寻找治疗方法防止入侵
梦想家:创造新的医学奇迹
导航者:海量内容中探索独特片刻
创造者:构建3D体验-虚拟自我提升至更高现实水平
好帮手:头脑风暴变为现实-分享100万程序员的智慧-想法转化为虚拟世界-编写脚本,为文字注入生命
二、软硬件、云业务及大数据
(一)、软件
1.ApacheSpark:加速云数据处理引擎,可加速处理包括GCP Dataproc、 Amazon EMR、Databricks 和 Cloudera。
2.RAFT加速库:用于加速索引、 数据加载和近邻检索。用于向量数据库加速合作方FAISS,milvus,redis。
3.cuOpt:加速调度和进化算法,每秒分析 300 亿次动作,打破了世界纪录。用于运营和调度合作方:AT&T,德勤,埃森哲等,用于对话式 AI、数字人等。
4.Triton:支持集成模型的模型分析器、并发多模型服务适用于 GPT-3 大语言模型的多 GPU、多节点推理。IDC推理服务合作方:美国运通、微软等。
5.重点CV-CUDA+VPF:计算机视觉用加速库+视频处理用加速库。CV-CUDA 包括 30 个计算机视觉算子,可用于检测、分割和分类。VPF 是一个 Python 视频编解码加速库。腾讯使用每日处理30万个视频、微软处理视觉搜索、超级酷的 Runway 公司 为其云生成式AI 视频编辑服务处理视频;视频已经占据了 80% 的互联网流量。
6.Parabricks:用于端到端基因组分析的AI模型加速库。加速计算帮助基因组学实现了里程碑式发展,现在医生可以在同一次就诊中抽取患者的血液,并对其 DNA 进行测序。另外,使用 NVIDIA 助力的仪器设备,将整个基因组测序的成本降低至仅需 100 美元。
7.Holoscan:实时传感器处理系统软件库。超过 75 家公司正在通过 Holoscan 开发医疗设备。Medtronic 宣布基于Holoscan 构建新一代 GI Genius 系统,将 AI 用于早期检测结肠癌并将于今年年底推出。
8.重点cuLitho:计算光刻库,将计算光刻加速了 40倍以上。合作方:台积电,ASML,Synopsys。
(二)、硬件
1、GraceSuperchip:通过900G低功耗芯片到芯片缓存一致接口(2个可构成一个1U服务器),适合云计算,风冷即可。Grace 的速度 比最新一代 x86 CPU 的平均速度快 1.3 倍,而在数据处理中则快 1.2 倍。华硕、 Atos、 GB、 HPE、 QCT、Supermicro、 Wistron 和 ZT 目前正在构建系统。
2、BlueField:加速数据中心操作系统和基础设施软件。Check Point、思科、 DDN、Dell EMC、 Juniper、 Palo Alto Networks、 Red Hat 和 VMWare 等超过二十个生态系统合作伙伴正在使用。
3、重点H100GPU:搭载Transformer引擎,为Transformer模型架构进行特化。
4、DGXH100超级计算机——8个H100通过NVLINKSwitch相连,通过400Gbps延迟的QuantumInfiniBand进行网络连接合作方:微软Azure,并用于处理类似令人惊叹的 ChatGPT 模型训练。
5、OVX服务器:针对Omniverse进行了优化。
6、AdaRTXGPU:用于新一代工作站。
(三)、云业务和大数据服务
1、DGXCloud:云服务平台。与Microsoft Azure、 Google GCP和 Oracle OCI合作。
2、重点AIFoundation:生成式AI模型训练和云服务。面向需要构建、优化和运营定制 LLM(大型语言模型)和生成式 AI,使用其专有数据进行训练,用于处理特定领域的任务。分为Nemo(文本),Picasso(图像)和Bionemo(生物医药用)三种。
3、重点OneArchitecture平台:四种推理平台:L4(视频工作用)、L40(图片渲染和图像文本转换)、H100NVL(针对LLM)和Grace-Hooper(针对推荐系统和向量数据库)。
4、重点Omniverse(联合微软office365组合):工业数字化平台合作方:亚马逊、奔驰和宝马等(OmniverseCloud在Azure上托管)。
三、会议中的关注点
1、推出NVIDIA cuLitho是计算光刻领域的一项突破,使半导体领导者能够加速下一代芯片的设计和制造。台积电可以通过在 500个 DGX H100系统上使用cuLitho加速,将功率从 35MW降至 5MW,从而替代用于计算光刻的 4万台 CPU服务器。
2、推出了一系列加速库,这些库包括用于汽车和航空航天行业的CFD求解器,用于量子计算的英伟达量子平台、大规模数据处理,进行湍流和空气动力学仿真;在电子领域,使用CFD进行热管理设计;NVIDIA A100的吞吐量是CPU服务器9倍,成本降低了9倍,能耗降低了17倍!
3、NVIDIA Grace™ CPU(英伟达数据中心处理器) 为每个数据中心的节能计算铺平了快车道。与主流应用程序相比,x86的能效性能提高了2倍。
4、推出DGX Cloud,企业不需采购与拥有服务服器,即可透过云服务供应商合作托管的DGX Cloud基础设施,透过浏览器取得超算电脑级的AI运算效能。
5、NVIDIA NeMo 服务(加快语音和语言模型的开发)可帮助企业将大型语言模型与其专有数据相结合,为更智能的聊天机器人、客户服务等提供支持。
6、CV-CUDA Beta(计算机视觉用加速库)优化了预处理和后处理,以四分之一的成本和能源实现更高的云吞吐量。微软、腾讯、百度等企业正在为自己的computer vision应用程序采用 CV-CUDA 的open source。
四、重要场景应用
1、医疗
药物研发是一个价值近 2万亿美元的行业,研发投入高达2500亿美元。NVIDIA Clara是一款医疗健康应用框架,用于影像仪器、基因组学分析和药物研发。
AI药物研发初创公司Insilico Medicine、 Exscientia、 Absci和 Evozyme等。
MegaMolBART和 MoFlow用于分子生成, DiffDock则用于分子对接。
药物研发和虚拟筛选的端到端工作流,BioNeMo的早期体验用户:Amgen、 AstraZeneca、 Insilico Medicine、 Evozyne、 Innophore和Alchemab Therapeutics。
Medtronic(美敦力) 将整合 NVIDIA 医疗保健和边缘技术,以加速AI的发展,并将基于 AI 的新解决方案引入患者护理。
2、数字化生产:价值3万亿美元
数字化目的是提高效率和速度,并节省了资金。Omniverse 是一个工业数字化平台,用途是以虚拟方式构建工厂,在真正的实体工厂建成之前,以数字方式整合工厂的所有机械设备。这样可以减少在最后时刻出现意外、变更订单和工厂延迟开工等情况。虚拟工厂整合可以为全球工厂节省数十亿美元。
Amazon Robotics用此制造、并部署了非常庞大的移动工业机器人机群。此机器人机群的最新成员是Proteus,这是 Amazon 首个完全自主的仓库机器人。Proteus 可利用先进的安全、感知和导航技术在我们的设施中移动。
沃尔沃汽车公司和通用汽车使用 Omniverse USD Composer连接和统一其资产工作流。
丰田公司正在使用Omniverse构建自己工厂的数字孪生。
梅赛德斯-奔驰使用 Omniverse为新车型构建、优化和规划组装流水线。
总结:随着AI未来在各行业的应用,其在各行业内的商业价值必将不断体现,当这些新事物到来的时候,我们用积极的心态去迎接他吧
标签: #apachespark体系