意外!老黄剧透下一代GPU芯片,新演讲又把摩尔定律按在地上摩擦

来源: 新京报
2024-06-03 07:23:20

  来源:量子位

  刚刚,中国台湾大学体育场,欢呼阵阵如同演唱会,但这次“摇滚巨星”,其实是英伟达创始人黄仁勋,再次回到学校,带来Computex重磅演讲,以及英伟达的新一代GPU。

  是的,英伟达新架构Blackwell宣布不过3个月,老黄就把后三代路线图全公开了:

2025年Blackwell Ultra,2026年新架构Rubin,2027年Rubin Ultra。

  好好好,像做iPhone一样造芯片。

  到这一代Blackwell为止,英伟达已经把AI模型有效扩展到万亿参数。(还给token定了个译名:词元)。

1.8万亿参数GPT4的训练能耗,8年降低至原来的1/350。

推理能耗,8年降低至原来的1/45000。

  看着这一波亮相和剧透,网友真相了:英伟达没有竞争对手,而是选择将摩尔定律放在地上摩擦……

  老黄是在书写自己的定律。

  所以应该叫老黄定律?还是英伟达定律?

  ComputeX前夜,老黄一开场就展开了一波隐形卖货,他自称不太准确的“CEO数学”:

买得越多,省得越多……

The more you buy, the more you save.

  经典语录依然引发现场欢呼大笑:虽然不太准确,但好像有些道理……

  好了话不多说,这就来看看老黄这次到底搞了哪些事情

  “AI Factory Is generating”

  谈到当前新的产业革命,老黄表示:新的计算时代正在开始;而AI Factory正在诞生。

  他在现场展示了BlackWell系统。

  3月份GTC大会上还遮遮掩掩地说是GPT-MoE-1.8T模型,这下彻底摊牌了:GPT-4参数就是1.8T。

  跟DGX Hopper相比。

  现场还看到了它的真身,大概有两米那么高吧…

  而真正的AI Factory大概会长这样,大概有32000GPU。

  AI加速每个应用程序

  AI对于企业的影响,老黄认为AI加速每一个应用程序。他首先谈到了NIM推理微服务,这是一个帮助开发者或者企业轻松构建AI应用,简化大模型部署程序。

  不管是聊天机器人、还是生活/驾驶助手等,部署时间都能从几周缩短到几分钟。

  运行Meta Llama 3-8B的NIM可以产生比不使用NIM多3倍的tokens。

  企业和开发者可以使用NIM运行生成文本、图像、视频、语音和数字人类的应用程序。

  而背后源于丰富的技术合作生态——

  近200家技术合作伙伴,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys等,正在将NIM集成到他们的平台中。

  此次在这个NIM中还有上新,也就是ACE 生成式AI微服务,数字人AI技术套件。

  除了原有自动语音识别、文本到语音的转换和翻译、Nemotron语言模型、 Audio2Face等套件,还增加了两个技术:

  一个是可以基于音轨生成身体姿势Audio2Gesture;

  一个Nemotron-3 4.5B,这是英伟达首款SLM(小爱语言模型),专为低延迟端侧设备而生。

  ∂接下来,这一数字人微服务将部署在一亿台RTX AI PC上面。

  当前英伟达在新的合作伙伴,比如华硕、MSI的加入下,已经拥有超过200种RTX AI PC型号。

  还推出了RTX AI Toolkit,一个工具和SDK集合,帮助Windows开发者定制优化本地部署模型。

  同Mac相比,部署了RTX的Windows的Stable Diffusion推理速度是Mac的7倍。

每一台带有RTX的PC,都是一台RTX AIPC。

  用于机器人开发的技术平台Isaac

  这次一同亮相的,还有用于机器人开发的技术平台,NVIDIA Isaac

  为啥搞这玩意儿呢,老黄给出的理由是这样的:

机器人时代已经到来。

有朝一日,所有会移动的东西,都将实现自主化。

  这个Isaac平台具体长啥样呢?

  Isaac平台提供一系列英伟达加速库、AI基础模型和仿真技术,供机器人制造商集成到自己的技术栈中。

  注意,平台是模块化的,允许公司单独或一起采用多种技术。

  具体而言,其中包括:

  NVIDIA Isaac ROS:一系列模块化的ROS 2包,为ROS社区开发者带来NVIDIA加速和AI模型

  NVIDIA Isaac Perceptor:一个参考工作流程,提供基于AI的自主移动机器人的多摄像头3D环视能力

  NVIDIA Isaac Manipulator:一个简化AI启用机械臂开发的参考工作流程

  NVIDIA Isaac Sim:一款参考应用程序,用于在基于NVIDIA Omniverse平台的物理环境中模拟、测试和验证机器人,并生成合成数据

  NVIDIA Isaac Lab:Isaac Sim中的参考应用程序,针对AI机器人基础模型训练的强化、模仿和迁移学习进行了优化

  这些团队用上Isaac,一边提高制造工厂、仓库和配送中心的效率,同时确保人类同事的安全;一边也能充当重复劳动和超精确任务的执行者。

  现场放出了很多demo,很多工厂在英伟达Omniverse里建造了一个完全模拟现实的自助工厂,以及基于Isaac平台开发的AI机器人。

  官网悄悄推出游戏Agent助手

  除了现场老黄亲自发布的上述内容外,我们在英伟达官网还找到了一个彩蛋,一个巨久远的call back。

  Project G-Assist

  时间回到2017年愚人节,英伟达官网开了个大玩笑:

  宣称自家发布了一款支持10080款游戏的USB人工智能超算卡GeForce GTX G-Assist。

  重点在于它很AI。

  GeForce GTX G-Assist像是个AI游戏助手,可以帮助玩家自动完成游戏操作,甚至代打击败Boss。

  今天,英伟达真的将这个愚人节玩笑变为现实——

  英伟达官网上线Project G-Assist,一套工具和模型的集合而成的AI Agent系统,供游戏和应用程序开发者使用。

  通过前后剧情,Project G-Assist利用大模型对游戏输出响应,能够检查游戏性能和系统设置,建议用户优化以充分利用可用硬件,或者适当升级角色。

  玩家这边呢,还可以通过Project G-Assist找到最好的武器,也可以查询到最牛的攻略,然后就可以或制作武器材料,或一路杀怪通关。

  总而言之,Project G-Assist可以让人有个Agent外挂,但是不会让你完全挂机,

  官网还贴心表示:

G-Assist 项目不会像我们在2017年愚人节预言视频中那样完全替代您玩游戏,但它可以帮助您从您最喜欢的游戏中获得更多收益。

  游戏体验再上大分!

  据介绍,Project G-Assist支持各种模态的输入。

  可以是来自玩家的文本提示,或声音指令;可以是屏幕上显示框架的上下文;可以是来自应用程序或系统本身的API。

  这些数据都通过连接了游戏知识数据库的大模型处理,然后使用RAG(检索增强生成)生成和用户相关的查询结果——没错,Project G-Assist允许玩家使用PC或云端RTX AI驱动的知识库。

  Project G-Assist开发工具将出现在即将推出的RTX AI开发套件中,具体会用在哪些游戏上,还需要游戏开发商来决定并提供支持。

  为了让大家更好地使用Project G-Assist,英伟达贴心地附上视频教学大礼包,需要可自取。

  One More Thing

  整场发布会,老黄还整了不少活儿。

  比如AI老黄似乎已经成了发布会常客。

  在介绍天气预测模型时,他坦白承认在视频中那么流利讲普通话的那位是AI生成的,因为自己中文不太好。

  而本场重磅的BlackWell系统、AI Factory的核心构成,也被他各种搬来搬去……

  除了下一代GPU取名Rubin,我们还看到 Vera CPU,他们共同出现在新的Vera Rubin加速器上。而这一名称来源,实际上是来自美国一位女天文学家Vera Rubin,她是研究暗物质先驱。

  以及,COMPUTEX 2024不愧是6月开头就炸场的AI终端大戏。

  除了黄院士外,英特尔、AMD、高通等老板都悉数到场,接下来几天会挨个发表演讲。

  这些主题演讲,绝大部分都跟AIPC有关。

  大家一起蹲一蹲吧~

责任编辑:何俊熹

  一是加强场站和交通运输工具的消毒通风,对乘客和从业人员日常接触的重点区域、设施设备进行每日消毒通风,交通工具在行驶途中和每趟运输结束后,有条件的还要开窗通风换气。

  《指导意见》指出,要以习近平新时代中国特色社会主义思想为指导,深入学习贯彻党的二十大精神,坚持以人民为中心的发展思想,坚持尽力而为、量力而行,聚焦大型易地扶贫搬迁安置区,以满足搬迁群众对美好生活的向往为出发点和落脚点,以巩固拓展易地扶贫搬迁脱贫成果实施新型城镇化和乡村振兴战略为主线,着力扶持壮大县域特色产业,着力促进搬迁群众就业创业,着力提升安置区配套设施,着力完善基本公共服务体系,着力健全社区治理体系,解决好搬迁群众急难愁盼问题,加快实现人口市民化、就业多元化、产业特色化、基本公共服务均等化、社会治理现代化,全面转变搬迁群众生产生活方式,确保搬迁群众稳得住、逐步能致富,为推动脱贫地区高质量发展如期实现中国式现代化打下坚实基础。

  据中国网,1月19日,国务院联防联控机制就春节期间疫情防控有关情况举行发布会,会上, 中国疾控中心传防处研究员常昭瑞介绍,近期,泰国检出“德尔特克戎”毒株,该毒株是奥密克戎变异株BA.4、BA.5和德尔塔变异株AY.45的重组体,国际分类命名为XAY.2。该毒株于2022年8月31日首次在南非发现,目前在全球9个国家和地区监测到。2022年12月以来,以丹麦为主的极少数国家呈升高趋势,目前还没有关于该病毒传播力、致病力和免疫逃逸能力等方面的足够数据。

  在正常医疗方面,也有正常恢复的迹象。第一,全国普通门诊在逐步恢复。同时,普通门诊当中新冠患者比例在逐步降低,到1月17日非新冠的在普通门诊的就诊率达到99.5%,提示门诊正常诊疗在逐步恢复。第二,住院患者呈现波动上升趋势,住院患者中非新冠患者的住院比例大幅度提升,1月17日已经达到了85%,提示我们住院的正常诊疗也在恢复。特别要指出的是住院患者手术量在12月9日到31日呈现下降趋势,1月1日以后就呈现了稳步提升的态势。1月17日比12月7日住院的手术量,已经上升超过了20%。这些指标都反映出医疗机构的正常医疗服务正在得到恢复。

  <strong>三是加快电网规划投资建设。</strong>加快推进跨省跨区特高压输电工程规划建设,提升重要通道和关键断面输送能力,发挥跨省跨区电网错峰支援、余缺互济作用,持续提高大型风电光伏基地外送规模和新能源消纳能力。强化电网骨干网架,全力提升重大自然灾害等极端条件下电力系统安全稳定运行水平。加快智能配电网建设,促进新能源就地就近开发利用。

  经排查,全路网暂未发现异常情况,目前全线路段通行未受影响,各收费站通行正常,未收到灾情报告,各收费站应急救援专用通道已开启。(总台记者 贾宜超)

谢佳琳

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有