【银河计算机吴砚靖】全球科学技术动态追踪丨GPT-5有望今年夏季发布多模态能力预期提升

时间: 2024-03-31 09:40:54

  原标题:【银河计算机吴砚靖】全球科学技术动态追踪丨GPT-5有望今年夏季发布,多模态能力预期提升

  3.美国10年期国债利率下降至4.22%,累计下跌9bps;截至3月22日,美元兑人民币中间价报7.10;累计调升29个基点。

  近日,多家媒体公开消息称GPT-5预计将在今年夏季正式对外发布,目前仍处内测阶段。当前,最新版本GPT-4 Turbo已能支持最高12.8万tokens的输入,而谷歌近期发布的Gemini 1.5 Pro模型已经在输入长度方面实现了显著的突破,可支持100万tokens的输入,上下文输入长度方面大幅赶超。

  鉴于此,我们预计,GPT-5将在大模型的上下文输入长度实现重大突破,意味着GPT-5将有能力处理更长的文本,从而在理解和生成更复杂的语言结构上展现出更强大的能力。另外,新版本预计持续突破GPT-4的多模态能力,不仅限于处理文本、语音、图像等类型的信息,处理和理解多种类型的数据也将灵活性更好,生成质量预计实现飞跃。迈向AGI的进程中,“超长文本”的解决能力和“超强模拟物理运动”的能力将被视为关键。GPT-5的预期发布预计成为AIAGI发展重要催化剂,相关产业链投资机会依然凸显。

  美股走强,中概股及港股小幅回落:标普500指数+2.29%,纳斯达克综合指数+2.85%,费城半导体指数+3.16%;TAMAMA科技指数+3.77%;纳斯达克中国金龙指数-2.78%;恒生科技指数-2.65%;计算机+3.51%。

  债市:周内,中国10年期国债利率下降至2.31%,累计下跌1.49bps;美国10年期国债利率下降至4.22%,累计下跌9bps。

  汇率:3月22日,美元兑人民币中间价报7.10;较3月15日价累计调升29个基点。

  为扩大Blackwell的规模,英伟达构建了一款名为NVLink Switch的新芯片。每个芯片可以以每秒1.8TB的速度连接四个NVLink,并通过减少网络内流量来消除流量拥塞。

  大规模训练上,GB200 NVL72内含的第二代Transformer引擎,具有FP8精度,可将大型语言模型的训练速度提高4倍。

  AI推理方面,GB200 NVL72具有第二代Transformer引擎,可加速LLM推理工作负载。与上一代H100相比,其为1.8T参数GPT-MoE等资源密集型应用加速了30倍。

  节能方面,液冷GB200 NVL72机架系统可减少数据中心的碳足迹和能耗。液体冷却可提高计算密度,减少使用的占用面积,并促进与大型NVLink域架构的高带宽、低延迟GPU通信。与NVIDIA H100风冷基础设施相比,GB200在相同功耗下提供25倍的性能,同时减少用水量。

  数据处理方面,为了在GPU上高效处理数据集,Blackwell架构引入了硬件解压缩引擎,该引擎可以大规模本地解压压缩数据,并进行端到端加速。该解压引擎支持LZ4、Deflate和Snappy压缩格式的数据。解压缩引擎加快了内存绑定的操作,提供高达800GB/s的速度,并使Grace Blackwell的执行速度比CPU(Sapphire Rapids)快18倍,比NVIDIA H100 Tensor Core GPU快6倍。凭借8TB/s的高内存带宽和Grace CPU高速NVlink-Chip-to-Chip(C2C),该引擎加快了数据库查询的整一个完整的过程。使得用户能快速获得数据,同时降低成本。

  基于物理模拟方面,仿真模拟仍然是产品设计和开发的支柱。从飞机和火车到桥梁、硅芯片,甚至药品,通过仿真测试和改进产品可节省数十亿美元。专用集成电路几乎完全在CPU上设计,工作流程复杂,包括使用模拟分析来识别电压和电流。以Cadence SpectreX仿真器为具体例子,SpectreX在GB200上的工作速度比在x86 CPU上快13倍。

  业界广泛使用GPU用于计算流体动力学(CFD)。工程师和设备设计师使用它来研究和预测他们的设计。以Cadence Fidelity大型涡流模拟器(LES)为例,在GB200 上运行模拟的速度比x86 CPU快22倍。

  英伟达于2024年3月18日发布人形机器人通用基础模型Project GR00T。除此之外,还发布了一款基于NVIDIA Thor系统级芯片(SoC)的新型人形机器人计算机 Jetson Thor,并对NVIDIA Isaa机器人平台做了重大升级,包括生成式AI基础模型和仿真工具,以及AI工作流基础设施。

  GR00T驱动的机器人将能够理解自然语言,并通过观察人类行为来模仿动作、快速学习协调、灵活性和其它技能,以适应现实世界并与之互动。

  Jetson Thor是一个全新的计算平台,能够执行复杂的任务,并安全、自然地与人和机器交互。该SoC包括一个带有Transformer Engine的GPU,采用了Blackwell架构,可提供每秒800万亿次8位浮点运算AI性能,以运行GR00T等多模态生成式AI模型。凭借集成的功能的安全处理器、高性能CPU集群和100GB带宽,简化了设计和集成工作。

  英伟达还发布了Isaac Manipulator和Isaac Perceptor等一系列机器人预训练模型、库和参考硬件。Isaac Manipulator为机械臂提供了灵活性和模块化AI功能,并提供了基础模型和GPU加速库。它提供了80倍的路径规划加速,零样本感知提高了效率和吞吐量,使开发者可以在一定程度上完成更多新的机器人任务的自动化。Isaac Perceptor提供了多摄像头和3D环绕视觉功能,这些功能正在被制造业和物流业中的自主移动机器人所采用,以提高效率和更好地保护工人,同时降低错误率和成本。

  OpenAI预计在未来几个月内发布其ChatGPT模型的下一个版本。据知情的人偷偷表示,可能在夏季发布GPT-5。另一位则表示,一些企业客户最近已经看到了最新模型及其对ChatGPT工具的相关增强演示。

  OpenAI目前还没有为新模型设置具体的发布日期,这在某种程度上预示着目前内部预期可能改变。据知情的人偷偷表示,OpenAI仍在训练GPT-5。训练完成后,它将在内部进行安全测试,并进一步进行“红队测试”,红队测试通常由外部专家或组织内部专门的红队人员执行,该测试的目的是在发布前找到问题。红队安全测试需要完成的具体时间框架尚不明确,因此这一过程可能会推迟任何发布日期。

  当前,最新版本GPT-4 Turbo已能支持最高12.8万tokens的输入,而谷歌近期发布的Gemini 1.5 Pro模型已经在输入长度方面实现了显著的突破,可支持100万tokens的输入,上下文输入长度方面大幅赶超。

  技术迭代没有到达预期风险;科技巨头竞争加剧风险;法律监管风险;供应链风险;下游需求没有到达预期风险。

  本文摘自:中国银河证券2024年3月29日发布的研究报告《【银河计算机】全球科学技术动态追踪_GPT-5有望今年夏季发布,多模态能力预期提升》

  评级标准为报告发布日后的6到12个月行业指数(或公司股票价格)相对市场表现,其中:A股市场以沪深300指数为基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准,北交所市场以北证50指数为基准,香港市场以摩根士丹利中国指数为基准。

  本公众订阅号为中国银河证券股份有限公司(以下简称“银河证券”)研究院依法设立、运营的两个研究官方订阅号之一(另一为“中国银河宏观”)。其他机构或个人在微信平台以中国银河证券股份有限公司研究院名义注册的,或含有“银河研究”,或含有与银河研究品牌名称等相关信息的其他订阅号均不是银河研究官方订阅号。

  本订阅号不是银河证券研究报告的发布平台,本订阅号所载内容均来自于银河证券研究院已正式对外发布的研究报告,本订阅号所摘录的研究报告内容经相关流程及微信信息发布审核等环节后在本订阅号内转载,本订阅号不承诺在第一时间转载相关联的内容,如需了解详细、完整的证券研究信息,请参见银河证券研究院发布的完整报告,任何研究观点以银河证券发布的完整报告为准。

  本订阅号旨在交流证券研究经验。本订阅号所载的全部内容只提供给订阅人做参考之用,订阅人须自行确认自己具备理解证券研究报告的专业能力,保持自身的独立判断,不应认为本订阅号的内容可以取代自己的独立判断。在任何情况下本订阅号并不构成对订阅人的投资建议,并非作为买卖、认购证券或其它金融工具的邀请或保证,银河证券不对任何人因使用本订阅号发布的任何内容所产生的任何直接或间接损失或与此有关的别的损失承担任何责任,订阅号所提及的任何证券均可能含有重大的风险,订阅人需自行承担依据订阅号发布的任何内容做投资决策可能会产生的一切风险。

  本订阅号所载内容仅代表银河证券研究院在相关证券研究报告发布当日的判断,相关的分析结果及预测结论,会根据银河证券研究院后续发布的证券研究报告,在不发出预先通知的情况下做出更改,敬请订阅者重视后续研究报告的最新相关结论。