更多

首页

资讯

剁手党

氪新抢先看

帧玩家

图库

借助 Tensor Core、LLM和适用RTX PC的工具,为用户带来生成式AI

2024-01-09 11:16:31    来源:互联网    编辑:summer    

美国拉斯维加斯—CES—2024年1月8日—NVIDIA发布具有高性能生成式AI功能的 GeForce RTX™ SUPER桌面端GPU,来自OEM合作伙伴的全新AI笔记本电脑,及面向 开发者和消费者的全新NVIDIA RTX™加速的AI应用和工具。

数十年来,NVIDIA在PC领域一直处于领军地位,现已有超1亿RTX GPU在推动着AI PC 时代的发展,NVIDIA正通过提供工具以提升PC上的生成式 AI体验:

NVIDIA TensorRT™加速用于文本生成图像工作流的热门Stable Diffusion XL模型、 NVIDIA RTX Remix与生成式AI纹理工具、NVIDIA ACE微服务以及更多使用DLSS 3帧 生成技术(Frame Generation)的游戏。

此外,NVIDIA TensorRT-LLM (TRT-LLM) 是一个开源库,可加速和优化最新大语言模 型 (LLMs) 的推理性能,现已支持更多面向PC的预优化模型。本月,NVIDIA发布由 TRT-LLM加速的Chat with RTX技术Demo,让AI爱好者能与他们的笔记、文档和其他 内容进行交互。

NVIDIA创始人兼首席执行官黄仁勋表示:"生成式AI是计算史上最重要的平台转变,它 将改变包括游戏在内的所有行业。NVIDIA拥有超过1亿台RTX AI PC和工作站的用户 基础,为开发者和玩家提供保证,让他们尽享生成式AI的魔力。”

在 PC 上本地运行生成式AI对于隐私、延迟和成本敏感型应用至关重要。但这需要大 量AI系统安装基础,以及合适的开发者工具来调优PC平台的AI模型。

为满足这些需求,NVIDIA正通过其整个技术栈提供创新,推动新体验,并在现已支持 超过 500 款NVIDIA RTX游戏和应用的AI PC基础上更进一步。

RTX AI PC 和工作站

NVIDIA RTX GPU能以最高性能运行各种应用,充分释放 PC上生成式AI的潜力。 RTX GPU 中的Tensor Core可显著加速工作和娱乐应用中要求最严苛的AI功能。

今天在 CES 发布的全新 GeForce RTX 40 SUPER 系列GPU包括

GeForce RTX 4080 SUPER、4070 Ti SUPER 和 4070 SUPER,提供出色的 AI 性能。 在AI工作负载方面,GeForce RTX 4080 SUPER 生成视频的速度比 RTX 3080 Ti 快 1.5 倍,生成图像的速度比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的Tensor Core可提 供最高可达 836 AI TOPS,在游戏、创作和日常工作等方面提供革命性的AI性能。

包括宏碁、华硕、戴尔、惠普、联想、微星等合作伙伴发布全新 RTX AI 笔记本电脑, 为用户带来开箱即用的生成式 AI体验。与使用NPU相比,RTX AI笔记本电脑的性能可 提升 20-60 倍。

配备RTX GPU的移动工作站可运行NVIDIA AI Enterprise软件,包括TensorRT和 NVIDIA RAPIDS™,用于简化、安全的生成式AI和数据科学开发。每台 NVIDIA A800 40GB Active GPU都包含为期三年的NVIDIA AI Enterprise许可证,为AI 和数据科学提供理想的工作站开发平台。

用于构建AI模型的全新 PC 开发者工具

为帮助开发者使用 PC 级的性能和显存快速创建、测试和定制预训练生成式 AI 模型和 LLM,NVIDIA于近期发布统一、易用的工具包NVIDIA AI Workbench。

AI Workbench 将于本月底推出测试版,提供对Hugging Face、GitHub 和 NVIDIA NGC™ 等热门资源库的流畅访问、简化用户界面,使开发者能轻松复制、协 作和迁移项目。

项目可扩展到数据中心、公有云或 NVIDIA DGX™ Cloud等任何地方,然后再回到PC 或工作站上的本地 RTX 系统进行推理和轻量定制。

NVIDIA通过与惠普的合作,将 NVIDIA AI Foundation Models and Endpoints(包括 RTX加速的AI模型和软件开发工具包)集成到惠普AI Studio中,这是一个集成化的数据 科学平台,从而简化AI模型的开发。这将使用户能跨 PC 和云轻松搜索、导入和部署优 化后的模型。

为PC使用场景构建AI模型之后,开发者可使用NVIDIA TensorRT 对其进行优化,以充 分利用 RTX GPU 的Tensor Core。

最近,NVIDIA通过TensorRT-LLM for Windows将TensorRT扩展到基于文本的应用, TensorRT-LLM for Windows是一个用于加速LLM的开源库。TensorRT-LLM 最新更 新现已发布,将Phi-2加入不断增长的 PC 预优化模型列表,与其他backend相比,推 理速度提升5倍。

RTX 加速生成式AI为全新 PC 体验提供动力

在CES 2024上,NVIDIA及其开发者合作伙伴发布全新生成式AI驱动的 PC 应用和服 务,包括:

● NVIDIA RTX Remix,用于创建令人惊叹的经典游戏 RTX 重制版的平台。测试 版将于本月底发布,提供生成式AI工具,可将经典游戏中的基本纹理转化物理 精准的4K高精度材质。

● NVIDIA ACE 微服务,包括生成式AI驱动的语音和动画模型,使开发者能为游戏 添加智能、动态的虚拟数字人物。

● TensorRT 加速Stable Diffusion XL (SDXL) Turbo 和LCM,这是两种最热门的 Stable Diffusion加速方法。与之前最快的实现相比,TensorRT 将这两种方法 的性能提升 60%。Stable Diffusion WebUI TensorRT 扩展的更新版现在也已 发布,包括 SDXL、SDXL Turbo、LCM-LoRA加速以及优化的 LoRA支持。

● NVIDIA DLSS 3 支持帧生成技术(Frame Generation),可利用AI将帧率提高到 原生渲染的 4 倍,将用于已发布的 14 款全新 RTX 游戏中的十几款游戏中,包 括《地平线:西之绝境》(Horizon Forbidden West)、Pax Dei和《龙之信条 2》 (Dragon’s Dogma 2)。

● NVIDIA技术Demo "Chat with RTX"将于本月晚些时候发布,让AI爱好者使用 名为 " 检索增强生成retrieval-augmented generation(RAG)"的热门技术,轻 松地将PC LLM连接到自己的数据。该Demo由 TensorRT-LLM 加速,使用户快 速与自己的笔记、文档和其他内容进行交互。作为开源参考项目,开发者可轻 松地在自己的应用中实现相同的功能。

欢迎参加 NVIDIA在美国拉斯维加斯举行的CES 2024,进一步了解生成式AI的最新突破。

关于NVIDIA

自1993年成立以来,NVIDIA (NASDAQ: NVDA) 一直是加速计算领域的先驱。NVIDIA 1999年发明的GPU驱动了PC游戏市场的增长,并重新定义了现代计算机图形,开启了 现代AI时代,正在推动跨市场的工业数字化。NVIDIA现在是一家全栈计算公司,其数 据中心规模的解决方案正在重塑整个行业。更多信息,请访问https://nvidianews.nvidia.com/ 。

# # #

媒体咨询: Jade Li

NVIDIA GeForce, Studio PR

邮箱:jadli@nvidia.com

相关资讯