AMD 揭示了一种只需 52 KB 显存而不是千兆字节的渲染方法

AMD 揭示了一种只需 52 KB 显存而不是千兆字节的渲染方法

Arkadiy Andrienko

AMD研究人员提出了一种全新的实时渲染复杂对象的方法。其核心思想是通过直接在GPU上“即时”生成几何体,从而大幅减少VRAM的使用,完全绕过CPU。

传统上,高度详细的3D树模型完全存储在VRAM中,消耗数十GB的空间。新方法利用了使用DirectX 12工作图和网格节点的程序生成技术。它并不将所有几何体存储在VRAM中,而是将一个紧凑的“指令”算法(约50 KB)加载到GPU上,该算法描述了树的构建规则。在帧渲染过程中,GPU使用这些指令动态生成所需的精确树几何体,并具备所需的细节级别(LOD)。

结果呢?使用传统方法需要超过34 GB VRAM的场景,现在仅使用52 KB的实际数据。这减少了超过650,000倍。

该技术的主要优点:

  • 释放CPU。重负载由GPU处理,几乎不影响CPU。
  • 高速。在像Radeon RX 7900 XTX这样的显卡上,几何体生成大约需要3毫秒,即使在复杂场景中也能实现稳定的120 FPS。
  • 参数控制。艺术家可以灵活调整超过150个参数(树枝形状、季节性叶色、风动画),并获得即时的视觉反馈。
  • 内存效率。中间数据缓冲区(最多约1.5 GB)在每帧生成后立即释放。

虽然演示集中在树木上,但这种方法确实是通用的。核心原则是让GPU处理复杂几何体的程序生成,同时保持最小的内存占用,这可能适用于其他自然物体甚至纹理。这为创建更详细和多样化的开放世界铺平了道路,而无需极端的VRAM要求。

目前,该技术需要支持现代图形API(带有工作图/网格节点的DirectX 12)和近期的GPU(AMD RDNA 3+或NVIDIA RTX 30系列及更新)。研究人员正在探索与光线追踪的集成,并相信这种方法可能成为游戏行业的新优化标准。

    关于作者
    评论0