NVIDIA detalla el diseño de DLSS 4: una tecnología de renderizado completamente basada en IA
Masterbitz
hace 20 minutos2 Min. de lectura
NVIDIA ha publicado un trabajo de investigación sobre DLSS versión 4, su tecnología de renderizado de IA para el rendimiento gráfico en tiempo real. El sistema integra los avances en la generación de marcos, la reconstrucción de rayos y la reducción de latencia. La función insignia de la Generación Multi-Frame genera tres marcos adicionales para cada marco nativo. El DLSS 4 más tarde trae los marcos más vistos al usuario rápidamente para hacer es parecer una representación real. En el núcleo de DLSS 4 está un cambio de redes neuronales convolutionales a modelos transformadores. Estas nuevas arquitecturas de IA sobresalen en la captura de dependencias espacio-temporales, mejorando la velocidad de transmisión de rayos afecta a la calidad en un 30-50% según los puntos de referencia de NVIDIA. La tecnología procesa cada marco generado por IA en sólo 1 ms en RTX 5090 GPUs. significativamente más rápido que los 3,25 ms requeridos por DLSS 3. Para los juegos competitivos, la nueva función Reflex Frame Warp reduce la latencia de entrada hasta en un 75%, logrando 14 ms en THE FINALS y bajo 3 ms en VALORANT, según los propios puntos de referencia de NVIDIA.
La implementación de DLSS 4 aprovecha las capacidades de arquitectura específicas de Blackwell, incluyendo núcleos de tensor del FP8 y núcleos fusionados de CUDA. La tubería optimizada incorpora optimizadas optimizaciones de fusión de capas verticales y de memoria que mantienen el sobrecargador computacional manejable a pesar de utilizar modelos de transformadores, que son el doble de grandes que las implementaciones anteriores de CNN. Esta eficiencia permite el rendimiento en tiempo real incluso con el procesamiento de IA sustancialmente más complejo. El oleoducto unificado de IA reduce los requisitos de sintonización manual para los efectos rapaces, permitiendo a los estudios implementar trazados avanzados de rutas a través de diversas configuraciones de hardware. El diseño también aborda desafíos de juego como interpolar elementos de interfaz de usuario y efectos de partículas y reducción de artefactos en escenas de alta tensión. La combinación de volteo de hardware de NVIDIA y la integración del motor de pantalla inducida por Blackwell garantizan una estimulación precisa de los marcos recién generados para juegos suaves y de alta frecuencia, con imágenes precisas.
Para asegurar que DLSS funcione como estaba previsto y que las redes neuronales produzcan resultados de calidad, NVIDIA ha utilizado un arma secreta: una supercomputadora dedicada que ha ido mejorando continuamente el DLSS durante los últimos seis años. La tarea principal de la supercomputadora implica analizar fallas en el rendimiento de DLSS, como fantasmas, parpadeos o deslumbramiento a través de cientos de juegos. Cuando se identifican los problemas, el sistema aumenta sus conjuntos de datos de entrenamiento con nuevos ejemplos de gráficos óptimos y escenarios desafiantes que DLSS necesita abordar. De esa manera, DLSS aprende cómo son los juegos y genera marcos realistas como lo haría un motor de juego, sin ningún artefacto.
Comentarios