El día de hoy AMD lanza su nueva tarjeta basada en la arquitectura RNDA3 orientada al gaming en 1440p, este segmento de jugadores es particularmente atractivo para AMD, ya que son quienes están actualmente en la decisión de actualizar su tarjeta gráfica, pero no quieren gastar un dineral, ni tampoco quieren optar por un producto antiguo.
Para esto, AMD desarrolló un nuevo GPU bajo el nombre interno de NAVI 32, este consta de un diseño similar al que conocimos en las Radeon RX 7900 XT y Radeon RX 7900 XTX, pero con una diferencia, que acá se tienen 4 MCD, en vez de los 6 CMD del chip NAVI 31.
Con este cambio en el diseño, se bajan los costos, y con ello el precio final sugerido para los consumidores, que en el caso de esta Radeon RX 7800 XT será de $499 USD, el cual AMD quiere posicionar de manera directa contra la GeForce RTX 4070 de NVIDIA, la cual tiene un precio actual de $599 USD (ver Newegg.com).
Arquitectura.
La arquitectura RDNA 3 de AMD cambia fundamentalmente varios de los elementos de diseño clave para las GPU, gracias al uso de chiplets. Y ese es un buen lugar para comenzar como cualquier otro.
Navi 32 consta de dos piezas principales, el Graphics Compute Die (GCD) y los Memory Cache Dies (MCD). Hay similitudes con lo que ha hecho AMD con sus CPU Zen 2/3/4, pero todo se ha adaptado para satisfacer las necesidades del mundo gráfico.
El Graphic Compute Die (GCD) alberga todas las unidades de cómputo (CU) junto con otras funciones principales, como hardware de códec de video, interfaces de pantalla y la conexión PCIe. El GCD de Navi 32 tiene hasta 60 CU, que es donde ocurre el procesamiento de gráficos típico. Pero también tiene un enlace Infinity Fabric a lo largo de los bordes superior e inferior (conectado a través de algún tipo de bus al resto del chip) que luego se conecta a los MCD.
Los MCD, como su nombre lo indica (Memory Cache Dies), contienen principalmente los grandes bloques de caché L3 (Infinity Cache), además de la interfaz de memoria física GDDR6. También deben contener enlaces de Infinity Fabric para conectarse al GCD, que puede ver en la toma del die a lo largo del borde central de los MCD.
Los GCD utilizan el nodo N5 de TSMC y empaquetarán 45.700 millones de transistores en una matriz de 300 mm2. Mientras tanto, los MCD están construidos en el nodo N6 de TSMC, cada uno con 2.050 millones de transistores en un chip de solo 37 mm2 de tamaño. El caché y las interfaces externas son algunos de los elementos de los procesadores modernos que escalan peor, y podemos ver que, en general, el GCD tiene un promedio de 152,3 millones de transistores por mm2, mientras que los MCD solo promedian 55,4 millones de transistores por mm2.
Para poder interconectar todos los chips entre sí, es que AMD trabajó sobre la tecnología Inifinity Fabric y la mejoró, llamandola High Performance Fanout. De esta forma pudieron disminuir el tamaño de esta, y con ello reducir drásticamente los requisitos de energía, y AMD dice que todos los enlaces Infinity Fanout combinados brindan 3.5 TB/s de ancho de banda efectivo y solo representan menos del 5 % del consumo total de energía de la GPU.
Fuera de las cosas del chiplet, muchos de los cambios más grandes ocurren dentro de las Unidades de cómputo (CU) y los Procesadores de grupo de trabajo (WGP). Estos incluyen actualizaciones de los tamaños de caché L0/L1/L2, más registros SIMD32 para FP32 y cargas de trabajo de matriz, e interfaces más amplias y rápidas entre algunos elementos.
Los cachés y las interfaces entre los cachés y el resto del sistema han recibido actualizaciones. Por ejemplo, el caché L0 ahora es de 32 KB (doble RDNA 2) y los cachés L1 son de 256 KB (doble RDNA 2 nuevamente), mientras que el caché L2 aumentó a 6 MB (1,5 veces más grande que RDNA 2).
El enlace entre las unidades de procesamiento principales y la memoria caché L1 ahora es 1,5 veces más ancho, con un rendimiento de 6144 bytes por reloj. Asimismo, el enlace entre la caché L1 y L2 también es 1.5 veces más ancho (3072 bytes por reloj).
El caché L3, también llamado Infinity Cache, se redujo en relación con Navi 22. Ahora es de 64 MB frente a los 128 MB en la generación anterior. Sin embargo, el enlace L3 a L2 ahora es 2,25 veces más ancho (2304 bytes por reloj), por lo que el rendimiento total es mucho mayor.
Los aceleradores de rayos RDNA 2 podrían hacer hasta cuatro intersecciones de rayos/cajas por reloj, o una intersección de rayos/triángulos. Por el contrario, Arc Alchemist de Intel puede hacer hasta 12 intersecciones de rayos/cajas por RTU por reloj, mientras que Nvidia no proporciona un número específico, pero tiene hasta dos intersecciones de rayos/triángulos por núcleo RT en Ampere y hasta cuatro intersecciones de rayos. /intersecciones de triángulos por reloj en Ada Lovelace. Lo que sí sabemos es que RDNA 3 tiene un recorrido BVH (Bounding Volume Hierarchy) mejorado que aumenta el rendimiento del trazado de rayos comparado a RNDA2.
El Dual Media Engine debería llevar a AMD a la par con Nvidia e Intel en el lado del video, permitiendo explotar el uso de la Codificación y Decodificación utilizando AV1.
Eso en lo relativo a su arquitectura, si quieren ahondar más, les recomendamos que lean nuestro artículo especial, donde encontrarán mayor detalle.
Especificaciones.
Luego de ver lo nuevo de esta arquitectura, pasemos a ver sus especificaciones.
Especificaciones | AMD Radeon RX 7900XT | NVIDIA RTX 4070Ti | AMD Radeon RX 7800XT | NVIDIA RTX 4070 | AMD Radeon RX 6800 XT | AMD Radeon RX 7700XT | AMD Radeon RX 6700XT | NVIDIA RTX 4060 TI |
---|---|---|---|---|---|---|---|---|
Proceso de Fabricación | 5 nm | 4 nm | 5 nm | 5 nm | 7 nm | 5 nm | 7 nm | 5 nm |
GPU | Navi 31 XT | AD104-400-A1 | Navi 32 XT | AD104-250-A1 | Navi 21 XT | Navi 32 | Navi 22 XT | AD106-350-A1 |
Shaders | 5376 | 7680 | 3840 | 5888 | 4608 | 3456 | 2560 | 4352 |
ROPs | 192 | 80 | 96 | 64 | 128 | 96 | 64 | 48 |
Texture Units | 336 | 240 | 240 | 184 | 288 | 216 | 160 | 136 |
Tensor Cores | - | 240 | - | 184 | - | - | - | 136 |
RT Cores / Ray Accelerators | 84 | 60 | 60 | 46 | 72 | 54 | 40 | 34 |
Core Clock | 1500 MHz | 2310 MHz | 1800 MHz | 1920 MHz | 1825 MHz | 1900 MHz | 2321 MHz | 2310 MHz |
Boost Clock | 2394 MHz | 2610 MHz | 2430 MHz | 2475 MHz | 2250 MHz | 2544 MHz | 2581 MHz | 2535 MHz |
Frecuencia de Memoria | 2500 MHz | 1313 MHz | 2425 MHz | 1313 MHz | 2000 MHz | 2250 MHz | 2000 MHz | 2250 MHz |
Memoria | 20 GB, GDDR6, 320 bit | 12 GB, GDDR6X, 192 bit | 16 GB, GDDR6, 256 bit | 12 GB, GDDR6X, 192 bit | 16 GB, GDDR6, 256 bit | 12 GB, GDDR6, 192 bit | 12 GB, GDDR6, 192 bit | 8GB, GDDR6, 128 bit |
Conectores | 2x 8-pin | 1x 16-pin | 2x 8-pin | 1x 16-pin | 2x 8-pin | 2x 8-pin | 1x 6-pin + 1x 8-pin | 1x 16-pin |
TDP | 315 W | 285 W | 263 W | 200 W | 300 W | 245 W | 230 W | 160 W |
Precio | $899 | $799 | $499 | $599 | $649 | $449 | $479 | $399 |
Una mirada de lo que GPU-Z nos informa.
Primera Mirada.
Démosle una mirada a este ejemplar de tarjeta de video Referencial de AMD.
Muy similar a lo que vimos con la Radeon RX 7900 XT o Radeon RX 7900 XTX, con una silueta de la tarjeta gráfica, y el juego de tonalidades negras, grises y el distintivo ROJO en 3 aletas del disipador.
Desde las Radeon RX 7900 XT y RX 7900 XTX, que se tiene un empaque de este estilo, minimalista y con un diseño donde predomina el negro y rojo.
Por la vista frontal este ejemplar de Navi 32 cuenta con 2 ventiladores, muy similar a lo que nos enseñó AMD en su modelo RX 6700XT.
Por la cara posterior la tarjeta de video cuenta con un backplate con un diseño con relieves muy atractivo.
La Radeon RX 7800XT se abastece de energía auxiliar a través de 2x conectores de 8 pines.
A nivel de salidas de video cuenta con 3x Display Port 2.1 y 1x HDMI 2.1b.
Bajo el backplate en la cara posterior vemos un PCB tamaño similar al sistema de refrigeración, también nos confirma que desde esta zona el backplate ofrece disipación a través de 3 pads térmicos que conectan con la zona posterior de 3 chips de memorias.
Los VRMs de la tarjeta están refrigerados por bloque independiente al de las memorias y GPU.
Disipador de 4 heatpipe con bloque para memorias y contacto con GPU en cobre, en la zona de refrigeración activa 2 ventiladores Delta.
Las memorias para este modelo de AMD vienen de parte de SAMSUNG con el modelo K4ZAF325BC-SC20 en 8 modulo y cada modulo cuenta con 2GB de memoria para dar el total de 16GB.
Controlador PWM MP2856 y controlador MPS2242.
Plataforma de Pruebas y Metodología.
Plataforma de Pruebas | |
---|---|
Procesador | - AMD Ryzen 9 7950X |
Placa Madre | - ASUS ROG CROSSHAIR X670E HERO |
Memoria | - Corsair Dominator Platinum RGB 6000 2x16GB EXPO |
Refrigeración | - Thermaltake Water 3.0 Riing RGB 360 |
Tarjeta de Video | - AMD Radeon RX 7800XT 16GB |
Fuente de Poder | - ASUS ROG THOR II 1000W |
Almacenamiento | - Corsair MP600 PRO 1TB M.2 PCIe 4.0 |
Monitor | - ASUS MG28UQ |
- Sistema operativo Windows 10 Pro x64 [22H2].
- Las pruebas fueron realizadas en un ambiente con temperatura de 23ºC aproximadamente.
- La plataforma fue utilizada sin gabinete.
- Driver de Video utilizado: 23.20.01.05-Win10-Win11-B4-PRESS-Navi32-XTX-XL-Aug23
- Las resoluciones de las pruebas sintéticas son las predeterminadas por cada uno de los benchmarks.
Pruebas Rasterizado.
Se puede apreciar que en Rasterizado, esta Radeon RX 7800 XT esta directamente ante la RTX 4070 de NVIDIA, y en ciertos juegos, contra la RTX 4070 Ti.
Pruebas Ray Tracing.
Veamos ahora juegos y aplicaciones con uso de Raytracing, sin aplicar escaladores o generadores de fotogramas.
Como era de suponer, el poder de cómputo en Raytracing sigue siendo la debilidad de AMD, a pesar de ello en muchas ocasiones queda muy cerca de la RTX 4070, teniendo en cuenta que esto es rendimiento en ratracing nativo, sin la ayuda de DLSS o FSR.
Pruebas Reescalado (DLSS/FSR – Rendimiento)
Ahora se tienen algunas pruebas aplicando reescalado de imagen, en una configuración de Performance.
Se puede apreciar el beneficio que tiene aplicar estas tecnologías de reescalado de imagen, sin embargo no se pueden comparar de manera directa DLSS con FSR, ya que operan de maneras diferentes. De todas maneras, a pesar de ello la RX 7800 XT logra dar una pelea ante la RTX 4070.
En esta oportunidad no se aplicó generador de fotogramas (Frame Generation), solo se utilizó DLSS 2.
Overclocking.
La posibilidad de overclocking en controladores Beta no suele ser siempre las mejores, sin embargo en esta oportunidad se ha logrado llevar al GPU a una frecuencia Boost base a los 2750 MHz (+ 13%) y en las memorias 2600MHz (+6%). Para ello también se aumento a un 15% más el limite de energía, todos estos cambiamos aplicados a través de la suite Radeon Software.
Con esta configuración de frecuiencias, se volvieron a ejecutar algunas pruebas, siendo el resultado el siguiente.
Las frecuencias adicionales entregan resultados que para pruebas sintéticas va desde un incremento de 2% a 5% mientras que para una prueba real ronda el 5%, lo que no está mal considerando un modelo referencial y controlador Beta, posiblemente con modelos mejorados de fabricantes y un controlador más acabado podría elevar aún más el adicional de rendimiento que nos puede entregar el overclocking.
Consumo y Temperatura.
La eficiencia energética ha sido un tema con las últimas tarjetas de AMD, ya que RDNA3 no se ha caracterizado por ser de las mejores en términos de consumo y manejo de la energía.
El consumo se alza hasta los 252W y 293W bajo nuestra configuración de overclocking, probablemente este sea el lado más oscuro de este modelo de Radeon, esto ya que si nos vamos a lo que experimentamos en una RTX 4070 (siendo el modelo directo a competir), la diferencia de consumo es más de 60W.
En los resultados de las pruebas hemos logrado en varios casos un rendimiento mayor a la NVIDIA RTX 4070 esto se opaca si consideramos que para ello debe sacrificar un consumo mayor, probablemente en una relación consumo/rendimiento la Radeon RX 7800XT no quedaría muy bien vs la NVIDIA RTX 4070.
Por otro lado la temperatura de esta versión referencial de la Radeon RX 7800XT llega a un peak de 70ºC, mientras que bajo el overclocking aplicado aumenta a 73ºC, la velocidad del ventilador para ambos escenarios no superaba el 55% de la velocidad. Si bien es posible aumentar un poco más la velocidad de los ventiladores y llevar la temperatura hacia los 60ºC el impacto del ruido podría ser más de lo que se suele percibir. Probablemente este apartado tenga grandes mejores a través de los modelos que los partners ofrezcan.
Ruido.
La tarjeta de video en su 100% experimenta una generación de ruido situada en muy ruidosa, dejando a su modo auto como moderado. Si bien son solo 2 ventiladores al parecer aumentan su velocidad por sobre lo que lo haría una de 3 ventiladores para compensar la falta de este y mantener la tarjeta fresca. En la practica, ofrece una experiencia dentro de los margenes normales para las características que hemos revisado en la tarjeta.
Conclusión.
La propuesta que nos plantea AMD con Navi 3x mejoró con creces lo que los usuarios experimentaron con la serie anterior, el aumento de rendimiento explotó en esta nueva serie y le ha permitido a AMD ser aún más competitiva en nuevas gamas, sobre todo en esta gama de la la Radeon RX 7800XT forma parte.
El diseño posee rasgos que hace recordar a la Radeon RX 6700XT por su configuración de doble ventilador, justamente ese doble ventilador limita en cierto sentido la experiencia de este modelo al no estar en línea a la generación de temperatura que desarrolla el modelo, un diseño similar a lo que ofrece en la RX 7900XT podría haber sido una buena opción.
Algunos puntos débiles de este nuevo modelo podría estar vinculado al consumo, una variable que también a aplicado en otros modelos y básicamente en las nuevas series de tarjetas de video, las cuales siguen sumando más y más consumo por sobre modelos anteriores sin respetar las gamas de estas, demostrando con ello que la eficiencia no forma parte principal del desarrollo de estos nuevos GPUs.
Como todo lanzamiento de AMD, los controladores suelen sentirse algo delicados, si bien no tuvimos caídas mientras mediamos el rendimiento, si en ocasiones algunas diferencias en los resultados bajo la misma prueba, sobre todo cuando se activaba el FSR.
Para finalizar con algunas palabras para este modelo, podemos decir que AMD si ha puesto en el mercado una tarjeta que le permitirá competir en gama media – alta, si bien con los inconvenientes previamente mencionados se logren pulir con próximos controladores, desde ya este modelo debería ser una buena opción para contenido en 1440p ultra. Aunque NVIDIA aún tiene algunos trucos bajo la manga como DLSS 3.5, en fuerza bruta la tarjeta ofrece un buen rendimiento, claramente tendrá una ventaja cuando no estén disponible las tecnologías de NVIDIA.