El día ha llegado, y se puede conocer el rendimiento real de los nuevos procesadores de AMD, esta nueva serie Ryzen 7000 llega con una nueva plataforma y mejoras de arquitectura, que preparan el camino de Ryzen de acá al futuro.
El salto de ZEN 2 a ZEN 3 fue grande, y se notó en variados tipos de aplicaciones, ahora AMD realiza un cambio de arquitectura nuevamente y se propuso un salto similar en rendimiento. Este salto también viene de la mano con un nuevo proceso de fabricación a 5nm para los CCX y 6nm para el IO.
Dentro del paquete de mejoras que tiene ZEN 4 sobre ZEN 3, se encuentran trabajos en el área de la predicción de rama (Branch Prediction), una caché de operaciones más grande (Op cache), instrucciones más grandes en las colas, archivos de registros INT/FP más grandes, etc.
Dentro de las mejoras que se hicieron en la sección del Front End, se tiene que ahora hay una L1 BTB un 50% mas grande, asimismo una L2 BTB mas grande que en ZEN 3, con esto se pueden predecir 2 ramas completas por ciclo. Además, la Op cache es un 68% mas grande comparada a ZEN 3 y la cantidad de macro-ops/ciclo se aumentó a 9.
En el motor de ejecución (Execution Engine) también hubo avances y mejoras, estas vienen dadas en un aumento de un 25% del tamaño de la cola de retiro, sumado a tener archivos de registros INT/FP mas grandes y buffers mas profundos dentro del núcleo. Finalmente se mantiene desde ZEN 3 la cantidad de schedules por ciclo de 10INT + 6 FP.
Finalmente se realizaron mejoras en la etapa de Carga y Almacenamiento (Load/Store), en esta lo primero es que la etapa de Load/Store Queues se aumentó en un 22%, esto ayudó a que hubiese menos conflictos de puerto para el cache de datos, y finalmente el caché L2 (I+D) paso de 512KB a 1MB. Desde ZEN 3 se mantiene la cantidad de 3 operaciones de memoria por ciclo, asimismo el máximo de 3 cargas por ciclo (2 si son instrucciones de 256bits), y un máximo de 2 almacenamientos por ciclo (1 si son instrucciones de 256bits), y los 6 TLB Workers.
En términos de la jerarquía en la memoria caché, el principal cambio fue el aumento de la cache L2 a 1MB, lo otro que fue mejorado es la cantidad de oustanding misses desde la L2 a la L3, y lo mismo en la cantidad de oustanding misses desde la L3 hacia la memoria. Todo lo demás en términos de jerarquía se mantiene similar a ZEN 3.
ZEN 4 trae consigo la inclusión de instrucciones AVX-512, este set de instrucciones creado por Intel que al tener un espacio de silicio dedicado para ello, permite la mejora en ejecución de aplicaciones y operaciones, como por ejemplo aplicaciones relacionadas a la inteligencia artificial, redes neuronales, de machine learning, aprovechando el soporte para instrucciones VNNI.
Este es un listado de las extensiones AVX-512 soportadas en ZEN4. Recordemos que Intel dejó de soportar estas instrucciones en sus procesadores de 12va Generación, quizás con la inclusión de AMD de este set de instrucciones las vuelvan a incorporar, o esta vuelva a tener un segundo aire. La ejecución de instrucciones AVX-512 generaba un aumento en la carga y en la temperatura de operación, y no tuvo mucho impacto en los usuarios finales.
Como resumen, tenemos esta tabla comparativa, de los cambios referentes a la arquitectura desde ZEN 3 hacia ZEN 4.
Nuevo chip IO de 6nm, con gráfica RDNA2 integrada
Este es un diagrama de arquitectura del nuevo chip IO que viene con los procesadores Ryzen 7000, este también viene bajo un nuevo proceso de fabricación, acá es TSMC de 6nm, y dentro de las novedades que incorpora se encuentra una unidad gráfica basada en RDNA2.
Obviamente también, como novedad es el aumento a 28 líneas PCIe 5.0, y el soporte de 2 canales de memorias DDR5 JEDEC-5200 con ECC, hasta un máximo de 128GB. Además, contiene todo lo aprendido desde Ryzen 6000 Mobile en lo relacionado al manejo de la energía, y las formas de trabajar con niveles de bajo consumo.
Esta es el diagrama de la pequeña unidad gráfica integrada que tienen todos los procesadores Ryzen 7000, y cuando decimos pequeña, es porque realmente lo es. Solamente tiene 2 CU, pero está pensada para ayudar en tareas de procesado, como por ejemplo aplicaciones CAD, CAM, etc.
La solución de gráficos integrados tiene capacidades de codificación/descodificación de hardware. Estas facultades pueden permanecer activas, incluso en presencia de un dispositivo gráfico discreto.
- 2x RDNA 2 compute units
- 4x ACE
- 1x HWS
- Encode: H.265 10bpc/8bpc, H.264 10bpc/8bpc
- Decode: AV1 10bpc/8bpc, VP9 10bpc/8bpc, H.265 10bpc/8bpc, H.264 10bpc/8bpc
- Display:
- HDMI 2.1 with: HFR, 48Gbps FRL, DSC, HDR10+, and VRR extensions
- DisplayPort 2.0 Ready with: Adaptive-Sync, DSC, UHBR10, and HDR extensions
Topología 2 CCD + cIOD, y manejo de Frecuencias en las memorias
Finalmente, esta será la topología para procesadores con 2 CCD en el package, como por ejemplo los Ryzen 7 y Ryzen 9. En esta topología aparecen los conceptos que ya conocimos con ZEN 3, como el fclk (frecuencia Infinity Fabric), el uclk (frecuencia Memory Controller) y memclk (frecuencia Memorias RAM), estas 3 frecuencias son importantes para el mejor desempeño de tus procesadores.
La recomendación para la serie Ryzen 5000 era mantener fclk, uclk y mlk vinculados 1:1:1 para un rendimiento óptimo; este ya no es el caso. Debido a que las frecuencias de DDR5 son significativamente más altas que las de DDR4, el mejor curso de acción para un usuario es dejar Infinity Fabric en AUTO y escalar el controlador de memoria y la DRAM en una proporción de 1:1.
En otras palabras: fclk:uclk:mclk establecido en AUTO:1:1 es probablemente el mejor rendimiento.
¿Qué significa el fclk en AUTO?
En términos generales, la RAM y el controlador de memoria están vinculados 1:1, mientras que RAM vs. Fabric se establece en 2000 MHz. Esta configuración generalmente dará como resultado el mejor rendimiento del usuario. Ejemplos de estas proporciones en acción:
- DDR5-4800 = 2400MHz RAM, 2400MHz IMC (relación 1:1) y 2000MHz Fabric
- DDR5-5200 = 2600MHz RAM, 2600MHz IMC (relación 1:1) y 2000MHz Fabric
- DDR5-6000 = 3000MHz RAM, 3000MHz IMC (relación 1:1) 2000MHz Fabric
Una vez que la frecuencia de la memoria DDR5 supera los 3000 MHz (DDR5-6000), la estrategia de proporción automática cambiará para la frecuencia de la memoria en uso. El reloj del controlador de memoria (uclk) cambiará a 1:2 con la frecuencia de la memoria. Es por ello que se menciona que DDR5-6000 es el «sweet spot» para estos Ryzen 7000.
En cuanto a las frecuencias de memoria y las capacidades admitidas, mientras que AM5 impone el uso de DDR5, en última instancia, son los controladores de memoria individuales los que determinan el resto. Para los procesadores de escritorio Ryzen 7000 de AMD, que se basan en el diseño Zen 4 Raphael, estos chips ofrecen soporte para velocidades oficiales (JEDEC) de hasta DDR5-5200 para una configuración de 1 DIMM por canal (DPC). Pero, como todos los demás productos DDR5 que hemos visto hasta ahora, 2 DPC viene con una penalización significativa; en ese caso, la velocidad máxima de JEDEC se reduce a solo DDR5-3600.
Entonces, como fue el caso con la plataforma Alder Lake de Intel, los desarrolladores de sistemas necesitarán pensar mucho más en cómo van a agregar memoria y cómo van a manejar la futura expansión de la memoria, si es que lo hacen. Si bien Ryzen 7000 puede manejar una configuración de 2 DPC/4 DIMM, se perderá el 31 % del ancho de banda de su memoria si sigue esa ruta. Entonces, para obtener el máximo rendimiento, será mejor tratar a Ryzen 7000 como una plataforma de 1 DPC.
AMD EXPO
Pero para la mayoría de los usuarios que realizan overclocking de memoria, es probable que simplemente confíen en los kits de memoria overclockeados de fábrica con perfiles preprogramados. Y aquí es donde AMD está implementando su propio estándar para esos perfiles de kit de memoria: EXPO.
AMD EXPO significa perfiles extendidos para overclocking y está diseñado para proporcionar a los usuarios overclocking de memoria de alto nivel cuando se usa junto con los procesadores de la serie Ryzen 7000 de AMD. Similar a la tecnología XMP (perfil de memoria extrema) preexistente de Intel que se encuentra en la mayoría de los kits de memoria de nivel de consumidor diseñados para plataformas Intel de escritorio, la tecnología EXPO de AMD tiene como objetivo hacer lo mismo, pero como un estándar abierto con énfasis en proporcionar la mejor configuración para las plataformas AMD.
La premisa de AMD EXPO es que es una función de overclocking DDR5 con un solo clic para placas base AM5. En la superficie, EXPO es esencialmente un conjunto de perfiles similares a XMP diseñados específicamente para los procesadores Ryzen 7000 (Zen 4) de AMD.
Cabe señalar que, a pesar de la existencia de EXPO, la memoria DDR5 con perfiles XMP será compatible con las plataformas Ryzen 7000. Aún así, AMD claramente está presionando a los clientes para que usen EXPO DIMM con sus sistemas para obtener el mejor rendimiento de los sistemas AMD.
En cuanto a EXPO en sí, como la mayoría de los otros estándares de AMD, la compañía está haciendo de este un estándar abierto y libre de regalías (se cree que XMP tiene regalías, pero nunca se ha publicado oficialmente cuánto). Por lo tanto, los socios de kits de memoria podrán implementar perfiles EXPO sin la bendición de AMD o sin necesidad de pagarle a AMD por el privilegio.
Dicho esto, EXPO será un programa de auto-certificación. Por lo tanto, AMD no está cobrando nada por él, pero al mismo tiempo no está haciendo mucho trabajo adicional para validar el soporte.
Al igual que con el overclocking de memoria manual, AMD espera que el punto ideal para los kits EXPO sea DDR5-6000. En un perfil de ejemplo proporcionado para un kit de memoria, ese kit funciona con DDR5-6000 CL30, con un voltaje VDD de 1,35 V. AMD espera que los kits como estos brinden el mejor rendimiento, ofreciendo latencias de memoria más bien bajas junto con un aumento más modesto en la frecuencia de la memoria.
Especificaciones.
Especificaciones | AMD Ryzen 9 7950X | Intel Core i9 12900K | Intel Core i7 12700K | AMD Ryzen 7 5800X | AMD Ryzen 5 7600X | Intel Core i5 12600K | AMD Ryzen 5 5600X |
---|---|---|---|---|---|---|---|
Proceso de Fabricación | 5nm | 10nm | 10nm | 7nm | 5nm | 10nm | 7nm |
Cores | 16 | 8+8 | 8+4 | 8 | 6 | 6+4 | 6 |
Threads | 32 | 24 | 20 | 16 | 12 | 16 | 12 |
GPU Core | Radeon 2 CU (RDNA2) | Intel UHD 770 | Intel UHD 770 | N/A | Radeon 2 CU (RDNA2) | Intel UHD 770 | N/A |
Frec. Base | 4.5GHz | 3.2 GHz (Performance), 2.4 GHz (Efficient) | 3.6 GHz (Performance), 2.7 GHz (Efficient) | 3.9 GHz | 4.7GHz | 3.7 GHz (Performance), 2.8 GHz (Efficient) | 3.7 GHz |
Frec. Máx | 5.7GHz | 5.2 GHz | 5.0 GHz | 4.5 GHz | 5.3GHz | 4.9 GHz | 4.6 GHz |
Caché L2 | 16MB | 14MB | 12MB | 4MB | 6MB | 9.5MB | 3MB |
Caché L3 | 64MB | 30MB | 25MB | 32MB | 32MB | 20MB | 32MB |
TDP | 170W | 125W | 125W Base 190W Turbo | 105W | 105W | 125W Base 150W Turbo | 65W |
Sist. Refrigeración | N/A | N/A | N/A | N/A | N/A | N/A | Wraith Stealth |
Precio USD | $699 SEP | $689 | $489 | $299 SEP | $349 | ||
Precio CLP | $449.900 | $389.990 | $329.000 | $249.000 |
Revisemos lo que indica CPU-Z
Primera Mirada.
El kit para este review fue entregado complemente por AMD, este cuenta con una placa madre ASUS ROG CROSSHAIR X670E HERO, Kit de memorias G.Skill TridentZ5 Neo 2x16GB DDR5-6000 compatibles con EXPO y 2 ejemplares de Zen4: Ryzen 9 7950X y Ryzen 5 7600X.
Internamente el procesador se presenta en dos empaques diferentes, por un lado el Ryzen 5 7600X (izquierdo) en una caja bien reducida donde se encuentra manual, kit y el procesador en blister (paciencia que cuesta un poco sacar el procesador del empaque) y por otro lado en un empaque más acabado el Ryzen 9 7950X (derecho)
En comparación con los procesadores de AM4, podemos ver el mismo tamaño, un «cuadrado» de las mismas dimensiones (40x40mm) que su generación anterior.
A la izquierda AM4 a la derecha AM5.
Una vez en la placa madre vemos el mismo acople del procesador a esta como se experimenta en Intel, o sea un socket LGA. Los cortes en el IHS son visibles aquí, lo que podría dificultar en cierta medida la distribución de la pasta termal sin caer a los sacados del IHS. Un punto a favor es que los orificios de los anclajes de refrigeración están unidos al back plate que sostiene el socket, por lo que no tendrás que preocuparte de sostener el backplate para anclar los tornillos de tu refrigeración.
Plataforma de Pruebas y Metodología.
Plataforma de Pruebas | |
---|---|
Procesador | - AMD Ryzen 9 7950X - AMD Ryzen 5 7600X |
Placa Madre | - ASUS CROSSHAIR X670E HERO |
Memoria | - G.Skill TridentZ5 Neo 2x16GB DDR5-6000 |
Refrigeración | - Thermaltake Water 3.0 Riing RGB 360 |
Tarjeta de Video | - AMD Radeon RX 6800 XT |
Fuente de Poder | - ASUS ROG THOR 1000W |
Almacenamiento | - Corsair MP600 PRO 1TB M.2 PCIe 4.0 |
Monitor | - ASUS MG28UQ |
- Sistema operativo Windows 10 Pro x64 [21H1].
- Las pruebas fueron realizadas en un ambiente con temperatura de 20ºC aproximadamente.
- La plataforma fue utilizada sin gabinete.
- Driver de Video utilizado: AMD Adrenalin 22.20.29.01 – BETA
- Las resoluciones de las pruebas sintéticas son las predeterminadas por cada uno de los benchmarks.
Pruebas 2D.
En 2D vemos un rendimiento increíble, podemos ver como deja muy por atrás a sus versiones de generación previa e incluso quitándole la corona a lo que el Core i9 12900K había logrado desarrollar. Particularmente es a nivel de memoria donde Zen4 no logra sorprender y es aquí donde se ve la falta de maduración de su tecnología EXPO y DDR5. En el resto las mejoras de arquitectura y frecuencia como parte de esto logran incluso a compensar la falta de núcleos al ver los 6 núcleos del Ryzen 5 7600X alcanzar sin problema a los 8 núcleos en Zen 3.
Pruebas 3D.
En el apartado 3D, hay datos donde sorprende esta nueva arquitectura como serían Shadow of the Tomb Raider, sin embargo en el resto Zen4 no logra levantar a lo que esperábamos ver, espero esto solo sea un factor más de controlador y BIOS que de la realidad de su arquitectura, ya que la 13va a la vuelta de la esquina necesitará de un gran impulso en gaming para seguir dominar este competitivo segmento.
Pruebas iGPU.
Una de las grandes diferencias de esta generación, además del salto de su arquitectura es también la presencia de videos en modelos que con anterioridad no contaban con este. Si bien AMD no apuntó un video integrado como el que conocemos en los Ryzen 7 5700G y Ryzen 5 5600G, en esta generación si podremos ver una solución con Ryzen 9 con video integrado, así como Intel ha entregado esto en sus i9. Otra sorpresa es ver como RDNA2 comienza a responder en soluciones integradas, una arquitectura grafica que si dio un buen salto de rendimiento en este ámbito con respecto a su generación previa y más desde Vega que es la arquitectura de los Ryzen 5000 con video.
El resultado es lo que podríamos ver y es que con 2 unidades de computo el potencial grafico no sería tan grande como para mover alta cantidad de FPS, sin embargo se ve muy prometedor ya que si comparamos con las 3 CUs que cuenta el Athlon 3000G, el rendimiento de 2 de RDNA2 es muy grande, por lo que cuanto contemos con el reemplazo de los Ryzen 7 5700G y Ryzen 5 5600G basados en RDNA2 estaremos frente a unas soluciones integradas de gran potencial y aún más mezclando con el potencial que DDR5 logra desarrollar.
Overclocking.
Con unos modelos que desde sus especificaciones de fabrica dan muestra de dar frecuencias impensables para Ryzen hasta hace 1 año atrás, hoy podemos dar cuenta que el salto de la frecuencia con las mejoras de IPC han creado un procesador de alto performance, pero y que hay con el overclocking por sobre todo esto nuevo y bueno veamos.
Configurados ambos modelos en todos sus núcleos en frecuencias 5.4 GHz y 5.5 GHz para el Ryzen 9 7950X y Ryzen 5 7600X respectivamente, con valores de voltaje en automático.
El rendimiento claramente mejora en ambiente multi núcleos, sin embargo en el Ryzen 5 7600X la frecuencia que podemos lograr bajo overclocking es mayor a la frecuencia tope por defecto, esto nos permite incluso ganar rendimiento en single core, diferente a lo que sucede con el Ryzen 9 7950X que por soluciones de refrigeración no es posible superar los 5.75 GHz que trae como velocidad máxima por defecto, limitando la ganancia de rendimiento en ambientes multi núcleo.
No quiere decir que no puedas superar los rendimiento aquí obtenidos, sino que basicamente necesitaras apuntar a una refrigeración más potente para ello, y esto probablemente te lleve a buscar soluciones liquidas de alto performance (quizás algo más custom) o técnicas poco usuales de refrigeración.
Consumo y Temperatura.
Uno de los apartados que se ha llevado gran especulación es el consumo y temperatura. Analizando procesadores que fácilmente han superado lo 5 GHz e incluso ya cerca de los 6 GHz no es de parecer extraño que este apartado necesite de más análisis que de costumbre.
Si bien más de 200W es un valor a considerar, es un consumo que un Ryzen 9 5950X sin problema podría alcanzar si lo eleváramos a las frecuencias a las que el Ryzen 9 7950X trabaja, e incluso superaría lo que experimentado por esto, sin embargo, el salto a 5nm se esperaba que fuera un avance hacia una mejora en el consumo, no un aumento de esto, un ideal habría sido mantener consumo vs gen anterior y obtener el rendimiento visto en estos Ryzen 7000, lo que no ocurrió, aún así es solo cosa de pulir mejor la arquitectura y desarrollar mejores BIOS, algo que con anterioridad también se vio y el tiempo logró mitigarlo.
La temperatura será crucial para los usuarios de Zen4 y es que deberán considerar una solución de refrigeración de buen nivel para mantener al margen la temperatura de estos procesadores. Si bien esto es algo que con una BIOS se podrá solucionar, de momento necesitarías una solución liquida de 280mm como base para compensar la temperatura, para el Ryzen 9 quizás directamente a 360mm. Igualmente es el mismo escenario que hoy sufren los Core i9 12900K y quizás también la futura 13va generación.
En el detalle que nos muestra HWiNFO64 podemos ver como el Ryzen 9 7950X es lanzado a un tope de 1.48V lo que es un voltaje muy alto en relación a lo que experimentábamos en los valores que nos mostraba el overclocking de entre 1.35V aprox, esto es claramente lo que lleva a esos 94°C de temperatura considerando que no todos los núcleos están a 5.750 MHz, es algo muy similar en lo que ha sucedido en generaciones previas de AMD. En el caso del Ryzen 5 7600X es un caso muy similar, es posible esto pueda afinarse aún más a través de una actualización de BIOS, ya que cambiando estos parámetros de forma manual el rendimiento disminuye considerablemente.
Conclusión.
Proceso de fabricación más diminuto, arquitectura más robusta, nuevos gráficos integrados, soporte DDR5 con tecnología EXPO, soporte PCIe 5.0 y como si fuera poco nuevo socket en formato LGA, y es así como AMD lanza al mercado su nueva plataforma AM5 con arquitectura Zen4, gran cantidad de cambios e innovaciones a diferentes niveles, AMD hace una apuesta bien arriesgadas integrando tecnologías muy inmaduras pero con grandes mejores si se afinan correctamente.
Lo que resalta sin lugar a duda es el performance alcanzado, y es que en algunos casos deja al Core i9 12900K muy por debajo, generando una gran expectativa de como será esta plataforma una vez alcance su maduración.
El video integrado es un punto que AMD necesitaba para responder a ciertos requerimientos de la industria y es que algunos se inclinaban por Core i9 con video integrado solo para responder a una necesidad de computo 2D, nivel al cual AMD no tenía con que responder. Es aquí donde el rendimiento del video que experimentamos no sorprende más allá de superar a los Athlon actuales con tan solo 2 unidades de computo, pero tan solo 2 CUs logran liberar un rendimiento interesante si es comparado con los 3 CUs de un Athlon, lo que para cuando esten los Ryzen G basados en serie 7000 podríamos ver unos gráficos integrados que puedan llegar a la gama media de lo que hoy conocemos en tarjetas de video.
Punto final a los dolores de cabeza con los pines en el CPU, y es que quizás para alguno no era problema para otros la manipulación de estos pines en el procesador era muy complejo, si bien AMD ya trabajaba con LGA en sus Threadripper, dar el salto con su plataforma entusiasta fue una gran sorpresa, pero el salto no fue solo para responder a lo que estos usuarios pedían, sino que también fue a una necesidad técnica de contacto, ya que la cantidad de pines en el CPU limitaba la comunicación del procesador con la placa madre por lo que pasar estos a la placa madre en formato LGA era la mejor solución.
Fuera de lo que AMD con su Zen4 puede lograr es el costo de la plataforma al momento del lanzamiento y es que como sabemos el chipset X670E será el tope de línea seguido por el X670, ambos estarán a bordo de placas madres que estarán posicionadas en el mercado en un segmento medio-alto, por lo que sumado a las DDR5 (y más si buscas con EXPO), tendrás un costo final de la plataforma algo elevado, igualmente los chipset B650E y B650 vendrán a aliviaran este costo, pero habrá que esperar para ello.
Dicho lo anterior, las nuevas innovaciones que AMD propone en AM5 de seguro generaran un gran impacto en el mercado del computo, sin embargo, le falta gran madurez en 2 puntos importantes como es afinar voltajes que solucionaría principalmente consumo y temperatura, y memorias relacionado mucho a EXPO. Los cambios suelen traer ciertas faltas de acomodación de innovaciones tras cada lanzamiento y AM5 no es la excepción y más aún si trae más de lo que acostumbramos a ver, por el momento solo debemos esperar a que BIOS o controladores ayuden a brindar eficiencia, ya que Zen4 se ve muy prometedor si se acomodan estos últimos puntos.