Ya comentamos en la primera entrega de estos dos artículos que Penryn, si bien estará fabricado en 45nm y traerá mejoras a la arquitectura Core en la cual está basado, no será un cambio de micro-arquitectura propiamente tal, mas bien será la ultima remozada a Core (Conroe y CIA) antes de dar el segundo Gran Paso en el itinerario bianual de cambio de arquitectura y procesos de fabricación de Intel; este paso, como ya se ha mencionado antes, es
Paul Otellini hablo, -si es que no me equivoco- por primera vez de Nehalem en una de las jornadas de análisis en abril del año pasado, cuando se sinceró respecto a su magra participación de mercado, aun cuando ni siquiera se lanzaba Core 2 Duo, en ese entonces Otellini ademas de anunciar las fechas para Woodcrest, Conroe y Merom, develo el nombre de las micro-arquitecturas para procesadores que sucederian a Core; estas como ya sabemos son Nehalem (45nm) y Gesher (32nm).
En esta imagen que hemos visto ya en mas de una vez, queda claro el plan de Intel respecto a sus micro-arquitecturas, que tienen un periodo de Vigencia de 2 años, quedando 2006-2007 para Intel Core, 2008-2009 para Nehalem y 2010-2012 para Gesher, aunque como vimos en el articulo anterior esta presentación se ve complementada pues entre cada uno de los bienios donde Intel pretende mantener como producto principal sus arquitecturas tendremos el respectivo refresh de cada una de ellas.
En este recorte podemos apreciar las dos etapas de cada una de las micro-arquitecturas: introduccion y refresco, donde vemos que tanto Penryn como Westmere serán ajustes de tuerca de Core y Nehalem respectivamente… ahora solo queda revelar que cosa seguiria luego de Gesher para alcanzar los 22nm y cual será el paso previo… aunque claro esta que es demasiado pronto para hablar de eso; de hecho es mas que probable que mucho de lo que se hable hoy en dia de Nehalem y Gesher sean ideas y trazos preliminares a trabajar… el tiempo puede cambiar mucho las cosas de acuerdo a lo que vaya marcando el mercado y por supuesto su archicompetencia, AMD.
Nehalem:
«The first dynamically scalable microarchitecture»
Hasta ahora pocos detalles se habían dado a conocer respecto a Nehalem, pues lo único que sabíamos es que era la arquitectura sucesora a Intel Core y que se basaba en un proceso de fabricación a 45nm, pero mucho mas de eso no sabíamos, aparte de las cosas deducibles como mejor relación de rendimiento y consumo. Los nuevos datos de esta microarquitectura apuntan a aspectos bastante interesantes y otros que resultaran un deja vu si miramos a uno de los elementos claves que introdujo AMD con sus A64.
Controlador de Memoria (IMC): Este es el deja vu al que me refería, por que Intel introducirá en algunos de sus procesadores basados en Nehalem, nada menos que un controlador de memoria integrado en el propio procesador, sin lugar a dudas, esto nos trae de inmediato a la memoria lo acaecido en el 2003 cuando AMD hizo este cambio en la micro-arquitectura de sus procesadores A64 y Opteron, pues el controlador de memoria se incluyo en el propio procesador, en lugar de dejarle esta tarea al chipset de la placa madre, esto se hizo con el fin de mejorar latencias entre la comunicación del procesador con la memoria, pues con un IMC en el procesador se evita el tener que pasar desde propio procesador al northbridge de la placa y luego al sistema de memorias, lo que redunda en menores tiempos y/o latencias.
Sólo algunos de los procesadores basados en la microarquitectura Nehalem usaran un controlador de memoria integrado, marcando cierta diferencia con AMD que lo incorporó en todos sus procesadores. La incorporación de un IMC es algo que Intel ha obviado por años pero que inexorableme
nte será incorporado e implementado por la compañial. Según lo que hemos publicado antes, uno de los primeros procesadores en hacer uso de un IMC en Intel, será Bloomfield (45nm Nehalem), el sucesor de Yorkfield (Derivado de Penryn 45nm). Este IMC será compatible con DDR3, lo que marcaría el paso también de DDR2 a la tercera generación de memoria DDR.
Simultaneous multi-threading: El viejo HyperThreading, uno de los elementos claves de Netburst y los P4 estará de vuelta con Nehalem, aunque tendrá algunos cambios, de partida no será HT a secas sino que se llamará SMT (Simultaneous Multi-Threading) contará con 2 vías (2-way) que permitirá administrar hasta 16 hilos (threads) de ejecución en un procesador de ocho cores, que es lo que permite Nehalem o en su defecto 8 hilos de ejecución en un procesador Quad core. Resulta algo contradictorio pues los procesadores multi-núcleos deberían suplir lo que se intentaba hace con el HT en procesadores single core de la compañía años atrás, pero la idea de tener mas hilos de ejecución es algo que para futuros sistemas de computo seduce bastante y si se pueden entre comillas tener mas hilos, habrá que ver como los sistemas y aplicaciones aprovechan estos canales adicionales para optimizar la performance, pues es sabido que cuando Intel incorporo el HT en sus P4, no todas las aplicaciones hacían uso o sabían aprovecharlo, pues todo o casi todo se programaba para un solo hilo de ejecución, actualmente la tendencia es aprovechar los procesadores dual o quad core para optimizar el rendimiento, veremos si este remozado HT logra hacer diferencia.
Procesadores de 8 Cores: Es una posibilidad que da esta «escalabilidad» de Nehalem, y más si es una arquitectura a 45nm, actualmente la compañía tiene sus Quad Core Kentsfield a 65nm, con los 45nm debiera ser en teoría más fácil poder incorporar mas cores en un solo procesador, solo bastaría un Quad Core monolítico a 45nm para poder hacer un Octo-Core no monolítico al incorporar 2 de estos primeros en un mismo sustrato, la idea suena genial, mas aun si cada uno de los hilos de ejecución de los cores se puede multiplicar por 2 con el Simultaneous multi-threading, llegando a un total de 16 hilos de ejecución en el mejor de los casos, el total de memoria cache por consiguiente también se incrementa en razón de numero de cores.
GPU Integrada en el procesador: La arquitectura Nehalem permitirá a Intel ofrecer procesadores polivalentes, es decir, procesadores que aparte de incluir núcleos para el proceso de cálculos en general, también permitirá incorporar una GPU en el propio procesador, esto será posible solo en algunos casos y no en todos los procesadores, pues Intel sabe que existen diversos sectores de mercado y ofrecerá soluciones acorde a las necesidades de cada uno de ellos, sin llegar a estratificar demasiado eso si con un sin fin de productos. La idea de incorporar un núcleo gráfico en el procesador, es algo que su rival AMD ya ha dejado ver con su proyecto AMD Fusión, del cual hablamos en el respectivo informe y es una tendencia que a través de la unificación pretende ahorrar costos, simplificar diseños y mejorar los consumos (al ahorrarse por ejemplo incorporar un IGP en la placa madre o usar una tarjeta gráfica discreta de conexión PCIE), es algo similar a lo que han hecho algunos fabricantes de chipset como ATI y NVIDIA al incorporar en un solo chip tanto Northbridge, Southbridge e IGP, aunque en el caso de un procesador resulta algo mas interesante de ver funcionar. El hecho de querer mejorar consumos de energía nos indica en todo caso que los rendimientos serán discretos al menos en la parte gráfica, pues mas poder requiere de mas energía, por lo tanto, los procesadores con GPU integrada bajo Nehalem será de gama media hacia abajo o bien productos ad-hoc para equipos portátiles como los notebooks, que podrán ahorrase algunos minutos de batería extra. En todo caso los productos High End serán para los más entusiastas.
CSI (Common System Interface): Una de las cosas que se piensa abolir con Nehalem, es sin lugar a dudas el famoso FSB (Fron-Side Bus), usado largamente por Intel, el cual pretende ser reemplazado por una tecnología de intercomunicación denominada CSI (Common System Interface) que a su vez será como la respuesta que Intel haga al HyperTransport que utiliza AMD. Este tipo de conexión pretende entregar un mayor ancho de banda que el FSB, lo que en sistemas multi-núcleo es una ventaja para administrar grandes caudales de información y no provocar cuellos de botella que limiten la performance o rendimiento general, sobre todo si consideramos que Nehalem puede escalar a procesadores de 8 cores como mencionamos más arriba en este articulo. El paso de FSB a otro sistema es algo que se esperaba de Intel desde el lanzamiento de Core, aunque sinceramente, hemos visto que por el momento Intel con un FSB de 1066Mhz no se ha complicado demasiado, es más, a mediados de este año lanzará la versión de 1333Mhz de FSB de Core 2 Duo. Pero como dijimos con Nehalem pretende dar dicho paso a un sistema como CSI.
Cahe de Alto nivel compartido: Intel tendrá en sus procesadores lo que ha denominado Multi-level shared cache, esto quiere decir que seguramente tanto la memoria cache de nivel 2 (L2) como la memoria Cache de nivel 3 (L3) serán memorias compartidas por cada uno de los núcleos del procesador, esto trae la ventaja de que se simplifica el diseño de la arquitectura interna del procesador, pero hay que ser cuidadosos en la forma en al que cada uno de los cores intenta acceder a la memoria para que no se produzcan conflictos en los accesos, quizás con un switch interno que administre las peticiones. Esto por que siempre será mas optimo que cada core tenga su propio cache y que acceda a el exclusivamente a que tener un solo Gran cache en que dos, cuatro o mas núcleos intenten acceder a el provocando, colas o latencias demasiado altas en los accesos, lo que provoca un contrasentido en la razón de ser del la memoria Cache de un procesador, la cual es ahorrarse tiempos al tener un cache externo o tratar de acceder a la memoria principal en tareas críticas.
¿Nuevos socket?: Sí, es más que seguro que con Nehalem Intel introduzca nuevos socket para sus procesadores, por que si todos estos cambios se concretan inevitablemente será necesario diseñar nuevos sistemas de conexión para el procesador e incrementar el numero de contactos en estos mismos, el solo hecho de incorporar un IMC en el procesador, hace que Intel necesite migrar del actual socket LGA775. Según lo que hemos informado antes serían preliminarmente 2 diseños: estos son el socket B (LGA1366) y el socket H (LGA715) para IMC y procesadores sin IMC respectivamente.
Arquitectura dinámica: Nehalem será una arquitectura que permitirá a Intel poder administrar de manera dinámica tanto los cores, hilos, memoria cache y la propia administración de energía, Intel publica en su sitio web escuetas líneas («Dynamically managed cores, threads, cache, interfaces and power») que nos permiten deducir lo demás, esto sería un paso más para hacer de la arquitectura flexible y eficiente en los niveles de consumo.
Opinión: Es acaso Nehalem un deja vu de AMD?, esto al juzgar por el IMC, intentar implementar un sistema de comunicación para el procesador que compita con el HyperTransport de AMD, la idea de incorporar en ciertos modelos de procesadores una GPU, es solo para tener algo que decir frente a Fusión de AMD?, también será una vuelta al pasado el hecho de tener que revivir el HyperThreading? Lo cierto es que Intel demostró con Core una tecnología que le dio el liderato en rendimiento y performance que hoy ostenta y le da las preferencias entre los mas entusiastas y podemos confiar merced de los antecedentes, que Nehalem podría ser otro «Salto Adelante» más, tal como versa el slogan de la compañía. Por nuestra parte solo queda esperar a que llegue el 2008 y veamos los primeros resultados de Nehalem.
Fuentes: