Tal como les habíamos adelantado anteriormente, AMD en el marco de la HOT CHIPS Conference, ha revelado detalles oficiales de su próxima arquitectura para microprocesadores AMD “Bulldozer” y también de “Bodcat”, el núcleo para equipos portátiles. Tecnología en la cual están puestos los objetivos de la compañía de ofrecer un producto superior a la actual generación de procesadores. A continuación explicaremos a grandes rasgos lo que nos ofrece Bulldozer y el video oficial de AMD (en inglés) respecto a las novedades.
De Bulldozer se viene hablando desde hace tiempo, AMD lleva años preparando esta micro arquitectura para tenerla lista acorde a sus roadmap, de hecho en el 2007 se conocieron los primeros detalles y desde anterior esa fecha AMD lleva trabajando y afinando este nueva micro arquitectura para sus procesadores.
Bulldozer: Este es el nombre con el que se conoce la tecnología que AMD está desarrollando para implementar sus su próxima generación de procesadores, tecnología que se construye bajo un avanzado proceso de 32nm (SOI + High-K Metal Gate) y que saldrá directamente desde las fabricas de Global Foundries. Como ha sido usual, AMD primero destinará esta arquitectura a sus procesadores para el segmento servidores, por lo que Bulldozer potenciará primero las plataformas servers “Interlagos” de socket G34 y “Valencia” de socket C32 con los procesadores AMD Opteron de próxima generación y luego a las partes de escritorio.
En lo primero en que AMD ha hecho hincapié, es que Bulldozer es algo radicalmente diferente en su diseño, de hecho no se basa en los principios de la actual arquitectura K10.5 (Starts generation), que a su vez es una evolución de la anterior arquitectura K8. Bulldozer en su diseño es algo totalmente diferente, quizás hecho desde 0 y que no hemos visto hasta ahora ni en los procesadores de AMD, ni en los de Intel, bueno esto hasta cierto punto pues Nehalem también posee arquitectura modular
Mayor rendimiento en enteros y punto flotante: Dos aspectos muy importantes que definen el rendimiento de un procesador en aspectos específicos, ambas son unidades de cálculo criticas en un procesador. AMD con Bulldozer ha hecho hincapié en este aspecto incorporando 2 unidades (módulos) de cálculo de enteros por núcleos, cada uno con 4 pipelines (8 en total), comparado con las 3 unidades (pipelines) de K10 y las 4 incorporadas en Westmere. Estas dos unidades comparten una interfaz común de punto flotante con dos FMACs de 128-bit, cada uno de estos elementos posee 2 bloques de cache L1 dedicados.
Nuevas Instrucciones x86: Bulldozer también agrega el soporte para nuevas instrucciones x86, entre las que podemos mencionar SSE4.1, SSSE4.2 y las ya citadas previamente instrucciones AVX (Advanced Vector Extensions o Extensiones de Vector Avanzadas), incluyendo 4 FMAC Operando, Registros YMM de 256-bit y AES; XSAVE e instrucciones XOP. Bulldozer también soportara la tecnología LWP (light weight profiling) y como ya mencionamos en una nota previa, no hay palabras respecto a 3Dnow!, pues AMD ya manifestó que no soportará estas instrucciones en algunos de sus profesadores o mejor dicho en la gran mayoría de sus futuros procesadores.
Elementos dedicados y compartidos: Los componentes internos de la arquitectura de bulldozer pueden ser elementos compartidos (shared) que trae beneficios como la reducción de consumo y temperatura, como así también reduce el espacio físico del núcleo, y pueden ser también dedicados (dedicated) que ayuda a incrementar el rendimiento y la escalabilidad. Así mismo Bulldozer puede cambiar dinámicamente entre los componentes compartidos como dedicados para maximizar el rendimiento por watts.
Diseño Modular: AMD ha construido Bulldozer en base a un diseño modular (que dicho sea de paso me recuerda mucho a las arquitecturas graficas de las GPUs actuales), es decir, cada chip o núcleo está compuesto por múltiples módulos “Bulldozer”, las divisiones de los módulos son transparentes para compartir hardware, sistema operativo o aplicaciones (es decir no se requieren drivers para que el sistema o las aplicaciones puedan detectarlos como tal), el diseño de arquitectura modular además le ha permitido a AMD incrementar la velocidad de desarrollo del chip e incrementar la flexibilidad del producto en este caso de los procesadores basados en esta arquitectura. (sin tener que rediseñar la arquitectura para ofrecer productos basados en ella, solamente controlar cada componente).
Si vemos bien el diseño de Bulldozer, tenemos en un diseño modular cada componente tiene elementos dedicados, también elementos compartidos a nivel de modulo y elementos compartidos a nivel de chip, dependiendo del orden jerárquico. Por ejemplo cada core o núcleo tiene su pequeño y respectivo cache dedicado de nivel1 (L1), a su vez incorpora 4 unidades de cálculo de enteros, a nivel de modulo cada núcleo (core) comparte memoria cache L2, comparte también las dos unidades de cálculo de punto flotante, el decode (decodificador) y la unidad Fetch. A nivel de chips comparten la memoria cache L3 y el northbridge, que también se ha movido dentro del procesador, especialmente para la gestión del enrutamiento PCI Express, tampoco debemos olvidar el controlador de memorias que es otro componente compartido a nivel de chip.
Debido al nuevo diseño de Bulldozer, los procesadores basados en este chip, vendrán diseñados para otro tipo de empaque, otro socket para ser mas precisos, así los procesadores basados en bulldozer no serán compatibles con los viejos sockets AM3 o AM2(+), claro que el diseño modular le trae a AMD una mayor facilidad para crear nuevos chips simplemente controlando el número de módulos de cada chip. AMD espera que una implementación de Bulldozer de 8 núcleos, tenga un 50% de alto rendimiento por watt comparado con su actual generación de procesadores “Magny-Cours”, que consta de variantes de 8 y 12 núcleos.
Simultaneous MultiThreding: AMD implementará con Bulldozer su propia tecnología SMT (Simultaneous MultiThreding), algo similar a la tecnología Hyper-Threding de Intel en sus principios básicos, de simular más núcleos para el sistema que los disponibles físicamente. Bulldozer soportará 2 hilos de ejecución por núcleo, así en los modelos de cuatro núcleos, 8 serán los hilos de ejecución que administrará el procesador y 8 los núcleos que el sistema operativo podrá ver a nivel lógico. Todo esto de una manera mucho más “fuerte” y eficiente que la implementación de Intel y transparente para el sistema operativo y las aplicaciones, donde no se requerirá drivers para que el software reconozca el hardware multi-hilo como tal. El hecho de ser un diseño modular la implementación de cada hilo de ejecución contará con su propia unidad de cálculo de enteros no teniendo que compartirla y disputarse los recursos con otras instancias (threads), con la consiguiente ganancia en la eficiencia de rendimiento que esto conlleva.
Phenom II vs Bulldozer: Se supone que Bulldozer, al ser un diseño nuevo, aportará mejores y mayores beneficios en prestaciones y rendimiento que la actual arquitectura de sus procesadores AMD Phenom II, de hecho el diseño modular y más eficiente de Bulldozer deberían superar a lo que ofrece hoy AMD. Más claro en las siguientes gráficas y detalles adicionales en la galería adjunta.
[nggallery id=550]