Hace unos cuantos meses, cuando el verano comenzaba a declinar mientras nosotros sacábamos la ropa de las maletas resignándonos al fin del relajo estival, había un lugar en el país de la libertad, las invasiones a países mediorientales y el cuarto de libra con queso donde estaban mas contentos que nosotros. Claro, allá lo que finalizaba era el invierno, empezando la temporada de nenas en ropas mas ligeras, así como también el engorde visual masculino. Eso podría haber sido suficiente causa para un estado de animo positivo, pero para mejorar aun más el rictus fácil de algunos, en esos momentos se realizaba lo que conocemos como el IDF. No me refiero a la versión gringota de las bencineras YPF con sus espantosas papas fritas heladas y su pan de hotdog anejo y partido, sino que hablo del Intel Developers Forum, que se desarrollaba en la ciudad de la liberación lila, San Francisco.
En este lugar, el fabricante de procesadores de computador mas grande del mundo, Intel, mostraba en público por primera vez algunos detalles de su próxima arquitectura de procesadores. Esta nueva arquitectura, presentada como Intel Core Microarchitecture, estaba destinada a relevar a la ya inestrujable Netburst, séptima generación Chipzilliana que jugaba en el mercado desde el ano 2000. Se prometieron procesadores para equipos de escritorio, portátiles y servidores, en pocos meses mas y con expectativas de rendimiento mas que optimistas. Este tema era el principal motor de la felicidad de los ejecutivos de la firma de Santa Clara, que por fin prometían un desquite para la puñalada que AMD les había propinado con el lanzamiento de su arquitectura K8 de 64 bits. El golpe en la mesa no era menor, ya que se prometía superar con creces el rendimiento de los procesadores basados en Netburst, y de pasada barrer con la familia completa de procesadores AMD. Algunos fruncieron el ceño con incredulidad, pensando en que esta era otra maniobra markitectónica planeada por la gente de Paul Otellini. Los más creyentes frotaron sus manos esperando a que las tiendas tuvieran en stock alguno de estos nuevos productos, y nosotros ya comenzábamos a planear como armaríamos el review de esta nueva promesa.
Luego de una reunión donde decidimos rápidamente de que manera abordaríamos el tema, raudamente se empezó a contactar a la gente que nos podría servir para lograr nuestro objetivo de informarles de la primicia como corresponde, y en español. A pesar de que en general Intel siempre ha tenido una gran disposición a cooperarnos como medio para que ustedes puedan estar siempre al día en cuanto a lo que les interesa, en esta ocasión las múltiples jugadas que realizo Chipzilla jugando con las fechas de lanzamiento y manteniéndonos permanentemente saltones respecto a la fecha definitiva en la que el mundo conocería el rendimiento real de la nueva familia Core 2 Duo, hicieron que fuera imposible que llegaran a tiempo los equipos con que Intel nos ayudaría a realizar nuestra labor informativa. Una pena, pero por suerte nosotros teníamos una gran carta bajo la manga y era nuestro propio E6000 E.S. Esto nos liberaba de cualquier embargo informativo que nos demorara en la entrega de resultados, pero las lamentables demoras a las que nos vimos sometidos por parte de las Aduanas Chilenas y su burocracia, hacen que apenas hoy en la mañana, a horas del fin del embargo informativo podamos entregarles el primer análisis en español de un procesador Core 2 Duo Intel. (edit: ya la manana se hizo noche, pero de todas maneras les tenemos primeros que nadie en espanol este gran acontecimiento). Un completo y extenso análisis que les permitirá conocer con detalles como rinde y que podemos esperar en diferentes situaciones y escenarios de uso de un procesador Core 2 Duo CONROE.
Sigan con nosotros aquí, en MADBOXPC, con esta revisión, de una calidad que es un orgullo para todos los chilenos y para el resto de nuestros amigos hispanoparlantes.
Como empezo esta historia?
Pensemos en el pasado. Cuan pasado? Una década completa. En realidad, un poco mas de una década 1995. ¿Qué sucedía en esos momentos con el fabricante de procesadores mais grande do mondo? Pentium Pro. La arquitectura que fue diseñada como relevo de los primeros Pentium (cuyo nombre «técnico» era P5) hacia su aparición, trayendo de la mano varias novedades que pretendían mejorar mucho el rendimiento de las maquinas. Una de ellas fue la inclusión por primera vez de cache de segundo nivel integrado en el core del procesador y corriendo a su misma velocidad. Antes el cache iba integrado en la placa madre, y a causa de eso corría solamente a una fracción de la velocidad del procesador. Junto con esto, el uso de un pipeline mas largo que el del P5 (14 etapas para el Pentium Pro) junto con un diseño de pipeline que lograba un alto numero de IPC (instrucciones por ciclo, es decir la cantidad promedio de instrucciones que se realizan por cada ciclo del reloj del sistema) aseguraban un muy buen rendimiento. Los Pentium Pro en esa época fueron muy famosos por su bajo consumo energético en comparación a su alto rendimiento. Pero como finalmente ningún equipo de R&D es infalible, la próxima arquitectura desarrollada por Intel (Netburst o P7, que no compartía nada con su antecesor P6, presente hasta los imbatibles Pentium III) en términos de eficiencia general era mucho, pero mucho menos consistente. Su consumo energético en relación a lo que rendía hizo que los especialistas de la época lapidaran a los investigadores de Intel y sentenciaran la muerte prontamente a todo lo que oliera a Netburst. Era curioso, porque a pesar de que Willamette (el primer core presente en un Pentium 4, nombre comercial de los procesadores que usaban esta arquitectura) rendía bastante bien, las características inherentes a esta familia hacían que se vaticinara un futuro nada de productivo. La gente de Intel no lograba convencer del todo, aunque prometieran en el plazo medio procesadores corriendo a 10Ghz.
Y bueno, hubo cosas con las que sencillamente Netburst no congraciaba. El gran consumo energético y su consiguiente generación de calor hacían que no fuera una idea 100% inteligente meter estos procesadores dentro de un equipo y es precisamente esta la causa de que la arquitectura P6 no fuera abandonada. En base a esta necesidad, se trabajo en una versión mejorada, (incluyendo un Front Side Bus corriendo a mayor frecuencia, mayor cantidad de cache L2, un pipeline un par de etapas mas largo y soporte para instrucciones SSE2) de esta arquitectura que fue la que conocimos dentro de la familia de procesadores conocidos como Pentium M. Primero el core Banias y tiempo más tarde el famoso core Dothan, fueron los que llevaron dentro esta tecnología, que dentro de todo tenia sus defectos, ya que no incluía el uso de instrucciones SSE3 y tenia una unidad de punto flotante que se quedaba corta ante el poder de la de manejo de enteros, debido al diseño en si de P6. El ancho de banda del bus no era lo ideal tampoco, ya para los tiempos en los que circulaba Dothan los cortos 133Mhz (533Mhz QDR) no eran competencia ante el HyperTransport de los K8, ni ante el bus de 800 QDR de los Netburst que en ese momento existían.
Luego de Dothan, lo que venia era obvio. Nos encontrábamos en los inicios del furor del Dual Core, así que la próxima mejora que tuvo la arquitectura P6 fue la inclusión de otro core más (como supondrán aquí ya estamos refiriéndonos a Yonah, el ultimo jinete de P6). Muchas de las deficiencias siguieron, pero un cambio muy importante en estos procesadores es el que hace que el cache L2, a diferencia del resto de procesadores Dual Core existentes hasta el momento, funcionara de manera compartida. Si, compartida, es decir, en vez de que cada core maneje de manera independiente su propio cache L2, existe solo un gran montón de cache, el que se asigna dinámicamente a cada core de acuerdo a los requerimientos del sistema. Esto redunda en ahorro energético, pues si antes necesitábamos tener constantemente «encendido» el cache de cada core, ahora solamente se consume energía en el cache que se encuentra en uso en ese momento por parte de cada core.
Yonah fue el ariete con que don Gigante Azul comenzó a insertar la marca Core dentro del mercado, y fue tecnológicamente lo que comenzó a anticipar la llegada de Core 2 Duo. A pesar de que Yonah tiene arquitectura P6 a diferencia de Core 2, que esta inspirado en esa arquitectura pero diseñado desde la base, las similitudes y relaciones son varias, como podrán ver en la próxima pagina.
Intel Core Microarchitecture
Ya es hora de cambiar de nombre. Para Pentium Pro y sus descendientes teníamos el nombre P6. Netburst, continuando con esa nomenclatura era P7. Ahora estamos hablando de una nueva generación de procesadores x86 Intel, por lo que correspondería hablar de P8.
¿Qué es?, ¿Cómo funciona?, ¿Qué trae P8?, también conocido como ICM: Intel Core Microarchitecture?. Primero que nada, conozcamos algunos datos clave que van de la mano con esta nueva familia de procesadores.
Como ya les decía, nos encontramos ante la octava generación (P8) de procesadores x86 Intel, fue diseñado por un equipo de Intel establecido en Haifa, Israel. El diseño de la arquitectura parte desde cero, pero con ideas y la misma filosofía de diseño que se utilizo para –valga la redundancia- diseñar la arquitectura P6, nacida con el Pentium Pro, es el reemplazo definitivo de la arquitectura de séptima generación Netburst, que se inicio con el Pentium 4 willamette, y concluyo con el Pentium D, marca el fin de la era Pentium (que nació en 1993); Intel ya no utilizara mas esa marca y la reemplazara por la nueva Core.
¿Quiénes serán los integrantes de esta nueva familia?
Para los que aun no los conocen, el hermano viajero será Merom, procesador destinado a los equipos portátiles. El bueno para la pelota será Conroe, hábil donde le pidan y destinado al segmento equipos de escritorio. Y como en toda familia no puede faltar un serio y trabajólico, Intel nos trae a Woodcrest, diseñado para servidores.
¿En qué estamos entonces? En que por lo que apuesta Intel en esta ocasión es por la eficiencia. Su mayor interés es que cada watt consumido se refleje con el rendimiento más alto posible; el trabajar con un pipeline de 14 etapas (recordemos que Netburst en sus ultimas revisiones trabajaba con un pipe de 31 etapas, más del doble de lo que intenta hacer ahora Intel con Core 2 Duo) junto con un diseño que permita tener una alta cantidad de instrucciones por ciclo (IPC), concepto clave a la hora de buscar la máxima eficiencia de un microprocesador.
Y si de eficiencia se trata, hoy en día lo que se busca es consumir la menor cantidad de energía. Si, la filosofía verde hace un buen tiempo que llego para quedarse, y los únicos beneficiados con esto somos nosotros, que ahorraremos unos cuantos pesos al pagar la boleta de la energía eléctrica (aunque rápidamente los gastemos en cosas como esta que sirven para ahorrar energía, que contradicción, no?). Intel como buen fabricante, no desconoce esta situación y una de las principales banderas que agita para promocionar sus nuevos Core 2 Duo es la del bajo consumo energético. Hasta antes de estos procesadores, Chipzi contaba con una muy mala fama respecto a este tema: Durante su etapa Netburst, Prescott fue duramente criticado por el gran consumo que tenia; su disipación térmica también era muy muy alta y ya es cuento conocido el famoso apodo de «Preshot» que se ganaron a causa de eso.
El punto aquí es que Intel nos propone una nueva familia de procesadores que se supone los reivindica completamente en esta área. Por lo menos los specs oficiales confirman esto a su favor; y a nosotros nos parece sencillamente fabuloso que según Intel el TDP de un modelo Conroe sea de solamente 65W, considerando que en el caso de un FX-62 estaríamos hablando de 125W, y en el de un 955 XE de la módica suma de 130W. La mitad de calor y se supone que mucho más rendimiento. Será así o no?
La mitad, el doble, etc etc. Es la hora de los porcentajes. cuando Intel hablo por primera vez de las capacidades de su nueva arquitectura, en el IDF durante el mes de marzo, hizo una promesa muy simple y concisa:
Al mismo nivel de consumo, Merom rendiría un 20% mas que su antecesor directo, Core Duo – Yonah
Conroe consumiría 40% menos de energía, y rendiría un 40% mas que Pentium D. Esa si que es promesa.
Y Woodcrest rendiría un brutal 80% mas que su predecesor el Dual Xeon, consumiendo un 35% menos de energía.
Pero no todo son maravillas; a pesar de que no es un problema que afecte a los procesadores actuales o a aquellos que aparezcan en el breve plazo, el hecho de que la arquitectura Intel siga considerando usar el Front Side Bus como bus de datos es algo que eventualmente ante la próxima aparición de procesadores de mas de dos núcleos (como el quad core Kentsfield) puede generar cuellos de botella molestos e innecesarios. Tecnologías como el HyperTransport usado por AMD son una buena solución como canal de comunicación entre dispositivos, y seria interesante que Intel se arriesgara en ese terreno.
Para terminar con esta breve introducción a la tecnología Core 2, veamos brevemente en que consiste el Advanced Smart Cache, concepto introducido con Yonah y que es parte de la lógica de diseño inteligen
te de Intel, en función de la máxima eficiencia. Para el, la ventaja del Advanced Smart Cache es que al asignar dinámicamente el cache L2 total a cada core, en el caso por ejemplo de que tengamos un core sin actividad o en espera de algún dato, el otro tendrá disponible todo el cache L2, lo que disminuiría la tasa de fallos de cache que redundan en latencias innecesarias. En los procesadores Dual Core que no disponen de Advanced Smart Cache, cada core tiene una cantidad fija e inmóvil de cache L2, el cual si no esta siendo usado por su core respectivo permanece inactivo e imposible de aprovechar por el otro núcleo.
Vamos a las especificaciones técnicas del procesador que probaremos en esta ocasión.
Core 2 Duo E6600 Conroe
CPU – Z verificando que nos encontramos ante un Core 2 Duo E6600
Aqui tenemos delante de nosotros el fierro que analizamos en esta ocasion
Para los que gustan de los numeros, aqui van las especificaciones tecnicas:
-
Frecuencia: 2.4Ghz
-
Tamaño del Cache L2: Advanced Smart Cache 4MB
-
Tamaño del Cache L1: 32kB de instrucciones + 32kB de datos por núcleo
-
Proceso de Fabricación: 65nm
-
Empaquetado: Socket 775 – die montado directamente en el sustrato
-
Tamaño del die: 143 mm2
-
Cantidad de transistores: 291 Millones aprox.
-
Voltaje nominal: 1.20v – 1.25v
-
MTP: 65W
Los 775 contactos que se encargaran de comunicar el Core 2 Duo con la placa madre que hayamos elegido.
Plataforma y metodos de prueba. Hora de entrar en accion
Hardware
-
CPU Core 2 Duo E6600 core Conroe
-
CPU Pentium 955 Extreme Edition core Presler
-
CPU Athlon 64 FX-62 socket AM2 core Windsor
-
MB Intel X975XBX Bad Axe Rev. 304 Bios 1304 (Chipset 975x)
-
MB ASUS P5WD2 Premium (Chipset 955x)
-
MB M2N32 – SLI DELUXE (Chipset Nforce590)
-
VGA ATI Radeon X1800XT
-
MEM Corsair XMS2 5400UL
-
HDD Seagate 200Gb SATA
-
PSU Delta Electronics DPS 600MB Rev01
-
PSU Thermaltake TR2-500W
-
PSU Topower High Efficiency TOP500W
Comentario al margen: Inicialmente ibamos a revisar el procesador que nos reune en esta ocasion en otra placa madre, enviada por uno de nuestros contactos secretos del barrio chino. Lamentablemente la placa aun estaba demasiado inmadura y no estaba en condiciones aptas para participar en un review. Agradecemos de todas maneras al fabricante por su confianza y las gestiones que nos consiguieron una placa madre que aun no sale al mercado.
Software
-
Windows XP SP2
-
Catalyst 6.4
-
Cpu Z 1.33
-
WinRAR 3.11
-
DVDShrink 3.2
-
VirtualDubMod 1.5.10.2 (build 2540/release)
-
Adobe Photoshop CS
-
Super PI mod 1.4
- Sisoft Sandra Lite 2005.SR3
-
Quake 4 v1.0.5 Beta Patch
-
F.E.A.R. v1.0
-
CINEBENCH 9.5
-
FutureMARK 3DMArk03
-
FutureMARK 3DMark05
-
FutureMARK 3DMark06
-
FutureMARK PCMark05
Para las pruebas utilizamos tres configuraciones de procesador:
Velocidad Default (266×9=2400 Mhz) con memorias a DDR2 800 4-4-4-12 (configuracion tipica de un par de modulos de memoria decentes hoy en dia
35% de Overclock por aire (360x9=3240Mhz), con memorias a DDR2 720 4-4-4-12, todos los voltajes a stock. Esta configuracion representa un overclock de facil logro para un usuario, en el que no tuvimos que pasar mas de dos minutos configurando variables en BIOS. En breves dias mas les tendremos un articulo exclusivamente dedicado al overclock de Core 2 Duo, con distintos metodos de overclock, tradicional y extremo. Preparense entonces para ver cosas que hasta el momento nunca se han visto en Chile!
Configuracion a (312×9=2800Mhz), con las memorias a DDR2 780 4-4-4-12. Esta configuracion se utilizo para observar el rendimiento clock a clock de una plataforma Intel Core 2 Duo vs una plataforma AMD AM2 configuradas a la misma frecuencia (inclusive las memorias en la plataforma Intel estaban en una ligera desventaja de frecuencia), pudiendose desprender de estas pruebas cual de las dos arquitecturas es mas eficiente.
Como comparativa utilizaremos la configuración default del procesador AMD Athlon 64 FX-62 (200×14=2800Mhz), con memorias corriendo a DDR2 800 4-4-4-12, asi como tambien la configuracion default del procesador Intel Pentium 955 Extreme Edition (266×13=3460Mhz), con memorias corriendo a DDR2 667 4-4-4-12.
La metodología de pruebas de las pruebas multitarea aparece en su sección correspondiente. P>
La metodología de las pruebas que realizaremos será la misma que empleamos en el análisis del AMD Athlon 64 FX-62 y del Intel Pentium 955 Extreme Edition, al que hemos llegado después de largas discusiones sobre el tema y que hasta nueva actualización será nuestra configuración oficial para analizar procesadores MadboxPC Certified. De todas maneras, les entregamos los detalles de nuestro sistema de pruebas para que puedan observar, discutir y aprender. (Por motivos practicos este sera el ultimo analisis en que incluyamos nuestra metodologia de pruebas para procesadores; a futuro vincularemos con analisis anteriores con el fin de no extendernos innecesariamente).
-
Para testear WinRAR hicimos dos pruebas: comprimimos mediante el método de compresión estándar de WinRAR una colección de 528 carpetas y 10464 archivos de 1,61Gb de tamaño, y comprimimos mediante el mismo método el archivo VTS_01_1.VOB producido por la compresión efecutada con DVDShrink. Los archivos se llamaron RARSAMPLE.RAR y VTS_01_1.RAR. Se tomaron las horas de creación y de última modificación de cada archivo.
-
Con DVDShrink cargamos un ISO de la película BEFORE SUNRISE, mediante DAEMON TOOLS, y procedimos a su compresión. La película principal y los extras (excepto menús) fueron comprimidos a un 50%. Se realizó el análisis previo del DVD sin considerar el tiempo de duración de éste. Se activaron las mejoras exclusivas de DVDShrink, ajustándose en Nítida (Estándar). Se desactivó la casilla que fija la prioridad de la compresión en baja. El software entrega al final el cálculo del tiempo utilizado en la tarea.
-
En el caso de la compresión mediante DivX, utilizamos el software VirtualDubMod, en el que seleccionamos el modo Fast Recompress. En la configuración del códec se activó la opción Enhanced Multithreading. El archivo comprimido fue el archivo VTS_01_1.VOB producido por la compresión efecutada con DVDShrink. Para el cálculo de tiempo se utilizaron la hora de creación y de última modificación del archivo.
-
Una imagen de 8000×6000 pixeles fue la utilizada para medir el rendimiento en Adobe Photoshop CS. El filtro aplicado fue Desenfoque Radial, ajustando en Cantidad 100, Método Giro y Calidad Óptima. La duración de la tarea se midió con cronómetro.
-
En Sisoft SANDRA no se hicieron cambios de ningún tipo en la configuración. Para SuperPI se corrieron las pruebas correspondientes a 1M de digitos.
-
En PCMark05 y 3DMark03,05,06 se utilizaron todos los ajustes por defecto.
-
Cinebench corrió el CPU Benchmark, en su modo 1 CPU y X CPU, sin modificar ninguna otra configuración.
-
En F.E.A.R. se ejecutó el test de rendimiento incorporado en el juego. todas las opciones gráficas estaban configuradas en Maximum, a excepción de los filtros Antialiasing y Anisotrópico, y de Sombras Suaves, que fueron desactivadas. La resolución utilizada fue de 1024×768.
-
Para finalizar, en Quake 4 fueron ejecutados los archivos DEMO1.DEMO y DEMO4.DEMO en modo timedemo. Se hicieron pruebas también con el modo SMP activado y desactivado. Se activaron todas las opciones gráficas, a excepción de los filtros antialiasing y anisotrópico. La calidad de las texturas se fijó en Ultra. La resolución ocupada fue 1024×768.
Los infaltables e inevitables sinteticos
Veamos como se comporta el E6600 contra la bestia de AMD FX-62 y contra su compañeero de armas 955 EE, que a pesar de estar pasando a la obsolescencia sigue siendo un procesador High End.
Wow! Estamos hablando de un procesador de 320 dólares contra un par de topes de línea de más de USD1.000? Eso dolio! Ni siquiera mencionemos que pasa al aplicar un overclock discreto…
Aqui los resultados del E6600 estan muy parejos con el FX62. Pero insisto, recordemos que este es un peso gallo contra un peso pesado…
Al igual que en la prueba anterior, la influencia fuerte de la tarjeta de video hace que los resultados esten muy pero muy parejos.
PCMark muestra una victoria leve del E6600, pero victoria al fin y al cabo. Claro que aprovechando el potencial overclockero del Core 2 Duo se transforma esa ventajita en una brecha enorme.
Cinebench muestra al E6600 ligeramente por debajo del FX-62 aunque superando con holgura al 955 EE. Si nos atrevemos a overclockear un poco, los resultados (sobre todo los de Multi CPU) se disparan al cielo, haciendose increíbles.
Aquí la Intel Core Microarchitecture es ama y reina. Puede que Super Pi no signifique nada, pero el E6600 destroza literalmente todo lo que se habia visto antes en rendimiento en Super Pi; lograr tiempos como los que se logran a velocidad stock eran cosa de overclockeros consumados. Imagínense como superar los tiempos que se pueden lograr con overclock.
Aun cuando los números que entrega Sandra son aun mas volátiles que los dados por Super Pi, los enormes resultados obtenidos por el E6600 hablan de la influencia del nuevo set de instrucciones SSE4, y de lo mucho mejor que es ésta arquitectura con respecto a Netburst.
Yo soy de verdad: Aplicaciones Reales
Ya es la ansiada hora que todos esperábamos: ver si los Core 2 Duo rinden tanto en aplicaciones que usamos día a día como lo que hemos visto que rinden en los benchmarks sintéticos.
Increíble. Los resultados no parecen reales, pero lo son. El E6600 le saca una ventaja innegable y muy importante a sus dos grandes competidores. ¿Qué pasara más adelante?, ¡por Dios!
Si la compresión mediante DVDShrink era antes una prueba que era territorio de Intel, ahora con mayor razón. Si antes la ventaja era leve, ahora lo que el E6600 hace con el FX-62 y el 955 EE es sencillamente impresionante. Imaginen que overclockearamos un poco más; podríamos casi llegar a sacar la mitad del tiempo que tarda el FX-62. Y recuerden, estamos hablando de un procesador que vale 1/3 de lo que vale el FX.
Bueno, la tunda en este caso venía desde los tiempos de Netburst. Si antes era porque Adobe tenia sus programas muy optimizados para que aprovecharan bien el Hyperthreading, ahora que los Core 2 Duo no traen esa característica y la única explicación es la misma que venimos diciendo hace rato: ¡el E6600 es un ANIMAL!
Aquí vemos que el Conroe vuelve a lograr la victoria. En la prueba de archivos grandes, donde el disco duro no hace tanto bottleneck (Cuello de botella), la paliza es clara.
Bueno, y ahora es hora de ver que pasa si nos ponemos a jugar.
Tugar tugar, salir a jugar
Cuando comenzaron a aparecer las primeras señales de Conroe, el tío Anand nos mostró como rendiría en juegos. Y al parecer, no se equivoco.
Humillación! Un procesador que vale el triple que el E6600 sólo logra obtener un 10% MENOS de frames por segundo en el test de performance de F.E.A.R.