Cumpliendo con su estrategia de tics y tocs, Intel hace un tiempo atrás puso a disposición de los consumidores su nueva linea de procesadores basados en la arquitectura Nehalem, cuyo nombre comercial es Core i7. Hoy revisamos todos los modelos disponibles en la actualidad: Core i7 920, Core i7 940 y Core i7 965 Extreme Edition que son los primeros procesadores Intel (aunque no los primeros de la industria, AMD se les adelantó con su núcleo Barcelona) de cuatro núcleos monolíticos, o sea concebidos, nacidos y criados como verdaderos cuatrillizos siameses y no como dos parejas de mellizos siameses tomados de la mano. Luego de esta habilosa comparación (es 31 de diciembre, último día nadie se enoja), los invito a leer el último review del año 2008 en MADBOXPC. Apúrense y léanlo rápido, que más tarde no van a estar sobrios.
Intel Core i7: Novedades
Intel incorporó en Nehalem varias tecnologías nuevas que diferencian a los Core i7 de los Core 2 Quad. Revisemos los cambios más importantes:
QPI: Quick Path Interconnect
Esta nueva tecnología reemplaza al bus frontal (FSB) que viene acompañando a los procesadores Intel desde antes incluso que los primeros Pentium. Opera de una manera similar al túnel HyperTransport que utilizan los procesadores AMD, ya que es una conexión punto a punto. Haciendo gala de una alta velocidad y baja latencia, ofrece un ancho de banda máximo de 25.6GB/s, más del doble que ofrece el actual Front Side Bus.
IMC: Controlador de Memoria Integrado de Triple Canal DDR3
A diferencia de las generaciones anteriores de procesadores Intel y adoptando una de las características más aplaudidas de los procesadores AMD, en Nehalem se sacó el controlador de memoria del chipset y se le introdujo dentro del CPU, reduciendo con ello la latencia y aumentando el ancho de banda del que dispone la memoria. Este nuevo controlador permite manejar hasta 3 canales de memoria DDR3 (lo usual antes de esto era usar controladores de memoria de doble canal) con un ancho de banda máximo de 192bits (a diferencia de los 128bit que nos dan los dos canales tradicionales). Es importante mencionar que el triple canal de memorias no estará disponible en modelos futuros de Nehalem un poco más básicos. Los núcleos Bloomfield (cuyos tres modelos revisamos hoy) lo soportan, pero ni Lynnfield ni Havendale (que son de cuatro y dos núcleos respectivamente) soportarán esta característica, funcionando solamente con doble canal DDR3.
HT: Hyper-Threading
Hyperthreading no es una novedad 100% novedosa. Incorporada en algunos procesadores de arquitectura Netburst (Pentium 4) y luego dada de baja, Hyperthreading consiste en que cada núcleo físico tiene la capacidad de trabajar con 2 hebras de software aprovechando los tiempos muertos inevitables que hay al trabajar con una sola. Esto obviamente no es lo mismo que tener dos núcleos físicos, pero en determinados contextos logra escalar el rendimiento decentemente. Como en este caso estamos ante procesadores de 4 núcleos tenemos un total de 8 hebras; en software altamente paralelizado se aprovecha de muy buena manera ya que se ocupan casi totalmente los ciclos de cómputo disponibles.
Caché L3: Memoria Caché L3 Compartida
También siguiendo el ejemplo de AMD con sus núcleos Barcelona y posteriores, Intel integró memoria cache de tercer nivel compartida para todos los núcleos. El cache L1 se mantiene igual que la arquitectura anterior (64KB por núcleo), el L2 (uno de los fuertes de los Core 2 Duo / Quad) bajó desde 6MB compartidos a 256KB dedicados por cada núcleo y con una menor latencia (11 ciclos). Este cambio se compensó con la adición del ya mencionado cache L3 de 8MB.
Turbo: Intel Turbo Boost
Como no todo el tiempo necesitamos todo el potencial del CPU, muchas veces ni siquiera aprovechamos todos los núcleos que tiene nuestro procesador: con el fin de darnos más velocidad en esos momentos Intel incluye la tecnología Turbo Boost. Esto consiste en darle prioridad al núcleo utilizado apagando los otros para no consumir mas energía de forma innecesaria. Para «compensar» el reposo de los otros núcleos esta tecnología aumenta la frecuencia (via aumento del multiplicador) del nucleo utilizado en forma dinámica de acuerdo al nivel de carga solicitado, lo que significa que en aplicaciones que no trabajen con todos los núcleos podremos acceder a una mayor velocidad de proceso de manera estable y sin arriesgarnos a que la temperatura ni el consumo eléctrico se disparen.
Intel X58 + ICH10: El nuevo chipset
Junto con renovar la arquitectura de sus procesadores, Intel presentó una nueva lógica para placas madre acorde a las características que ya les mencionamos: este es el chipset X58, de nombre código Tylersburg y que usa procesadores zócalo LGA1366 y soporta las tecnologías multiVGA AMD Crossfire y NVIDIA SLI. En el futuro se lanzará otro chipset dedicado especialmente a futuros procesadores Nehalem de gama más económica (núcleos Lynnfield y Havendale) que utilizarán incluso otro zócalo de inserción, el LGA1160.
Además de eso, gracias a sus 32 líneas PCIe 2.0 podemos tener una configuración 2×16, 4×8 o x16-x8-x8 para el 3-Way SLI. Para comunicarse con el CPU y de paso con el controlador de memoria, utiliza el QPI con un ancho de banda pasante de 25.6GB/s máximos teóricos.
Ya que hemos ya las características de los procesadores y del puente norte (X58) nos falta el encargado de los periféricos. Para este propósito Intel tiene un viejo conocido, presente desde la época del chipset P45: El puente sur ICH10/R. Este chip ofrece soporte para 12 puertos USB 2.0, 6 puertos SATA2, Puertos eSATA, 6 slots PCIe 1x, GigaLan, Audio de Alta Definición y la posibilidad de manejar algunas funciones u opciones vía software.
Pornografía tech: el procesador al desnudo
Ahora pasaremos a ver a nuestro protagonista, caballo de batalla de Intel en las próximas batallas, buque insignia de la escuadra de Otellini: su procesador tope de línea Core i7 Extreme 965, que opera a 3.2Ghz y posee 731 Millones de transistores en su interior fabricados con un proceso constructivo de 45nm High K – Metal Gate.
Como se puede apreciar, su tamaño es bastante grande, más grande que un procesador Intel de los actuales, es casi similar en tamaño que los anteriores procesadores intel que venían adheridos en las tarjetas Slot 1. Al ser una muestra de ingeniería posee la clasificación de Intel Confidential, el Batch de nuestra muestra es 3830A417.
En la fotografia podemos ver su tamaño comparado con un procesador Core 2 Quad (LGA 775); ahora queda un poco mas claro el tamaño que posee este nuevo procesador.
La clásica fotografía mostrando los pads de conexión; a diferencia del LGA 775, este nuevo LGA 1366 posee pads casi ovalados y orientados de forma diagonal.
Una fotografía detallada para que vean la diferencia de tamaño, de esta manera pueden ver de forma más clara que estos nuevos procesadores son más grandes que sus antecesores.
Pornografía tech: la placa madre al desnudo: Intel «Smackover» DX58SO
Junto con una nueva familia de procesadores, que incorporan nuevo socket y nuevo chipset para soportarlos, vienen de la mano nuevas placas madres, en este caso se trata de la nueva placa madre fabricada por Intel perteneciente a su línea Extreme High End. Se trata de la DX58SO (Smackover), que posee un lindo color negro y en contraste usa disipadores de aluminio de color azul metalizado.
En el panel I/O podemos apreciar la total ausencia de puertos PS2 para teclado y mouse; ocupando su lugar (pero no su función) tenemos 2 puertos eSATA (Marvell 88SE8121). Además incorpora 8 puertos USB 2.0, FireWire (Ti TSB43AB22A), Gigabit Ethernet (Intel 82567LM) y Sonido 7.1 HD con Optical SPDIF (Realtek ALC 889).
En lo referente a las memorias, esta placa tiene 4 ranuras DDR3 con soporte para triple canal y un máximo de 16GB (utilizando módulos de 4GB). Si quieres montar 4 módulos de memoria, los 3 primeros (slots azules) quedarán operando en triple canal por lo que tendrán una tasa de transferencia máxima teórica de 32GB/s y la otra memoria quedará trabajando en solitario con una transferencia máxima teórica de 10GB/s (datos utilizando memorias de 1333Mhz). Para llenar los slots comenzaremos a utilizarlos desde afuera hacia adentro, por ende el slot azul que queda hacia afuera de la placa es el primero y de ahi hacia adentro se deben llenar.
Aquí podemos apreciar el nuevo socket LGA 1366 y las 6 fases de poder que contiene esta placa todas ellas con sus respectivos mosfets enfriados por sus respectivos disipadores de aluminio azul. Obviamente toda la sección de las fases de poder contiene capacitores sólidos además de inductores con núcleo de ferrita (PULSE).
Las ranuras de expansión que posee esta placa son 2 PCIe 2.0 16X, 1 PCI, 2 PCIe 1x y 1 PCIe 4x. A pesar que el chipset X58 soporta tanto Crossfire y SLI (mediante certificación por parte de NVIDIA para ciertas placas), esta placa de Intel solamente soporta Crossfire.
Bajo ese disipador azul con la calavera que identifica la plataforma Skulltrail se encuentra el cerebro lógico de esta placa, el chipset X58. Junto a él se aprecia el conector de 12v 8pines y practicamente a la misma altura 2 de los 6 puertos SATA2 que monta la placa.
En primer plano tenemos los 6 puertos SATA 3Gbps que incorpora la placa, todos ellos controlados por el Southbridge ICH10R, todos poseen soporte Raid 0, 1, 10, 5. Entre los últimos tenemos un pequeño speaker (buzzer) que nos alertará de alguna anomalía mediante los pitazos de rigor. La ubicación de los puertos SATA es relativamente buena, ya que de los 6 que posee, solamente 3 pueden ser utilizados si poseemos 2 tarjetas de video de gran tamaño, y solamente 1 de los 2 puertos superiores pueden ser utilizados si poseemos 1 tarjeta de video de gran tamaño.
Junto al otro conector de poder tipo molex clásico de 4 pines, tenemos este molex de poder extra tipo SATA. Algo curioso por decirlo menos, ya que estamos acostumbrados a solamente 1 conector de poder y del clásico molex de 4 pines. Por lo demás la ubicación es un tanto incómoda, ya que se encuentra en el extremo inferior de la placa, debiendo utilizar un conector plano.
En esta toma, tenemos a la placa con algunos de los agregados que posee. Una «tapa» autoadhesiva para el southbridge de color negro con la calavera y para el Chipset X58, además de un ventilador con luz azul, bastante ruidoso pero que envía harto aire a nuestro disipador que (hay que mencionarlo) se calienta bastante.
Otra de las curiosidades que posee esta placa de Intel, es el chip BIOS que utiliza. Este chip se encuentra montado en un nuevo socket llamado SPI.
El protagonista de la placa, el chipset Intel X58, en nuestro caso poseemos una version ES (Engineering Sample).
Intel DX58SO: BIOS y opciones para overclock
Esta es la pantalla que nos da la bienvenida cuando encendemos nuestro equipo. Para que no quede duda que estamos ante una placa Intel. Presionamos F2 e ingresamos a la BIOS.
La primera pantalla de bienvenida, muestra información de nuestro CPU y sistema.
La pestaña Advanced despliega informacion sobre las temperaturas y voltajes, asimismo de las rpm de los ventiladores instalados.
En Performance es donde podemos modificar frecuencias y voltajes. La pantalla principal nos muestra la informacion actual y la propuesta para nuestro CPU y Memorias.
En el menú Processor Overrides podemos manipular las variables que permiten el funcionamiento de nuestro procesador. El vCore en esta placa llega hasta los 1.6v pero podemos asignarle hasta +0.492v mediante Offset, o sea podría llegar hasta un máximo de 2.092v. Maximum Non-Turbo Multiplier es el Multiplicador del procesador en modo NO TURBO (es decir, en términos simples, es el Multiplicador del CPU :P). Al activar Intel Turbo Boost nos aparecen 3 opciones, 2 relacionadas con el TDP y una con la energía. Esas 2 opciones de TDP son más que nada para evitar que las especificaciones de TDP limiten tu overclock y sólo aparecen para el Core i7 965E; para los dueños de Core i7 920 y 940 basta con deshabilitar el VR Current Limit y listo. Finalmente tenemos 4 opciones de multiplicadores, esas son para el momento en que estamos con el modo Turbo activado, por ende podemos configurar el multiplicador del CPU para cada caso (Core i7 920 hasta 22 maximo, Core i7 940 hasta 26 maximo y Core i7 965 «ilimitado»)
En la sección de las memorias, aparecen 2 nuevas opciones que antes no existian: Uncore Multiplier y QPI/Uncore Voltage. La primera es el multiplicador para la frecuencia del «Uncore» que es el controlador de memorias y el cache L3, es decir «todo lo que está en el procesador pero no es núcleo». La segunda maneja la frecuencia del QPI que es la misma que la de la zona Uncore. En lo referente a los timings la lista es bastante extensa y el voltaje máximo para las memorias es de 2.5v (recuerden que estamos con memorias DDR3).
Estos son los multiplicadores o divisores de las memorias, básicamente es el factor de amplificacion con respecto del BCLCK, por ejemplo si tenemos un BCLK de 133 y queremos las memorias a 1333Mhz, solo basta con seleccionar un factor de 10. El Uncore Multiplier como ya les adelantábamos es la frecuencia a la cual trabajará el IMC y el caché L3 y hay que tenerla siempre o preferentemente al doble de la frecuencia de las memorias.
El QPI/Uncore Voltage es el voltaje que se le entrega al Controlador de memoria integrado en el CPU. Para efectos de estabilidad en el overclock, es recomendable usarlo en 1.35v o 1.4v.
Otra de las cosas a las que hay que ponerle atención es el QPI Data Rate, este factor hay que tratar de mantenerlo bajo los 7900Mhz (cuando realizamos overclock). IOH Core Voltage es el clásico Voltaje del Northbridge (chipset).
Plataforma de pruebas
Hardware
CPU Intel Core i7 Extreme 965 (133×24, 3.2Ghz)
CPU Intel Core i7 940 (133×22, 2.93Ghz)
CPU Intel Core i7 920 (133×20, 2.66Ghz)
CPU Intel Core 2 Extreme QX9770 (400×8, 3.2Ghz)
CPU Intel Core 2 Quad Q9450 (333×8, 2.66Ghz)
MB Intel DX58SO-401 (BIOS 2786)
MB ECS P45T-AD3
RAM 3x1GB Corsair XMS3 1333C9DHX (9-9-9-24)
VGA Nvidia GeForce GTX 260
HDD WesternDigital 120GB SataII
PSU FSP Epsilon 700W Active PFC
Software
Windows Vista Ultimate x64 + SP1
NVIDIA GeForce 180.48
PCMark Vantage
SiSoft Sandra 2009 SP1
Everest Ultimate 4.60.1500
Cinebench R10
SuperPi v1.5
Virtualdub v1.86 usando codec DivX 6.8
WinRar 3.71
PovRay v3.7b26
Photoshop CS4
ScienceMark 2.0
Crysis 1.21
FarCry 2
World in Conflict
3DMark Vantage
Metodología de testeo
La metodología utilizada en este review es exactamente la misma que utilizamos en los reviews de placas madres y/o de CPUs que hemos realizado anteriormente. Solamente actualizamos algunas versiones de programas para hacerlas compatibles con esta nueva familia de procesadores.
Todas las pruebas fueron ejecutadas en promedio 4 veces, indicando como valor final y presentado el promedio estable de las corridas. El sistema se mantuvo bajo sus condiciones default en todo momento, se deshabilitó C-State, SpeedStep y NVPhysX.
Para la prueba de Encoding de video se utilizó la película «Pirates of Silicon Valley» utilizando el codec DivX 6.8, para PovRay se utilizó una imagen de 1024×768 con filtrado antialiasing de 3 muestras. Los juegos (FarCry2, WiC y Crysis) fueron ejecutados en configración High Quality en las resoluciones indicadas en los respectivos graficos, para Crysis el modo de Shader es DX10. WinRar utilizado en la prueba MultiTasking fué ejecutado comprimiendo un archivo de 560MB en formato .rar.
Las pruebas fueron ejecutadas sobre una mesa de benchs, en una pieza con temperatura promedio de 20ºC sin ventilación auxiliar salvo los coolers proporcionados por las mismas piezas de Hardware (Cooler del CPU, Placa Madre y VGA).
Los procesadores Core 2 Quad (Q9450 y QX9770) fueron utilizados con 2x1GB de memoria DDR3 en doble canal corriendo a una frecuencia de 1333Mhz con latencias 9-9-9-24.
Pruebas de sistema: CPU – RAM – HDD
En PCMark Vantage los resultados que obtiene Core i7 son muy similares (aunque ligeramente más altos) a los que obtiene un Core 2 Quad a la misma frecuencia. Veamos si este patrón se repite a lo largo de las pruebas.
Aquí la situación cambia drásticamente, ya que a igual frecuencia un Core i7 es capaz de realizar más cálculos, muchos más cálculos: de un 40% a un 50% más.
Los márgenes de diferencia en esta otra prueba son un poco menores pero siguen mostrando un enorme potencial para todos los procesadores basados en Nehalem. La todopoderosa arquitectura Core queda un buen poco detrás.
¿Alguien dijo controlador de memoria integrado en el procesador? Los resultados no resisten ningún análisis, la diferencia en ancho de banda entre procesadores corriendo a la misma frecuencia pero con el controlador dentro o fuera del procesador es radical. Sencillamente radical.
Esta prueba también mide ancho de banda de memorias, y aunque los números no son tan extremos como en el test Sandra siguen mostrando el enorme potencial que tiene un controlador de memorias integrado en el procesador. ¿Por qué no lo hicieron antes, amiguis de Intel? ¿Se guardaban esta cartita bajo la manga?
Aquí se puede oler la inclusión de Hyperthreading en Core i7. Resultados relativamente similares a misma frecuencia en la prueba de 1 CPU pero una ventaja demoledora en X CPU muestran que Nehalem si hace algo bien es multithreading. Veamos si el resto de las pruebas lo confirman.
En ScienceMark la ventaja es marginal tanto para el Core i7 920 contra el Core 2 Quad Q9450 como para el Core i7 965 Extreme Edition contra el Core 2 Extreme QX9770. Misma frecuencia y un resultado que apenas se despega del empate técnico. ¿Estamos ante una prueba que aprovecha sólo 1 núcleo?
SuperPI muestra de manera muy aproximada lo que es el poder de cómputo que tiene un núcleo determinado. A pesar de que es una prueba poco confiable (porque finalmente los ingenieros de la industria saben perfectamente que muchas veces los entusiastas se guían por SuperPI por lo que bastan unas optimizaciones por aquí y otras por allá para crear un procesador campeón en SuperPI), podemos ver que un núcleo Core a 3.2Ghz obtiene un tiempo similar al que logra un núcleo Nehalem a 2.66Ghz, una frecuencia un 17% más lenta.
Aquí nos caemos de espaldas. POVRay es un buen ejemplo de software muy paralelizado (al igual que otros programas para render de imagenes en 3D) y realmente hace brillar a los Core i7. El Hyperthreading le da una ventaja adicional a los Core i7, ventaja imposible de superar por los Core 2 Quad.
No tan exageradamente buenos pero igual de destacables son los números que obtenemos en Photoshop. Ejecutando un filtro que es 100% cómputo de CPU vemos que los Core i7 aprovechan muy bien su capacidad de trabajar con ocho hebras de proceso en sus cuatro núcleos, dejando sin ninguna posibilidad a los Core 2 Quad. Pensar que 6 meses atrás me preguntaban por un procesador para diseño o render y decía a ciegas: Core 2 Quad. El tiempo pasa, nos vamos poniendo viejos.
En rendering de video los resultados son igual de favorables para el nuevo invento de Intel. Resultados que clock a clock son muy superiores a los que logra la arquitectura Core confirman lo que hemos visto en el resto de las pruebas. Nada que objetar.
Si lo que hacemos es estresar al sistema ejecutando varias aplicaciones al mismo tiempo, también veremos que incluso estando una de las aplicaciones bien limitada por disco duro el resultado que obtienen los Core i7 es sobresaliente.
Pruebas de sistema: VGA
El resultado general de 3DMark Vantage está fuertemente limitado por la tarjeta de video, por lo que la diferencia entre Core y Nehalem, aún siendo visible, es mínima… cosa completamente diferente a lo que encontramos cuando tomamos sólo los puntajes de las pruebas de CPU. Ahí Core i7 en todos sus sabores actuales es amo y señor, no teniendo nada que hacer la ya «obsoleta» arquitectura que se hizo famosa a través de los Core 2 Duo.
En Far Cry 2 los Core i7 se nos cayeron del pedestal. Después de ver un rendimiento excepcional en la página anterior, nos cambia el rictus del rostro al ver que en Far Cry 2 los números ni siquiera alcanzar a igualar a los Core 2 Quad, que obtienen una ventaja palpable sobre los nuevos procesadores. Pero bueno, ustedes que nos leen todos los días se darán cuenta que el 90% de las quejas por falta de optimización recaen en el mundo de los videojuegos. Ojalá una actualización de drivers, BIOS o del mismo juego dejen los resultados como uno espera después de ver las pruebas anteriores.
Crysis arregla un poco las cosas. Naturalmente no esperamos que con un Core i7 los juegos anden 20 veces más rápido (ya que hoy por hoy esa tarea se la llevan las tarjetas de video) pero por lo menos pedimos que anden a la misma velocidad o un poquito más de lo que logran los Core 2 Quad. ¡Y pensar que andan dando vueltas 20 comerciales diciendo que para ser gamer tienes que comprar un Quad, plop!
En World in Conflict nos enfrentamos a un escenario similar al de Crysis en el sentido de que la aplicación está limitada por otros componentes del sistema. De todas maneras, Core i7 logra sacarle un par de frames por segundo de ventaja a Core 2 Quad.
Lo que si tenemos claro es que si jugamos y hacemos 90 cosas al mismo tiempo (cosa que por muy Quad Core que tengan no recomendamos porque hay otros cuellos de botella, como el disco duro, que son aún difíciles de superar), la posibilidad de los Core i7 de manejar hasta 8 hebras nos dará una chance más de que el juego ande a un framerate decente por sobre el rendimiento que nos brinda un Quad Core «de los viejos».
Pruebas de sistema: Single, Dual y Triple Channel
Uno de los temas a tener en consideración al analizar los resultados que presentamos en las páginas anteriores es el hecho de que las pruebas están realizadas usando los tres canales de memoria, a diferencia de un Core 2 Quad, Core 2 Duo o un Phenom, que soportan máximo dos canales. Quizás la duda de muchos para pasarse a Core i7 está radicada en el hecho de no tener un kit de memoria de triple canal y por eso estar en la incertidumbre de como rinde Core i7 en modo Dual Channel. Para ustedes, realizamos todas las pruebas en modo single, doble y triple, para que ustedes mismos puedan concluir cuanto se gana o se pierde al usar los módulos de memoria correspondientes.
En la prueba específica de memoria se observa que al usar sólo un canal el rendimiento cae bastante. Entre dos y tres canales la diferencia no es mucha.
En ambas pruebas de CPU de Sandra la diferencia de rendimiento entre uno, dos y tres es casi nula. Estas pruebas no están limitadas por el ancho de banda de memorias.
En cambio, si lo que medimos es ancho de banda de memorias las diferencias son notables, con escalones muy bien definidos para cada configuración. Si una situación así se repite en las aplicaciones del mundo real estaríamos en problemas, siendo mandatorio usar los tres canales para lograr el rendimiento que vimos en las páginas anteriores.
En la otra prueba de ancho de banda de memorias los resultados son acorde a lo esperado aunque no tan dramáticamente como en Sandra Memory Bandwidth.
Cinebench: nula diferencia.
Nada. 1,2 o 3 es lo mismo.
Lo mismo de arriba.
Es indiferente usar más de un canal de memoria. Como vieron en los tres gráficos anteriores, ni la edición de video, ni el render 3D ni el uso de filtros fotográficos se impactan demasiado por popular completamente las ranuras de memoria RAM.
3DMark no muestra ninguna ventaja.
Curiosamente Far Cry 2, luego de haber visto como la gran mayoría de las aplicaciones reales no eran afectadas, sufre un impacto en rendimiento (aunque no decisivo) al modificar la cantidad de canales de memoria en funcionamiento. Lo más probable es que esto se deba en mayor medida a que al dejar sólo 1 canal de memoria además estamos bajando la RAM del sistema de 3 o 2 GB a sólo 1. Eso sí da un poco lo mismo fijarse en eso: en este juego Core i7 no brilla, sino que más bien opaca: Los Core 2 Quad andan mucho mejor.
En Crysis la única configuración que pierde rendimiento es la de un canal solitario (y aún así la pérdida en marginal). El usar dos o tres no da mayor ventaja en el rendimiento.
World in Conflict repite calcado el escenario de Crysis: 1 canal cae un poco, pero entre 2 y 3 es lo mismo.
La primera prueba multitarea confirma lo que hemos venido viendo: la diferencia entre el uso de distintas cantidades de canales de memoria no es demasiado relevante.
Aquí vemos una caída fuerte en Single Channel, pero en realidad lo que ocurre es que Vista con 1GB y varias aplicaciones pesadas corriendo no llega ni a la vuelta de la esquina.
Pruebas de sistema: Hyperthreading
En este apartado quisimos comprobar si el Hyperthreading tiene una participación relevante en el gran rendimiento de los Core i7. En su última aparición pública, HT no gozó de gran fama en gran medida por la poca popularidad de los Pentium 4 entre los especialistas, subvalorándose mucho su potencial.
En la serie de gráficos que tienen en esta página pueden ver como al desactivar Hyperthreading el rendimiento en todas las aplicaciones que están bien paralelizadas cae bastante, aunque sigue siendo superior al de un Core 2 Quad corriendo a la misma frecuencia. La conclusión es corta y concisa: HT es un «regalo» de rendimiento que sirve y no poco.
Intel Core i7: Temperatura de operación
Para aquellos preocupados de temperatura a la que funciona su hardware (factor importante si vamos a tener la máquina en una pieza con poca ventilación, por ejemplo), los Core i7, aún cuando están fabricado con proceso constructivo de 45nm salieron bastante «ardientes». Por lo mismo, dato a considerar por los entusiastas es que el cooler que incorpora Intel junto a los procesadores servirá solamente en caso de mantenerlos en su frecuencia de fábrica o con muy poco nivel de overclock.
En reposo, la temperatura se mantiene bordeando los 36ºC en una habitación con 20ºC ambientales. Sin embargo, al momento de utilizar los 4 nucleos con HT (carga pesada) la temperatura a frecuencias y voltajes stock llega hasta los 53ºC. Además de eso el cooler del CPU (cooler box) con su ventilador girando a máximas rpm hace un ruido bastante molesto. Si queremos silencio, al momento de bajarle las rpm al ventilador las temperaturas suben drásticamente, logrando mas de 40ºC en reposo.
Con overclock las temperaturas lograron un peak de 65ºC con un promedio de 60ºC.
Overclockeando con la Intel DX58SO
Overclockear los Core i7 no fue una tarea fácil (pero tampoco muy difícil); solamente fue necesario leer mucho acerca de las nuevas características y opciones además de hacer muchas pruebas. Lo primero que notarán es que ya no tenemos el FSB sino que ahora es el Base Clock (BCLK) el que actúa como nuestro «antiguo» FSB. Junto a este Base Clock tenemos asociada la Frecuencia QPI (QPI Link), la cual para efectos de overclock, afecta de una manera similar a lo que ocurre con el HTT de AMD, ya que hay que mantenerla dentro de un rango para que no cause inestabilidad, por eso hay que tratar de evitar que sobrepase los 7900Mhz (3950Mhz) y eso lo podemos controlar gracias a los multiplicadores o las opciones que nos ofrece la BIOS (4.6GT/s, 5.8GT/s, 6.4GT/s). En ese caso de querer overclockear, lo recomendable es de inmediato seleccionar la opcion de 4.8GT/s. Otro de los nuevos conceptos que manejaremos es la Frecuencia Uncore (Uncore Ratio) que es la frecuencia a la cual opera el IMC: para efectos de overclockear es preferible dejarla siempre al doble de la frecuencia de la memoria.
En lo referente a los voltajes, tenemos los clásicos vCore, vDimm, vNB (que ahora se llama IOH Voltage) y aparece un nuevo valor que monitorear, el cual es el vQPI (QPI Voltage). Este voltaje se encarga de darle el voltaje al controlador de memorias (IMC) dentro de nuestro CPU. Para efectos de estabilidad y no matar nuestro CPU, es preferible mantenerlo dentro del rango de 1.35v hasta 1.4v (en nuestras pruebas), con ello podemos utilizar nuestras memorias sin problemas a la frecuencia necesaria
Teniendo en cuenta estas nueva variables nos dispusimos a tratar de sacarle un poco de trote a este nuevo CPU, el resultado fueron 4Ghz estables sin problemas, tan solo tuvimos que subirle un poco al vCore y le subimos el BCLK hasta los 170Mhz (con multi 24x).
Comentarios finales
Nehalem es una arquitectura que hace tiempo nos llamaba la atención. Benchmarketeo mediante, todos estaban expectantes de conocer que tan buena podía ser al compararla con la exitosa Core. Los más escépticos (entre los que nos contamos nosotros) tenían sus dudas respecto a la posibilidad de que Intel fuera a dar con el lanzamiento de su nueva arquitectura un golpe de cátedra similar al que dio cuando reemplazó a la criticada arquitectura Netburst con Core; el hecho es que hoy, siendo líder en cuanto a poder de procesamiento (AMD actualmente juega sus cartas en otro campo: los precios) vemos que la primera versión de Nehalem, diseñada para entusiastas del rendimiento de bolsillos semihondos supera (y no estrechamente) a los Core 2 Duo.
Tanto en las pruebas sintéticas como en las pruebas con aplicaciones reales el rendimiento de los 3 modelos de Core i7 disponibles (920, 940 y 965) supera en un 20% o más el rendimiento de un Core 2 Quad a la misma frecuencia. Los casos más notables son los de las aplicaciones altamente paralelizadas, que saben sacar muy bien provecho del Hyperthreading (que vuelve desde Netburst donde fue amado y odiado) y del paso del ya vetusto bus frontal al QPI.
En cuanto a precios, Core i7 naturalmente no es ni será un producto de entrada. Situándose en la escala natural de precios que Intel ha ocupado en el último tiempo, tenemos procesadores de 1000, 500 y 300 dólares, precios similares a los valores de lanzamiento que se vieron a mediados del 2006 cuando los Conroe se apoderaron de los titulares. La gran diferencia es el rendimiento. El poder de cómputo que obtenías en 2006 con un X6800, E6700 o E6600 (todos de dos núcleos) es bastante (y créanme que bastante) menor que el de uno de los modelos que probamos hoy. Es deslumbrante incluso para nosotros, que estamos todo el día pendientes de las novedades del mundo del silicio, ver como mejora todo ley-de-moorísticamente hablando en apenas un par de años.
Para los que no necesitan procesadores tan rápidos (porque créanme, si lo que hacen es ver videos de Youtube todo el día no necesitan un Core i7), pronto iremos viendo más representantes de Nehalem: Core i5 y quien sabe si quizás Core i3 o hasta Core i1. La pregunta obligada de «¿es hora de cambiar mi procesador por un Core i7?» no es sencilla pero tampoco es tan difícil: el cambio no es barato, ya que implica obligadamente cambiar placa madre (una X58 vale en promedio 50 dólares más que una P45) e incluso memorias si aún no adoptabas en tu plataforma memorias DDR3 (aunque el kit triple channel no es 100% obligatorio: los gráficos muestran que la mejora más importante ocurre al pasar de 1 a 2 canales. De 2 a 3 el aumento es más discreto). Si tienes el dinero y necesitas realmente este poder de proceso adicional (edición de video, rendering, o sea cosas «serias») y ocupas la máquina para trabajar, ve a ciegas: Core i7 es la opción correcta. Total, para pasarte a i5 también necesitarías cambiar de placa y todo.
Los gamers son los únicos que no se ven demasiado beneficiados por el cambio. Hoy en día los juegos están muy limitados por la tarjeta de video por lo que como vieron en los gráficos el cambiar el procesador por uno muy poderoso no trae tantas ventajas sobre el rendimiento del juego a diferencia de campos como los mencionados arriba donde la diferencia si que es notoria. Quizás lo más sensato sea esperar la llegada de Core i5, que probablemente no rendirá tanto sobre Core 2 Quad como lo hace Core i7, pero si tendrá productos en un rango de precios «apto para todo público».
¿Y le damos premio? Definitivamente sí. El premio que se lleva Intel con sus Core i7 es por no dejar de avanzar, aún cuando la situación del mercado le da espacio de sobra para empezar a vivir de refritos (como ocurre en mundos como el de las VGA). Si Core 2 Duo fue un salto muy grande luego de Netburst, Core i7 es un salto quizás no tan grande pero igual de aplaudible. Por el poder de Grayskull, le damos nuestra preferencia personal a los nuevos procesadores Core i7.