Fotos. Muchas fotos. Eso fue lo que sacamos cuando Greg Wagnon y Mahmoud Khorashadi , ambos expertos benchmarketeadores de Intel nos invitaron durante el Editors Day del Cono Sur 2008 a una sesión de preguntas y respuestas sobre Nehalem. Y las fotos no fueron de nosotros preguntando ni de ellos respondiendo, sino de que un juguetito que procedieron a desarmar y luego hacer funcionar ante nuestros ojos: un servidor de alto rendimiento, con lo que pudimos aprender que clase de hardware hay dentro y como funciona una de esas máquinas siempre administradas por un gordito fanático de las pizzas y las piscolas.
Todos los fierros que veremos hoy estaban dentro de un bicho bastante grande: un tamaño de 4U (Las U son la medida en altura para poder saber cuanto espacio vertical va ocupar una máquina instalada en un rack. 1U equivale a 4.445 cms, por lo este servidor tiene 17.78 cms de alto). No les voy a adelantar más specs para ir sorprendiéndolos de a poco.
Lo primero que conocimos fue la tarjeta SCSI que permite la instalación de configuración de varios discos duros Serial Attached SCSI (SaS) en RAID. Greg Wagnon la sostiene en sus manos en la imagen de arriba.
4 disipadores, lo que significan cuatro procesadores en cuatro sockets. Los disipadores, aunque parecen pasivos en la práctica no lo son (ya verán porqué un poco más adelante). Volviendo al tema de los procesadores, como podrán imaginar, en esta época donde todo tiene más de un núcleo no nos dice mucho cuantos sockets físicos hay. Para que sepan realmente cuantos núcleos (y en consecuencia de cuanto poder de cómputo potencial tendremos a nuestra disposición) hay en la máquina, tendremos que revelarles el codename de los procesadores: Dunnington, la última novedad en cuanto a procesadores para servidores, montando en su sustrato el actual récord de núcleos en un solo sustrato: SEIS. Estos seis núcleos no son monolíticos (Dunnington está basado en arquitectura Core construido a 45nm, por lo que estamos hablando de tres parejas de núcleos conectadas por el FSB) pero al día de hoy son la mayor cantidad de núcleos a los que podemos acceder en un solo procesador. Los detalles técnicos de Dunnington son para quedar helados: instalables dentro de un zócalo 771, 1,900 millones de transistores, 503mm cuadrados de puro silicio, 9 (3 por cada pareja) MB de cache L2, 16MB de cache L3 y 130W de TDP, corriendo a una frecuencia de 2,660 Mhz y valuados cada uno en 2,730 dólares, los Xeon X7460 (nombre comercial de estos procesadores) al juntar un grupo de cuatro de ellos (como en el caso del servidor que fotografíamos en esta nota) lo que se obtiene son nada menos que 6×4 = VEINTICUATRO núcleos, lo máximo que se puede tener en 4U.
Discos duros, como ya decíamos, hay de sobra: Ocho discos, completamente cambiables en caliente (recuerden que si se echa uno a perder el show tiene que continuar, un servidor no puede paralizarse por un problema tan básico),los que podemos sacar de la máquina fácilmente.
Los discos que este servidor tenía dentro eran los Seagate Savvio 10K.2 de 146GB cada uno (estos discos no son SATA, sino que SaS, como explicábamos un poco más arriba). Eso significa 146×8=1,168GB de espacio. Nada demasiado impresionante si consideramos que hoy hay disponibles a un precio no demasiado prohibitivo discos de 1TB, pero cuando lo que queremos es velocidad hay que sacrificar algo de eso. Seagate promete más velocidad en estos discos de 2.5″ que en un disco de 10,000RPM de 3.5″. Hablando en plata, cada uno de ellos vale cerca de 270 dólares americanos.
Para mantener el tarro frío, se utilizan dos grupos de dos ventiladores (MUY ruidosos por cierto, aunque Greg nos dijo que ese ruido no era nada comparado contra el bullicio que metía un Blade Server) los que también funcionaban de manera redundante (cada par de ventiladores funciona al 50% de su velocidad, pero si uno de ellos falla el otro gira al 100% para suplir al defectuoso mientras llega corriendo el administrador a cambiarlo antes de que lo despidan). Como pueden ver, TODO es redundante. En servidores, la paranoia es un estilo de vida. Los ventiladores que ven succionan el aire del exterior para hacerlo atravesar la máquina (y consecuentemente retirar el calor de los disipadores de los 4 CPU, por eso les decía que no eran pasivos) y salir por el otro lado (donde hay más ventiladores). El servidor tiene un sistema de seguridad que detecta cuando se levanta la tapa del gabinete e inmediatamente hace que todos los ventiladores comiencen a girar a máxima velocidad. Esto porque al levantar la tapa el flujo del aire (entrando por el frente, atravesando los disipadores de los CPU y luego saliendo por la parte posterior del tarro) se modifica, perdiéndose efectividad en el enfriamiento y creando una eventual condición de inseguridad. Wagnon nos explicó que aún a tapa descubierta es bastante difícil que los procesadores se quemen; eso en el mundo de los servidores no importa, ya que si podemos evitar una posibilidad de falla, debemos evitarla. Como sea.
Los ventiladores que ven arriba son los que expulsan el aire de la máquina tras retirar el calor de los disipadores de los CPU. Dos parejas, una a cada lado, funcionando tal como pueden suponer, de manera redundante.
¿Y cuánta memoria RAM creen ustedes que lleva dentro un servidor de estas características? ¿4GB? ¿8GB? Antes de darles el número exacto deben saber que los FB-DIMM no van directamente montados sobre la placa madre, sino que se instalan sobre unas placas auxiliares llamadas RISERS (esas «cajas» negras que se ven en la imagen de arriba). El servidor que vimos tenía posibilidad de montar 4 risers sobre la placa madre, así que rápidamente tomamos uno de ellos para desmontarlo y ver cuántos slots de memoria tenía.
OCHO. Es decir, la placa madre es capaz de utilizar 4×8=32 módulos de memoria mediante los cuatro risers; y ya que hablamos de un servidor megapotente en esta ocasión cada uno de esos slots estaba ocupado por un módulo de memoria de 4GB. Nuevamente, hagamos las matemáticas y veremos que esta máquina tiene disponible 4x8x4=128GB. Ciento veintiocho gigabytes de RAM, a ver si con eso Vista anda bien.
¿Cuántas fuentes de poder creen que tiene este aparatito? ¿Una? De ninguna manera, para evitar una posible falla la máquina ocupa dos fuentes de poder que funcionan simultáneamente y que en caso de falla permiten transferir toda la carga a una de ellas mientras llega la ambulancia tech con la parte de reemplazo.
Wagnon, con una de las fuentes de poder en sus manos nos explicó que al funcionar las dos fuentes simultáneamente lo que hacen es repartirse la carga de trabajo, aunque esto se puede controlar desde el panel de administración del servidor (donde podemos hacer que sólo una trabaje y que la otra se encienda sólo en caso de fallo o ir dando porcentajes de carga a cada una dependiendo del servicio que se esté ejecutando).
Como pueden ver en la foto superior, cada una de las fuentes de poder ofrece una salida máxima de 1570 Watts. Eso significa que entre ambas pueden abastecer hasta 3140W de consumo… una bicoca, eh? Esperen a saber los amperajes: la línea de 12V si alimentamos la fuente con 220V es capaz de entregar una intensidad de corriente de CIENTRO TREINTA PUNTO OCHO AMPERES! (130.8A). Multipliquen eso por dos y piensen en la cuenta de la luz. ¿Conciencia planetaria? Difícil tenerla cuando quieres una máquina que sea capaz de correr 15 servidores de Crysis multiplayer sin tener ni un hipo.
Y bueno, no llevaron una máquina de ese porte y de ese precio a pasear por el mundo (les recuerdo que esto lo vi en Punta del Este, Uruguay) para tenerla apagada. Después de desarmarla y volverla a armar (certifico que no sobró ningún tornillo), Wagnon agarró cables y conectores y apretó ON.
Un par de segundos de silencio, hum… oh… ¿no prende? ¿qué pasa?. El experto en probar servidores nos explicó que la máquina tarda varios minutos en EMPEZAR a bootear, debido a que hace un autotest de todas sus partes y toma bastante tiempo chequear cada uno de los 32 módulos de memoria. Y con bastante no me refiero a un par de segundos, sino que a un par de minutos con la pantalla en negro esperando que parta. Eso puede sonar molesto pero la idea de un servidor es prenderlo una sola vez y no volverlo a apagar jamás de los jamases.
Arriba pueden ver el momento en que se estaba activando la controladores de discos SaS, y abajo, para horror de los profesionales IT que trabajan con Linux, la pantalla de carga del sistema operativo, que evidencia que este monstruo en esta ocasión está corriendo Windows Server 2008.
Entramos al escritorio del sistema operativo y de ahí un par de clic para sacar la foto obligadísima de esta sesión de pruebas: Propiedades del sistema y administrador de dispositivos, para ver cuantos núcleos disponibles había y cuanta memoria RAM detecta el sistema. Nos hubiera gustado más CPU-Z, pero no andábamos con el pendrive bajo la manga.
24 procesadores físicos, 2.66Ghz y 128GB de RAM. BEHOLD THE MONSTER. Ahora, no más blablá y a benchear.
La máquina traía instalado el benchmark de Cinebench4D, ese de la motito que permite determinar el poder de cálculo de un núcleo (en esa aplicación específica) y cuanto escala al utilizar varios de ellos. Para esta configuración de hardware en especial está algo limitado, ya que no soporta más de 16 núcleos, es decir para nuestra máquina con 4 Xeon X7460 habrá ocho núcleos físicos que permanecerán inactivos.
La velocidad a la que se ejecutó la prueba de Cinebench 4D en modo X Core fue sencillamente muy impresionante. He visto muchas veces correr este benchmark, y francamente la prueba tarda muy poco al aprovechar 16 núcleos para renderear la imagen. Lo que usualmente había visto tardar algunos minutos, aquí no tomó más de 10 segundos.
El resultado: 3284 puntos en modo 1 CPU, 30641 puntos en modo X CPU. Para que se ubiquen en el tiempo y el espacio, un QX9650 da cerca de 3300 puntos en modo 1 CPU (muy similar a lo que nos dio el X7640) y 11800 puntos en modo X CPU. Esto significa que 16 núcleos escalan 9.33x y 4 núcleos escalan 3.58x. O sea más allá de 4 núcleos la escalada de rendimiento no es lineal.
Antes de finalizar la sesión de pruebas, Greg Wagnon nos mostró que no todas las aplicaciones son incapaces de utilizar más de 16 núcleos (como Cinebench 4D). Un programa de simulación financiera en un par de segundos tenía a los 24 núcleos triturando números.
¿Qué tal les pareció este recorrido fotográfico? En las palabras de Intel tuvimos delante a la máquina más rápida del mundo (podemos acceder a más poder de proceso pero para eso estamos hablando de una granja de más de una máquina). Con un precio absolutamente «profesional» de USD 20,000+, aún cuando no somos expertos en servidores creo que era obligación hacer una nota como esta y mostrarles parte a parte que tiene dentro una máquina de este tipo. Voyeurismo nerd 100%.
Muy lindo, muy poderoso, muy caro: la pregunta obligada es si acaso puede correr Crysis. Tal como pueden imaginar, la respuesta es NO. Y no me pregunten por qué, la respuesta es bastante obvia.