Hoy NVIDIA hizo una suerte de lanzamiento en papel de Fermi, la nueva arquitectura de NVIDIA que pretende -nuevamente- barrer el piso con AMD/ATI.
Fermi tiene varias características innovadoras que iremos mencionado una a una, pero para partir nos concentraremos en los 3.000 millones de transistores que esta tiene, casi un 50% más de los que el RV870 trae. Este enfoque se debe a que NVIDIA es el único gran actor en la industria del hardware que no tiene un CPU propio como AMD e Intel, por lo que han tenido que poner un esfuerzo enorme en promover el uso de tecnologías como CUDA, PhysX y últimamente OpenCL.
Los cuadros verdes que vemos en la imagen son los 512 CUDA Cores, más del doble que los 240 incluidos en el GT200. Cada uno de los «DRAM I/F» son las interfaces de memoria, de 64 bits cada una. Esto nos da un ancho de memoria total de 384 bits, o sea, un 50% más que el RV870. La caché L2 que atravieza al núcleo es de 768KB y el Giga Thread será el encargado de aumentar el rendimiento de manera exponencial
El problema de tener tantos transistores extra y un tamaño significativamente más grande que el de tu competencia es que el precio no puede ser el mismo, por lo que en vez de apuntar Fermi 100% hacia los gamers sin presupuesto como ATI, prefirieron dedicar todos sus esfuerzos a demostrar cómo utilizando la GPU para cálculos generales puedes obtener maravillas. Si bien podemos quejarnos y decir que NVIDIA tomó este enfoque solamente porque no tienen CPUs, la resolución de los monitores lleva estancada durante varios años y recién se está volviendo común jugar a 1440×900 o 1680×1050 luego de años jugando a 1280×1024 y la industria de los videojuegos solo nos trae mugrosos ports en DX9 de sus juegos con tan solo un puñado de compañías que realmente aprovechan los recursos existentes en el PC.
No entraremos a fondo hablando de cada uno de los detalles y cómo el ajustar en 0.5° a la izquierda la silla de la señora juanita en la línea de ensamblaje durante el equinoxio de verano, hace que Fermi sea lo más grande desde la aparición de Redtube, pero daremos una pincelada a las características más importantes del GT300.
Ya les mencionamos los 3.000 millones de transistores que Fermi (o Furby si es que eres del lado rojo) trae junto a los 512 cores de éste. Si bien no son 1600 como en el RV870, éstos pueden procesar instrucciones más complejas y siempre son 512, mientras que los del lado rojo pueden hacer uso de los 1600 stream processors siempre y cuando las instrucciones sean simples. Estos 512 núcleos están divididos en 16 grupos con una caché dinámica de 64KB que puede dividirse en una combinación 48+16 para caché L1 y Datos respectivamente o vice versa, dependiendo del uso que queramos darle a la GPU.
Estos racimos de núcleos necesitarán compartir datos entre ellos, por lo que es ahí donde la caché L2 común de 768KB entra en juego. Estos cambios de caché se deben a que sin importar la cantidad de threads en paralelo que la GPU pueda procesar el limitante siempre es la memoria, por lo que NVIDIA extrañamente disminuyó el número de threads soportados a 24.576 desde los 30.720 del GT200 en vez de colocar un asterisco y letra chica diciendo que puede procesar hasta un millón de instrucciones en paralelo si todas estas son null.
Obviamente las instrucciones no crecen en los árboles y alguien tiene que decirle a la GPU que se mueva, función exclusiva del nuevo NVIDIA Giga Thread. Este scheduler (o planificador) se encarga de ordenar y repartir las instrucciones en paralelo enviando más de una a la vez por ciclo, ya sea juntando varias pequeñas o separando una grande para que ésta pueda hacer uso del poder de cómputo que se perdería en el proceso.
¿Y dónde se guardan estas instrucciones? En la memoria pues. Como Fermi está apuntado al mercado profesional y gente que quiera usar la GPU para mucho más que jugar el núcleo debe cumplir con estándares de la industria como IEEE754 y dar la flexibilidad de programar en diversos lenguajes como C for CUDA, OpenCL, DirectCompute y demases. Las consecuencias de que un 0 se vuelva un 1 de manera inesperada podría hacer que el colisionador de hadrones trate de dividir por 0 y el universo explote, por lo que NVIDIA no sólo soporta corrección de error en las memorias GDDR5 como el RV870, sino que en todo tipo de registros como la caché y demases, volviéndolos la GPU más segura -en el papel- a la fecha.
Junto a ser flexible en software y soportar corrección de error en las memorias, Fermi tiene un diseño casi escalable que permite hasta 6GB de RAM GDDR5 por tarjeta, lo que de seguro traerá a más de un modelito TESLA con el precio de un auto compacto. Al menos el precio elevado no le dará excusas a NVIDIA para seguir utilizando memorias GDDR3 en sus tarjetas y finalmente estarán a la altura de la industria en lo que a nuevas tecnologías se refiere.
Este lanzamiento (si es que se le puede considerar como tal) es medio extraño. Recién están armando las primeras tarjetas para probar y las frecuencias de núcleo, shaders o memorias no han sido fijadas. Ya vimos un par de fotos de la tarjeta y podemos hacernos una idea de lo que nos espera como un precio si o si superior al del RV870por la cantidad de mejoras incluidas, mejoras que si bien suenan muy lindas en papel no son una mejora enorme para los gamers que constituyen la mayor parte del mercado de NVIDIA.
Por otro lado está el tema de los refritos de NVIDIA. Aún cuando salga el GT300 a tiempo no habrán partes para el mercado mainstream, por lo que tendremos que esperar hasta mediados de 2010 para tener una GTS350 «Fermi» o recibir de brazos abiertos a la «nueva» GTX275 GTS350 que sólo le traerá mala publicidad a NVIDIA.
De cualquier forma el único beneficiado en la guerra de GPUs es el consumidor, por lo que el único consejo que tenemos para ustedes es empezar a juntar el vuelto del pan y las monedas que encuentran entre los cojines del sillón porque es más que seguro que las ofertas para esta temporada navideña estarán imperdibles.
Rumor: Posibles Especificaciones
Como en esta vida todo se rumorea, obviamente una nueva tarjeta de video no puede quedar fuera, menos si estamos hablando de la nueva tarjeta tope de serie del gigante verde. Estas serían las posibles especificaciones de la futura tarjeta de video basada en Fermi (GT300).
Core Clock: 750+ Mhz
CUDA Cores Clock: 1500+ Mhz
Memory Clock: 1200Mhz (4800Mhz)
Memory Interface: 384bits
CUDA Cores: 512
Memory: 1.5GB GDDR5
Esas son las especificaciones que creemos poseerá la nueva tarjeta de video basada en el GT300 de NVIDIA. Cuando se sepan de forma oficial contrastaremos con estas que especulamos y veremos que tan cerca estuvimos.
Fuentes: