Image default
LanzamientosReviewsTarjetas de Video

Review: NVIDIA GeForce GTX 680 «Kepler»

Finalmente ha llegado el día que muchos estaban esperando, la nueva y flamante GEFORCE GTX 680 (Kepler), luego de un largo viaje ha desembarcado en nuestros laboratorios para mostrarles a ustedes su bondades y así reclamar el trono de rendimiento gráfico que actualmente ostenta AMD con sus Radeon HD 7900 series.

La GeForce GTX 680 (GK104) es la primera GPU de NVIDIA basada en su  nueva y renovada arquitectura de nombre clave “Kepler”, que a pesar de llegar mucho después de Graphics Core Next (GCN) en la cual se basan las tarjetas de AMD (Radeon HD 7000 series), ha tenido más tiempo de saber cuál era la barrera que había que superar, dándole ventaja en este sentido a NVIDIA para preparar un producto más robusto y poderoso, aunque desventaja en términos de mercado, que lógicamente NVIDIA espera recuperar con la salida de la GTX 680, recuperar mercado y recuperar también el trono de rendimiento gráfico hasta ahora suponemos en manos de AMD.

Kepler se basa en los fundamentos establecidos por NVIDIA cuando lanzo Fermi en el 2010 con el lanzamiento de la GeForce GTX 480, la primera GPU de NVIDIA basada en Fermi, arquitectura basada en el paralelismo, motores de geometría optimizador para técnicas como teselacion, como así también una nueva arquitectura de cómputo que mejora notablemente el rendimiento en operaciones atómicas, pero con un gran talón de Aquiles que fue el consumo y disipación térmica que hicieron hasta cierto punto impopular a las GTX 400 series, por tal razón NVIDIA optimizó la arquitectura y luego lanzo las GTX 500 series que seguían basas en Fermi.

Ahora es tiempo de dejar a Fermi en el pasado y poner nuestra atención en “Kepler”, la nueva arquitectura gráfica de NVIDIA que  viene a mejorar en muchos aspectos la actual arquitectura basada en fermi y para esto NVIDIA ha hecho los cambios necesarios tanto cuantitativos como cualitativos y que espera reflejar en términos de calidad visual, rendimiento gráfico, potencia de cómputo, consumo eficiente, entre otras tecnologías que NVIDIA agrega con esta nueva generación de tarjetas gráficas de alto rendimiento  y que pasaremos a revisar en las siguientes secciones técnicas.

Especificaciones Generales: Como pueden ver en la siguiente imagen, NVIDIA ha apostado por incrementar el número de CUDA Cores, la velocidad de la GPU y las memorias con la GeForce GTX 680. NVIDIA presume de tener la primera tarjeta gráfica con memorias GDDR5 con una velocidad de 6.000 MHz, que superan los 5.500 MHz de la Radeon HD 7970 y los 4.000 MHz de la GTX 580. Además la GTX 680 triplica el número de CUDA Cores desde los 512 en Fermi (GTX 580) a 1536 con Kepler, incorpora 2GB de memoria en un bus de 256-Bit, que le da un ancho de banda de 192.26 GB/s a la GTX 680, en este último punto está a la par del ancho de banda que alcanza la GTX 580.

Kepler vs Fermi: Para hacernos una idea general de las ventajas de Kepler, respecto a Fermi, sólo basta observar la siguiente tabla, en ella nos daremos cuenta que el poder geométrico y de computo se ha incrementado notablemente con  la nueva arquitectura de NVIDIA, como así también sus especificaciones bases de frecuencias.

Como pueden ver  los cambios más notable en términos cuantitativos de Kepler respecto a fermi son: en primer lugar el número de CUDA Cores (1536 vs 512 respectivamente), la velocidad de núcleo 1066 Mhz vs 772 MHz, el poder de cómputo de 3090 GFLOPs de Kepler, respecto a los 1581 GFLOPs de Fermi, las unidades de textura 128 vs 64 y la tasa de relleno que se incrementa desde los 49.4 Gigatexeles/seg a 128 Gigtexeles/seg para dotar a la GTX 680 de un poder geométrico mucho más alto que su antecesora.

Tomando el ejemplo de la tabla anterior, Kepler tiene un TDP de sólo 195W, respecto a fermi que con mucho menos elementos tenía un TDP de 244W. Por tal razón, la GTX 680 se alimenta de una configuración de conectores de energía PCIe 6+6 pines, mientras que la GTX 580 y la Radeon HD 7970 utilizan una configuración de conectores PCIe de 6+8-pines. Según NVIDIA la GTX 680 es la tarjeta más eficiente en consumo jamás creada.

 

Arquitectura: Como ya mencionamos de entrada Kepler es una nueva arquitectura gráfica, aunque mantiene los fundamentos de la filosofía con la que se construyo Fermi, Kepler ha mejorado muchos aspectos y agregado nuevas características que la hacen la arquitectura más potente y eficiente jamás hecha por NVIDIA, bueno es algo lógico con cada nueva arquitectura gráfica, pero Kepler quiere destacar por una potencia gráfica preponderante y un consumo muchísimo más eficiente que su antecesora.

La arquitectura de Kepler en términos generales está compuesta por muchos bloques de hardware diferentes, casi en el mismo orden que los de Fermi, y cada uno de estos bloques realiza una función o tarea específica, siendo el GPC (Graphics Processors Clusters) el motor general de Kepler, con sus propios recursos o elementos dedicados a tareas como: rasterización, sombreado, texturizado y computo, así la mayoría de las funciones gráficas de la GPU se llevan a cabo dentro de estos GPC.

Hilando un poco más fino, la GPU de la GTX 680 está compuesta de 4 Graphics Processing Clusters (GPCs) que agrupan otros elementos como los el Raster Engine y sus respectivos elementos, PolyMorph Engine 2.0 (de segunda generación), Streaming Multiprocessors (SMs) y controladores de memoria. Así, Kepler consiste en cuatro GPC, cada uno contiene 2 SMX para conformar un total de 8 next-generation Streaming Multiprocessors (SMX) y cuatro controladores de memoria dedicados para cada GPC. Con la GeForce GT 680 cada GPC tiene un motor de rasterizado dedicado, cuatro en total.

 

Streaming Multiprocessors (SMX): Luego de los GPC tenemos los SMX que en la arquitectura de Kepler son los nuevos Streaming Multiprocessors, que a su vez son un sub-cluster dentro del GPC que alberga nada menos que 192 Cores o CUDA Cores en Kepler, esto comprado con los SM de Fermi que sólo contenían 32 CUDA Cores.

Así, teniendo en cuenta que Kepler posee 8 SMX con 192 Cores cada uno, es cosa de multiplicar para obtener los 1536 CUDA Cores que posee la GeForce GTX 680. Por otra parte cada SMX cuenta con 16 unidades de textura (128 en total para Kepler), con un motor Polymorph 2.0 del cual hablaremos en el siguiente párrafo. En términos generales la arquitectura de Kepler ofrece un rendimiento por watt 2 veces superior al de Fermi, posee mecanismos que ajustan los clocks eficientemente en virtud del consumo.

En esta imagen tenemos un SM de la GTX 580 (Fermi) conformado por 32 CUDA Cores.

En esta otra tenemos un SMX de la GeForce GTX 680 «Kepler» que contiene 192 CUDA Cores, es decir, 6 veces más de CUDA Cores que en un SM de la GTX 580 (Fermi). NVIDIA tambien ha mejorado x2 el rendimiento por watt de sus SMX respecto a los SM de Fermi, algo que sin duda repercute en el consumo de la tarjeta.

 

PolyMorph Engine 2.0: Otro de los elementos que NVIDIA ha mejorado dentro de la arquitectura de Kepler es el PolyMorph Engine 2.0, la segunda generación de este importante motor hace su debut en las entrañas de la GTX 680. Este es el principal responsable de entregar a la tarjeta un desempeño sin sobresaltos en aspectos relativos a DirectX 11 como la teselacion, aun en operaciones complejas.

El PolyMorph Engine de Kepler tiene exactamente los mismos elementos que ya estudiamos cuando analizamos la arquitectura de Fermi, como Vertex Fetch, Tessellation, Viewport Transform, Attribute Setup y Stream Output, que se encargan de complejas operaciones geométricas, como la teselacion.

Con el Raster Engine ocurre algo similar, sus elementos son exactamente los mismos que encontramos en fermi como: Edge Setup, Rasterizer y Z-cull, claro que tambien han sido optimizados para entregar un mejor rendimiento en sus respectivas operaciones, como el rasterizado.

Curiosamente la GTX 680 contiene solo 8 motores PolyMorph Engine 2.0, comparados con los 16 motores PolyMorph Engine 1.0 de la GTX 580, esto debido a los cambios en el diseño o layout general de la arquitectura de la GTX 680, sin embargo, en Kepler estas unidades fueron rediseñadas para entregar un rendimiento por-clock el doble de lo que ofrecen las unidades integradas en Fermi.  Además el 30% extra de frecuencias que trae la GTX 680 sobre la GTX 580 asegura una significante mejora promedio en cargas de trabajo relativas a teselacion.

 

GPU Boost: En una de nuestras notas ya habíamos hablado de esta característica  que incorpora Kepler y que si lo vemos de manera superficial se asemeja a los modos de overclock automático de los procesadores de AMD e Intel con sus tecnologías Turbo Boost y Turbo Core. Aunque NVIDIA ha implementado algoritmos más avanzados para regular este asunto, por cuanto la arquitectura de una GPU es mucho más compleja que la de una CPU.

GPU Boost básicamente incrementa las frecuencias de la GPU utilizando algoritmos avanzados que van en pro de un consumo más eficiente, para poder así entregar un mayor rendimiento 3D cuando la ocasión lo amerite. GPU Boost es la combinación de hardware y software que funcionan con la GTX 680, la tecnología trabaja en segundo plano, basado en las condiciones de operación de la GPU, para esto circuitos de hardware dedicado continuamente monitorizan el consumo de energía de la GPU y ajusta los clocks para conseguir la máxima frecuencia posible, mientras mantiene los márgenes de consumo en límites predefinidos.

GPU Boost además opera de manera completamente autónoma, sin perfiles para juegos y sin intervención del usuario, entregando mejoras de rendimiento instantáneas para los gamers.  Para entender un poco mas este asunto tengamos en cuenta que la frecuencia base de la GTX 680 es de 1.006 MHz, frecuencia que se denomina “Base clock”, esta es la frecuencia mínima que la GPU garantiza alcanzar bajo carga en aplicaciones que no demandan tanto TDP.

El “Boost Clock” por su parte es la frecuencia  que la GPU puede alcanzar bajo carga en aplicaciones que requieren un poco más de TDP  y que llega a un pequeño overclock del 5% llevando a la GPU a 1.058 MHz. En algunos casos el Boost Clock puede ser mayor y llevar automáticamente a la GPU a 1.100 MHz o incluso más frecuencia dependiendo si hay margen en el límite de TDP establecido para esta característica por parte de NVIDIA que está en los 170W.

GPU Boost es completamente compatible con el overclock de la GPU, ya que los usuarios podrán llevar la GPU a frecuencias aun mayores utilizando utilidades de terceros y podrá ajustar manualmente el límite de energía para alcanzar frecuencias más altas, asunto que se puede alcanzar debido al nivel de overclock que ofrece la GTX 680.

Adaptive VSync: Antes, cuando utilizábamos monitores con tecnología CRT mantener un framerate constante era todo un suplicio. Los juegos utilizaban un refresco de frames de forma sincrónica, esto quiere decir, que todos los frames nuevos aparecían de forma periódica en base al intervalo de refresco. A esto se le llama Vertical Sync.

Pero esto tenía un problema, toda vez que la tasa de rendereo era más baja que la de refresco, la tasa de sincronización disminuía desde el valor típico de 60Hz a 30Hz, provocando caídas abruptas de los FPS. Obviamente, lo que se acostumbró a utilizar, fue el VSync deshabilitado, pero esto acarreó otro problema, que aparecían líneas «fantasmas» o que cruzaban toda la pantalla, esto se debía a que la tasa de rendereo era muy por encima de la tasa de refresco.

NVIDIA para solventar este problema, introduce lo que denominan «Adaptive VSync«, lo que en palabras simples hace esta técnica es «encender y apagar» el vsync cuando la situación lo necesite. Entonces cuando el frame rate baje de 60, desactiva el vsync, y cuando sobrepase los 60FPS, activa el vsync para evitar el tearing. Esto provocaría que los juegos tengan un framerate más parejo y fluido.

La buena noticia es que esta técnica está disponible a partir de los drivers R300 y es compatible con la nueva GeForce GTX680 y con las tarjetas anteriores (GTX500, GTX 400, etc.), por lo tanto, no será exclusiva de la GTX 680.

FXAA: Junto con las mejoras que trae consigo Kepler, NVIDIA reintroduce una nueva técnica de filtrado llamada FXAA, esta tecnología consiste en un algoritmo de filtrado a nivel sub-pixel, en el que cada pixel es revisado en cada movimiento entre frames (cuadros), reduciendo el borde de cada uno con un tiempo de aplicación menor a 1ms. Esto se traduce en una imagen mucho más suave comparada a un filtrado MultiSampling de 4 muestras (4x MSAA) y además con un framerate el doble más rápido.

Mencionamos que reintroduce esta tecnología, ya que está presente desde el año pasado, en donde se presentó por primera vez en el juego Age of Conan, desde ese entonces ya van 15 juegos que soportan esta tecnología. Antes era solamente en el panel de control del juego, a partir de los drivers R300, puede ser activado en el Panel de Control de NVIDIA.

A modo de ejemplo, en la GDC2011, la empresa EPIC presentó un demo llamado SAMARITAN, este demo corrió bajo una configuración 3-Way SLI de GTX580, consumiendo 732W y generando 2500BTUs de temperatura, este año NVIDIA presentó el mismo demo corriendo con una sola GTX 680 y filtrado FXAA, consumiendo 195W y sólo generando 660BTU. Este es el nivel y la calidad de filtrado entregada por el FXAA y es el nivel de poder de la nueva GEFORCE GTX 680.

[nggallery id=896]

TXAA: Aprovechando el poder de procesamiento de texturas en punto flotante de 16-bits de la GEFORCE GTX 680, NVIDIA introduce una nueva tecnología de filtrado. Esta técnica consiste en la introducción de una serie de efectos y filtros AA (Anti Aliasing), que conllevan a que se tenga una calidad de imagen con nivel «de película».

Obviamente, este nivel de filtrado conlleva un decaimiento en los FPS, comparado a lo que nos castiga la aplicación de filtrado MSAA. Por ejemplo, aplicar TXAA 1, es como si tuviésemos aplicado un filtrado 8xMSAA pero con un rendimiento en FPS como si tuviésemos aplicado 4xMSAA.

[nggallery id=897]

NVENC: Este es el nombre del nuevo encoder de video que NVIDIA incorporará en todas las tarjetas basadas en Kepler, comenzando con la GTX 680. Este motor basado en hardware podrá codificar video H.264 para videos de alta definición. Antes de Kepler, el encoding de video en las tarjetas GeForce era administrada por un software de encoding que hacía uso del array de CUDA Cores, mientras estas unidades son capaces de entregar un tremendo rendimiento en velocidad  comprado a una CPU realizando tareas de encoding, tenían la desventaja que incrementaba notablemente el consumo de energía.

Por contrapartida, utilizando circuito de hardware especializado para el encoding H.264, el nuevo motor NVENC en Kepler es casi cuatro veces más rápido que el previo motor basado en CUDA, mientras consume mucho menos energía, según indica casi literalmente NVIDIA.

Capacidades Multi-monitor: Con la GTX 680 NVIDIA ha mejorado sus capacidades multi-monitor, ahora con una sola GTX 680 es posible administrar hasta 4 monitores independientes con soporte para 3D Vision Sorround, esto comparado con los 2 monitores que soporta la GTX 580. Esto es posible gracias al nuevo motor de pantallas que incorpora Kepler que ha sido pensado para la próxima generación de pantallas con resolución 4K, pantallas HDMI de 3Ghz, juegos en pantallas múltiples con NVIDIA Sorround, multi-stream de audio y transcoding de video mejorado.

La GeForce GTX 680 en su diseño de referencia incorpora 2 salidas dual-link DVI, como asi tambien una salida HDMI y DisplayPort.

Sistema de Enfriamiento: Tres son los elementos principales para el sistema de refrigeración de la GTX 680, primero materiales con amortiguación acústica para el ventilador, un diseño triple de heatpipes embebidos y  un disipador con aletillas de aluminio que ha sido moldeado para un mejor flujo de aire.

Estos heatpipes integrados en la base tienen la función de conducir el calor fuera de la GPU hacia el heatsink, posteriormente el ventilador conducirá el calor por las aletillas de aluminio para finalmente disiparlo o moverlo fuera del gabinete.

 

Primera Mirada.

Un modelo muy sobrio y elegante, con un FAN tipo blower, que para los mas exigentes, no es muy ruidoso.

 

Esta VGA soporta 4way-SLI, estamos a la espera de la segunda, para demostrarles como escala.

 

Salidas Dual Link-DVI,  HDMI y Display Port.

Doble conector de 6 pines, cabe mencionar que se encuentran como espejo, por lo que un cable entra en una posición y el otro, al revés.

 

 

 

GK 104 en todo su esplendor.

[nggallery id=898]

 

Metodología y plataforma.

Plataforma de pruebas.
Procesador- Intel Core i7 2600K
Placa Madre- Intel DP67BG
Refrigeración- Noctua NH-D14
Memorias- Gskill Ripjwas X 2x4GB 2133MHz 9-11-9-28
VGA- NVIDIA GTX 680
- MSI N580GTX Twin Frozr II/OC
- MSI N560GTX-Ti Hawk
Fuente de Poder- Corsair AX-850
SSD- Corsair Force 3 120GB
Monitor- Viewsonic VA2231wm

Software.
- Windows 7 x64 Ultimate SP1
- ATTO
- CrystalDiskMark x64
- HD Tune.

Metodología La metodología utilizada en este review es exactamente la misma que utilizamos en los reviews de placas madres y/o de CPUs que hemos realizado anteriormente. Solamente actualizamos algunas versiones de programas para mantener los resultados lo más frescos posible. Todas las pruebas fueron ejecutadas 3 veces, indicando como valor final y presentado el promedio estable de las corridas. El sistema se mantuvo bajo sus condiciones stock en todo momento, se deshabilitó Cool&Quiet y los juegos corrieron sin PhysX.

 

Pruebas sintéticas.

 

No hay mucho que decir y los resultados hablan por si solos, las VGAs se comportan como se supone, no hay grandes sorpresas en este apartado, salvo mencionar que la GTX 680, rinde en promedio el DOBLE que una GTX 560Ti (y eso que nuestro modelo trae overclock de fábrica)

 

Pruebas reales.

Misma tónica, la GTX 680 barre absolutamente con las generaciones. Si posees una GTX 580, y eres amante del performance, es una actualización que si vale la pena.

 

Overclock.

 

Bueno, esta es la sección favorita de muchos y también la mía.
Al ser una VGA con drivers beta y utilidades de OC también en estado beta, costó bastante estabilizar el overclock, de hecho pasado 1.1de vcore el bench se cae, pero aun así logramos pasar de los 1006mhz stock, a 1166mhz sin turbo, con turbo esta frecuencia salta hasta 1213mhz (21.3% de OC) lo que permitió lograr un puntaje 3DMark 11 Performance de 10021 y superar la marca chilena en mas de 1700pts. y de paso llevarme casi 10 puntos en HWBOT para el TeamOC.

 

Quedo en deuda para el próximo Overclock en Vivo tenemos placa nueva y no daré la hora, donde tratare de pasar con creces esa marca.

 

Palabras Finales.

 

Que podemos decir, NVIDIA se ha superado nuevamente a sí misma y cabe destacar, el chip utilizado es el GK104 no el GK100, por lo que esta tarjeta es el técnicamente el  reemplazo de la GTX 560Ti, AMD esta en problemas al parecer, ya que si el chip de la gama MEDIA-ALTA logra estos resultados… vaya a saber uno que tiene NVIDIA preparado para los próximos meses, en especial con el próximo lanzamiento de las soluciones DUAL-GPU de parte de AMD.

La VGA es silenciosa, sobria (al menos nuestro modelo de referencia), escala muy bien y es muy fría, como detallamos anterior mente no se utiliza una cámara de vapor para este modelo y aun así las temperaturas full carga no superan los 55°con la configuración automática para el fan.

¿El precio? Us$499. Lo que la pone en un segmento demasiado atractivo y es una clara burla de parte de NVIDIA a AMD, que pueden poner un chip de gama MEDIA-ALTA que rinde mejor que el tope de línea actual de AMD, y aun así vale menos. Yo en lo particular quiero ver con que nos sorprende NVIDIA a fin de año, cuando haga el lanzamiento de sus GPU GK100 (¿GTX 780?). AMD tendrá que ponerse las pilas, o recortar seriamente los precios, porque la guerra que estaba ya declarada tiene al ganador en  su primera batalla.

Por ser un producto excepcional, marcando un predominio en poder y consumo, le otorgamos nuestra más alta distinción a esta nueva apuesta de NVIDIA, que cumplió con lo que prometía y posee la más rápida y eficiente GPU jamás construida.

Créditos:
Reviewers: Pilot_ & Noir
Apartado técnico: Cedrik & Marioace
Equipo de MadBoxpc.com

Posts relacionados

NVIDIA lanza Jetson Orin Nano Super Developer Kit: potencia y accesibilidad para desarrolladores

Mario Rübke

El nuevo estándar HDMI 2.2 podría ser presentado durante #CES2025, con más ancho de banda y resolución

Mario Rübke

NVIDIA anuncia presencia en CES 2025, y da luces de sus nuevas gráficas GeForce RTX 50

Mario Rübke