Image default
NoticiasTarjetas de VideoTecnología

NVIDIA revela las especificaciones del GPU GK110 (Big Kepler)

En esta nota ya les comentamos de Tesla K10 y Tesla K20, los 2 nuevos aceleradoras de computo para computación de alto rendimiento que NVIDIA presentó en la GPU Technology Conference (GTC), en dicha nota les comentamos de las especificaciones de Tesla K10 que incorporaba dos GPUs GK104, pero quedaron pendientes las especificaciones de Tesla K10 el primer acelerador de cómputo basado en el núcleo GK110 aka “Big Kepler”.

El núcleo GK110 es simplemente un GPU monstruoso, ya que a rasgos generales se compone de 7100 millones de transistores, más que cualquier otro procesador y GPU creada a la fecha, hasta ahora el procesador Xillinix (FPGA) poseía el record con 6000 millones de transistores y la GPU “Tahiti” que se compone de 4310 millones de transistores, lo que denota la alta complejidad del GPU de cómputo GK110.

Según las especificaciones reveladas por NVIDIA, el GK110 incorpora un total de 2880 CUDA Cores, organizados en 15 Cluster SMX que contienen cada uno 192 CUDA Cores, con una interfaz de memoria de 384-bit, soporte para hasta 24GB de memoria GDDR5 con soporte ECC.

Lo anterior comparado con el núcleo GK104 que potencia la GeForce GTX 680 y Tesla K10 que posee 3500 millones de transistores, 1536 CUDA Cores organizados en 8 Clusters SMX que contienen también 192 CUDA Cores, pero con una pequeña pero decidora diferencia, las unidades FP64 con 64 para el GK110 y sólo 8 unidades para el GF110, lo que convierte al GK110 en una GPU mucho más potente en operaciones de punto flotante de doble precisión que el GK104.

El cache L2 que se utiliza para compartir información entre las unidades SMX también se ha incrementado desde los 768KB en Fermi a 1.5MB en Kepler. Los ROPs se mantienen en 48 unidades, pero las unidades de textura se incrementan de 64 unidades en Fermi a 240 en el GK110.

El GK110 además posee un controlador de memoria de 384-bit que en realidad son 6 controladores de 64-bit, comparado con el controlador de 256-bit del GK110 o 4 controladores de 64-bits. Este controlador puede soportar configuraciones de memorias de 6GB, 12GB y hasta 24GB, además incorpora soporte para memorias con registros ECC (Error Correction Code) que como ya mencionamos en el artículo anterior reserva el 12.5% del total de memoria para sus operaciones de corrección/recuperación. El GK110 puede entregar un ancho de banda para las memorias de 250 GB/s.

  • 2880 CUDA Cores
  • 15 SMX Clusters
  • 384-bit Memory Controller
  • Up to 24GB of GDDR5 memory
  • 2nd Gen ECC
  • Hardware GPU Silicon Virtualization
  • Hyper-Q (Slashes CPU idle time by allowing multiple CPU cores to simultaneously utilize a single Kepler GPU, dramatically advancing programmability and efficiency)
  • Dynamic Parallelism (Simplifies GPU programming by allowing programmers to easily accelerate all parallel nested loops – resulting in a GPU dynamically spawning new threads on its own without going back to the CPU)
  • 50-85% Double Precision Rate to Single Precision
  • At least 1.5 TFLOPS DP FP64
  • Target: 250 GB/s bandwidth
  • TDP: 300 Aprox.

Otra de las características especiales del GPU de cómputo GK110 es que soporta tecnologías como:

Dynamic Parallelims o Paralelismo Dinámico: Esta tecnología permite a los hilos de ejecución de la GPU poder dinámicamente generar nuevos hilos de ejecución, permitiendo a la GPU adaptarse dinámicamente a la información. Esta característica toma especial relevancia para los aspectos de aplicaciones altamente intensivas en cómputo paralelo  ya que la GPU por su solo pude auto-programar y auto-generar nuevas cargas de trabajo basadas en los parámetros de programación sin la necesidad de la intervención de la GPU. Así mientras Fermi y toda la generación previa de GPU para HPC fueron buenos para escalar con grandes cargas de trabajo, Kepler es aun mucho mejor en este sentido, prescindiendo como ya mencionamos de la intervención de la CPU.

Hyper-Q: Esta tecnología permite a múltiples núcleos de la CPU, utilizar simultáneamente los núcleos de la arquitectura CUDA en una sola GPU Kepler, esto incrementa dramáticamente la utilización de la GPU y reduciendo notablemente el desperdicio de recursos de GPU. Fermi por ejemplo permitiría solo 1 cola de trabajo desde el CPU, mientras que el GK110 soporta hasta 32 colas de trabajo, esto como ya mencionamos permite una mayor utilización de los recursos de la GPU por parte de la CPU.

NVIDIA GPUDirect: Presentado por primera vez el año pasado, NVIDIA GPUDirect da acceso a la memoria de la GPU para dispositivos de terceros, incluyendo tarjetas de red y SSD, sin búfer de datos del lado de la CPU. El objetivo es reducir la latencia para la comunicación entre distintos sistemas o servidores.

En términos eléctricos el GK110 puede ser alimentado por un 1 conetor PCI Express de 8-pines y otro de 6-pines, con un TDP aproximado de 300W,

Como ya mencionamos en el artículo anterior, el primer producto basado en el núcleo GK110  es el acelerador de computo NVIDIA Tesla K20 que NVIDIA lanzará en el cuarto trimestre de este año, aunque muchos ya especulan de alguna tarjeta grafica de la línea GeForce basada en este núcleo, pero por ahora NVIDIA no ha mencionado nada al respecto.

 

UPDATE: Desde Guru3D informan que el nucleo GK110 podría incluso tener no 15, sino 16 SMX, lo que totalizaría 3072 CUDA Cores.

Update: new information shows that there actually might be 16 SMX cores and thus 3072 Shader processors on GK110.

[Anandtech] [Softpedia] [Legitreviews]

Posts relacionados

Nuevos juegos se sumaron al soporte de DLSS esta semana

Mario Rübke

NVIDIA RTX AI: Todo el potencial de la IA en tu PC

Mario Rübke

NVIDIA presenta Llama-3.1-Nemotron-70B-Instruct LLM de código abierto, que supera a GPT-4o de OpenAI en evaluaciones comparativas centradas en IA

Mario Rübke