Durante el evento GTC 2014, NVIDIA no sólo ha anunciado su nueva bestia GeForce GTX Titan Z, también ha dado los primeros detalles de su futura Arquitectura «Pascal» (en honor al matemático francés Blaise Pascal), la cual sucederá a la arquitectura “Maxwell” y traerá novedades como NVLink, Unified Memory y 3D Memory.
Actualizando el Roadmap: Sale Volta, entra Pascal
Aun cuando Maxwell no debuta en el segmento de alto rendimiento, NVIDIA ha actualizado sus roadmaps de GPUs para escritorio anunciado su sub-siguiente arquitectura gráfica y de cómputo “Pascal”, la cual toma el lugar de “Volta” en los mapas de ruta de NVIDIA y que será la arquitectura de sus próximas tarjetas gráficas GeForce GTX 900 series o como NVIDIA nombre a las GPU basadas en esta arquitectura que llegará eventualmente a finales del 2016.
NVLINK, hasta 5 veces el ancho de banda de PCIe 3.0
Entre las novedades que ofrecerá la arquitectura Pascal está el desarrollo de NVLINK, tecnología co-desarrollada por NVIDIA e IBM, la cual también será incorporada en los futuros procesadores Power de IBM que serán acoplados con futuras GPU NVIDIA Tesla basadas en la arquitectura Pascal.
NVIDIA pretende con NVLINK ofrecer mayores anchos de banda para la comunicación de la GPU con la CPU de los que actualmente se pueden alcanzar, permitiendo desbloquear todo el potenciar de la GPU minimizando el tiempo que ésta debe esperar para que la información sea procesada por la CPU. La idea es eliminar todo tipo de cuello de botella que limita los sistemas de cómputo heterogéneos de la actualidad, siendo una característica desarrollada en su esencia para sistema de supercomputación, aunque también podrá ser aplicada a menor escala en el mercado de consumo.
Con esta tecnología, NVIDIA podrá desarrollar eventualmente GPUs que puedan brindar todo su potencial de rendimiento a límites que actualmente son inalcanzables.
Desde el punto de vista de los desarrolladores, la tecnología también ofrece ventajas, ya que estos pueden modificar las aplicaciones de análisis de datos que demandan gran cantidad de nivel de procesamiento paralelo para beneficiarse y tomar ventaja de sistemas acelerados por CPU-GPU.
Ventajas de NVLINK sobre PCI Express 3.0
Por años PCI Express ha sido la tecnología predilecta para conectar desde grandes sistemas de cómputo, servidores, hasta GPU de escritorio, debido a su gran ancho de banda, actualmente las GPU utilizan la tercera generación de la tecnología (PCI Express 3.0) para comunicarse con la unidad central de proceso o CPU, pero esto limita la capacidad de la GPU de acceder al sistema de memoria de la CPU, el cual es de cuatro a cinco veces más lento que los sistemas de memoria utilizado en las GPUs modernas. Por este motivo la tecnología de interconexión NVLink pretende igualar los anchos o equiparar los anchos de bandas de ambos sistemas de memoria GPU <-> CPU para permitir un acceso expedito entre ambos sistemas y con un gran ancho de banda.
Sistema tradicional basados en PCI Express (single GPU y Multi-GPU)
Este alto-ancho de banda mejorará dramáticamente el rendimiento de software y aplicaciones que sean acelerados por esta combinación de GPU y CPU, mediante una interfaz que eliminará los cuellos de botella y las esperas (latencias) en el procesado de grandes volúmenes de datos. Estos son de vital importancia para por ejemplo mover información en grandes redes de datos, servidores o sistemas de almacenamiento, los cuales usualmente mueven estos datos al sistema de memoria de la CPU y luego copian los datos a la memoria de la GPU antes de ser procesados por esta última. Con NVLink la información se moverá entre el sistema de memoria de la GPU y el sistema de memoria de la CPU a una mayor velocidad, con un gran ancho de banda y con menos tiempo de acceso (latencias), haciendo de las aplicaciones aceleradas por GPU mucho más rápidas.
Sistema basados en PCI Express con NVLink (single GPU y Multi-GPU)
En la conferencia el CEO de NVIDIA Jen-Hsun Huang mostró un módulo a modo de ejemplo que incorporaba una GPU basada en Pascal (obviamente una maqueta nada funcional de momento) con tecnología NVLink. Este módulo era un tercio del tamaño de una placa PCIe estándar utilizado en los GPU actuales, este módulo posee conectores que permiten conectarlo en la placa madre, mejorando el diseño de los sistemas y la integridad de la señal.
Según NVIDIA, la tecnología NVLINK permitirá crear la próxima generación de supercomputadores “exascale”, con un alto grado de eficiencia energética, los cuales podrán superar los 1000 PetaFLOPS, lo que representa en primera instancia casi 30 veces más potencia de cómputo en operaciones de punto flotante que los actuales supercomputadores más veloces del mercado.
NVIDIA a futuro seguirá soportando la tecnología PCI Express, ya que NVLink será usada para conectar GPUs con CPUs compatibles con NVLink como así también proveer altos anchos de banda para conexiones directas entre múltiples GPUs, también a pesar de los altos anchos de banda, NVLink será también más eficiente energéticamente por bit transferido que PCIe, aunque como ya mencionamos es una tecnologia dirigida principalmente al mercado de supercomptuación, servidores, redes etc.
Unified Memory o Memoria Unificada.
Otra de las novedades que NVIDIA pretende implementar con su arquitectura Pascal, es la arquitectura de Memoria Unificada o Unified Memory, esta implementación no es algo nuevo debemos decir, ya que AMD ya anuncio una implementación similar con Heterogeneous Uniform Memory Access (hUMA).
Lo que propone NVIDIA con Unified Memory es permitir a los desarrolladores poder optimizar sus aplicaciones para que utilicen tanto el sistema de memoria de la CPU como el sistema de memoria de la GPU como un solo bloque de memoria. El programador puede operar con los datos sin preocuparse respecto a que estos residan en el sistema de memoria de la GPU o GPU, simplificando su labor de poder optimizar y desarrollar aplicaciones aceleradas por GPU y/o GPU.
Unified Memory permite también crear aplicaciones que tomen ventaja de lo que tanto la CPU o CPU puedan hacer más rápido y fácil, permitiendo a la CPU acceder al sistema de memoria de la CPU y la GPU acceder al sistema de memoria de la CPU, por lo tanto, los desarrolladores no tienen la obligación de asignar los recursos entre ambos componentes.
Memoria 3D o 3D Memory
Otras de las novedades que anuncio NVIDIA para su arquitectura Pascal, es la memoria 3D o 3D memory, no es una implementación nueva debemos decirlo, ya que en las memorias Flash se utiliza desde hace años la técnica de apilar chips uno arriba del otro para mejorar la densidad de los chips de memoria, reducir el consumo y el espacio que ocuparían varios chips de memoria dispersos en un PCB.
NVIDIA con 3D Memory pretende crear memorias de mayor densidad y reducido tamaño para incorporar estos chips dentro del mismo empaque de la GPU, esto permitirá a la GPU obtener datos de la memoria de manera mucho más rápida de lo que se hace actualmente con chips que están en la periferia de la GPU mediante enrutamiento externo.
Esto le permitirá a las futuras GPU con memoria 3D impulsar el rendimiento y la eficiencia, permitiendo incluso crear GPU más compactas y de mayor rendimiento en dispositivos más pequeños, apuntando con esto también a los dispositivos móviles.
La arquitectura Pascal soportará el sistema de memorias apiladas (stacked memory) con múltiples capas de memorias DRAM integradas verticalmente en un solo empaque con la GPU, esto resultará también en mejores anchos de banda para el sistema de memoria de la GPU, doblar la cantidad de memoria que acompañe a la GPU y cuadruplicar su eficiencia energética comparado con los chips de memoria GDDR5 que son ubicados fuera de la GPU.
NVIDA apunta con la arquitectura Pascal alcanzar anchos de banda de memoria que lleguen hasta los 1000 GB/s o 1 TB/s, comparado con los 300+ GB/s que alcanzan las GPUs más potentes de la actualidad.
[Guru3D #1] – [Guru 3D #2]