Image default
ActualidadAIEmpresasLanzamientosNoticiasSoftwareTecnología

NVIDIA presenta Llama-3.1-Nemotron-70B-Instruct LLM de código abierto, que supera a GPT-4o de OpenAI en evaluaciones comparativas centradas en IA

NVIDIA decidió liberar uno de los LLM más importantes de la industria, «Llama-3.1-Nemotron-70B-Instruct«, superando a OpenAI GPT-4o y a Claude 3.5 Sonnet de Anthropic.

NVIDIA está acelerando el ritmo en lo que se refiere a innovar en el segmento de IA de formas que se consideran imposibles y, después de dominar aparentemente el segmento de «hardware de IA» , la empresa ahora busca mostrar su magia en modelos LLM de código abierto, en colaboración con Meta. El nuevo LLM Llama-3.1-Nemotron-70B-Instruct de NVIDIA aún no ha tenido mucha cobertura general, pero según la información inicial disponible junto con los puntos de referencia, el nuevo LLM de NVIDIA podría resultar líder en la industria.

NVIDIA afirma que el modelo Llama-3.1-Nemotron-70B-Instruct LLM está diseñado únicamente para que las respuestas de la IA sean mucho más específicas y estén alineadas con las preferencias humanas, especialmente en términos de corrección de hechos y resolución coherente de problemas. Se dice que el modelo está entrenado en base a la base Llama-3.1-70B-Instruct de Meta, que es una vez más una creación de Meta diseñada para 70 mil millones de parámetros. Con el ajuste fino de NVIDIA, Llama-3.1-Nemotron-70B-Instruct apunta específicamente al «Modelado de recompensa de regresión SteerLM«.

Model Arena Hard AlpacaEval MT-Bench Mean Response Length
Details (95% CI) 2 LC (SE) (GPT-4-Turbo) (# of Characters for MT-Bench)
Llama-3.1-Nemotron-70B-Instruct 85.0 (-1.5, 1.5) 57.6 (1.65) 8.98 2199.8
Llama-3.1-70B-Instruct 55.7 (-2.9, 2.7) 38.1 (0.90) 8.22 1728.6
Llama-3.1-405B-Instruct 69.3 (-2.4, 2.2) 39.3 (1.43) 8.49 1664.7
Claude-3-5-Sonnet-20240620 79.2 (-1.9, 1.7) 52.4 (1.47) 8.81 1619.9
GPT-4o-2024-05-13 79.3 (-2.1, 2.0) 57.5 (1.47) 8.74 1752.2

Basándose en la tabla anterior presente en Hugging Face , este modelo en particular logra resolver el problema de la «fresa«, que los modelos de IA tradicionales no podían resolver, donde implicaba contar las R en la palabra. Este no es solo el único logro, ya que los próximos detalles pueden sorprender aún más a los lectores. Este modelo Llama-3.1-Nemotron-70B-Instruct LLM de NVIDIA ha logrado una clasificación líder en numerosos puntos de referencia, en particular Arena Hard, una herramienta de evaluación automática para LLM ajustados por instrucciones, y aquí se muestra cómo se acumulan las puntuaciones generales.

No entraremos en cifras específicas por ahora, pero el elemento crítico a destacar aquí es que Llama-3.1-Nemotron-70B-Instruct ha logrado superar a los LLM más populares de la industria, como GPT-4o de OpenAI, lo que es un hito significativo, dado el gran impacto que tiene el ajuste fino de NVIDIA en Llama-3.1-70B-Instruct Base. No hemos visto cómo se desempeña el LLM en situaciones específicas, como tareas de codificación complejas o incluso problemas centrados en la inferencia, pero los puntos de referencia iniciales revelan que el LLM más nuevo de NVIDIA está bien equipado.

Pueden darle una mirada acá, o en Hugging Face.

Posts relacionados

NVIDIA lanza oficialmente, NVIDIA App 1.0, que potencia las GPU RTX con herramientas y funciones de IA

Mario Rübke

AMD mejora el rendimiento en Llama.cpp y LMStudio con sus procesadores Ryzen AI 300

Mario Rübke

Nuevos juegos se sumaron al soporte de DLSS esta semana

Mario Rübke