NVIDIA presenta Llama-3.1-Nemotron-70B-Instruct LLM de código abierto, que supera a GPT-4o de OpenAI en evaluaciones comparativas centradas en IA

NVIDIA decidió liberar uno de los LLM más importantes de la industria, «Llama-3.1-Nemotron-70B-Instruct«, superando a OpenAI GPT-4o y a Claude 3.5 Sonnet de Anthropic.

NVIDIA está acelerando el ritmo en lo que se refiere a innovar en el segmento de IA de formas que se consideran imposibles y, después de dominar aparentemente el segmento de «hardware de IA» , la empresa ahora busca mostrar su magia en modelos LLM de código abierto, en colaboración con Meta. El nuevo LLM Llama-3.1-Nemotron-70B-Instruct de NVIDIA aún no ha tenido mucha cobertura general, pero según la información inicial disponible junto con los puntos de referencia, el nuevo LLM de NVIDIA podría resultar líder en la industria.

NVIDIA afirma que el modelo Llama-3.1-Nemotron-70B-Instruct LLM está diseñado únicamente para que las respuestas de la IA sean mucho más específicas y estén alineadas con las preferencias humanas, especialmente en términos de corrección de hechos y resolución coherente de problemas. Se dice que el modelo está entrenado en base a la base Llama-3.1-70B-Instruct de Meta, que es una vez más una creación de Meta diseñada para 70 mil millones de parámetros. Con el ajuste fino de NVIDIA, Llama-3.1-Nemotron-70B-Instruct apunta específicamente al «Modelado de recompensa de regresión SteerLM«.

Model	Arena Hard	AlpacaEval	MT-Bench	Mean Response Length
Details	(95% CI)	2 LC (SE)	(GPT-4-Turbo)	(# of Characters for MT-Bench)
Llama-3.1-Nemotron-70B-Instruct	85.0 (-1.5, 1.5)	57.6 (1.65)	8.98	2199.8
Llama-3.1-70B-Instruct	55.7 (-2.9, 2.7)	38.1 (0.90)	8.22	1728.6
Llama-3.1-405B-Instruct	69.3 (-2.4, 2.2)	39.3 (1.43)	8.49	1664.7
Claude-3-5-Sonnet-20240620	79.2 (-1.9, 1.7)	52.4 (1.47)	8.81	1619.9
GPT-4o-2024-05-13	79.3 (-2.1, 2.0)	57.5 (1.47)	8.74	1752.2

Basándose en la tabla anterior presente en Hugging Face , este modelo en particular logra resolver el problema de la «fresa«, que los modelos de IA tradicionales no podían resolver, donde implicaba contar las R en la palabra. Este no es solo el único logro, ya que los próximos detalles pueden sorprender aún más a los lectores. Este modelo Llama-3.1-Nemotron-70B-Instruct LLM de NVIDIA ha logrado una clasificación líder en numerosos puntos de referencia, en particular Arena Hard, una herramienta de evaluación automática para LLM ajustados por instrucciones, y aquí se muestra cómo se acumulan las puntuaciones generales.

No entraremos en cifras específicas por ahora, pero el elemento crítico a destacar aquí es que Llama-3.1-Nemotron-70B-Instruct ha logrado superar a los LLM más populares de la industria, como GPT-4o de OpenAI, lo que es un hito significativo, dado el gran impacto que tiene el ajuste fino de NVIDIA en Llama-3.1-70B-Instruct Base. No hemos visto cómo se desempeña el LLM en situaciones específicas, como tareas de codificación complejas o incluso problemas centrados en la inferencia, pero los puntos de referencia iniciales revelan que el LLM más nuevo de NVIDIA está bien equipado.

Pueden darle una mirada acá, o en Hugging Face.

Noctua NH-D15 G2 LBC [Air-Cooling]

Review placa madre GIGABYTE Z890 AORUS ELITE WIFI7…

Review AMD Ryzen 7 9800X3D [Zen5 – AM5]

Review G.Skill TridentZ5 Royal NEO 6400 2x16GB [F5-6400J3039G16GX2-TR5NS]

Review fuente de poder FSP Hydro PRO 500W…

Control parental en smartphones: ¿Cómo proteger a los…

Hisense presenta sus televisores «CanvasTV»: La nueva tendencia…

NVIDIA lanza Jetson Orin Nano Super Developer Kit:…

Google DeepMind presenta Veo 2, e Imagen 3,…

LG presentará en #CES2025 una solución de detección…

Internet Satelital en Chile cierra el año con…

COLUMNA: 4 tendencias que marcarán la transformación digital…

Distintos tipos de Internet Satelital ¿Cuál elegir?

NVIDIA RTX AI: Todo el potencial de la…

Cómo el almacenamiento digital impulsó la revolución de…

NVIDIA presenta Llama-3.1-Nemotron-70B-Instruct LLM de código abierto, que supera a GPT-4o de OpenAI en evaluaciones comparativas centradas en IA

Noctua NH-D15 G2 LBC [Air-Cooling]

Control parental en smartphones: ¿Cómo proteger a los niños en la era...

Hisense presenta sus televisores «CanvasTV»: La nueva tendencia que une alta tecnología...

NVIDIA presenta Llama-3.1-Nemotron-70B-Instruct LLM de código abierto, que supera a GPT-4o de OpenAI en evaluaciones comparativas centradas en IA

Posts relacionados