Intel lanza Xeon 6 y Gaudi 3, sus soluciones de IA de próxima generación

A medida que la IA sigue revolucionando las industrias, las empresas necesitan cada vez más una infraestructura que sea tanto rentable como disponible para el desarrollo y la implementación rápida. Para satisfacer esta demanda de manera frontal, Intel lanzó hoy Xeon 6 con núcleos de rendimiento (P-cores) y aceleradores de IA Gaudi 3, fortaleciendo el compromiso de la compañía de ofrecer sistemas de IA potentes con un rendimiento óptimo por watt y un menor costo total de propiedad (TCO).

Los últimos avances de Intel en infraestructura de IA incluyen dos actualizaciones importantes en su cartera de centros de datos:

• Intel Xeon 6 con P-cores: Diseñado para manejar cargas de trabajo intensivas en computación con una eficiencia excepcional, Xeon 6 ofrece el doble de rendimiento que su predecesor.
Cuenta con un mayor número de núcleos, el doble de ancho de banda de memoria y capacidades de aceleración de IA integradas en cada núcleo. Este procesador está diseñado para satisfacer las exigencias de rendimiento de la IA, desde el edge hasta los centros de datos y entornos en la nube.
• Acelerador de IA Intel Gaudi 3: Específicamente optimizado para IA generativa a gran escala, Gaudi 3 cuenta con 64 núcleos de procesamiento Tensor (TPC) y ocho motores de multiplicación de matrices (MME) para acelerar los cálculos de redes neuronales profundas. Incluye 128 GB de memoria HBMe2 para entrenamiento e inferencia, y 24 puertos Ethernet de 200 Gb para redes escalables.
Gaudi 3 también ofrece una compatibilidad perfecta con el marco de PyTorch y los avanzados modelos transformers y diffusers de Hugging Face. Intel anunció recientemente una colaboración con IBM para desplegar aceleradores de IA Intel Gaudi 3 como servicio en IBM Cloud. Mediante esta colaboración, Intel e IBM pretenden reducir el coste total de propiedad para aprovechar y escalar la IA, al tiempo que mejoran el rendimiento.

Mejorando los sistemas de IA con beneficios de TCO

El despliegue de IA a gran escala implica considerar opciones de implementación flexibles, relaciones competitivas entre precio y rendimiento, y tecnologías de IA accesibles. La sólida infraestructura x86 de Intel y su extenso ecosistema abierto lo posicionan para ayudar a las empresas a construir sistemas de IA de alto valor con un costo total de propiedad (TCO) y rendimiento por vatio óptimos. Cabe destacar que el 73 % de los servidores acelerados por GPU utilizan Intel Xeon como CPU anfitrión.
Intel colabora con los principales fabricantes de equipos originales (OEM), incluidos Dell Technologies y Supermicro, para desarrollar sistemas co-diseñados que se adapten a las necesidades específicas de los clientes para implementaciones de IA efectivas. Actualmente, Dell Technologies está diseñando conjuntamente soluciones basadas en RAG que aprovechan Gaudí 3 y Xeon 6.

Cerrando la brecha entre prototipos y producción con esfuerzos de co-ingeniería

La transición de soluciones de IA generativa (Gen AI) desde prototipos a sistemas listos para producción presenta desafíos en cuanto a monitoreo en tiempo real, manejo de errores, registro, seguridad y escalabilidad. Intel aborda estos desafíos mediante esfuerzos de co-ingeniería con OEM y socios para ofrecer soluciones de generación aumentada por recuperación (RAG) listas para producción.
Estas soluciones, construidas sobre la plataforma Open Platform Enterprise AI (OPEA), integran microservicios basados en OPEA en un sistema RAG escalable, optimizado para sistemas Xeon y Gaudi AI, diseñado para permitir a los clientes integrar fácilmente aplicaciones de Kubernetes, Red Hat OpenShift AI y Red Hat Enterprise Linux AI.

Ampliando el Acceso a Aplicaciones de IA Empresarial

El portafolio Tiber de Intel ofrece soluciones empresariales para abordar desafíos como acceso, costo, complejidad, seguridad, eficiencia y escalabilidad en entornos de IA, nube y edge. La Intel® Tiber™ Developer Cloud ahora proporciona sistemas de vista previa de Intel Xeon 6 para evaluación y pruebas tecnológicas. Además, algunos clientes seleccionados tendrán acceso anticipado a Intel Gaudi 3 para validar despliegues de modelos de IA, con clústeres de Gaudi 3 que comenzarán a implementarse el próximo trimestre para despliegues de producción a gran escala.

Las nuevas ofertas de servicios incluyen SeekrFlow, una plataforma de IA integral de Seekr para desarrollar aplicaciones de IA fiables. Las últimas actualizaciones incluyen la versión más reciente del software Intel Gaudi y Jupyter notebooks cargados con PyTorch 2.4 e Intel oneAPI y herramientas de IA 2024.2, que incluyen nuevas capacidades de aceleración de IA y compatibilidad con procesadores Xeon 6.

Related posts

Alienware anuncia audífonos para profesionales de eSports en colaboración con Team Liquid

Lenovo tiene un concurso para llevarte al GP de Formula 1 en Brasil

Valparaíso es líder en el mundo en velocidad de Internet fija, según OOKLA (Speedtest)