Intel lanza el acelerador de IA Gaudi 3 y la CPU P-Core Xeon 6
A medida que la IA continúa revolucionando las industrias, las empresas necesitan cada vez más una infraestructura que sea rentable y que esté disponible para un rápido desarrollo y despliegue. Para satisfacer esta demanda de forma directa, Intel ha lanzado hoy Xeon 6 con Performance-cores (P-cores) y aceleradores de IA Gaudi 3, reforzando el compromiso de la compañía de ofrecer potentes sistemas de IA con un rendimiento óptimo por vatio y un menor coste total de propiedad (TCO).
«La demanda de IA está conduciendo a una transformación masiva en el centro de datos, y la industria está pidiendo opciones en hardware, software y herramientas para desarrolladores», dijo Justin Hotard, vicepresidente ejecutivo de Intel y director general del Grupo de Centro de Datos e Inteligencia Artificial. «Con nuestro lanzamiento de Xeon 6 con núcleos P y aceleradores de IA Gaudí 3, Intel está habilitando un ecosistema abierto que permite a nuestros clientes implementar todas sus cargas de trabajo con mayor rendimiento, eficiencia y seguridad.»
Presentación de Intel Xeon 6 con núcleos P y aceleradores de IA Gaudi 3
Los últimos avances de Intel en infraestructura de IA incluyen dos importantes actualizaciones en su cartera de productos para centros de datos:
Intel Xeon 6 con núcleos P: Diseñado para manejar cargas de trabajo de cómputo intensivo con una eficiencia excepcional, Xeon 6 ofrece el doble de desempeño que su predecesor. Cuenta con un mayor número de núcleos, el doble de ancho de banda de memoria y funciones de aceleración de IA integradas en cada núcleo. Este procesador se ha diseñado para satisfacer las demandas de rendimiento de la IA desde el perímetro hasta el centro de datos y los entornos de nube.
Acelerador Intel Gaudi 3 AI: Optimizado específicamente para la IA generativa a gran escala, Gaudi 3 cuenta con 64 núcleos de procesador tensorial (TPC) y ocho motores de multiplicación de matrices (MME) para acelerar los cálculos de redes neuronales profundas. Incluye 128 gigabytes (GB) de memoria HBM2e para entrenamiento e inferencia, y 24 puertos Ethernet de 200 Gigabit (Gb) para redes escalables. Gaudi 3 también ofrece compatibilidad sin fisuras con el marco PyTorch y modelos avanzados de transformadores y difusores Hugging Face. Intel ha anunciado recientemente una colaboración con IBM para desplegar los aceleradores de IA Intel Gaudi 3 como servicio en IBM Cloud. A través de esta colaboración, Intel e IBM pretenden reducir el coste total de propiedad para aprovechar y escalar la IA, al tiempo que mejoran el rendimiento.
Mejora de los sistemas de IA con ventajas de coste total de propiedad
La implementación de IA a escala implica consideraciones tales como opciones de implementación flexibles, relaciones precio-desempeño competitivas y tecnologías de IA accesibles. La sólida infraestructura x86 de Intel y su amplio ecosistema abierto la posicionan para apoyar a las empresas en la creación de sistemas de IA de alto valor con un TCO y un rendimiento por vatio óptimos. En concreto, el 73% de los servidores acelerados por GPU utilizan Intel Xeon como CPU host3.
Intel colabora con los principales fabricantes de equipos originales, entre ellos Dell Technologies y Supermicro, para desarrollar sistemas de ingeniería conjunta adaptados a las necesidades específicas de los clientes para implantaciones eficaces de IA. Actualmente, Dell Technologies está co-diseñando soluciones basadas en RAG que aprovechan Gaudi 3 y Xeon 6.
Colmar la brecha entre prototipos y producción con esfuerzos de coingeniería
La transición de las soluciones de IA generativa (Gen AI) de prototipos a sistemas listos para la producción presenta desafíos en la supervisión en tiempo real, el manejo de errores, el registro, la seguridad y la escalabilidad. Intel aborda estos desafíos mediante esfuerzos de ingeniería conjunta con fabricantes de equipos originales y socios para ofrecer soluciones de generación aumentada por recuperación (RAG) listas para la producción.
Estas soluciones, construidas sobre la plataforma Open Platform Enterprise AI (OPEA), integran microservicios basados en OPEA en un sistema RAG escalable, optimizado para sistemas Xeon y Gaudi AI, diseñado para permitir a los clientes integrar fácilmente aplicaciones de Kubernetes, Red Hat OpenShift AI y Red Hat Enterprise Linux AI.
Ampliación del acceso a las aplicaciones empresariales de IA
La cartera Tiber de Intel ofrece soluciones empresariales para abordar retos como el acceso, el coste, la complejidad, la seguridad, la eficiencia y la escalabilidad en entornos de IA, nube y periferia. Intel Tiber Developer Cloud ofrece ahora sistemas de vista previa de Intel Xeon 6 para evaluación y pruebas tecnológicas. Además, algunos clientes obtendrán acceso anticipado a Intel Gaudi 3 para validar despliegues de modelos de IA, y los clústeres Gaudi 3 comenzarán a desplegarse el próximo trimestre para despliegues de producción a gran escala.
Las nuevas ofertas de servicios incluyen SeekrFlow, una plataforma de IA integral de Seekr para desarrollar aplicaciones de IA fiables. Las últimas actualizaciones incluyen la última versión del software Intel Gaudi y cuadernos Jupyter cargados con PyTorch 2.4 e Intel oneAPI y herramientas de IA 2024.2, que incluyen nuevas capacidades de aceleración de IA y compatibilidad con procesadores Xeon 6.
Comments