Qualcomm lanza en CES 2025 una solución de dispositivo de IA on-premise y una suite de inferencia
Qualcomm Technologies, Inc. ha anunciado hoy en CES 2025 Qualcomm AI On-Prem Appliance Solution, una solución de hardware de sobremesa o de montaje en pared, y Qualcomm AI Inference Suite, un conjunto de software y servicios para la inferencia de IA que abarca desde el near-edge hasta la nube. La combinación de estas nuevas ofertas permite a las pymes, empresas y organizaciones industriales ejecutar aplicaciones de IA personalizadas y estándar en sus instalaciones, incluidas las cargas de trabajo generativas. Ejecutar la inferencia de IA en las propias instalaciones puede suponer un ahorro significativo en costes operativos y en el coste total de propiedad (TCO), en comparación con el coste de alquilar una infraestructura de IA de terceros.
Utilizando la solución AI On-Prem Appliance en combinación con la AI Inference Suite, los clientes pueden ahora utilizar la IA generativa aprovechando sus datos propios, modelos afinados e infraestructura tecnológica para automatizar procesos y aplicaciones humanos y mecánicos en prácticamente cualquier entorno final, como tiendas minoristas, restaurantes de servicio rápido, centros comerciales, concesionarios, hospitales, fábricas y talleres, donde el flujo de trabajo está bien establecido, es repetible y está listo para la automatización.
«Nuestra nueva AI On-Prem Appliance Solution y AI Inference Suite cambian la economía del coste total de propiedad de la implantación de la IA al permitir el procesamiento de cargas de trabajo de IA generativa desde una implantación exclusiva en la nube a una implantación local en las instalaciones. Para una amplia variedad de casos de uso de automatización de IA, como asistentes en tiendas, entrenamiento de trabajadores, información específica del sitio, cumplimiento de seguridad y habilitación de ventas y servicios en tiendas, concesionarios o fábricas, nuestra solución AI On-Prem Appliance reduce significativamente los costos operativos de IA para las necesidades empresariales e industriales», dijo Nakul Duggal, director general del grupo de automoción, IoT industrial y computación en la nube de Qualcomm Technologies, Inc. «Ahora, las empresas pueden acelerar el despliegue de aplicaciones de IA generativa aprovechando sus propios modelos, con privacidad, personalización y adaptación, al tiempo que mantienen el control total, con la confianza de que sus datos no saldrán de sus instalaciones.»
La solución Qualcomm AI On-Prem Appliance está impulsada por la hoja de ruta de aceleradores Qualcomm Cloud AI. Combina la accesibilidad y el rendimiento de un servidor de inferencia de centro de datos con la eficiencia energética, el peso y el factor de forma, la privacidad de los datos, la personalización y el control de una solución de IA local. La solución AI On-Prem Appliance admite capacidades de amplio alcance:
Escalabilidad desde un producto de sobremesa autónomo hasta un clúster de dispositivos montados en la pared que proporciona una serie de servicios locales de IA como agentes de voz in-a-box, descarga de modelos lingüísticos pequeños (SLM), modelos lingüísticos grandes (LLM) y modelos multimodales grandes (LMM), y funciones de generación aumentada de recuperación (RAG) para búsqueda indexada inteligente y resumen, IA agéntica, automatización del flujo de trabajo de IA, generación de imágenes, generación de código, visión por ordenador y procesamiento de cámaras.
Compatibilidad con una amplia gama de modelos de IA generativa, procesamiento del lenguaje natural y visión por ordenador, tanto de código abierto como patentados, para permitir la automatización del flujo de trabajo de muchas aplicaciones empresariales, como la búsqueda multilingüe inteligente, los asistentes y agentes de IA personalizados, la generación de código, la redacción y la toma de notas automatizadas, etc.
IA de cámara con procesamiento de imágenes, vídeo y streaming para aplicaciones de visión por ordenador centradas en la seguridad, la protección y la supervisión de sitios.
Qualcomm AI Inference Suite for On-Prem ofrece a los clientes empresariales y desarrolladores externos un completo conjunto de herramientas y bibliotecas para desarrollar o portar aplicaciones de IA generativa a la solución AI On-Prem Appliance. Cuenta con un amplio conjunto de interfaces de programación de aplicaciones (API) que incluyen gestión y administración de usuarios, chat, generación de imágenes, capacidades de IA generativa de audio y vídeo, compatibilidad con la API OpenAI y RAG. El paquete admite la integración con modelos de IA generativa populares, marcos y despliegue mediante Kubernetes o contenedores bare.
Los líderes del sector adoptan la solución Qualcomm AI On-Prem y AI Inference Suite
Honeywell está colaborando con Qualcomm Technologies en el diseño, evaluación y/o despliegue de casos de uso de automatización de flujos de trabajo de IA utilizando AI On-Prem Solution y AI Inference Suite.
Aetina es uno de los primeros fabricantes de equipos originales en proporcionar equipos locales para implantaciones empresariales basados en la solución AI On-Prem Appliance. Estos dispositivos de IA locales, compactos y alimentados desde la pared, utilizan una combinación de SLM para el procesamiento del lenguaje natural, junto con LLM y LMM ajustados (hasta 70B parámetros) para ejecutar agentes de IA empresariales que admiten respuestas en tiempo real y funciones de automatización de flujos de trabajo de IA, como la búsqueda indexada inteligente y la creación de contenidos, todo ello con el mejor consumo de energía de su clase y una arquitectura de coste de propiedad superior.
IBM está colaborando para llevar su plataforma de datos e IA watsonx y la familia Granite de modelos de IA para su despliegue a través de dispositivos de IA On-Prem, además de la nube, para dar soporte a una serie de casos de uso empresarial e industrial en automoción, fabricación, comercio minorista y telecomunicaciones.
Comments