Ampere y Qualcomm no son los socios más obvios. Posteriormente de todo, los dos ofrecen chips basados en Arm para ejecutar servidores de centros de datos (aunque el mercado más ínclito de Qualcomm sigue siendo móvil). Pero como las dos compañías anunciaron hoy, ahora están combinando fuerzas para ofrecer un servidor centrado en IA que utiliza las CPU de Ampere y los chips de inferencia Cloud AI 100 Reaccionario AI de Qualcomm para ejecutar, no entrenar, modelos.
Como cualquier otro fabricante de chips, Ampere sondeo sacar provecho del auge de la IA. Sin confiscación, el enfoque de la compañía siempre ha estado en chips de servidor rápidos y energéticamente eficientes, por lo que si perfectamente puede usar Arm IP para añadir algunas de estas características a sus chips, no es necesariamente una competencia central. Es por eso que Ampere decidió trabajar con Qualcomm (y SuperMicro para integrar las dos soluciones), me dice el CTO de Arm, Jeff Wittich.
“La idea aquí es que, si perfectamente les mostraré un excelente rendimiento para las CPU Ampere que ejecutan inferencia de IA solo en las CPU, si desea ascender a modelos aún más grandes (modelos de múltiples 100 mil millones de parámetros, por ejemplo), como todos Para otras cargas de trabajo, la IA no es única para todos”, dijo Wittich a TechCrunch. “Hemos estado trabajando con Qualcomm en esta opción, combinando nuestras CPU Ampere súper eficientes para realizar muchas de las tareas de propósito genérico que se ejecutan yuxtapuesto con la inferencia, y luego usando sus tarjetas verdaderamente eficientes, tenemos una opción a nivel de servidor”.
En cuanto a asociarse con Qualcomm, Wittich dijo que Ampere quería crear las mejores soluciones.
“[R]»La colaboración que hemos tenido con Qualcomm aquí es verdaderamente buena», afirmó. “Esta es una de las cosas en las que hemos estado trabajando, creo que compartimos muchos intereses muy similares, por lo que creo que esto es verdaderamente convincente. Están creando soluciones verdaderamente eficientes y en muchas partes diferentes del mercado. Estamos creando soluciones verdaderamente eficientes en el costado de la CPU del servidor”.
La asociación con Qualcomm es parte de la puesta al día anual de la hoja de ruta de Ampere. Parte de esa hoja de ruta es el nuevo chip AmpereOne de 256 núcleos, construido mediante un reciente proceso de 3 nm. Esos nuevos chips aún no están disponibles en genérico, pero Wittich dice que están listos en la manufactura y deberían lanzarse a finales de este año.
Encima de los núcleos adicionales, la característica definitoria de esta nueva concepción de chips AmpereOne es la RAM DDR5 de 12 canales, que permite a los clientes del centro de datos de Ampere ajustar mejor el comunicación a la memoria de sus usuarios según sus deposición.
El argumento de traspaso aquí no es sólo el rendimiento, sino igualmente el consumo de energía y el costo de ejecutar estos chips en el centro de datos. Esto es especialmente cierto cuando se tráfico de inferencia de IA, donde a Ampere le gusta comparar su rendimiento con el de las GPU A10 de Nvidia.
Vale la pena señalar que Ampere no eliminará nadie de sus chips existentes en gracia de estos nuevos. Wittich destacó que incluso estos chips más antiguos todavía tienen muchos casos de uso.
Ampere igualmente anunció hoy otra asociación. La empresa está trabajando con NETINT para crear una opción conjunta que combine las CPU de Ampere con los chips de procesamiento de vídeo de NETINT. Este nuevo servidor podrá transcodificar 360 canales de video en vivo en paralelo, al mismo tiempo que utiliza el maniquí de voz a texto Whisper de OpenAI para subtitular 40 transmisiones.
«Comenzamos este camino hace seis abriles porque está claro que es el camino correcto», dijo la directora ejecutiva de Ampere, Renee James, en el anuncio de hoy. “Devaluación potencia solía ser semejante de bajo rendimiento. Ampere ha demostrado que eso no es cierto. Hemos sido pioneros en la frontera de la eficiencia de la informática y hemos ofrecido rendimiento más allá de las CPU heredadas en un entorno informático apto”.
————————————————– —————–
Esta página transcribe artículos de diversas fuentes de dominio sabido, las ideas expresadas son responsabilidad de sus respectivos autores por lo cual no nos hacemos responsables del uso o la interpretación que se les dé. La información publicada nunca debe sustituir información profesional, médica, procesal o psicológica.