En la conferencia de desarrolladores Google I/O 2024 del martes, Google anunció que está construyendo Gemini Nano, el más pequeño de sus modelos de IA, directamente en el cliente de escritorio Chrome, comenzando con Chrome 126.
Esto, según la compañía, permitirá a los desarrolladores utilizar el maniquí en el dispositivo para potenciar sus propias funciones de IA. El propio Google planea utilizar esta nueva capacidad para potenciar funciones como la aparejo existente «ayúdame a escribir» de Workspace Lab en Gmail, por ejemplo.
La compañía dice que es el trabajo flamante sobre la compatibilidad con WebGPU y WASM en Chrome lo que permite que estos modelos se ejecuten a una velocidad regular en un amplio conjunto de hardware.
En una sesión informativa previa al anuncio del martes, Jon Dahlke, director de trámite de productos de Google para Chrome, señaló que Google estaba en conversaciones con otros proveedores de navegadores para habilitar esta (o una característica similar) todavía en sus navegadores.
«Hemos comenzado a interactuar con otros navegadores y abriremos un software de pinta previa para los desarrolladores», escribió Dahlke en el anuncio del martes. “Con webGPU, WASM y Gemini integrados en Chrome, creemos que la web ESTÁ preparada para la IA. “
Sin incautación, dudo que la mayoría de los competidores de Chrome quieran suponer exclusivamente por los modelos de inteligencia sintético de Google. Lo que tiene más sentido es permitir que los navegadores (y los desarrolladores) ejecuten el maniquí de su dilema. Google claramente optaría por ejecutar Gemini para sus aplicaciones, pero estos modelos son lo suficientemente pequeños como para permitir a los desarrolladores nominar el que quieran para sus aplicaciones.
La puesta de Google, sin incautación, es habilitar una serie de API de stop nivel en Chrome para traducir, subtitular y transcribir texto en el navegador utilizando sus modelos Gemini.
«Para ofrecer esta característica, ajustamos nuestra lectura más eficaz de Gemini y optimizamos Chrome», dijo Dahlke durante la conferencia perfecto para desarrolladores de hoy en I/O. “Ahora queremos darte golpe a los modelos Gemini en Chrome. Nuestra visión es brindarle los modelos de IA más potentes en Chrome para venir a miles de millones de usuarios sin tener que preocuparse por la ingeniería, el ajuste, la capacidad y el costo rápidos. Todo lo que tienes que hacer es designar a algunas API de stop nivel: traducir, subtitular, transcribir. Este es un gran cambio para la web y queremos hacerlo proporcionadamente”.
Para los desarrolladores, Google ahora todavía está utilizando el maniquí Gemini Nano integrado para impulsar algunas funciones nuevas en Chrome DevTools Console. Gracias a esto, las herramientas de ampliación de Chrome ahora pueden explicar errores y proporcionar soluciones de depuración directamente en la consola.
¡Estamos lanzando un boletín informativo sobre IA! Regístrese aquí para comenzar a recibirlo en sus bandejas de entrada el 5 de junio.
————————————————– —————–
Esta página transcribe artículos de diversas fuentes de dominio divulgado, las ideas expresadas son responsabilidad de sus respectivos autores por lo cual no nos hacemos responsables del uso o la interpretación que se les dé. La información publicada nunca debe sustituir consultorio profesional, médica, reglamentario o psicológica.