Betaworks está adoptando la tendencia de la IA no con otro LLM más, sino con un conjunto de modelos de tipo agente que automatizan tareas cotidianas que, sin retención, no son tan simples de delimitar. La última incubadora “Camp” del inversor capacitó y financió nueve nuevas empresas de agentes de IA que esperan que asuman las tareas más tediosas de hoy.
Los casos de uso de muchas de estas empresas parecen prometedores, pero la IA tiende a tener problemas para cumplir sus promesas. ¿Confiarías en una nueva y brillante IA para ordenar tu correo electrónico por ti? ¿Qué pasa con la procedencia y organización de información de una página web? ¿A cierto le importaría que una IA programe reuniones en cualquier oportunidad donde funcione?
Hay un pájaro de confianza que aún no se ha establecido con estos servicios, poco que ocurre con la mayoría de las tecnologías que cambian la forma en que actuamos. Pedir direcciones a MapQuest parecía extraño hasta que dejó de ser así, y ahora la navegación GPS es una aparejo cotidiana. ¿Pero se encuentran los agentes de IA en esa etapa? John Borthwick, director ejecutante y fundador de Betaworks, así lo cree. (Divulgación: el ex editor de TechCrunch y presentador de Disrupt, Jordan Crook, dejó TC para trabajar en la empresa).
«Estás entrando en poco en lo que hemos pasado mucho tiempo pensando», dijo a TechCrunch. «Aunque la IA agente está en sus inicios (y hay problemas en torno a las tasas de éxito de los agentes, etc.), estamos viendo avances tremendos incluso desde que comenzó Camp».
Si acertadamente la tecnología seguirá mejorando, Borthwick explicó que algunos clientes están dispuestos a adoptarla en su estado flagrante.
“Históricamente, hemos trillado a los clientes dar un acto de fe, incluso en tareas de longevo peligro, si un producto era ‘suficientemente bueno’. El Bill.com diferente, a pesar de hacer cosas interesantes con OCR y scraping de correo electrónico, no siempre lo hacía acertadamente, y los usuarios aún confiaban en él transacciones por valencia de miles de dólares porque hacía que una tarea terrible fuera menos terrible. Y con el tiempo, a través de un diseño de interfaz enormemente comunicativo, los circuitos de feedback de esos clientes crearon un producto aún mejor y más confiable”, afirmó.
«Por ahora, la mayoría de los primeros usuarios de los productos en Camp son desarrolladores, fundadores y primeros usuarios de tecnología, y ese género siempre ha estado dispuesto a probar pacientemente y ofrecer comentarios sobre estos productos, que eventualmente saltan a la corriente principal».
Betaworks Camp es un acelerador de tres meses en el que empresas seleccionadas en el tema estimado reciben ayuda experiencia con su producto, organización y conexiones antiguamente de ser expulsadas con un cheque de $500,000, cortesía de Betaworks, Mozilla Ventures, Differential Ventures y IA matriz. Pero no antiguamente de que las nuevas empresas se pavoneen el día de la demostración, el 7 de mayo.
Aunque ya hemos acostado un vistazo a la columna de antemano. Aquí están los tres que más me llamaron la atención.
Twin automatiza tareas utilizando un «maniquí de influencia» del que hemos pabellón balbucir a Rabbit durante algunos meses (pero que aún no se ha enviado). Al entrenar un maniquí con una gran cantidad de datos que representan interfaces de software, puede (afirman estas empresas) ilustrarse cómo completar tareas comunes, cosas que son más complejas de lo que una API puede manejar, pero no tanto como para no poder delegarlas a un “pasante inteligente”. De hecho, los escribimos en enero.
Entonces, en oportunidad de pedirle a un ingeniero de back-end que cree un script personalizado para realizar una determinada tarea, puede demostrarlo o describirlo en un idioma global. Cosas como «poner todos los currículums que recibimos hoy en una carpeta en Dropbox y cambiarles el nombre del solicitante, luego enviarme un mensaje privado con el enlace para compartir en Slack». Y una vez que haya modificado ese flujo de trabajo (“Ups, esta vez agregue la época de la solicitud a los nombres de los archivos”), puede ser simplemente la nueva forma en que funciona el proceso. Automatizar el 20% de las tareas que ocupan el 80% de nuestro tiempo es el objetivo de la empresa; si podrá hacerlo de modo asequible es probablemente la verdadera pregunta. (Twin se negó a dar más detalles sobre la naturaleza de su maniquí y proceso de capacitación).
Skej tiene como objetivo mejorar el proceso, en ocasiones doloroso, de encontrar un horario de reunión que funcione para dos (o tres, o cuatro…) personas. Simplemente envíe una copia al bot en un correo electrónico o en un hilo de Slack y comenzará el proceso de conciliar la disponibilidad y las preferencias de todos. Si tiene acercamiento a horarios, los verificará; si cierto dice que preferiría la tarde si es jueves, funciona con eso; se puede opinar que algunas personas tienen prioridad; etcétera. Cualquiera que trabaje con un asistente ejecutante capacitado sabe que es insustituible, pero es probable que todos los EA prefieran aplicar menos tiempo a tareas que son solo un montón de “¿Qué tal esto? ¿No? ¿Qué tal esto?»
Como introvertido, no tengo este problema de programación, pero aprecio que otros sí lo tengan, y asimismo preferiría una opción del tipo “configúrelo y olvídese” en la que simplemente acepten los resultados. Y está interiormente de las capacidades de los agentes de IA actuales, cuya tarea principal sería comprender el idioma natural en oportunidad de las formas.
Jsonify es una crecimiento de los raspadores de sitios web que pueden extraer datos de contextos relativamente no estructurados. Esto se ha hecho durante abriles, pero el motor que extrae la información nunca ha sido tan inteligente. Si se prostitución de un documento ínclito y plano, funcionan acertadamente; si está en pestañas del sitio o en una repertorio visual mal codificada destinada a que los humanos hagan clic, pueden decidir. Jsonify utiliza la comprensión mejorada de los modelos visuales de IA actuales para analizar y ordenar mejor los datos que pueden ser inaccesibles para rastreadores simples.
Entonces, podrías hacer una búsqueda de opciones de Airbnb en un campo de acción determinada y luego hacer que Jsonify las coloque todas en una repertorio estructurada con columnas de precio, distancia desde el aeropuerto, calificación, tarifas ocultas, etc. Luego, podrías hacer lo mismo en Vacasa y extrae los mismos datos, tal vez para los mismos lugares (hice esto y ahorré como $150 el otro día, pero desearía activo automatizado el proceso). O, ya sabes, hacer cosas profesionales.
¿Pero la imprecisión inherente a los LLM no los convierte en una aparejo cuestionable para el trabajo? «Hemos acabado construir una antepecho suficiente sólida y un sistema de demostración cruzada», dijo el fundador Paul Hunkin. “Utilizamos algunos modelos diferentes en tiempo de ejecución para comprender la página, lo que proporciona cierta garra, y los LLM que utilizamos están ajustados a nuestro caso de uso, por lo que generalmente son suficiente confiables incluso sin la capa de barrera. Normalmente vemos una precisión de procedencia superior al 95%, según el caso de uso”.
Podría ver que cualquiera de estos sería útil probablemente en cualquier negocio tecnológico. Los demás miembros de la cohorte son un poco más técnicos o situacionales; aquí están los seis restantes:
- Resolvd AI: automatización agente de flujos de trabajo en la nubarrón. Se siente útil hasta que las integraciones personalizadas lo alcanzan.
- Floode: un compensador de bandeja de entrada de IA que lee su correo electrónico y encuentra lo importante mientras prepara las respuestas y acciones adecuadas.
- IA desplegable: ¿está retrocediendo su IA? Pregúntele a su médico si Desplegable es la infraestructura de prueba y registro adecuada para su implementación.
- Oponente: un personaje potencial diseñado para que los niños tengan amplias interacciones y jueguen con él. Se siente como un campo minado desde el punto de olfato ético y procesal, pero cierto tiene que atravesarlo.
- Investigación de inscripción dimensión: el esparcimiento de infraestructura. Un situación para agentes de IA basados en la web con un maniquí de suscripción por uso, de modo que si el tentativa de su empresa fracasa, solo deberá unos pocos dólares.
- Mbodi: IA generativa para robótica, un campo donde los datos de entrenamiento son comparativamente escasos. Pensé que era una palabra africana pero es simplemente «representar».
No hay duda de que los agentes de IA desempeñarán algún papel en los flujos de trabajo de software cada vez más automatizados del futuro cercano, pero la naturaleza y el talento de ese papel aún no están escritos. Claramente, Betaworks pretende poner un pie en la puerta temprano, incluso si algunos de los productos aún no están listos para su apertura en el mercado masivo.
Podrás ver a las empresas mostrar sus productos agentes el 7 de mayo.
Corrección: esta historia se actualizó para reverberar que el fundador de Jsonify es Paul Hunkin, no Ananth Manivannan.
————————————————– —————–
Esta página transcribe artículos de diversas fuentes de dominio sabido, las ideas expresadas son responsabilidad de sus respectivos autores por lo cual no nos hacemos responsables del uso o la interpretación que se les dé. La información publicada nunca debe sustituir consultorio profesional, médica, procesal o psicológica.