Betaworks apuesta por agentes de IA en la última cohorte de 'Camp'

Betaworks está adoptando la tendencia de la IA no con otro LLM, sino con un grupo de modelos de agentes que automatizan tareas cotidianas que sin embargo no son tan simples de definir. El último incubador de inversiones "Camp" formó y financió a nueve startups de agentes de IA que esperan que asuman las tareas más tediosas de hoy en día.

Los casos de uso para muchas de estas empresas suenan prometedores, pero la IA tiende a tener problemas para cumplir sus promesas. ¿Confías en una nueva IA brillante para ordenar tu correo electrónico? ¿Qué tal extraer y estructurar información de una página web? ¿A alguien le importará que un IA programe reuniones donde sea conveniente?

Hay un elemento de confianza que aún debe establecerse con estos servicios, algo que ocurre con la mayoría de las tecnologías que cambian cómo actuamos. Pedirle direcciones a MapQuest se sintió extraño hasta que no lo fue, y ahora la navegación GPS es una herramienta cotidiana. ¿Pero los agentes de IA están en ese nivel? El CEO y fundador de Betaworks, John Borthwick, piensa que sí. (Divulgación: el ex editor de TechCrunch y presentador de Disrupt, Jordan Crook, dejó TC para trabajar en la empresa).

“Estás adentrándote en algo en lo que hemos dedicado mucho tiempo a pensar,” le dijo a TechCrunch. “Mientras que la IA de agencia está en su nacimiento, y hay problemas en torno a las tasas de éxito de los agentes, etc., estamos viendo enormes avances incluso desde que Camp comenzó.”

Si bien la tecnología seguirá mejorando, Borthwick explicó que algunos clientes están listos para adoptarla en su estado actual.

“Históricamente, hemos visto a los clientes dar un salto de fe, incluso con tareas de alto riesgo, si un producto era ‘lo suficientemente bueno'. El Bill.com original, a pesar de hacer cosas interesantes con OCR y raspado de correos electrónicos, no siempre lo hacía bien, y los usuarios todavía confiaban en él con miles de dólares en transacciones porque hacía una tarea terrible menos terrible. Y con el tiempo, a través de un diseño de interfaz altamente comunicativo, los bucles de retroalimentación de esos clientes crearon un producto aún mejor y más confiable,” dijo.

“Por ahora, la mayoría de los usuarios iniciales de los productos en Camp son desarrolladores, fundadores y adoptadores tempranos de tecnología, y ese grupo siempre ha estado dispuesto a probar pacientemente y dar su opinión sobre estos productos, que eventualmente pasarán al público en general.”

Betaworks apuesta por la IA aumentativa en la última cohorte de campamento: ‘Estamos rabiosamente interesados’

Betaworks Camp es un acelerador de tres meses en el que las empresas seleccionadas en el tema elegido reciben ayuda práctica con su producto, estrategia y conexiones antes de recibir un cheque de $500,000 - cortesía de Betaworks, Mozilla Ventures, Differential Ventures y Stem AI. Pero no antes de que las startups muestren sus productos en el día de demostración, el 7 de mayo.

Echamos un vistazo al programa de antemano, sin embargo. Aquí están los tres que más me llamaron la atención.

Twin automatiza tareas usando un “modelo de acción” del que Rabbit ha estado hablando desde hace unos meses (pero aún no ha lanzado). Al capacitar a un modelo con una gran cantidad de datos que representan interfaces de software, puede (según estas empresas) aprender a completar tareas comunes, cosas que son más complejas de lo que un API puede manejar, pero no tanto como para no poder ser delegadas a un “interno inteligente”. De hecho, los escribimos en enero.

Entonces, en lugar de que un ingeniero de backend construya un script personalizado para hacer una cierta tarea, puedes demostrarlo o describirlo en lenguaje común. Cosas como “poner todos los currículums que recibimos hoy en una carpeta en Dropbox y renombrarlos con el nombre del solicitante, luego enviarme el enlace de compartir en Slack”. Y una vez que hayas ajustado ese flujo de trabajo (“Oops, esta vez añade la fecha de solicitud a los nombres de archivo”), puede ser la nueva forma en que funciona el proceso. El objetivo de la empresa es automatizar el 20% de las tareas que ocupan el 80% de nuestro tiempo, pero probablemente la verdadera pregunta es si puede hacerlo de manera asequible. (Twin se negó a ampliar sobre la naturaleza de su modelo y proceso de entrenamiento).

Skej tiene como objetivo mejorar el proceso ocasionalmente doloroso de encontrar un horario para una reunión que funcione para dos (o tres, o cuatro…) personas. Simplemente cc al bot en un hilo de correo electrónico o Slack y comenzará el proceso de conciliar la disponibilidad y preferencias de todos. Si tiene acceso a los horarios, los verificará; si alguien dice que prefiere la tarde si es en jueves, trabajará con eso; puedes decir que algunas personas tienen prioridad; y así sucesivamente. Cualquiera que trabaje con un asistente ejecutivo experto sabe que son insustituibles, pero es probable que cada asistente ejecutivo prefiera pasar menos tiempo en tareas que son simplemente un montón de “¿Qué tal esto? ¿No? ¿Qué tal esto?”

Como misántropo, no tengo este problema de programación, pero aprecio que otros lo tengan, y también preferirían una solución del tipo “configúralo y olvídalo” donde simplemente se conformen con los resultados. Y está dentro de las capacidades de los agentes de IA de hoy en día, que principalmente estarían encargados de comprender el lenguaje natural en lugar de formularios.

Jsonify es una evolución de los raspadores de sitios web que pueden extraer datos de contextos relativamente no estructurados. Esto se ha hecho desde hace tiempo, pero el motor que extrae la información nunca ha sido tan inteligente. Si es un documento grande y plano, funcionan bien; si está en pestañas del sitio o alguna lista visual mal codificada destinada a que los humanos hagan clic alrededor, pueden fallar. Jsonify utiliza la mejor comprensión de los modelos de IA visual actuales para analizar y ordenar mejor los datos que pueden ser inaccesibles para los rastreadores simples.

Entonces podrías buscar opciones de Airbnb en una zona determinada, luego hacer que Jsonify las coloque todas en una lista estructurada con columnas para precio, distancia desde el aeropuerto, calificación, tarifas ocultas, etc. Luego podrías hacer lo mismo en Vacasa y extraer los mismos datos - tal vez para los mismos lugares (hice esto y me ahorré como $150 el otro día, pero ojalá pudiera haber automatizado el proceso). O, ya sabes, hacer cosas profesionales.

Pero ¿la imprecisión inherente a los LLMs los convierte en una herramienta cuestionable para el trabajo? “Hemos logrado construir un sistema de protección y verificación bastante robusto,” dijo el fundador Paul Hunkin. “Utilizamos varios modelos diferentes en tiempo de ejecución para comprender la página, que proporcionan cierta validación — y los LLM que utilizamos están adaptados a nuestro caso de uso, por lo que suelen ser bastante confiables incluso sin la capa de protección. Por lo general, vemos una precisión de extracción del 95% o más, dependiendo del caso de uso.”

Podría ver que cualquiera de estos siendo útiles probablemente en cualquier empresa tecnológica avanzada. Los otros en la cohorte son un poco más técnicos o situacionales — aquí están los seis restantes:

  • Resolvd AI - automatización de agente de flujos de trabajo en la nube. Parece útil hasta que las integraciones personalizadas lo alcancen.
  • Floode - un organizador de bandeja de entrada de IA que lee tu correo electrónico y encuentra las cosas importantes mientras prepara respuestas y acciones apropiadas.
  • Extensible AI - ¿tu IA está retrocediendo? Pregúntele a su médico si Extensible es la infraestructura adecuada para las pruebas y el registro de su implementación.
  • Opponent - un personaje virtual destinado a que los niños tengan extensas interacciones y jueguen con él. Parece ser un campo minado ética y legalmente, pero alguien tiene que atravesarlo.
  • High Dimensional Research - el juego de infraestructura. Un marco para agentes de IA basados en la web con un modelo de pago por uso, por lo que si el experimento de tu empresa fracasa, solo debes unos pocos dólares.
  • Mbodi - IA generativa para robótica, un campo donde los datos de entrenamiento son comparativamente escasos. Pensé que era una palabra africana, pero es simplemente “personificar”.

No hay duda de que los agentes de IA jugarán algún papel en los flujos de trabajo de software cada vez más automatizados del futuro cercano, pero la naturaleza y el alcance de ese papel todavía no han sido escritos. Claramente, Betaworks tiene como objetivo entrar temprano en la puerta, incluso si algunos de los productos aún no están listos para su debut en el mercado masivo.

Podrás ver a las empresas mostrando sus productos de agencia el 7 de mayo.

Corrección: Esta historia fue actualizada para reflejar que el fundador de Jsonify es Paul Hunkin, no Ananth Manivannan.