Apenas puedes pasar una hora estos días sin leer sobre la inteligencia artificial generativa. Aunque todavía estamos en la fase embrionaria de lo que algunos han llamado la 'máquina de vapor' de la cuarta revolución industrial, no hay duda de que 'GenAI' se está perfilando para transformar prácticamente todas las industrias, desde finanzas y cuidados de la salud hasta el derecho y más allá.
\n\nLas aplicaciones frescas orientadas al usuario pueden atraer la mayor parte de los elogios, pero las empresas que impulsan esta revolución son las que más se están beneficiando actualmente. Justo este mes, el fabricante de chips Nvidia brevemente se convirtió en la empresa más valiosa del mundo, un gigante de $3.3 billones impulsado sustancialmente por la demanda de potencia informática de IA.
\n\n\n\tPero además de las GPU (unidades de procesamiento gráfico), las empresas también necesitan infraestructura para gestionar el flujo de datos, para almacenar, procesar, entrenar, analizar y, en última instancia, desbloquear todo el potencial de la IA.
\n\nUna empresa que busca capitalizar esto es Onehouse, una startup californiana de tres años fundada por Vinoth Chandar, quien creó el proyecto de código abierto Apache Hudi mientras se desempeñaba como arquitecto de datos en Uber. Hudi aporta los beneficios de los almacenes de datos a los lagos de datos, creando lo que se ha conocido como un 'data lakehouse', permitiendo el soporte para acciones como la indexación y la realización de consultas en tiempo real sobre conjuntos de datos grandes, ya sean datos estructurados, no estructurados o semi-estructurados.
\n\n\n\tPor ejemplo, una empresa de comercio electrónico que recopila continuamente datos de clientes que abarcan pedidos, comentarios e interacciones digitales relacionadas necesitará un sistema para ingerir todos esos datos y asegurarse de que estén actualizados, lo que podría ayudarle a recomendar productos en función de la actividad de un usuario. Hudi permite que los datos se consuman desde diversas fuentes con una latencia mínima, con soporte para eliminar, actualizar e insertar ('upsert'), lo cual es vital para tales casos de uso de datos en tiempo real.
\n\nOnehouse se basa en esto con un data lakehouse completamente gestionado que ayuda a las empresas a implementar Hudi. O, como lo describe Chandar, "inicia la ingestión y estandarización de datos en formatos de datos abiertos" que se pueden utilizar con casi todas las principales herramientas en los ecosistemas de ciencia de datos, IA y aprendizaje automático.
\n\n'Onehouse abstrae la creación de infraestructura de datos de bajo nivel, ayudando a las empresas de IA a centrarse en sus modelos', dijo Chandar a TechCrunch.
\nHoy, Onehouse anunció que ha recaudado $35 millones en una ronda de financiación de la Serie B mientras lanza al mercado dos nuevos productos para mejorar el rendimiento de Hudi y reducir los costos de almacenamiento y procesamiento en la nube.
\n\nEn la (casa de datos) lakehouse
\n\nChandar creó Hudi como un proyecto interno dentro de Uber en 2016, y desde que la empresa de transporte compartido donó el proyecto a la Apache Foundation en 2019, Hudi ha sido adoptado por empresas como Amazon, Disney y Walmart.
\n\n\n\t