¿Funcionan las empresas sin humanos? Compañía lo probó con empleados 100 % IA: estos fueron los resultados
Una universidad decidió llevar la inteligencia artificial al extremo: creó un modelo de negocio en el que todos sus empleados fueran sistemas de IA. ¿Cómo salió el experimento?

Noticias RCN
11:15 a. m.
En un experimento audaz, la prestigiosa institución académica Carnegie Mellon University de Estados Unidos, especializada en ciencia y tecnología se aventuró a crear una empresa donde cada rol, desde la programación hasta la gestión de recursos humanos, fue asumido por sofisticados agentes de inteligencia artificial.
La iniciativa realizada en la universidad buscó medir la eficiencia y la capacidad de la IA para operar de manera autónoma en un entorno empresarial simulado.
Empresa reemplazó trabajadores por la inteligencia artificial
Durante el período de prueba se experimentó un ambiente inédito: ausencia de pausas para el café, almuerzos compartidos, conversaciones informales e incluso celebraciones de cumpleaños.
Sin embargo, a pesar de la falta de interacción humana, la compañía logró mantenerse operativa.
El equipo de investigadores de la CMU bautizó a su creación como "The Agent Company", una simulación empresarial diseñada para replicar tareas del mundo real, abarcando áreas como desarrollo de software, análisis de datos, gestión de proyectos, istración y finanzas.
Cada una de estas funciones fue asignada a un agente de IA distinto, con el objetivo primordial de evaluar si la inteligencia artificial, trabajando de manera colaborativa, podía emular el funcionamiento de una empresa convencional.
El experimento, pionero en su enfoque, buscaba trascender el debate teórico sobre el desplazamiento laboral por la IA, creando un entorno práctico para observar su desempeño en un contexto organizacional integral.
¿Qué tan exitosa resultó la prueba de la compañía que reemplazó trabajadores por la IA?
Para la ejecución de las tareas, que variaban desde la redacción de documentos y la búsqueda de información en línea hasta la resolución de errores de programación en Python y la gestión de bases de datos, se implementó un sistema denominado OpenHands, impulsado por modelos de lenguaje avanzados como Claude Sonnet 3.5, Gemini 2.0 y GPT-4o.
Los resultados arrojaron una mezcla de asombro y limitaciones. El agente con mejor desempeño, basado en Claude 3.5 Sonnet, logró completar apenas el 24% de las tareas asignadas.
Esta limitación no se debió a una falta de sofisticación, sino a la incapacidad de comprender ciertas instrucciones que requieren un nivel de sentido común aún ausente en la IA.
Los agentes también mostraron dificultades para interpretar correctamente el contenido de páginas web, una tarea que implica la comprensión de estructuras visuales y el a la información a través de los árboles de accesibilidad de los navegadores.
La paradoja se hizo evidente: la IA demostró capacidad para resolver tareas complejas, pero falló en otras que un empleado junior podría realizar con facilidad.
A pesar de la baja tasa de éxito general, el experimento marcó un hito al ser la primera prueba de la IA en condiciones tan cercanas a la realidad del trabajo diario, revelando tanto el potencial como las significativas brechas que aún existen antes de una posible automatización total del entorno empresarial.
Los investigadores también observaron fallas en el razonamiento matemático y la tendencia de los agentes a "improvisar" respuestas convincentes ante problemas sin solución aparente, una característica que contrasta con la capacidad humana de reconocer la propia limitación.