AI om uw bedrijf te beheren?
09/05/2025 - Gepubliceerd door : FiduPress < Terug
Kunstmatige intelligentie maakt enorme vooruitgang. Maar is ze klaar om zelfstandig een bedrijf te runnen zonder menselijke tussenkomst? Een recente studie van de onderzoekers van Carnegie Mellon University geeft een fascinerend – maar genuanceerd – antwoord.
Een virtueel bedrijf onder leiding van AI
De onderzoekers creëerden een fictief bedrijf, TheAgentCompany, opgebouwd als een echte KMO: met intranet, communicatietools, projectbeheer, HR en interne berichten. Alles was aanwezig… behalve mensen. Elke functie werd toegewezen aan een geavanceerde generatieve AI, zoals Claude 3.5 Sonnet, GPT-4o of Gemini.
Elke agent kreeg een specifieke taak: een ontwikkelingssprint organiseren, een financieel formulier invullen, nieuwe kantoorruimte kiezen of communiceren met een virtuele HR-collega. Dit alles gebeurde in een realistische werkomgeving met echte professionele tools.
Een puntensysteem werd opgezet om de prestaties van elke taak (ook gedeeltelijke successen) te evalueren, en zo de voortgang van elk AI-agent objectief te meten.
Het verdict: nog niet klaar
De resultaten van het experiment temperen het enthousiasme rond volledige automatisering. Geen enkele AI-agent slaagde erin om meer dan 25% van de toegewezen taken tot een goed einde te brengen. Claude 3.5 Sonnet presteerde het best met 24% voltooide opdrachten en een totaalscore van 34,4% wanneer ook gedeeltelijke successen werden meegerekend. GPT-4o en Gemini kwamen amper boven de 10% uit.
Hoe komt dat, ondanks hun geavanceerde capaciteiten? De onderzoekers wijzen op meerdere fundamentele beperkingen:
- Gebrek aan gezond verstand: de AI begrijpt niet altijd vanzelfsprekende dingen, zoals dat een .docx-bestand hoort bij Word.
- Moeilijkheden in communicatie: zodra een opdracht samenwerking vereist met een collega, loopt het vaak fout. De AI weet niet hoe die een vaag antwoord moet interpreteren of een gesprek moet herstarten.
- Problemen met navigatie: AI worstelt met complexe gebruikersinterfaces, pop-ups of bekende software zoals ownCloud.
Deze zwakke punten tonen aan dat AI’s nog steeds moeite hebben met taken die meertrapsplanning, oordeelsvorming en improvisatie vereisen.
(Nog) geen AI-baas
Betekent dit dat AI geen plaats heeft in bedrijfsbeheer? Zeker niet. De studie toont aan dat AI uitstekend kan presteren bij goed afgebakende taken: code schrijven, data analyseren, repetitieve processen automatiseren.
Maar bij opdrachten waar coördinatie, prioriteit, contextbegrip of menselijke intuïtie nodig zijn, blijven mensen onmisbaar. Het onderzoek onderstreept dan ook het belang van mens-AI samenwerking: AI als assistent, niet als vervanger.
De onderzoekers stellen duidelijk dat AI in sommige domeinen goed werkt (zoals softwareontwikkeling), maar in andere – zoals administratie of finance – nog tekortschiet. Dat heeft ook te maken met de datasets waarop ze zijn getraind.
Samengevat
Het idee dat een AI volledig zelfstandig een kantoor runt, blijft voorlopig sciencefiction. Verre van supermanagers, tonen huidige AI-systemen aan dat ze nog flink wat beperkingen hebben.
AI is een krachtig productiviteitstool, maar (nog) geen baas.
Terug