AI-agenter fastnar på enkla hinder: "Löjligt överhajpade"

AI-agenter ses som techvärldens nästa stora innovation. Än så länge är de dock överraskande dåliga på att utföra enklare arbetsuppgifter.

I KORTHET

AI-agenter klarar i nuläget bara en bråkdel av uppgifterna i realistiska jobbsimuleringar. Ofta faller de på enkla hinder.
Företag som Moody’s och Johnson & Johnson testar AI-agenter på intern data, men använder fortfarande mänsklig översyn.
Tekniken funkar bäst för programmering, där det finns gott om träningsdata – men är långt ifrån redo att ersätta roller inom HR, ekonomi eller administration.

Sammanfattat med hjälp av AI och kvalitetssäkrat av Realtid

AI-agenter är det senaste steget i den teknologiska revolutionen. Det tror åtminstone de stora techutvecklarna som satsar hårt på agenter.

Fördelen med en AI-agent är att den kan arbeta mer oberoende jämfört med exempelvis en chattbot, vilket kan få långtgående konsekvenser.

Missa inte: Kan AI-agenter göra ensamföretag till unicorns? Realtid

Men nu visar en färsk studie att AI-agenter, trots all hype, fortfarande har långt kvar innan de kan ersätta mänskliga arbetstagare i realistiska jobbsituationer, skriver Business Insider.

Klarar var fjärde uppgift

Forskarna från Carnegie Mellon University skapade ett simulerat företag, utrustat med interna system, chattverktyg och uppdrag hämtade från vardagen i branscher som mjukvaruutveckling, administration och ekonomi.

Här fick AI-modeller från OpenAI, Google, Meta och Anthropic pröva sina vingar i roller som annars kräver både kompetens och sunt förnuft.

Resultaten var överraskande svaga. Den mest kapabla modellen, Claude 3.5 Sonnet, lyckades slutföra färre än 25 procent av uppgifterna. Andra modeller presterade ännu sämre.

Patienten: ”AI mer empatisk än min läkare”

Läkare har fått nya insikter.

Fattar inte

Många agenter fastnade på enkla hinder, som att inte förstå ett vanligt pop-up-fönster eller att feltolka instruktioner.

Ofta saknades förmågan att resonera, planera flera steg i följd eller kommunicera smidigt med ”kollegor”.

Enligt AI-forskaren Stephen Casper har AI-agenter blivit ”löjligt överhajpade” under den senaste tiden, vilket har gjort att deras begränsningar har glömts bort.

Läs även: Svensk AI bakom framtidens drönare – teknik utvärderas av Nato. Dagens PS

Behöver mycket träningsmaterial

Trots detta pågår en snabb utveckling på området. Företag som Moody’s och Johnson & Johnson har börjat experimentera med egna AI-agenter tränade på intern data.

Genom att kombinera expertkunskap och AI-stöd försöker de effektivisera uppgifter som tidigare krävde stora team.

Kinas nya AI-agent hyllas och sågas: ”Förändrar allt”

En ny AI-agent från Kina delar meningarna hos experter.

Även Amazon, med sina enorma resurser, tror mycket på teknologin.

Nyligen släppte företaget sin AI-agent Nova Act, som kan ta över din webbläsare och utföra många av de saker som du normalt måste göra manuellt, som att boka resor eller möten, skriver Forbes.

Bäst för dessa uppgifter

Men det lär alltså dröja innan AI-agenterna är tillräckligt för att ersätta hela yrkesgrupper.

Forskarna menar att de i dagsläget lämpar sig bäst för tekniknära arbetsuppgifter, som programmering, där det finns mycket öppet träningsmaterial.

Inom områden som HR, ekonomi och administration är datan ofta mer skyddad, vilket gör modellerna sämre rustade för sådana miljöer.

Missa inte: 2025 – året då AI kodar bättre än människor. Realtid

AI-agenter fastnar på enkla hinder: "Löjligt överhajpade"

Klarar var fjärde uppgift

Patienten: ”AI mer empatisk än min läkare”

Fattar inte

Behöver mycket träningsmaterial

Kinas nya AI-agent hyllas och sågas: ”Förändrar allt”

Bäst för dessa uppgifter

Senaste lediga jobben

Mest läst i kategorin

Därför kan ett SMS kosta dig dina konton

AI-kritiken växer i styrka – kan stoppa stora projekt

Från storbolag till startup – duon som slår hål på silos

Protesterna mot datacenter växer – kan försena AI-utvecklingen

Kina slår tillbaka – stryper mineralflöden efter Japans Taiwan‑uttalande