Realtid

AI-agenter fastnar på enkla hinder: "Löjligt överhajpade"

agenter
AI-agenter kräver fortfarande en stor dos mänsklig vägledning för att utföra arbetsuppgifter. (Foto: Pexels)
Johannes Stenlund
Johannes Stenlund
Uppdaterad: 24 apr. 2025Publicerad: 24 apr. 2025

AI-agenter ses som techvärldens nästa stora innovation. Än så länge är de dock överraskande dåliga på att utföra enklare arbetsuppgifter.

ANNONS
ANNONS

Mest läst i kategorin

I KORTHET

  • AI-agenter klarar i nuläget bara en bråkdel av uppgifterna i realistiska jobbsimuleringar. Ofta faller de på enkla hinder.

  • Företag som Moody’s och Johnson & Johnson testar AI-agenter på intern data, men använder fortfarande mänsklig översyn.

  • Tekniken funkar bäst för programmering, där det finns gott om träningsdata – men är långt ifrån redo att ersätta roller inom HR, ekonomi eller administration.

Sammanfattat med hjälp av AI och kvalitetssäkrat av Realtid

AI-agenter är det senaste steget i den teknologiska revolutionen. Det tror åtminstone de stora techutvecklarna som satsar hårt på agenter.

Fördelen med en AI-agent är att den kan arbeta mer oberoende jämfört med exempelvis en chattbot, vilket kan få långtgående konsekvenser.

Missa inte: Kan AI-agenter göra ensamföretag till unicorns? Realtid

Men nu visar en färsk studie att AI-agenter, trots all hype, fortfarande har långt kvar innan de kan ersätta mänskliga arbetstagare i realistiska jobbsituationer, skriver Business Insider.

Klarar var fjärde uppgift

Forskarna från Carnegie Mellon University skapade ett simulerat företag, utrustat med interna system, chattverktyg och uppdrag hämtade från vardagen i branscher som mjukvaruutveckling, administration och ekonomi.

Här fick AI-modeller från OpenAI, Google, Meta och Anthropic pröva sina vingar i roller som annars kräver både kompetens och sunt förnuft.

ANNONS

Resultaten var överraskande svaga. Den mest kapabla modellen, Claude 3.5 Sonnet, lyckades slutföra färre än 25 procent av uppgifterna. Andra modeller presterade ännu sämre.

Patienten: ”AI mer empatisk än min läkare”

Läkare har fått nya insikter.

ANNONS

Senaste nytt

relevance
Spela klippet
Realtid Partner

Relevance spränger tillväxtmålen – trots tuff mediemarknad

15 maj 2025
relevance
Spela klippet
Affärer

Fri journalistik ger starka resultat för Relevance Communication

14 feb. 2025

Fattar inte

Många agenter fastnade på enkla hinder, som att inte förstå ett vanligt pop-up-fönster eller att feltolka instruktioner.

Ofta saknades förmågan att resonera, planera flera steg i följd eller kommunicera smidigt med ”kollegor”.

Enligt AI-forskaren Stephen Casper har AI-agenter blivit ”löjligt överhajpade” under den senaste tiden, vilket har gjort att deras begränsningar har glömts bort.

Läs även: Svensk AI bakom framtidens drönare – teknik utvärderas av Nato. Dagens PS

Behöver mycket träningsmaterial

ANNONS

Trots detta pågår en snabb utveckling på området. Företag som Moody’s och Johnson & Johnson har börjat experimentera med egna AI-agenter tränade på intern data.

Genom att kombinera expertkunskap och AI-stöd försöker de effektivisera uppgifter som tidigare krävde stora team.

Kinas nya AI-agent hyllas och sågas: ”Förändrar allt”

En ny AI-agent från Kina delar meningarna hos experter.

Även Amazon, med sina enorma resurser, tror mycket på teknologin.

Nyligen släppte företaget sin AI-agent Nova Act, som kan ta över din webbläsare och utföra många av de saker som du normalt måste göra manuellt, som att boka resor eller möten, skriver Forbes.

Bäst för dessa uppgifter

Men det lär alltså dröja innan AI-agenterna är tillräckligt för att ersätta hela yrkesgrupper.

Forskarna menar att de i dagsläget lämpar sig bäst för tekniknära arbetsuppgifter, som programmering, där det finns mycket öppet träningsmaterial.

ANNONS

Inom områden som HR, ekonomi och administration är datan ofta mer skyddad, vilket gör modellerna sämre rustade för sådana miljöer.

Missa inte: 2025 – året då AI kodar bättre än människor. Realtid

Läs mer från Realtid - vårt nyhetsbrev är kostnadsfritt:
ANNONS
ANNONS