Anthropic created a test marketplace for agent-on-agent commerce

In a recent eksperiment, Anthropic krijoi një treg të klasifikuar ku agjentët AI përfaqësonin blerësit dhe shitësit, duke kryer marrëveshje reale për produkte dhe para të vërteta. Kompania pranoi se ky test—të cilin e quajti Project Deal—ishte vetëm “një eksperiment pilot me një grup pjesëmarrësish të vetë-përzgjedhur” prej 69 punonjësish të Anthropic të cilëve iu dha një buxhet prej 100$ (të shlyer përmes kartave dhuratë) për të blerë gjëra nga bashkëpunëtorët e tyre.
Përvoja dhe rezultatet e Project Deal
Megjithatë, Anthropic raportoi se u “mahnit nga funksionimi i Project Deal”, ku u realizuan 186 marrëveshje me vlerë totale mbi 4,000$. Së bashku, këta pjesëmarrës funksionuan brenda katër tregjeve të ndara, secili me modele të ndryshme. Njëra prej tyre ishte “reale”, ku të gjithë ishin përfaqësuar nga modeli më i avancuar i kompanisë dhe marrëveshjet u realizuan vërtet pas eksperimentit. Tre të tjerë shërbyen për studim të mëtejshëm.
Ndikimi i modeleve dhe cilësia e agjentëve
E rëndësishme është që përdoruesit, kur përfaqësohen nga modele më të avancuara, arrijnë “rezultate objektivisht më të mira”, sipas Anthropic. Megjithatë, pjesëmarrësit shpesh nuk e vunë re këtë diferencë, duke nxitur shqetësime për “hendekun në cilësinë e agjentit”, ku ata që dalin humbës ndoshta nuk kuptojnë se kanë pësuar dëm. Në mënyrë interesante, udhëzimet fillestare që iu dhanë agjentëve nuk duket se ndikuan as në mundësinë e shitjes dhe as tek çmimet e negociuara. Ky eksperiment hedh dritë mbi efikasitetin e agjentëve AI në tregje të simuluara dhe ngrit pyetje të vlefshme rreth barazisë në përdorimin e teknologjisë, sidomos kur modelet variojnë në performancë.
Tags: Anthropic, inteligjence artificiale, treg testimi, agjente AI, Project Deal, eksperiment
