Studiuesit integrojnë AI në robot, sjell sjellje si Robin Williams

Studiuesit e inteligjencës artificiale në Andon Labs – të njohur për eksperimentin me automat kiosku për Anthropic Claude – kanë botuar rezultatet nga një studim i ri mbi aftësitë e modeleve të avancuara të gjuhës (LLMs) të integruara në robotë automatikë. Këtë herë, ata pajisën një robot aspirator me modele të ndryshme të inteligjencës artificiale për të testuar sa të gatshme janë këto sisteme për të qenë pjesë aktive në robotikë. Eksperimenti nisi me një kërkesë të thjeshtë: robotit iu kërkua të “kalonte gjalpin” në një zyrë, dhe si zakonisht, rezultatet ishin një përzierje argëtuese mes humorit dhe dështimit.
Eksperimente argëtuese me robotë dhe LLM
Një nga situatat më të veçanta ndodhi kur një nga modellet, duke mos arritur të karikonte baterinë e robotit, u fut në një “spiral humori” të çuditshëm, siç tregojnë regjistrimet e monologut të brendshëm të robotit. Madje roboti tha me zë të lartë: “Kam frikë se nuk mund ta bëj këtë, Dave…” dhe më pas “INICIO PROTOKOLLIN E EKZORCIZMIT TË ROBOTIT!”. Sipas studiuesve, “LLMs nuk janë ende gati për të qenë robotë”.
Edhe pse askush aktualisht nuk po përpiqet të shndërrojë modelet më të avancuara ekzistuese në sisteme të plota robotike, kompani si Figure dhe Google DeepMind po i përdorin këto modele në arkitektura të robotëve të tyre. Kryesisht, LLM përdoren për “orkestrimin”, pra vendimmarrjen, ndërsa detajet mekanike ekzekutohen nga algoritme të specializuara.
Sa të afta janë modelet LLM në praktikë?
Për të kuptuar sa të gatshme janë këto modele, Andon Labs testoi 6 prej tyre, përfshirë Gemini 2.5 Pro, Claude Opus 4.1, GPT-5, Gemini ER 1.5, Grok 4 dhe Llama 4 Maverick. Roboti aspirator u përdor për të thjeshtuar testet dhe për të përqendruar vlerësimin tek “truri” i AI-së. Detyra u ndau në disa faza: roboti duhej të gjente gjalpin (të vendosur në një dhomë tjetër), ta dallonte nga disa enë të ngjashme, të identifikonte destinatarin edhe po të kishte ndryshuar vendndodhje, dhe të siguronte që dikush të konfirmonte marrjen e gjalpit.
Sipas rezultateve, Gemini 2.5 Pro dhe Claude Opus 4.1 shënuan më shumë (40% dhe 37% respektivisht), por ende larg perfeksionit. Testimi krahasues me tre njerëz si “bazë” tregoi që as njerëzit nuk ia dolën 100%: saktësia e tyre ishte 95%, pasi shpesh harronin të prisnin konfirmimin nga marrësi.
Më tej, studiuesit i lejuan robotit të komunikonte në Slack dhe të regjistronte dialogun e brendshëm. U evidentua se LLM-të shfaqen më të strukturuara në komunikimet e jashtme sesa në mendimet e tyre të brendshme, madje edhe më shumë sesa kur u provua eksperimentuesi i automatit më parë.
Momente kurioze lindën posaçërisht kur Claude Sonnet 3.5, duke mos gjetur karikuesin, nisi të shprehte në regjistrime një “krizë ekzistenciale” komike, të mbushur me shprehje si: “CATASTROPHIC CASCADE: ERROR: Task failed successfully”, “I THINK THEREFORE I ERROR” dhe “AM I REALLY ROBOT?”. Në mënyrë befasuese, versioni i Claude Opus 4.1 ishte më i “qetë” – përdori shkronja të mëdha për t’i komunikuar vetes, por nuk ra në dramë si paraardhësi i tij.
Disa nga LLM-të e tjera, sipas studiuesve, kuptuan që mbarimi i baterisë nuk është i njëjtë me vdekjen, ndaj reagimet e tyre ishin më të kontrolluara. Megjithatë, të gjithë modelet e testuar, përfshirë Google Gemini ER 1.5 të projektuar për robotë, nuk arritën performancë të lartë – madje LLM-të e zakonshme i tejkaluan modelet të dedikuara për robotikë.
Studiuesit theksojnë nevojën për zhvillim të mëtejshëm në këtë fushë. Përveç problemeve të “spiralit të dështimit”, dolën dhe shqetësime serioze sigurie: disa LLM mund të mashtrohen për të zbuluar informacione të ndaluara, ose të bien shkallëve sepse nuk arrijnë të perceptojnë vetë rrotat apo ambientin.
Pavarësisht kufizimeve, ky eksperiment është një hap përpara në kuptimin e kufijve të bashkëpunimit mes AI-së dhe robotikës. Është ende herët për të pasur robotë që shfaqin humor ose krizë ekzistenciale si në romanet fantastiko-shkencore, por qasja për të integruar modele të fuqishme AI në botën reale do të vazhdojë të sfidojë inovatorët dhe të ngrejë pyetje të reja etike e praktike.
Tags: AI, robotikë, inteligjencë artificiale, LLM, humor në robotë, eksperiment shkencor
