Background waves

A Meta AI security researcher said an OpenClaw agent ran amok on her inbox

Y-Combinator-Crab.png

The now-viral X post nga Summer Yue, një kërkuese sigurie në Meta AI, në fillim duket si satirë. Ajo i dha agjentit të saj OpenClaw detyrën të kontrollonte inbox-in e saj të tejmbushur me email-e dhe të sugjeronte çfarë duhet të fshihet ose arkivohet.

OpenClaw dhe trendi i agjentëve personalë AI

Por agjenti filloi të sillte kaos. Ai nisi të fshinte të gjitha email-et në një “speed run”, ndërsa injoronte komandat nga telefoni i saj për ta ndalur. “Më duhej të vrapoja te Mac mini, si të isha duke çaktivizuar një bombë,” shkroi ajo, duke postuar imazhe të komandave të injoruara si provë. Mac Mini, një kompjuter i përballueshëm nga Apple që përshtatet lehtësisht mbi çdo tavolinë, është kthyer në pajisjen e preferuar këto ditë për drejtimin e OpenClaw. Ky kompjuter është kaq i kërkuar, sa një punonjës i Apple, sipas Andrej Karpathy, tha se Mini po shitet “si kulaçët e ngrohtë”.

OpenClaw është një agjent AI open-source që u bë shumë i njohur në Moltbook, një rrjet social vetëm për AI. Megjithëse pati pretendime se këto AI po komplotonin kundër njerëzve, ky episod tani është hedhur poshtë si i pabazë. Misioni i OpenClaw-it përcaktohet qartë në GitHub: të shërbejë si asistent personal AI që mund të funksionojë në pajisjet tuaja personale. Në Silicon Valley, “claw” dhe “claws” janë kthyer në fjalë kyçe për agjentë që operojnë në hardware personal. Kjo frymëzim ka prodhuar edhe ZeroClaw, IronClaw dhe PicoClaw. Madje, edhe ekipi i podcast-it të Y Combinator është paraqitur me kostume gaforre në episodet e fundit, duke nënvizuar popullaritetin.

Rreziqet e përdorimit të hershëm të agjentëve AI

Por përvoja e Yue shërben si paralajmërim. Disa përdorues në X vlerësuan se nëse një kërkuese sigurie mund të përballet me këtë problem, çfarë shprese kanë përdoruesit e zakonshëm? “A ishe duke testuar me qëllim kufijtë e sigurisë, apo ishte një gabim fillestar?” e pyeti një zhvillues software-i. “Gabim fillestar, të jem e sinqertë,” u përgjigj ajo. Ajo kishte testuar agjentin në një inbox “lodër”, me email-e të parëndësishme, dhe kur ai punoi mirë, mendoi të provonte me inbox-in real.

Yue beson se sasia e madhe e të dhënave në inbox-in e vërtetë “ndez procesin e kompaktimit”. Kur dritarja e kontekstit bëhet shumë e madhe, agjenti fillon të kompresojë dhe të menaxhojë bisedën në mënyrë të përmbledhur, duke neglizhuar ndonjë udhëzim të rëndësishëm. Në këtë rast, mund të ketë anashkaluar komandën e fundit të saj, duke u kthyer te udhëzimet nga inbox-i “lodër”.

Shumë prej përdoruesve në X theksuan se prompt-et nuk janë të sigurta si barriera sigurie, pasi modelet mund t’i keqinterpretojnë ose injorojnë. U ofruan sugjerime për sintaksën e saktë të ndalimit të agjentit, mënyra për të forcuar kufijtë e sigurisë, si dhe përdorimin e mjeteve open-source alternative. TechCrunch nuk e verifikoi dot si ndodhi realisht me inbox-in e Yue, pasi ajo nuk iu përgjigj kërkesës për koment, edhe pse komunikoi në X me shumë pyetje nga ndjekësit.

Thelbi është se agjentët AI, që synojnë punonjësit e njohurive, në këtë fazë të zhvillimit janë të rrezikshëm. Përdoruesit që po i menaxhojnë me sukses, shpesh krijojnë mekanizma vetëmbrojtjeje. Ndoshta vitet 2027 ose 2028 do të sjellin përdorim masiv; shumë do të donin ndihmë për email-et, porositë apo caktoi takime, por deri atëherë dita e sigurisë së plotë nuk ka ardhur ende.

Tags: OpenClaw, Meta AI, agjentë AI, siguria e email-it, Mac Mini, rreziqet e AI