Background waves

Arsyeja pse inteligjenca artificiale e Google gabon në drejtshkrim

google-two-ps.jpg

Sa ‘P’ ka te fjala Google? Sipas Google, janë dy.

Gjithashtu, AI Overview i Google tregon se ka “saktësisht 1 ‘r’ në fjalën ‘poop’”, po ashtu dy ‘d’ te ‘journalism’, edhe pse e shkruan gabim: j-o-u-r-n-a-d-i-s-m. Të paktën, Google arriti të identifikojë një ‘P’ në mbiemrin e presidentit amerikan, por e shkroi si t-r-p-u-m.

Gabimet e drejtshkrimit nga AI-ja e Google

Nuk duhet të jesh parashikues për të menduar se ndryshimi i ri në motorin e kërkimit të Google me anë të AI do të pritej me skepticizëm. Kjo ka ndodhur edhe më parë. Kur Google shtoi herën e parë AI Overviews te Search, inteligjenca artificiale citoi postime satirike nga The Onion dhe Reddit, duke këshilluar përdoruesit të hanin gurë apo të vendosnin ngjitës në pica.

Ndërkohë që Google po angazhohet gjithnjë e më shumë për ta bërë AI-në pjesë kryesore të produktit të saj 29-vjeçar, nuk është surprizë që shfaqen probleme.

“Numërimi i shkronjave në fjalë është një sfidë e njohur për modelet e mëdha gjuhësore, dhe po punojmë për të rregulluar këtë çështje,” deklaroi Google për TechCrunch. Gabimet elementare të drejtshkrimit janë të zakonshme sepse LLM-të (modelet e mëdha të gjuhës) që fuqizojnë AI-në nuk janë të ndërtuara për të kuptuar drejtshkrimin. Prej vitesh ky është objekt humori – sa herë prezantohet një model i ri AI, përdoruesit testojnë aftësitë e tij në drejtshkrim, sidomos me fjala ‘strawberry’.

Pse AI-të gabojnë në drejtshkrim?

Gabimet nuk kanë të bëjnë vetëm me drejtshkrimin. Google javën e kaluar rregulloi një problem ku kërkimi i fjalës “disregard” nxirrte një përkufizim gabim, duke dhënë përgjigje të tipit “U kuptua! Më njofto nëse ke një kërkesë të re!” Megjithatë, gabimet me drejtshkrimin vijojnë të jenë qesharake sepse janë të vështira për t’u ndrequr.

Studiuesit shpjegojnë se AI-të nuk i perceptojnë fjalitë si njësi të përbëra nga fjalë dhe shkronja. Modelet, zakonisht të bazuara në arkitekturën transformer, ndajnë tekstin në ‘tokena’ – të cilat mund të jenë fjalë, rrokje apo shkronja, sipas modelit. Në vend që “të lexojë” si njeriu, AI-ja e kodon tekstin në paraqitje numerike të vetes së saj, duke i vënë në kontekst për të gjeneruar përgjigje logjike.

Matthew Guzdial, studiues i AI dhe profesor në Universitetin e Alberta-s, shpjegon: “Kur AI-së i jepet një kërkesë, ajo përkthehet në një kodim. Nëse i jep fjalën ‘the’, AI ka një kodim për këtë fjalë, por nuk njeh shkronjat veç e veç.”

Kjo arkitekturë që mbështetet te tokenat ka kufizime të natyrshme dhe deri më tani studiuesit nuk janë optimistë se problemi i drejtshkrimit mund të zgjidhet plotësisht.

Sipas Sheridan Feucht, student PhD për interpretimin e modeleve të mëdha gjuhësore në Northeastern University: “Është e vështirë të përcaktohet se çfarë është saktësisht një ‘fjalë’ për një model gjuhësor dhe, edhe nëse ekspertët bien dakord mbi një fjalor perfekt të tokenave, modelet ndoshta do të vazhdojnë të ndajnë tekstin më tej sipas nevojës.”

Megjithëse drejtshkrimi nuk përbën shqetësimin kryesor për studiuesit, këto dështime të theksuara na kujtojnë se AI-ja nuk është e pagabueshme, edhe pse mund të duket herë pas here si e gjitha-dijshme. Prandaj, është e rëndësishme të mos i besojmë verbërisht çdo prodhim të AI-së pa verifikuar saktësinë e tij.

Tags: AI Google, gabime drejtshkrimi, modele gjuhësore, AI Overviews, kufizime AI, verifikimi informacionit