Background waves

Why Google’s AI can’t spell Google (or anything else)

google-two-ps.jpg

How many Ps are in Google? According to Google, there are two.

There’s also “exactly 1 ‘r’ in the word ‘poop’,” Google’s AI Overview says, as well as two ‘d’s in the word journalism, yet spelled it: j-o-u-r-n-a-d-i-s-m. Google did at least identify that there is one P in the last name of the U.S. president, but spelled it as t-r-p-u-m.

You didn’t need to be a prophet to predict that Google’s AI-forward Search overhaul was going to go over poorly. We’ve done this before. The first time Google added AI Overviews to Search, the feature ended up citing satirical posts from The Onion and Reddit, advising people to eat rocks and put glue on their pizza.

This time around, as Google doubles down on its commitment to make generative AI the centerpiece of its 29-year-old flagship product, it’s not surprising to see it stumble.

Problemet e AI me drejtshkrimin

Google po e ndryshon tërësisht motorin e kërkimit.

pic.twitter.com/PIR4llFhiV — mersomas (May 27, 2026)

“Counting within words has been a known challenge for LLMs, and we’re working to fix this particular issue,” Google i tha TechCrunch në një deklaratë me email.

Këto gabime të thjeshta drejtshkrimi mund të duken të njohura. LLM-të, lloji i inteligjencës artificiale që fuqizon chatbot-et dhe gjeneratorët e tjerë të tekstit, nuk janë krijuar për të kuptuar drejtshkrimin. Prej vitesh është bërë shaka që, sa herë një kompani prezanton një model të ri AI, dikush duhet t’i pyesë për sa ‘r’ përmban fjala strawberry. Shumë nga këto modele AI — të cilat mund të krijojnë një aplikacion në sekonda ose të zgjidhin probleme të vjetra matematikore — nuk janë më të mira se një fëmijë kopshti për drejtshkrimin.

Pengesa thelbësore të modeleve të mëdha gjuhësore

Problemet e Google’s AI me drejtshkrimin shkojnë përtej këtyre gabimeve qesharake. Google tashmë ka rregulluar një problem nga java e kaluar, kur kërkimi për fjalën “disregard” tregon një përkufizim të gabuar, por gabimet drejtshkrimore vazhdojnë të jenë argëtuese sepse janë vërtet të vështira për t’u zhbërë.

Studiuesit kanë shpjeguar më parë se AI nuk i percepton fjalitë si njësi gjuhësore të përbëra nga fjalë dhe shkronja. Shumica e LLM-ve bazohen në modele transformer, të cilat e ndajnë tekstin në tokena, që mund të jenë fjalë të plota, rrokje, ose edhe shkronja, sipas modelit. Në vend se të “lexojë” si një njeri, AI e kthen tekstin në përfaqësime numerike që më pas kontekstualizohen për të prodhuar një përgjigje logjike.

TechCrunch spelling AI Google
Image Credits: TechCrunch

“LLM-të janë të bazuara te kjo arkitekturë e transformerëve, që realisht nuk lexon tekstin siç bëjmë ne”, shpjegon Matthew Guzdial, studiues AI në Universitetin e Albertës për TechCrunch. “Kur AI sheh fjalën ‘the,’ ka vetëm një përfaqësim për të, por nuk di për ‘T,’ ‘H,’ ‘E.’”

Arkitektura me tokena është në vetvete kufizuese dhe kërkuesit nuk janë tepër optimistë për të gjetur një zgjidhje të plotë për drejtshkrimin.

“Është shumë e vështirë të përkufizosh se çfarë ekzaktësisht është një ‘fjalë’ për një model gjuhësor, dhe edhe sikur ekspertët të bien dakord për një fjalor të përsosur tokenash, modelet ndoshta sërish do të ‘ndajnë’ elementet akoma më imtësisht,” thotë Sheridan Feucht, doktorante për interpretimin e modeleve të mëdha të gjuhës në Northeastern University. “Supozoj që nuk ekziston një ‘tokenizer’ i përsosur për shkak të kësaj paqartësie të brendshme.”

Ky nuk është domosdoshmërisht një problem urgjent për komunitetin kërkimor, pasi vlera kryesore e LLM-ve nuk qëndron te drejtshkrimi. Megjithatë, këto dështi të qarta na ndihmojnë të kujtojmë se AI nuk është e përsosur, edhe kur mund të duket sikur ka njohuri të pakufizuara. Nuk mund t’i besojmë verbërisht përgjigjeve të AI pa i verifikuar ato.

Tags: AI Google, gabime drejtshkrimi, modele gjuhësore, AI Overviews, kufizime AI, verifikimi informacionit