Background waves

OpenAI bets big on audio as Silicon Valley declares war on screens

GettyImages-2197091379.jpg

OpenAI po investon fuqishëm në inteligjencën artificiale për audio, dhe nuk bëhet fjalë vetëm për t’i dhënë një zë më të mirë ChatGPT. Sipas raportimeve të reja nga The Information, kompania ka bashkuar disa ekipe inxhinierike, të produktit dhe hulumtimit gjatë dy muajve të fundit, për të përmirësuar modelet e saj audio. Të gjitha këto lëvizje po behen si përgatitje për një pajisje personale që vendos audion në qendër, e cila pritet të prezantohet pas rreth një viti.

Industria po orienton drejt një të ardhme audio

Ky zhvillim pasqyron transformimin më të gjerë brenda gjithë industrisë së teknologjisë, ku ekranet po lihen në plan të dytë dhe interaksioni përmes zërit po bëhet qendror. Folësit inteligjentë tashmë janë kthyer në pjesë të përditshme në mbi një të tretat e shtëpive amerikane. Për më tepër, Meta ka lansuar një veçori të re për syzet e mençura Ray-Ban që përdorin pesë mikrofona për të përmirësuar dëgjimin në ambientet me zhurmë, duke i kthyer syzet në pajisje të orientimit të zërit. Nga ana tjetër, Google gjatë qershorit nisi testimin e “Audio Overviews”, një përmbledhje bisedore e rezultateve të kërkimit, ndërsa Tesla po integron chatbot-in Grok të xAI në automjetet e saj, për të lehtësuar gjithçka nga navigimi te kontrolli i klimës përmes dialogut natyral.

Nuk janë vetëm gjigantët e teknologjisë që po i besojnë kësaj të ardhmeje. Një valë startups-ash po shfaqen me të njëjtën bindje, por me rezultate të ndryshme. Për shembull, Humane AI Pin shpenzoi qindra miliona dollarë para se të bëhej një mësim për çfarë të mos bëhet, ndërsa varësja Friend AI, e cila pretendon se mund të regjistrojë jetën tuaj dhe të ofrojë shoqëri, ka hapur debate mbi privatësinë dhe natyrën njerëzore. Së fundmi, dy kompani, përfshirë Sandbar dhe një tjetër e udhëhequr nga themeluesi i Pebble Eric Migicovsky, premtojnë unaza të mençura me AI që do të dalin në treg në vitin 2026 dhe që lejojnë përdoruesit të flasin me dorën.

Audio si ndërfaqja e së ardhmes

Megjithëse format dhe pajisjet ndryshojnë, idea mbetet e njëjtë: audio po bëhet ndërfaqja kryesore e së ardhmes. Çdo hapësirë — shtëpia, makina, madje edhe fytyra juaj — po shndërrohet në një sipërfaqe kontrolli. Modeli i ri i OpenAI për audio, i planifikuar për fillimin e vitit 2026, raportohet se do të tingëllojë më natyrshëm dhe do të jetë i aftë të menaxhojë ndërprerjet si një bashkëbisedues i vërtetë. Për më tepër, ky model mund të flasë njëkohësisht me përdoruesin, një veçori që modelet e sotme nuk e kanë.

OpenAI, gjithashtu, pritet të prezantojë një seri pajisjesh të reja, përfshirë ndoshta syze të mençura apo altoparlantë pa ekran, që janë më shumë partnerë se sa mjete. Këto pajisje mund të çojnë drejt një marrëdhënieje më të natyrshme dhe më të shëndetshme me teknologjinë.

Këto risi nuk janë të habitshme. Ish-kreu i dizajnit në Apple, Jony Ive, i cili iu bashkua përpjekjeve të OpenAI pas blerjes prej 6.5 miliardë dollarësh të kompanisë së tij io, e sheh këtë qasje audio-sëpari si një mundësi për të “korrigjuar gabimet” e pajisjeve elektronike të së kaluarës dhe për të ulur varësinë nga teknologjia.

Tags: OpenAI, inteligjencë artificiale, audio technology, pajisje të mençura, Silicon Valley, ndërfaqe zanore