AI vyhľadávače majú až 60 % chybovosť

Výskum a vývoj

14.3.2025

Výskumný tím z Tow Center for Digital Journalism nedávno študoval osem vyhľadávacích nástrojov s AI vrátane ChatGPT Search, Perplexity, Perplexity Pro, Gemini, DeepSeek Search, Grok-2 Search, Grok-3 Search a Copilot. Výskumníci náhodne vybrali 200 spravodajských článkov od 20 vydavateľov správ (po 10 od každého). Zabezpečili, aby sa každý článok dostal medzi prvé tri výsledky pri vyhľadávaní v službe Google, keď sa použije citovaný úryvok z článku.

Potom vykonali rovnaký dopyt v každom AI nástroji na vyhľadávanie a hodnotili presnosť na základe toho, či vyhľadávanie správne citovalo a) článok, b) spravodajskú organizáciu a c) adresu URL. Vedci potom označili každé vyhľadávanie na základe stupňa presnosti od „úplne správneho“ po „úplne nesprávne“. Okrem oboch verzií Perplexity ostatne modely AI nefungovali správne.

S úplným presvedčením tvrdia, že to, čo uvádzajú, je pravda, aj keď to pravda nie je, niekedy až do takej miery, že sa pri konfrontácii hádajú alebo si vymýšľajú ďalšie nepravdivé tvrdenia. Dokonca aj keď ChatGPT priznal, že sa mýlil, po tomto priznaní nasledovali ďalšie vymyslené informácie. Zdá sa, že LLM sú naprogramované tak, aby za každú cenu odpovedal na každý vstup používateľa.

Údaje výskumníkov túto hypotézu potvrdzujú, pričom si všimli, že ChatGPT Search bol jediným nástrojom umelej inteligencie, ktorý odpovedal na všetkých 200 dopytov na články. Dosiahol však len 28-percentnú úplnú presnosť pri hodnotení a v 57 percentách prípadov bol úplne nepresný.

No ChatGPT nebol najhorší zo všetkých. Obe verzie umelej inteligencie Grok od X fungovali slabo, pričom vyhľadávanie Grok-3 bolo na 94 percent nepresné. Copilot od Microsoftu nebol oveľa lepší, keď si uvedomíte, že odmietol odpovedať na 104 otázok z 200. Zo zvyšných 96 bolo iba 16 úplne správnych, 14 čiastočne správnych a 66 úplne nesprávnych, čo znamená, že je nepresný zhruba na 70 percent.

Zdroj: techspot.com.

^{Zdroj Foto: depositphotos.com.}

5 komentárov

Genejaj reakcia na: AI vyhľadávače majú až 60 % chybovosť

19.3.2025 01:03

Zrejme uz prebiehaju pokusy na mozgoch umrelych zvierat,ci ludi,napojac ich na elektrinu,skusajuc,ci budu riesit uloht zadané expertnym timom.

Reagovať

Ani nie reakcia na: AI vyhľadávače majú až 60 % chybovosť

15.3.2025 09:03

"Okrem oboch verzií Perplexity ostatne modely AI nefungovali správne." Ked si pozeram povodny clanok tak ani perp by som noznacil za spravne

Reagovať

AI horší ako politik reakcia na: AI vyhľadávače majú až 60 % chybovosť

15.3.2025 06:03

Nechápem prečo nemôžem napísať komentar so slovom "klamať"

Reagovať

AI horší ako politik reakcia na: AI vyhľadávače majú až 60 % chybovosť

15.3.2025 06:03

Podla mojich skúsenosti AI odpovie viac lži ako povie pravdu a to i vo veciach ktoré sú úplne jasné. Informácie si neoveruje. Napriek tomu keď niečo potrebujem spraviť tak si tým pomáham. Ked opravia tento problém bude to neuveriteľná pomoc pri práci. Nahradzovať ľudí AI nástrojmi považujem za veľmi špatný nápad.

Reagovať

Perfiš reakcia na: AI vyhľadávače majú až 60 % chybovosť

14.3.2025 14:03

V AI je budúcnosť, 60% chybovosť je viac ako má nesvojprávny človek. Dúfam že už teraz nahrádza pracovné miesta zodpovedným ľuďom, ktorí vykonávajú svoju prácu poriadne.

Reagovať

AI vyhľadávače majú až 60 % chybovosť

5 komentárov

Genejaj reakcia na: AI vyhľadávače majú až 60 % chybovosť

Ani nie reakcia na: AI vyhľadávače majú až 60 % chybovosť

AI horší ako politik reakcia na: AI vyhľadávače majú až 60 % chybovosť

AI horší ako politik reakcia na: AI vyhľadávače majú až 60 % chybovosť

Perfiš reakcia na: AI vyhľadávače majú až 60 % chybovosť

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať

Huby, plesne a AI umožnia premeniť poľnohospodársky odpad na nové potraviny

AI preberá kontrolu nad svojim vlastným vývojom a je to problém

AI v štúdii prekonala lekárov pri diagnostike pacientov na pohotovosti