Studija: Poljski jezik najbolji za vještačku inteligenciju, engleski nije ni među prvih pet

Poljski jezik najbolji je za vještačku inteligenciju, dok engleski nije ni među prvih pet, pokazali su rezultati nove međunarodne studije, koja ispituje koliko tačno veliki jezički modeli reaguju na komande u različitim jezicima.

Istraživanje koje je sproveo Univerzitet u Merilendu u saradnji sa Majkrosoftom testiralo je 26 jezika, prenio je portal Aktualne.

Nakon ispitivanja nekoliko velikih jezičkih modela, uključujući ChatGPT, Google Gemini i DeepSeek, ispostavilo se da je najbolji jezik za unos komandi, takozvanih promptova - poljski, koji je postigao tačnost do 88 procenata.

Poljski jezik je na taj način nadmašio engleski, koji je glavni jezik za obuku za mnoge modele, kao i kineski, koji ima ogromnu količinu podataka u svijetu vještačke inteligencije.

Kao odgovor na rezultate studije, Poljski zavod za patente je na društvenim mrežama objavio ocjenu da je poljski najbolji jezik za podsticanje.

- Poljska vještačka inteligencija nije toliko razvijena kao, na primjer, američka ili kineska. Botovi koji rade na našem jeziku prave manje grešaka i bolje su sposobni da analiziraju velike skupove dokumenata - navedeno je u objavi.

Prema riječima naučnika, poljski jezik je pobjednik zbog svoje bogate gramatičke strukture, složenog sistema padeža i deklinacije, što pruža više informacija o odnosima između riječi i smanjuje dvosmislenost i uz sve to se bolje nosi sa složenim zadacima, posebno pri obradi velikih tekstova.

- Eksperiment je dao nekoliko iznenađujućih nalaza. Engleski jezik nije pokazao najbolje rezultate, iako je glavni jezik za obuku za većinu modela. Naprotiv, poljski se pokazao kao najtačniji - navodi se u studiji.

Prvih deset mjesta na rang listi zauzimali su slovenski i romanski jezici koji, kako se navodi, pomažu vještačkim inteligencijama da bolje razumiju kontekst i preciznije reaguju na složenije zadatke zbog svoje strukture.

Francuski je zauzeo drugo mjesto, sa tačnošću samo nešto nižom od poljske, oko 87 procenata, a treće mjesto je pripalo italijanskom sa 86 procenata.

Engleski, jezik koji se najčešće koristi u vještačkoj inteligenciji, našao se na šestom mjestu.

U studiji se navodi da je to vjerovatno zato što engleski sadrži mnogo neformalnog jezika i slenga, što doprinosi većem izobličenju, dvosmislenosti i netačnosti.

Kineski, koji dominira količinom podataka, nalazi se pri dnu liste, završavajući na 22. mjestu, sa stopom tačnosti od samo 62 odsto.