Istraživanje koje je sproveo Univerzitet u Merilendu u saradnji sa Majkrosoftom testiralo je 26 jezika, prenio je portal Aktualne.
Nakon ispitivanja nekoliko velikih jezičkih modela, uključujući ChatGPT, Google Gemini i DeepSeek, ispostavilo se da je najbolji jezik za unos komandi, takozvanih promptova - poljski, koji je postigao tačnost do 88 procenata.
Poljski jezik je na taj način nadmašio engleski, koji je glavni jezik za obuku za mnoge modele, kao i kineski, koji ima ogromnu količinu podataka u svijetu vještačke inteligencije.
Kao odgovor na rezultate studije, Poljski zavod za patente je na društvenim mrežama objavio ocjenu da je poljski najbolji jezik za podsticanje.
- Poljska vještačka inteligencija nije toliko razvijena kao, na primjer, američka ili kineska. Botovi koji rade na našem jeziku prave manje grešaka i bolje su sposobni da analiziraju velike skupove dokumenata - navedeno je u objavi.
Prema riječima naučnika, poljski jezik je pobjednik zbog svoje bogate gramatičke strukture, složenog sistema padeža i deklinacije, što pruža više informacija o odnosima između riječi i smanjuje dvosmislenost i uz sve to se bolje nosi sa složenim zadacima, posebno pri obradi velikih tekstova.
- Eksperiment je dao nekoliko iznenađujućih nalaza. Engleski jezik nije pokazao najbolje rezultate, iako je glavni jezik za obuku za većinu modela. Naprotiv, poljski se pokazao kao najtačniji - navodi se u studiji.
Prvih deset mjesta na rang listi zauzimali su slovenski i romanski jezici koji, kako se navodi, pomažu vještačkim inteligencijama da bolje razumiju kontekst i preciznije reaguju na složenije zadatke zbog svoje strukture.
Francuski je zauzeo drugo mjesto, sa tačnošću samo nešto nižom od poljske, oko 87 procenata, a treće mjesto je pripalo italijanskom sa 86 procenata.
Engleski, jezik koji se najčešće koristi u vještačkoj inteligenciji, našao se na šestom mjestu.
U studiji se navodi da je to vjerovatno zato što engleski sadrži mnogo neformalnog jezika i slenga, što doprinosi većem izobličenju, dvosmislenosti i netačnosti.
Kineski, koji dominira količinom podataka, nalazi se pri dnu liste, završavajući na 22. mjestu, sa stopom tačnosti od samo 62 odsto.
