Crnogorski naučnik Aleksandar Kapisoda, koji više od 20 godina živi u Njemačkoj i bavi se jezičkim i semantičkim modelima baziranim na vještačkoj inteligenciji, gostujući u Drugačijoj radio vezi rekao je da je potreba za prepoznavanjem crnogorskog jezika u digitalnom svijetu bila ključni razlog zbog kojeg je kreirao jezički model MontenegroGPT i asistenta na bazi vještačke inteligencije (AI) Vladimir Dukljanski.
Motiv da pokrene ovaj projekat bio je i u tome što je, kada je prvi put probao da koristi ChatGPT, primijetio da crnogorski jezik nije prepoznat, jer ovaj jezički model zasnovan na vještačkoj inteligenciji nije poznavao njegovu strukturu, niti je pravilno koristio slova ś i ź. Još jači motiv bila je potreba da se stane na put negiranju crnogorskog jezika.
Kapisoda naglašava da je motivacija bila višestruka.
“Dugo se bavim upravljanjem znanjimaa i prikupljanjem informacija – profesionalno radim na tome već više od 20 godina. To je tehnički dio priče”, naglasio je.
Drugi razlog, kako je dodao, vezan je za problem sa Wikipedijom, jer ovo pitanje, kako je istakao, ni prethodna vlast u Crnoj Gori nije shvatila dovoljno ozbiljno.
“Crnogorski jezik nije ozbiljno shvaćen na toj platformi i, jednostavno, crnogorska verzija Wikipedije ne postoji”, istakao je sagovornik Antene M.
Jedan od razloga koji su ga motivisali takođe bilo je i uočavanje da jezički modeel zasnovan na vještačkoj inteligenciji ChatGPT nije prilagođen crnogorskom jeziku.
“Treći ključni trenutak desio se 2022. godine, kada sam vidio da dolazi ChatGPT i shvatio njegov kvalitet. To je bio ‘game changer’, digitalna revolucija slična onoj industrijskoj iz 1890-ih godina. Kada sam prvi put probao ChatGPT, primijetio sam da crnogorski jezik nije prepoznat – nije poznavao njegovu strukturu, niti je pravilno koristio slova, a ni danas ne poznaje u potpunosti. To je bio moj motiv da pokrenem ovaj projekat”, rekao je.
Međutim, pored tehničkih, razloge za rad na projektu MontenegroGPT naš sagovornbik vidio je i u sveri kulturološkog prepoznavanja.
“Četvrti aspekt, koji neki mogu smatrati političkim, ali ja ga vidim kao nacionalno pitanje, jeste negiranje crnogorskog jezika. U Crnoj Gori se to često svodi na političku raspravu, ali ja ne želim da ulazim u politiku. Cilj mi je bio da eliminišem to negiranje kroz MontenegroGPT”, istakao je Kapisoda, dodavši da se sada kroz njega jasno može vidjeti razlika između crnogorskog, hrvatskog, bosanskog i srpskog jezika, a razlike nijesu samo u slovima i riječima, već i u strukturi rečenica i gramatici.
Komentarišući činjenicu da, zarazliku od velikih svjetskih jezika kojima je ChatGPT u velikoj mjeri prilagođen, jer koristi ogromnu bazu publikacija i sajtova koje su dostupne na internetu, što kada je u pitanju crnogorski jezik to nije bilo moguće, budući da ne postoje toliko velike tekstualne baze na našem jeziku, naš sagovornik ističe da je to i bio jedan od najvećih izazova.
“Tražio sam sve što je bilo dostupno na internetu. Naravno, poštovao sam autorska prava i koristio metode poput web crawlinga da prikupim javno dostupne podatke. Tehnički detalji su posebna tema, ali su zahtijevali mnogo rada i eksperimentisanja. Konsultovao sam se s više advokata i utvrdio da je materijal koji sam koristio potpuno validan i u skladu s regulativama”, naglasio je naš sagovornik.
Komentarišući činjenicu da kod jezičkih modela baziranih na vještačkoj inteligenciji nerijetko dolazi do tzv. “halucinacija”, odnosno da chatbot u nekim situacijama “izmisli” odgovor koji nije baziran na činjenicama, Kapisoda je rekao da mu je upravo bio cilj da MontenegroGPT oslobodi takvih grešaka.
“Napravio sam nešto drugačije – samostalno sam uzeo te materijale i razvio program. Postavio sam pitanje zašto 79-80% korisnika ChatGPT-a, odnosno obični korisnici, najčešće koriste model za postavljanje i odgovaranje na pitanja. Na osnovu toga, u prvom koraku uzeo sam kompletan tekst s interneta i zatražio da mi izvuče sva pitanja i odgovore iz tog teksta. Nakon što sam pročitao te odgovore, validirao sam ih i dodatno ih unio u jezični model. Time sam omogućio da odgovori budu precizniji i smanjio pojavu tzv. ‘halucinacija’ – situacija u kojoj jezični modeli izmišljaju informacije kada nijesu sigurni ili kada je pitanje nejasno”, naglasio je, dodavši da su zahvaljujući procesu validacije odgovora, značajno smanjene greške i dezinformacije koje se često pojavljuju kod drugih jezičnih modela.
U tom smislu, može se reći da je Montenegro GPT napredniji model u odnosu na ono što je OpenAI ponudio kroz ChatGPT. Informacija da postoji jezični model koji ne pravi greške u odgovorima proširila se kroz AI zajednicu.
“Kada je objavljeno da postoji model koji minimizira te greške, interesovanje je bilo ogromno. Dobio sam više od 30.000 e-mailova izvan Crne Gore, a iz same Crne Gore čak 120.000 poruka. Iskreno se izvinjavam svima kojima još nijesam odgovorio – trudim se da to postepeno učinim... Ljudi su bili zainteresovani da saznaju zašto sam kreirao Montenegro GPT i šta me je motivisalo. Kao što sam ranije rekao, crnogorski jezik nije bio u fokusu istraživača koji su trenirali OpenAI modele od 2019. do 2022. godine. Oni jednostavno nijesu imali taj jezik u vidu”, pojasnio je.
Kapisoda podsjeća i da je i na AI festivalu u Kanu, na kojem je učestvovao zbog svog redovnog posla, takođe bilo komentara i pitanja vezanih za MontenegroGPT, jer su tehnike koje je razvio mogle biti primijenjene i u kompaniji u kojoj radi, posebno u domenu validiranja odgovora na pitanja.
“Iskustvo u Kanu bilo je zaista nevjerovatno – ljudi su me prepoznali i počeli da razgovaraju sa mnom o modelu. Bilo mi je fascinantno da je nešto što sam razvio samostalno izazvalo toliku pažnju u AI zajednici”, ispričao je naš sagovornik.
Dodatnu motivaciju je, kako je naglasio, imao i zbog toga što spada u one Crnogorce u inostranstvu koji u svakodnevnom životu nemaju mnogo prilika da govore crnogorskim jezikom.
“Možda je upravo to što živim van Crne Gore bila dodatna motivacija da doprinesem crnogorskoj zajednici na ovaj način. Crna Gora zaslužuje da ima snažan jezični model, i ponosan sam što sam to ostvario. Ljudi su bili impresionirani ne samo tehničkim aspektima modela, već i mojom ličnom motivacijom”, dodavši da je jedan od načina da crnogorski jezik opstane u digitalnom svijetu upravo Montenegro GPT.
Pored činjenice da je u ovom jezičkom modelu eliminisana pojava AI “halucinacija”, MontenegroGPT takođe ima još jednu važnu karakteristiku o kojoj se razmišljalo prilikom kreiranja, a to je zaštita privatnosti korisnika i njihovih podataka.
“Montenegro GPT je razvijen uz poštovanje evropskog AI akta, koji stupa na snagu naredne godine. Već u julu ove godine biće predstavljen kodeks koji će regulisati način na koji se AI programira i koristi, a upravo te regulative bile su mi vodilja. Ključno pitanje jeste – gdje se nalazi model? Na kojim serverima? Da li je smješten u Evropskoj uniji, kao što je to slučaj sa mnogim evropskim modelima, ili u Kini, poput DeepSeeka, ili možda koristi infrastrukturu OpenAI-a, koji svoje servere ima širom svijeta? Mi, kao i druge kompanije, koristimo različite infrastrukturne partnere, ali osnovno pravilo jeste da serveri moraju biti u skladu s GDPR regulativom i pravilima zaštite podataka. To je prva ključna stvar”, istakao je naš sagovornik.
Druga bitna razlika Montenegro GPT-a u odnosu na OpenAI jeste način upravljanja podacima.
“OpenAI prikuplja određene informacije kako bi spriječio zloupotrebe – na primjer, ako korisnik pokuša da generiše nezakonit sadržaj, OpenAI može privremeno da zadrži podatke do 30 dana radi kontrole. To je legitimna praksa. Međutim, moj pristup je drugačiji. Montenegro GPT koristi sistem monitoringa, ali bez direktnog povezivanja podataka s identitetom korisnika. Umjesto toga, postoji nezavisna komisija u Austriji koja procjenjuje da li je određeni sadržaj problematičan. Ako postoji potreba za daljom istragom, tek tada se pristupa IP adresama i relevantnim pravnim procedurama. Ovaj sistem omogućava neophodnu kontrolu, ali uz poštovanje privatnosti korisnika”, dodao je Kapisoda.
On je naglasio da, dok se čeka početak zvanične primjene AI akta sljedeće godine, ovo rješenje predstavlja prelazno, ali efikasno sredstvo zaštite podataka.
Dodao je i da je Montenegro GPT sertifikovan kao prvi crnogorski digitalni AI model. To znači da će od sljedećeg mjeseca postojati mogućnost procjene usklađenosti drugih AI modela u Crnoj Gori s evropskim regulativama. Ako neka kompanija želi da implementira AI rješenja, moći će provjeriti da li ispunjava sve standarde privatnosti i etike.
“Zamislimo situaciju u kojoj kineska kompanija razvije revolucionarni AI model. Korisnici bi trebalo da se zapitaju – da li bi željeli da se njihova pitanja, postavljena nekom AI modelu, kasnije koriste i monetizuju bez njihovog znanja”, upitao je Kapisoda, naglasivši da je regulatorni okvir u Kini potpuno drugačiji, da ne štiti korisničke podatke i da zbog toga nikada ne bi koristio jezički model DeepSeek, jer, kako je precizirao, to jednog dana može postati jako opasno, ne samo zbog pojedinaca kao korisnika tih platformi, nego i zbog države i nacionalne sigurnosti.
Kapisoda je najavio da će u budućnosti predstaviti i druge
Kapisoda je naglasio da je MontenegroGPT tek početak njegovog rada na primjeni vještačke inteligencije u svrhu zaštite crnogorske jezičke i kulturne baštine, najavivši da će naredni projekat o ovoj oblasti biti NjegošGPT, koji će na osnovu djela ovog crnogorskog pjesnika i vladara pronići u njegov način razmišljanja i omogućiti da saznamo kako bi Petar II Petrović Njegoš danas odgovorio na neka pitanja ili reagovao na informacije koje bi saznao.
Hoggar
Od 15 veka u Istanbulu na Porti bila su samo dva zvanična jezika, crnogorski i turski.Kasnije na pritisak sultana i hrvatski da bi početkom 16 veka i bošnjački.
Slqvko
Ovome mladom čovjeku,patrioti,naklon do poda,pokazao je kako se i po pitanju Crnogorskog jezika,brani naš nacionalni identitet.Fali riječi da opišem ushićenje,zadovoljstvo ...ovim radom gospodina Kapisode.
Delboj
Moramo imati crnogorski o na sve veće adrese za prevodjenje i sli