საუკუნეების განმავლობაში, ქართული ენა ჩვენი კულტურული იდენტობის, ისტორიული მეხსიერებისა და ეროვნული თვითმყოფადობის მთავარი საყრდენი იყო. დღეს კი ის სრულიად ახალ, ციფრულ გამოცდას გადის. ხელოვნური ინტელექტის ეპოქაში, როცა კოდები ჩვენს ყოველდღიურობას მართავენ, ენის გადარჩენის ფორმულაც შეიცვალა.
ერთი შეხედვით, ტექნოლოგიურ სამყაროში ყველაფერი რიგზეა: ნებისმიერ პოპულარულ AI პლატფორმას შეგიძლიათ ქართულად დაუსვათ კითხვა, ისიც წამებში გიპასუხებთ, თარგმნის, წერს ან აჯამებს ტექსტებს. თუმცა, თუ პროცესს უფრო ღრმად დავაკვირდებით, უმთავრესი კითხვა მაინც ღიად რჩება: მართლა ესმის თუ არა ხელოვნურ ინტელექტს ქართული ენა ისე, როგორც ქართულად მოაზროვნე ადამიანს?
სწორედ ამ გამოწვევაზე საპასუხოდ და ქართული ენის მომავლის დასაცავად, ბიზნესისა და ტექნოლოგიების უნივერსიტეტმა მასშტაბური პროექტი, ქართული ენის ციფრული სუვერენიტეტის პროექტი დაიწყო.
როგორც წესი, ხელოვნური ინტელექტი ქართულში ხშირად ცდება არა იმიტომ, რომ რომელიმე კონკრეტული სიტყვის მნიშვნელობა არ იცის, არამედ იმიტომ, რომ წინადადების შიდა კავშირებსა და ფარულ ლოგიკას ვერ აღიქვამს.
ქართული ენა ხომ მხოლოდ სიტყვების მექანიკური თანმიმდევრობა არ არის. ჩვენს ენაში უმთავრესი აზრი ხშირად ზმნაში, ბრუნვაში, უმცირეს ზმნისწინში, სიტყვათა განლაგებასა და ისეთ კონტექსტურ ფრაზებში იმალება, რომელთა პირდაპირი, სიტყვა-სიტყვითი თარგმანი შეუძლებელია. თუ ხელოვნური ინტელექტი ამ სიღრმეს ვერ ხვდება, ის თითქოს გამართულ, გრამატიკულად სწორ ტექსტს დაწერს, მაგრამ შინაარსი ნაწილობრივ მაინც დაიკარგება. სწორედ ამიტომ, AI-სთვის ქართულის სწავლება მხოლოდ მილიონობით ტექსტის მექანიკურ დაგროვებას არ ნიშნავს — ამისათვის თავად ენის უნიკალური შიდა არქიტექტურის ციფრული აღწერაა საჭირო.
BTU-ს მკვლევრების მიერ გადადგმული პირველი ნაბიჯები
ბიზნესისა და ტექნოლოგიების უნივერსიტეტის აკადემიურმა გუნდმა და BTUAI Research Team-მა დაიწყეს ქართული ენის ინფორმაციულ-მათემატიკური მოდელირება. მათ უკვე შექმნეს საწყისი ციფრული ინფრასტრუქტურა, რომელიც სამომავლოდ სრულმასშტაბიანი ეროვნული ენობრივი მოდელის საფუძველი გახდება.
ამ ეტაპზე პროექტის ფარგლებში რამდენიმე უმნიშვნელოვანესი მიმართულება დამუშავდა:
რა არის ციფრული სუვერენიტეტი და რატომ გვეხება ის თითოეულ ჩვენგანს?
გლობალური ტექნოლოგიური გიგანტებისთვის ქართული ენა ე.წ. „მცირე ენების“ კატეგორიას მიეკუთვნება, მაგრამ ჩვენი ქვეყნისთვის ის საზოგადოებრივი ცხოვრების ყოველი სფეროს მამოძრავებელი ძალაა.
თუ ქართული ენა AI სისტემებში მხოლოდ ზედაპირულად იქნება წარმოდგენილი, მომავალში შეცდომები მხოლოდ უწყინარ თარგმანებში აღარ გაჩნდება. ეს შეცდომები ეტაპობრივად გადავა საგანმანათლებლო პლატფორმებში, მედიაში, იურიდიულ და სამართლებრივ დოკუმენტებში, ბიზნეს-კომუნიკაციასა და იმ საჯარო სერვისებში, რომლებსაც მოქალაქეები ყოველდღიურად ვიყენებთ.
ციფრული სუვერენიტეტი ნიშნავს მარტივ, მაგრამ ფუნდამენტურ რამეს: ქართული ენა ახალ ციფრულ ერაში არ უნდა დარჩეს მხოლოდ უცხოური ტექსტების გადასათარგმნ ინსტრუმენტად. ის გლობალურ ქსელში წარმოდგენილი უნდა იყოს როგორც დამოუკიდებელი, საკუთარი გრამატიკული და ინფორმაციული ლოგიკის მქონე სისტემა.
თუ ქართული ენა სწორად იქნება მოდელირებული, ხელოვნური ინტელექტი ქვეყნისთვის საფრთხედ კი არა, ენის გაძლიერების, უახლესი საგანმანათლებლო რესურსების შექმნისა და ქართული კულტურის საერთაშორისო ასპარეზზე სწორად პოზიციონირების საუკეთესო იარაღად იქცევა. ეს არის XXI საუკუნის ეროვნული დამოუკიდებლობისა და უსაფრთხოების ახალი ფრონტი.
(R)