თანამედროვე ციფრულ ეპოქაში, ხელოვნური ინტელექტი ყოველდღიური ცხოვრებისა და პროფესიული საქმიანობის განუყოფელი ნაწილია. სწორედ ამიტომ ენობრივი თავსებადობის საკითხი განსაკუთრებით მწვავედ დგება. ერთი შეხედვით, გლობალური ენობრივი მოდელები ქართულად თავისუფლად პასუხობენ, თარგმნიან და ქმნიან ტექსტებს, თუმცა რეალობა ბევრად უფრო კომპლექსურია. მთავარი გამოწვევა ისაა, რომ ხელოვნურ ინტელექტს ქართული ენა ხშირად მხოლოდ ზედაპირულად, სიტყვების დონეზე ესმის და ვერ აღიქვამს იმ ღრმა, შინაგან სტრუქტურას, რომელიც ქართულად მოაზროვნე ადამიანისთვის ბუნებრივი და ინტუიციურია. ქართული ენის სირთულე ხელოვნური ინტელექტის სისტემებისთვის არა უბრალოდ მწირი ლექსიკური მარაგით, არამედ მისი უნიკალური გრამატიკული და სემანტიკური თავისებურებებით არის განპირობებული.
ენის დამუშავებისას ხელოვნური ინტელექტის მოდელები ძირითადად სიტყვათა თანმიმდევრობასა და სტატისტიკურ ალბათობებს ეყრდნობიან. ეს კარგად მუშაობს ისეთ ანალიტიკურ ენებზე, როგორიც ინგლისურია. ქართული ენა კი სრულიად განსხვავებულ ლოგიკას ეფუძნება. აქ წინადადების მთავარი დატვირთვა და აზრობრივი ცენტრი ზმნაშია კონცენტრირებული. ქართულ ზმნას გააჩნია უნიკალური უნარი, ერთდროულად მოიცვას ინფორმაცია მოქმედი პირის, მოქმედების მიმართულების, მისი დასრულებულობის, სუბიექტ-ობიექტური დამოკიდებულებისა და თავად კონტექსტის შესახებ. როდესაც ხელოვნური ინტელექტი ცდება, ეს ხდება არა იმიტომ, რომ მან კონკრეტული სიტყვის მნიშვნელობა არ იცის, არამედ იმიტომ, რომ წინადადების შიდა კავშირებს ვერ კითხულობს სათანადო სიზუსტით. სისტემას უჭირს იმის გარჩევა, თუ ვინ მოქმედებს წინადადებაში, ვის ეხება ეს მოქმედება, რა ფუნქციური დატვირთვა აქვს ამა თუ იმ ბრუნვას ან როგორ ცვლის კონტექსტს თუნდაც ერთი უმნიშვნელო ზმნისწინი. შედეგად, ხელოვნური ინტელექტის მიერ გენერირებული ტექსტი გარეგნულად შეიძლება გამართული ჩანდეს, მაგრამ მისი რეალური, ავთენტური შინაარსი ნაწილობრივ ან სრულად დაიკარგოს.
ამ გამოწვევის საპასუხოდ, ბიზნესისა და ტექნოლოგიების უნივერსიტეტმა ქართული ენის ინფორმაციულ-მათემატიკური მოდელირების მეტად ამბიციური პროექტი დაიწყო. მკვლევრები აღნიშნავენ, რომ ხელოვნური ინტელექტისთვის ქართულის სწავლება მხოლოდ დიდი მოცულობის ტექსტური ბაზების მიწოდებას არ ნიშნავს, რადგან ტექსტების უბრალო დაგროვება ენის შიდა ფენომენს ვერ ხსნის. ამის ნაცვლად, აუცილებელია ენის შიდა სტრუქტურის მათემატიკური და კოდირებული აღწერა. პროექტის ფარგლებში BTU-ს აკადემიურმა გუნდმა და მკვლევრებმა უკვე შექმნეს საწყისი არქიტექტურა, რომელიც ქართული ენის სრულმასშტაბიანი ციფრული ინფრასტრუქტურის საყრდენ ბაზისად შეიძლება იქცეს.
სწავლების ეს ახალი მეთოდოლოგია რამდენიმე უმნიშვნელოვანეს მიმართულებას მოიცავს. პირველ რიგში, დამუშავდა ქართული ზმნისა და მისი რთული ზმნური ფორმების კოდირება, რაც ხელოვნურ ინტელექტს ზმნის მრავალპიროვანი ბუნების აღქმაში ეხმარება. ამასთანავე, შეიქმნა ბუნებრივი ქართული წინადადებების სპეციალური ბაზა და აღიწერა ის ფრაზები, რომელთა პირდაპირი, სიტყვასიტყვითი თარგმანი შეუძლებელია. განსაკუთრებული ყურადღება დაეთმო ხელოვნური ინტელექტის მიერ დაშვებული შეცდომების ტიპების კლასიფიკაციას და სპეციალური AI-ტესტირების საწყისი მოდელის შემუშავებას. ეს პილოტური არქიტექტურა პრაქტიკულად აჩვენებს გზას, თუ როგორ უნდა გადაიტანოს ქვეყანამ ქართული ენის ღრმა სტრუქტურა ხელოვნური ინტელექტისთვის გასაგებ ციფრულ კოდში, რათა მომავალში სრულყოფილი ენობრივი მოდელი შეიქმნას.
(R)