საუკუნეების წინ დაწერილი იოანე ზოსიმეს ტექსტი, „ქებაჲ და დიდებაჲ ქართულისა ენისაჲ“, დღეს სრულიად ახალ მნიშვნელობას იძენს. ხელოვნური ინტელექტის ეპოქაში ზოსიმეს ტექსტი შეიძლება წავიკითხოთ როგორც ქართული ენის ციფრული გასაღები, მინიშნება, რომ ქართული ენის ღრმა ლოგიკა თავად ენის შიგნით უნდა ვეძებოთ.
სწორედ ეს ტექსტი გახდა ერთ-ერთი მთავარი საწყისი წერტილი BTU-ს ქართული ენის ციფრული სუვერენიტეტის პროექტისა, რომლის მიზანიცაა ხელოვნური ინტელექტის ეპოქაში ქართულმა ენამ არ დაკარგოს თავისი აზრობრივი სიზუსტე, გრამატიკული ლოგიკა და კულტურული სიღრმე.
როგორ უნდა გაიგოს AI-მ ქართული ენა სწორად? ამ კითხვაზე პასუხი მხოლოდ ტექსტების რაოდენობაში არ არის. AI-ს შეიძლება მივცეთ მილიონობით ქართული წინადადება, მაგრამ თუ მან ვერ დაინახა, როგორ მუშაობს ქართული ზმნა, ბრუნვა, ზმნისწინი, ნაგულისხმევი ობიექტი, კონტექსტი, იდიომი და ღირებულებითი შრე, ის ქართულად მხოლოდ ზედაპირულად იმუშავებს.
სწორედ აქ ჩნდება ზოსიმეს ტექსტის მნიშვნელობა და უნიკალურობა. ის მიგვანიშნებს, რომ ქართული ენის ღრმა მნიშვნელობა გარედან კი არ უნდა აიხსნას, არამედ თავად ქართული ენის შიგნით უნდა მოიძებნოს. ეს ნიშნავს, რომ თუ ქართული ენის ძალა მის შიდა სტრუქტურაშია, მაშინ XXI საუკუნეში ეს სტრუქტურა უნდა აღიწეროს, დაიშალოს, გაიზომოს და AI-სთვის გასაგებ ფორმად გადაიქცეს.
ამ იდეამ საფუძველი დაუდო მნიშვნელოვან ეროვნულ სამუშაოს - ქართული ენის სიღრმისეული ინფორმაციულ-მათემატიკური მოდელის შექმნას. პროექტში ზოსიმეს ტექსტი განიხილება როგორც მეტა-კოდი. მეტა-კოდი ნიშნავს იმ ღრმა საწყის ლოგიკას, რომელიც გვეუბნება, სად უნდა ვეძებოთ ენის მთავარი სტრუქტურა. ზოსიმეს ტექსტმა სწორედ ასეთი როლი შეასრულა. მან ქართული ენის ისტორიული ღირსება თანამედროვე ტექნოლოგიურ ამოცანად გადააქცია. მარტივად რომ ვთქვათ, დღეს AI-მ ქართულად მხოლოდ არ უნდა დაწეროს. AI-მ ქართული შიგნიდან უნდა გაიგოს.
ქართული ენა განსაკუთრებით რთულია ხელოვნური ინტელექტისთვის, რადგან ზმნის ერთი ფორმა ძალიან ბევრ ინფორმაციას შეიძლება მოიცავდეს. მაგალითად, ფორმა „მოგატანინებდი“ არ არის მხოლოდ ერთი სიტყვა. მასში ჩანს მოქმედი პირი, ადრესატი, მესამე შემსრულებელი, მიმართულება, მიზეზობრიობა და პირობითობა. სხვა ენაზე ამ აზრის გადმოსაცემად შეიძლება მთლიანი წინადადება გახდეს საჭირო.
ხელოვნურმა ინტელექტმა შინაარსი სრულად რომ გაიგოს, საჭიროა არა მხოლოდ ლექსიკონი და ტექსტების ბაზა, არამედ ენის შიდა კოდის ანალიზი. BTU-მ, საკუთარი ხელოვნური ინტელექტის BTUAI-ის დახმარებით, დაიწყო სწორედ ამ შიდა კოდის პილოტური მოდელირება. პროექტის ამოცანაა ქართული ენა დაიშალოს იმ ფენებად, რომლებიც AI-ს დაეხმარება მნიშვნელობის სწორად აღდგენაში.
ეს პროექტი კი პირდაპირ დაუკავშირდა ზოსიმეს ისტორიულ ტექსტს. ზოსიმემ დასვა დიდი კულტურული კითხვა - რა ინახება ქართულ ენაში? BTU-ს პროექტი ამ კითხვას თანამედროვე ენაზე აგრძელებს - როგორ უნდა გახდეს ეს შიდა ლოგიკა AI-სთვის გასაგები? და ამავდროულად, პასუხსაც ამზადებს.
ბიზნესისა და ტექნოლოგიების უნივერსიტეტის პროექტის მიზანი არა მხოლოდ ქართული ტექსტების შეგროვება, არამედ ქართული ენის სიღრმისეული მათემატიკური მოდელის შექმნაა. ეს იქნება მოდელი, რომელიც ქართულს აღწერს არა მხოლოდ სიტყვებით, არამედ როლებით, კავშირებით, კონტექსტით და ფარული მნიშვნელობებით.
BTU-ს მიერ დაწყებული სამუშაო მოიცავს ზმნის ფორმების ანალიზს, წინადადებების ანოტაციას, იდიომური და ღირებულებითი ფრაზების ოპერაციულ კოდირებას, ბირთვული ცნებების სემანტიკურ რუკას, AI შეცდომების ტიპოლოგიას და ქართული AI-ის საწყის არქიტექტურას.
როგორც პროექტის ავტორები განმარტავენ, ქართული ენის ციფრული სუვერენიტეტი ნიშნავს, რომ ქართული ენა AI-ს ეპოქაში არ უნდა დარჩეს უცხო ენობრივი მოდელების ზედაპირულ დამუშავებაზე დამოკიდებული. ქართულს სჭირდება საკუთარი შიდა ლოგიკით აღწერილი ციფრული ინფრასტრუქტურა.
ზოსიმეს ტექსტმა ამ პროცესში სიმბოლური და შინაარსობრივად მნიშვნელოვანი როლი შეასრულა. ის პირდაპირ მიგვანიშნებს, რომ ქართული ენის ღრმა მნიშვნელობა თავად ქართულში უნდა ვეძებოთ. BTU-მ კი ამ იდეით დაიწყო პროექტი, რომელიც მიზნად ისახავს ქართული ენის შიდა კოდი გახდეს აღწერადი, გაზომვადი და AI-სთვის გასაგები.
სწორედ ამიტომ ზოსიმეს ტექსტი დღეს შეიძლება ჩაითვალოს არა მხოლოდ ქართული ენის ისტორიულ საგანძურად, არამედ ქართული ენის ციფრული მომავლის ერთ-ერთ პირველ გასაღებად.
(R)