ქართული ენის ეროვნული კორპუსი — ვირტუალური სივრცე, რომელიც მოიცავს ქართული ენის ისტორიული არსებობის განმავლობაში შექმნილი წერილობით ძეგლებსა და ქართული ენის ზეპირმეტყველების გაციფრებულ რესურსებს და საშუალებას აძლევს მომხმარებელს, გამოიყენოს იგი ლინგვისტური და ინტერდისციპლინარული - როგორც დიაქრონიული, ისე სინქრონული - კვლევებისათვის. ქართული ენის ეროვნული კორპუსი შეიქმნა საერთაშორისო სამეცნიერო პროექტების ფარგლებში გერმანელი და ქართველი მეცნიერების თანამშრომლობის შედეგად.
ენის ეროვნული კორპუსი არის სახელმწიფო ენისათვის შექმნილი ვირტუალური სივრცე, რომელშიც განთავსებულია სახელმწიფო ენის ისტორიული და თანამედროვე მემკვიდრეობა ელექტრონული რესურსების სახით. ენის ეროვნული კორპუსი სახელმწიფო ენის სტატუსით აღჭურვილი ენისათვის შექმნილი კორპუსია, რომელიც გამოიყენება როგორც სახელმწიფო ინტერესებისათვის (სახელმწიფო ენის ნორმალიზაცია-სტანდარტიზაცია, ენის ეკოლოგიის დაცვა, ენობრივი პოლიტიკის დაგეგმვა და ა.შ.), ისე ქვეყანაში მეცნიერების სხვადასხვა დარგის, განსაკუთრებით ციფრული ჰუმანიტარიის განვითარებისათვის. ეროვნული კორპუსი სახელმწიფო ენაზე ზრუნვის განხორციელებისათვის ეფექტიანი და მეთოდურად გამართული საშუალებაა, რაზედაც მეტყველებს, მაგ., ინგლისური ენისათვის შექმნილი სამი კორპუსის არსებობა: ბრიტანული ეროვნული კორპუსი, ამერიკული ეროვნული კორპუსი, ავსტრალიური ეროვნული კორპუსი. მიუხედავად იმისა, რომ სამივე დასახელებული კორპუსი ინგლისური ენის რესურსების ნაკრებს წარმოადგენს, თითოეული მათგანი შესაბამისი ქვეყნის სახელმწიფო ენის (ბრიტანული ინგლისური, ამერიკული ინგლისური, ავსტრალიური ინგლისური) ამსახველი ელექტრონული რესურსების სტრუქტურირებულ მონაცემთა ბანკია.
ქართული ენისათვის პირველი ელექტრონული რესურსების შექმნა და ქართული დამწერლობის უმნიშვნელოვანესი ძეგლების გაციფრება დაკავშირებულია გერმანელი ქართველოლოგის პროფ. იოსტ გიპერტის სახელთან. ინდოევროპული ენების ისტორიული კორპუსის TITUS (Thesaurus Indogermanischer Text- und Sprachmaterialien) შემქმნელი გერმანელი მეცნიერი ქართველური ენებით ჯერ კიდევ გასული საუკუნის 80-იან წლებში დაინტერესდა და სწორედ ამ პერიოდში დაიწყო ქართული ხელნაწერების ბეჭდური გამოცემების პირველი ციფრული ვერსიის შექმნა ქართული ენის თანამედროვე ტექნოლოგიებით კვლევის მიზნით. ამ პერიოდში იოსტ გიპერტი ახორციელებს ძველი ქართული ენის ძეგლების გაციფრებას და იწყებს ქართული ენის ისტორიული კორპუსისათვის საფუძვლის მომზადებას. პირველი ციფრული კორპუსი ძველი ქართული ენისათვის მოიცავდა ძველ ქართულ ბიბლიურ ტექსტებს, აპოკრიფებსა და კომენტარებს, აგიოგრაფიულ და ჰომილეტიკურ ტექსტებს, როგორიცაა ძველი აღთქმის ოშკისა და იერუსალიმის რედაქცია, ფსალმუნნი (A რედაქცია), პარიზის ლექციონარი, ახალი აღთქმის აპოკრიფები და სხვ. ასევე, წამებაჲ წმიდისა შუშანიკისი, მარტვილობაჲ და მოთმინებაჲ წმიდისა ევსტათი მცხეთელისაჲ, წამებაჲ წმიდისა და ნეტარისი მოწამისა ქრისტესა ჰაბოჲსი, მოქცევაჲ ქართლისაჲ, ცხოვრებაჲ და წამებაჲ წმიდისა მოწამისა კოსტანტინისი ქართველისაჲ, წამებაჲ ყრმათა წმიდათაჲ რიცხვით ცხრათაჲ, ცხოვრებაჲ წმიდისა მამისა ჩუენისა იოვანე ზედაზნელისაჲ (A და B რედაქციები), ცხოვრებაჲ და მოქალაქობაჲ მამისა ჩუენისაჲ დავით გარესჯელისაჲ, მოქალაქობაჲ და წამებაჲ წმიდისა აბიბოს ნეკრესელ ეპისკოპოსისაჲ (A და B რედაქციები), ცხოვრებაჲ და მოქალაქობაჲ და ღუაწლი წმიდისა და ღირსისა დედისა ჩუენისა ნინოჲსი და მრავალი სხვა; ასევე ძეგლები ნათარგმნი აგიოგრაფიული, ჰომილეტიკური და ეგზეგეტიკური ტექსტები S-1141 და Ath-8. (57) ხელნაწერებიდან და სხვ. იოსტ გიპერტის მიერ მომზადებული ძველი ქართული ენის კორპუსი, რომელშიც 100-მდე ტექსტი გაერთიანდა, აღჭურვილი მეტამონაცემებითა და საძიებო სისტემით, განთავსდა ფრანკფურტის უნივერსიტეტის TITUS-ის პლატფორმაზე და დღემდე მოიხმარება მკვლევართა მიერ, როგორც საერთაშორისო მიმოქცევის პროდუქტი.
ქართული ენის კორპუსისათვის ელექტრონული რესურსების მიზნობრივი შექმნა 1995 წლიდან დაიწყო და რამდენიმე ეტაპად ხორციელდებოდა:
1995-99 წლებში იოსტ გიპერტი ქართველ მეცნიერებთან თანამშრომლობით იწყებს ქართული ენის ისტორიული კორპუსის გაფართოებას და ძველი და საშუალი ქართულის ელექტრონული რესურსების მომზადებას და მათ განთავსებას TITUS-ის პლატფორმაზე. ამ პერიოდში გიპერტთან აქტიურად თანამშრომლობენ ქართველ მეცნიერთა მთელი პლეადა: ვ. იმნაიშვილი, ზ. სარჯველაძე, ლ. ქაჯაია, დ. თვალთვაძე, ა. ხარანაული, ვ. წამალაშვილი, მ. ბაბუხადია, ლ. ბასილაია, ნ. დობორჯგინიძე, თ კარსანიძე, მ. მაჩხანელი, ნ. შარაშენიძე, თ. ცოფურაშვილი, ნ. შუღლაძე, თ. ცქიტიშვილი, ს. სარჯველაძე, ქ. გოჩიტაშვილი, ნ. დათუკიშვილი, ნ. ლოლაძე, ა. მეფისაშვილი და სხვ.
1999-2012 წლებში იოსტ გიპერტი ქართველ მეცნიერებთან თანამშრომლობას ფოლკსვაგენის ფონდის მხარდაჭერით საერთაშორისო პროექტების ფარგლებში აგრძელებს. ქართული ენის კორპუსის შექმნის მეორე ეტაპზე კორპუსის შექმნაში არა მხოლოდ ცალკეული ქართველი მეცნიერები, არამედ ქართული კვლევითი და საგანმანათლებლო ინსტიტუციებიც არიან ჩართული. 1999 წლიდან 2012 წლამდე 8 ჯგუფური საერთაშორისო სამეცნიერო პროექტი და 7 ქართველი მეცნიერის ინდივიდუალური პროექტი განხორციელდა იოსტ გიპერტისა და მანანა თანდაშვილის ხელმძღვანელობით, რომლის საერთო ღირებულება 1, 5 მილიონ ევროს შეადგენს:
აღნიშნული პროექტების განხორციელებაში მონაწილეობას იღებდა 200-ზე მეტი ქართველი მეცნიერი და ახალგაზრდა თაობის წარმომადგენელი საქართველოს სხვადასხვა კვლევითი და სასწავლო დაწესებულებებიდან. მათ შორის იყვნენ მზ. შანიძე, თ. გამყრელიძე, ზ. ალექსიძე, ზ. სარჯველაძე, ვ. იმნაიშვილი, დ. მელიქიშვილი, თ. უთურგაიძე, ი. ჩანტლაძე, გ. გოგოლაშვილი, დ. თვალთვაძე, ა. ხარანაული, ქ. დათუკიშვილი, ნ. ჭუმბურიძე, ნ. ლოლაძე, მ. ბაბუხადია, ნ. დობორჯგინიძე, მ. მაჩხანელი, ნ. შარაშენიძე, კ. გაბუნია, ჭ. ქირია, ლ. ეზუგბაია, რ. ქურდაძე, მ. მანჯგალაძე, მ. საღლიანი, რ. იოსელიანი, ქ. მარგიანი, ე. გიუნაშვილი, მ. მაჩხანელი, ტ. სიხარულიძე, რ. აბაშია, ლ. ქაროსანიძე, თ. ლომთაძე, დ. ჩიტუნაშვილი, თ. აბაშიძე, ხ. თოდუა, ბ. თოფურია, ვ. კვანტრიშვილი, გ. ალექსიძე, გ. შაბაშვილი, ლ. ციხელაშვილი, ნ. დანელია და სხვ. ქართული ენის კორპუსის შექმნის მეორე ეტაპზე კორპუსი საგრძნობლად განივრცო გაციფრებული რესურსებით, ძველი და საშუალი ქართულის ორიგინალური და ნათარგმნი ძეგლებით, როგორიცაა გრაცის ხანმეტი ლექციონარი (ი. გიპერტი, ვ. იმნაიშვილი, ზ.სარჯველაძე), ხანმეტი პალიმფსესტი A89 / A844 (ლ. ქაჯაია, ი. გიპერტი), ვენის ხანმეტი პალიმფსესტი[მკვდარი ბმული] (ი. გიპერტი, ზ. სარჯველაძე, ლ. ქაჯაია), სახარების ადიშის რედაქცია (ი. გიპერტი, ვ. იმნაიშვილი, ზ. სარჯველაძე, ს. სარჯველაძე, დ.თვალთვაძე), მცხეთის ბიბლია (ი. გიპერტი, ა. ხარანაული, ქ. დათუკიშვილი, ნ. ლოლაძე, ს. სარჯველაძე, დ. თვალთვაძე, ნ. ჭუმბურიძე), http://titus.uni-frankfurt.de/texte/etcs/cauc/ageo/nt/pavlecd/pavle.htm პავლენი[მკვდარი ბმული] (ი. გიპერტი, ვ. იმნაიშვილი, ს. სარჯველაძე, დ. თვალთვაძე), საქმენი მოციქულთანი (ი. გიპერტი, ვ. იმნაიშვილი), კათოლიკეთა ეპისტოლენი (ი. გიპერტი, ვ. იმნაიშვილი), იოანეს გამოცხადება (ი. გიპერტი, ვ. იმნაიშვილი), ქებათა ქება - G რედაქცია (ზ. სარჯველაძე) პეიკოპები ძველი და ახალი აღთქმიდან (ი. გიპერი, ს. სარჯველაძე, დ. თვალთვაძე), შოთა რუსთაველი, ვეფხისტყაოსანი (ი. გიპერტი, ვ. იმნაიშვილი), ვისრამიანი (ი. გიპერტი, თ. აბაშიძე, ხ. თოდუა), არჩილიანი (მეფე არჩილისი სხვა პოეტური ტექსტები) (პ. ოლივიერი, ი. გიპერტი, ა. მეფისაშვილი), ჩახრუხაძე, თამარიანი (ი. გიპერტი, ვ. იმნაიშვილი), შავთელი, აბდულმესიანი (ი. გიპერტი, ვ. იმნაიშვილი), მოსე ხონელი, ამირანდარეჯანიანი (ი. გიპერტი, ნ. ჭუმბურიძე) და სხვ.
ქართული ენის კორპუსის შექმნაში მონაწილეობდნენ საქართველოს სხვადასხვა სამეცნიერო-კვლევითი და საგანმანათლებლო ინსტიტუციები საქართველოს ყველა რეგიონიდან, მათ შორის სამეცნიერო აკადემიები, უნივერსიტეტები, კვლევითი ინსტიტუტები და მუზეუმები:
1984-2012 წლებში იოსტ გიპერტის ხელმძღვანელობით და ქართველი მეცნიერების აქტიური მონაწილეობით თავი მოეყარა ქართული ენის ისტორიული არსებობის განმავლობაში შექმნილ უზარმაზარ კორპუსს - უძველესი წარწერებიდან მოყოლებული ბესიკის ჩათვლით - და მოიცავს V-XVIII საუკუნეების ქართული დამწერლობის უმნიშვნელოვანეს ძეგლებს, მათ შორის უცხოეთის ბიბლიოთეკებში, უნივერსიტეტებსა და მონასტრებში დაცულ პალიმფსესტურ ხელნაწერებს.
ქართული ენის ეროვნული კორპუსის შექმნა დაიწყო 2012 წელს, როდესაც ფოლკსვაგენის ფონდმა დააფინანსა იოსტ გიპერტისა და მანანა თანდაშვილის მიერ წარდგენილი საერთაშორისო სამეცნიერო პროექტი „ქართული ენის ეროვნული კორპუსი: ტექნოლოგიური ჩარჩოს შექმნა“ (2012-2014). ქართული ენის ეროვნული კორპუსის ელექტრონული რესურსების საფუძველს წარმოადგენდა ის ელექტრონული რესურსების ნაკრები, რომელიც იქმნებოდა სამეცნიერო პროექტების სახით ფრანკფურტის გოეთეს სახ. უნივერსიტეტის ემპირიული ენათმეცნიერების ინსტიტუტში გერმანელ და ქართველ მეცნიერთა მონაწილეობით და განთავსებული იყო გერმანიაში (TITUS-სა და ARMAZI-ს ქართული რესურსები), ნორვეგიაში (Clarino), ჰოლანდიასა (Max Plank Institute, Language Archive) და საქართველოში (დიალექტური კორპუსი, Opentext, lib.ge).
ამდენად, ქართული ენის ეროვნული კორპუსი ეყრდნობა დიგიტალურ რესურსებს, რომელიც გასული საუკუნის 80-იანი წლებიდან იქმნებოდა საქართველოსა და მის ფარგლებს გარეთ და მოიცავს როგორც წერილობით, ისე ზეპირმეტყველების წერილობით დოკუმენტირებულ და გაციფრებულ რესურსებს:
ქართული ენის ეროვნული კორპუსი დღევანდელი მონაცემების მიხედვით 130 მილიონი ტოკენის, ანუ სიტყვაფორმის მომცველია (შდრ. ბრიტანული ეროვნული კორპუსი - 100 მილიონი ტოკენი, სომხური ეროვნული კორპუსი - 110 მილიონი ტოკენი, რუსული ეროვნული კორპუსი - 150 მილიონი ტოკენი). მასში შესულია როგორც ქართული ენის ისტორიული მემკვიდრეობა (V-XVIII საუკუნეების ლიტერატურული და ისტორიული ძეგლები), ისე XIX-XX საუკუნეების ქართული ლიტერატურა და 90-იანი წლებიდან მოყოლებული ქართული პრესა. ამჟამად მიმდინარეობს ქართული ენის კორპუსის XIX და XX საუკუნეების პრესის მასალებით განვრცობა. კორპუსის შექმნის არსებით მიზანს წარმოადგენს კორპუსის ჟანრობრივი დაბალანსება, კერძოდ სამეცნიერო, იურიდიული, პოლიტიკური და სოციოლექტური მასალებით მისი გაჯერება.
2013 წლის 29 სექტემბერს ხელი მოეწერა ურთიერთთანამშრომლობის მემორანდუმს ფრანკფურტის გოეთეს სახ. უნივერსიტეტის ემპირიული ენათმეცნიერების ინსტიტუტსა და საქართველოს პარლამენტის ეროვნულ ბიბლიოთეკას შორის, რომელიც ითვალისწინებს ფრანკფურტის უნივერსიტეტში განთავსებული ქართული ენის ეროვნული კორპუსის საქართველოში გადმოტანას და გრძელვადიან თანამშრომლობას ქართული ენის ეროვნული კორპუსის შემდგომი განვითარების მიზნით. ქართული ენის ეროვნული კორპუსის განვითარების შესახებ თანამშრომლობა სამი ეტაპისგან შედგება:
ქართული ენის ეროვნული კორპუსის კონცეფცია და განვითარების გეგმა შედგენილია კორპუსის დირექტორიუმის მიერ, რომელშიც შედიან:
ქართული ენის ეროვნული კორპუსის შექმნას აქვს როგორც სახელმწიფოებრივი, ისე სამეცნიერო და საზოგადოებრივი მნიშვნელობა.