В Україні продовжується процес збору інформації для розробки Національної великої мовної моделі (LLM), бета-тестування якої має відбутися у весняний період 2026 року.
Цю інформацію оприлюднив у Telegram перший віцепрем'єр-міністр і міністр цифрової трансформації Михайло Федоров, повідомляє Укрінформ.
"Нині триває найважливіша частина роботи -- збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями -- це терабайти унікальних даних", - йдеться в повідомленні.
Крім того, команда фахівців активно займається розробкою тестів для мовної моделі, що сприятиме оцінці та підвищенню її якості. Це дозволить зосередитися на ефективності та безпеці LLM.
Протягом найближчого місяця планується створення початкової бази текстів для навчання моделі, вдосконалення токенізатора — інструменту, що розбиває слова на складові елементи, щоб LLM могла обробляти мовні дані швидше та ефективніше, а також розробка тестів.
У січні також стартує голосування в "Дії" для обрання назви національної моделі.
Бета-версія тестування LLM намічена на весну 2026 року.
Як повідомлялося, на початку літа 2025 року Міністерство цифрової трансформації України та компанія "Київстар" підписали меморандум про співпрацю, яка передбачає створення національної великої мовної моделі (LLM) - основи для інтеграції ШІ в державний сектор, оборону та бізнес.
#Укрінформ #Міністерство цифрової трансформації #Інтернет #Органи державної влади #Михайло Федоров #Київстар #Університет #Штучний інтелект #Бізнес #Магістр права