Державна архівна служба України надала 10 терабайтів даних для навчання національної мовної моделі "Сяйво".
Цю інформацію оприлюднило Міністерство цифрових технологій, інформує Укрінформ.
Уявіть собі обсяг даних, еквівалентний 70 тисячам книжок. Це 10 терабайтів унікальних історичних документів, державних архівів та наукових текстів, які вперше передала Державна архівна служба України для навчання національної мовної моделі "Сяйво", згідно з інформацією в офіційному повідомленні.
Важливо зазначити, що це перший випадок, коли Укрдержархів надає інформацію для підтримки розвитку цифрових сервісів в Україні. До завершення року кількість цифрових копій державних архівів зросте з 150 мільйонів до більш ніж 200 мільйонів — це один з найшвидших темпів оцифрування архівної спадщини у світі.
Модель вивчатиме історичні джерела, рукописи, закони, судові рішення, медіаматеріали та словники.
На сьогоднішній день більше 50 партнерів Міністерства цифрової трансформації, включаючи медіа, університети, бібліотеки та інші організації, забезпечують матеріали для навчання великих мовних моделей.
У червні 2025 року Міністерство цифрової трансформації України в партнерстві з компанією "Київстар" уклали угоду про співпрацю, метою якої є розробка національної великої мовної моделі (LLM). Ця модель стане основою для впровадження штучного інтелекту в державний сектор, оборону та бізнес-середовище. Наразі триває процес збору даних, необхідних для навчання LLM, а бета-тестування заплановано на весну 2026 року.
#Укрінформ #Міністерство цифрової трансформації #Бібліотека #Університет #Словник #Штучний інтелект #Бізнес #Магістр права #Терабайт #«Київстар» #Державна архівна служба України