В Казахстане разработана большая языковая модель KazLLM
Проект реализован Институтом Умных Систем и Искусственного Интеллекта (ISSAI) при Nazarbayev University при поддержке МЦРИАП и МНВО РК.
В Казахстане завершена разработка языковой модели KazLLM, обученной на основе 148 млрд токенов на казахском, русском, английском и турецком языках, сообщает Exclusive.kz со ссылкой на пресс-службу Минцифры.
Модель доступна для научного сообщества, стартапов и корпораций и станет основой для создания TurkLLM — проекта по развитию технологий обработки языка в тюркоязычных странах, что соответствует инициативе Президента РК.
KazLLM создана в двух версиях — на 8 и 70 миллиардах параметров, превосходящих аналоги по качеству и точности. Модель оптимизирована для работы как на мощных серверах, так и на персональных устройствах. Её применение включает чат-боты, системы автоматизации документооборота, анализ данных, образовательные приложения и инструменты для медиа.
Ключевыми партнерами в создании национальной языковой модели стали Beeline Казахстан и его ИТ-компания QazCode. Объединив усилия и опыт в разработке языковых моделей, таких как Kaz-RoBERTA, а также в создании ИИ-решений для малых языковых групп в партнерстве с зарубежными организациями, компании сыграли важную роль в создании инновационной и доступной модели для казахстанцев. Серверы с 8 DGX H100 ускорили обучение модели, которое заняло 50 дней.
Отмечается, что KazLLM направлена на преодоление языкового барьера и развитие национальной AI-инфраструктуры.
Фото: Gov.kz
Комментариев пока нет