В Казахстане разработана большая языковая модель KazLLM

Контекст дня — 14 декабря 2024 09:00

Проект реализован Институтом Умных Систем и Искусственного Интеллекта (ISSAI) при Nazarbayev University при поддержке МЦРИАП и МНВО РК.

В Казахстане завершена разработка языковой модели KazLLM, обученной на основе 148 млрд токенов на казахском, русском, английском и турецком языках, сообщает Exclusive.kz со ссылкой на пресс-службу Минцифры.

Модель доступна для научного сообщества, стартапов и корпораций и станет основой для создания TurkLLM — проекта по развитию технологий обработки языка в тюркоязычных странах, что соответствует инициативе Президента РК.

KazLLM создана в двух версиях — на 8 и 70 миллиардах параметров, превосходящих аналоги по качеству и точности. Модель оптимизирована для работы как на мощных серверах, так и на персональных устройствах. Её применение включает чат-боты, системы автоматизации документооборота, анализ данных, образовательные приложения и инструменты для медиа.

Ключевыми партнерами в создании национальной языковой модели стали Beeline Казахстан и его ИТ-компания QazCode. Объединив усилия и опыт в разработке языковых моделей, таких как Kaz-RoBERTA, а также в создании ИИ-решений для малых языковых групп в партнерстве с зарубежными организациями, компании сыграли важную роль в создании инновационной и доступной модели для казахстанцев. Серверы с 8 DGX H100 ускорили обучение модели, которое заняло 50 дней.

Отмечается, что KazLLM направлена на преодоление языкового барьера и развитие национальной AI-инфраструктуры.

Фото: Gov.kz

Комментариев пока нет

Все комментарии проходят предварительную модерацию редакцией и появляются не сразу.

Рекомендуемое

📌 «Роскомнадзору» не нравятся новости Exclusive.kz о смертях украинцев

17 марта 1
📌 Задержан Санжар Бокаев – его обвиняют в хищениях и лжи

18 марта 0
Last.fm заблокировал пользователей из России и Центральной Азии

25 марта 4