Сможет ли искусственный интеллект поглотить Казахстан?
Вслед за созданием Комитета искусственного интеллекта при министерстве цифрового развития правительство Казахстана приняло Концепцию развития ИИ в стране до 2029 года. Exclusive.kz детально изучил содержание этого документа и проанализировал, насколько он вообще реалистичен.
Если ещё три года назад человечество не могло себе представить, чтобы робот на самом деле мог писать тексты и «рисовать» изображения по заказу человека, то теперь, после появления открытого доступа к ChatGPT, MidJourney, Stable Diffusion и другим подобным разработкам, это стало нашей реальностью. Всеми этими технологиями мы сейчас можем свободно пользоваться, хоть и они пока несовершенны и находятся на стадии своего развития.
По итогам 2023 года, Казахстан занимает 72 место из 193 в рейтинге готовности экономик различных стран к внедрению технологий с искусственным интеллектом. Аналитическое агентство Oxford Insights, которое составляет этот рейтинг, выделяет в качестве сильных сторон страны доступность данных, цифровой потенциал и адаптивность правовой базы к цифровым бизнес-моделям.
Аналитики считают, что Казахстан сильно продвинулся в генерации и сборе данных. В частности, большие объёмы информации о гражданах генерируют банковский, финансовый и телекоммуникационный секторы бизнеса. Помимо этого, в стране существует 183 официальных информационных систем центральных государственных органов, содержащих данные о всех направлениях госуправления.
Наибольшие объёмы государственных данных хранятся в озере Smart data ukimet, которое объединяет 93 систем для их дальнейшего анализа и принятия на основе их решений. Для обработки всех этих данных в Казахстане функционируют 66 дата-центров, ещё один более крупный строится сейчас в Экибастузе.
Казалось бы, все относительно неплохо. Но отсутствие стратегического видения (на которое неоднократно указывали журналисты), недостаточные технологическая зрелость и развитость инфраструктуры (вспомним пресловутые проблемы с доступностью интернета), плохой инновационный потенциал и человеческий капитал (другими словами, отсутствие специалистов) и крохотные расходы на НИОКР (о чём также Exclusive.kz неоднократно упоминал в аналитических материалах) внедрению искусственного интеллекта сильно мешают.
Что предлагает концепция?
Основная задача концепции – сделать так, чтобы при имеющихся проблемах искусственный интеллект и инновации с его применением всё равно появлялись и развивались внутри страны. Для этого правительство предлагает создать необходимую инфраструктуру и разработать совместно с университетами большую языковую модель (чтобы искусственный интеллект обладал знанием казахского языка и мог применяться в Казахстане).
Чтобы улучшить инфраструктуру для появления инноваций, согласно концепции, в Казахстане будут созданы суперкомпьютер, новый крупный центр обработки данных и национальная платформа искусственного интеллекта.
Мощности суперкомпьютера, как утверждается в документе, будут предоставляться в аренду разработчикам-специалистам в сфере искусственного интеллекта, бизнесу в приоритетных отраслях экономики и учёным.
– Это позволит удовлетворить потребности внутреннего рынка в вычислительных мощностях, а также экспортировать мощности в соседние государства, способствуя международному сотрудничеству и экономическому росту, – сказано в концепции.
Новый центр обработки данных будет напрямую связан с суперкомпьютером. Этот центр хотят оснастить «мощными чипами-ускорителями», а его вычислительная мощность составит один экзафлопс «с перспективой наращивания по мере необходимости» (хотя выше мощности ещё не изобрели, разработки по созданию суперкомпьютеров с большей мощностью, чем экзафлопс только ведутся мировыми компаниями типа NVIDIA).
Национальная платформа искусственного интеллекта будет создана на базе озера Smart data ukimet, про которое упоминалось ранее. Эта платформа, как заявлено, поможет стартапам, научным организациям, бизнесу и государству разрабатывать, тестировать и внедрять модели искусственного интеллекта на основе имеющихся в озере массивов данных для дальнейшего их ввода в работу.
Помимо этого, правительство обещает расширить наконец-таки доступ к государственным данным, которые, несмотря на наличие портала открытых данных, абсурдным образом остаются закрытыми (об этом мы писали в материалах «Что скрывает «открытое правительство» Казахстана?» и «Как Казахстан остается закрытым, несмотря на попытки быть открытым»), улучшить их качество и обеспечить возможность анализа.
– Важным подходом к расширению доступа к данным для общественного и частного секторов выступит продвижение политики открытых данных. Государство предпримет меры для формирования датасетов отраслевых цифровых данных, аккумулируемых в различных государственных и квазигосударственных информационных системах. Учитывая необходимость сохранения конфиденциальности и защиты персональных и стратегических данных, они будут деперсонифицированы. Государственные органы и операторы информационных систем будут определять объем и структуру данных, предназначенных для открытого доступа, и активно участвовать в формировании открытых датасетов, – обещают нам в концепции.
Для повышения качества открытых данных (в концепции это названо словами «уделение особого внимания решению проблемы неполных и отсутствующих значений данных по ключевым атрибутам в информационных системах государственных органов») правительство планирует разработать и внедрить «руководящие принципы по управлению данными» – отраслевые регламенты по тому, какими должны быть данные и как часто они будут обновляться.
– Регламенты должны описывать меры по организации сбора, обеспечению полноты и репрезентативности, хранению данных, политике доступа к данным, очистке, обработке, защите, передаче, использованию, оценке, актуализации, аудиту данных и др. В результате внедрения руководящих принципов и регламентов будут устранены или минимизированы неточности, дубликаты и устаревшие данные, что обеспечивает их качество для обучения искусственного интеллекта, – объясняется в документе.
Вторая задача – разработка казахской языковой модели, получившей название KazLLM. Этой работой занимается созданный в 2019 году при Назарбаев университете институт умных систем и искусственного интеллекта. Они обещают, что будет разработана модель с функцией «из казахского текста в речь», которая «поможет в коммуникациях и различных приложениях, включая колл-центры государственных и частных учреждений».
Однако есть нюанс: для этой работы нужны большие мощности. Если до этого речь шла об одном суперкомпьютере мощностью 1 экзафлопс, то про эту задачу уже говорится о необходимости 4 суперкомпьютеров, пусть и значительно меньшей общей мощностью (128 петафлопс). Причём провести первые тестирования планируют уже в третьем квартале года. А в четвёртом квартале разработчики хотят ещё больше увеличить вычислительные мощности, для чего понадобится уже 12 суперкомпьютеров, названа даже конкретная модель – NVIDIA DGX H100. Откуда их возьмут? Этот вопрос в концепции не раскрывается.
В концепции, как и во всех подобных документах, говорится о содействии участия в международных партнёрствах для обмена лучшими практиками и о разработке необходимых нормативных правовых актов и этических норм. Обещают, что этические нормы будут предусматривать соблюдение прав и свобод человека и соответствие продуктов ИИ нравственным, духовным и культурным ценностям, а в НПА отразят вопросы ответственности разработчиков и пользователей искусственного интеллекта, норм по безопасности применения, недопущения использования нейросетей в преступных целях и принципов государственного регулирования.
Регулировать искусственный интеллект и осуществлять координацию исполнения задач концепции путём проведения аудитов будет новый комитет при министерстве цифрового развития.
Но сможет ли правительство справиться со всеми поставленными задачами?
В Казахстане остаётся ряд глобальных проблем, вызывающих опасения, что реализация принятой концепции на одном из этапов может глубоко встрять. Во-первых, это отсутствие в стране достаточного количества профессиональных разработчиков нейросетей.
– Открытыми остаются системные проблемы, связанные с дефицитом кадров, отсутствием необходимых знаний, высокой конкуренцией за таланты в сфере ИИ, недостаточным количеством образовательных программ, недостатком практической подготовки в области искусственного интеллекта, – признаются в концепции.
Для решения этих проблем в 2023 году внесены в перечень приоритетных отраслей науки и в дальнейшем планируется внедрить программы переподготовки и повышения квалификации специалистов и начать обучать основам разработки и использования искусственного интеллекта в средних и старших классах. Но есть вопрос: кто будет этому всему обучать, если достаточного количества специалистов этой области в стране нет? Концепция никак не него не отвечает.
Во-вторых, остаётся проблема катастрофически низкого финансирования научно-исследовательских и опытно-конструкторских работ в Казахстане. Пока этот параметр остаётся в разы ниже значения 1% от ВВП, ни о каком появлении инноваций не может идти речи, – особенно если говорить о разработках искусственного интеллекта, которые являются крайне дорогостоящими. Об этом говорят уже многие годы как внутри Казахстана, так и на международном уровне, но правительство упрямо продолжает это игнорировать и выделяет науке настолько низкие средства, что наша страна регулярно занимает последние места в мировых рейтингах по затратам на науку. И даже в самой концепции правительство это признало, но вот будет ли оно с этим что-либо делать, как-то исправлять эту ситуацию – не говорится.
В-третьих, несмотря на большое совокупное количество данных о стране, остаются проблемы с недостаточной оцифровкой отдельных отраслевых данных. В частности, самый низкий показатель как раз-таки в научной сфере – оцифрованы только 2%. Большая часть информации о научной сфере Казахстана так и осталась лишь на бумаге. Также мало цифровых данных по регулированию бизнеса (13%), по туризму и спорту (25%) и по энергетике (33%). И даже самый большой массив оцифрованных данных, по образованию, – это не 100% или близкое к нему значение, а только 81%. Это мало для применения в создании искусственного интеллекта.
Крайне показательно реалистичность исполнения концепции продемонстрировал брифинг о ней в СЦК, прошедший 19 июля.
Пока спикеры – председатель комитета искусственного интеллекта Гиззат Байтурсынов и генеральный директор центра поддержки цифрового правительства Рустем Бигари – получали аккуратные вопросы по информации, которая и так в общих чертах содержится в концепции (опасения об использовании ИИ мошенниками, процесс разработки казахской языковой модели, когда и для чего будет запущен в Казахстане суперкомпьютер и т.п.), они спокойно отвечали на них примерно теми же словами, как сказано в тексте документа.
Но как только прозвучали конкретные вопросы о реализацию концепции, про которые в документе не сказано абсолютно ничего, в частности, о неизбежных финансовых затратах на эту работу, – у спикеров заметно опустился взгляд и возник ступор.
Более того, между словами спикеров и содержанием документа есть противоречия. На брифинге было заявлено, что создание казахской языковой модели KazLLM – это спонсорский проект. Но в приложении к концепции, где расписаны все ответственные исполнители, нет никаких частных компаний. По всем пунктам, включая вопросы запуска суперкомпьютера, строительства центра обработки данных и развития национальной языковой модели, в качестве ответственных организаций написаны лишь министерства (практически во всех пунктах это министерство цифрового развития, однако в отдельных есть также финансов, просвещения, науки), КНБ, центральные государственные органы и государственные АО «Национальные информационные технологии», АО «Самрук-Қазына, КФ «Астана Хаб». О том, что в реализации концепции участвуют некие спонсоры, в документе не говорится ни слова.
Помимо этого, у концепции искусственного интеллекта присутствует та же самая проблема, которая была у национальных и бюджетных программ, – в качестве целевых индикаторов, которыми будет измеряться эффективность реализации концепции, приведены цифры ради цифр. Это количество собранных датасетов, количество разработанных продуктов с применением искусственного интеллекта, доля организаций послевузовского и профессионального образования, включивших образовательные программы обучения или дисциплины по искусственному интеллекту, количество публикаций об ИИ в научных журналах, количество патентов, количество стартапов, результаты общественных опросов об осведомлённости населения о продуктах и технологиях, разработанных с применением ИИ… Всё это никак не говорит о качестве проведённой работы. К примеру, уже сейчас возможно свободно создавать чат-боты на основе ChatGPT и писать об этом научную публикацию. Теоретически, это будет являться разработкой с использованием ИИ, но инновацией, свидетельствующей о качестве технологического развития, – не будет.
Существует, впрочем, в концепции требования к росту результатов Казахстана в рейтинге Oxford Insights, которые, в теории, могли бы говорить об улучшении качества. Однако параметр этого требования прописан крайне мягкий: «каждый год с 2024 по 2029 годы увеличение результата как минимум на одну позицию». Получается, требование заключается в том, чтобы за 5 лет мы поднялись всего лишь на 5 строчек. В глобальном рейтинге это увеличение с 72 места до 67, которое сейчас занимает карликовое государство Княжество Монако.
Отметим, Казахстан – не единственная страна, которая пытается регулировать работу искусственного интеллекта и внедрять существующие наработки в государственное управление. В начале этого месяца первый в мире закон об искусственном интеллекте, который разрабатывался несколько лет и обязывает разработчиков нейросеть соблюдать правила по минимизации рисков, официально вступил в силу в Европейском союзе – впрочем, большинство его ключевых положений начнут работать не раньше 2026 года. А год назад, в апреле, первой страной, внедрившей нейросеть ChatGPT для написания некоторых официальных документов и депутатских запросов, стала Япония.
Ранее Exclusive.kz подробно анализировал влияние искусственного интеллекта на Казахстанское общество в материалах «ТОП-10 профессий под угрозой цифровизации», «Оставит ли нас цифровая экономика без работы?» и «Убьет ли искусственный интеллект духовное наследие казахов?».
2 Комментария
[…] масштабных наукоёмких проектов типа реализации концепции искусственного интеллекта эта проблема становится ещё актуальней и […]
[…] […]