Стало известно, что Минцифры должно подготовить к следующему месяцу план по предоставлению бизнесу доступа к государственным обезличенным данным для обучения систем на базе искусственного интеллекта. На первом этапе данные предоставят Россельхознадзор, ФНС, Росстат, Минвостокразвития и Росреестр. Об этом пишет «Коммерсантъ» со ссылкой на соответствующее поручение правительства.

Поручение вице-премьера Дмитрия Чернышенко предполагает, что Минцифры до 1 февраля представит согласованный план-график обеспечения доступа бизнеса к дата-сетам министерств и ведомств. «Прорабатываются изменения в законодательство для предоставления разработчикам ИИ-решений доступа к государственным наборам данных, урегулирования вопросов обезличивания», — подтвердили поручение в пресс-службе господина Чернышенко.

В Минцифры пояснили, что в план-график входят мероприятия по проведению стратегических сессий, разработке стандартов для отраслевых решений с применением ИИ, публикация результатов внедрения ИИ, а также создание единого репозитория наборов данных и регламентов работы с ними. На данный момент проект плана-графика находится на этапе согласования с ведомствами.

Что касается самих дата-сетов, то речь идёт о наборах данных, пригодных для считывания нейронными сетями. Помимо прочего, такие сеты будут тестироваться в рамках проводимых хакатонов по ИИ. Согласно имеющимся данным, в 2021 году было сформировано 26 ведомственных дата-сетов с возможностью использования сторонними разработчиками и 22 дата-сета для внутренних нужд Федеральных органов исполнительной власти РФ в рамках цифровой трансформации.

В конце прошлого года глава Минцифры Максут Шадаев говорил, что создание единого государственного «data lake» (озеро данных) и запуск маркетплейса дата-сетов станут приоритетными направлениями работы министерства в 2022 году. Ожидается, что «data lake» позволит в том числе собирать обезличенные данные в регионах и на их основе проводить расширенную аналитику. Эти данные должны стать основой для развития ИИ-технологий. Однако законопроект о порядке обезличивания данных, который был внесён в Госдуму ещё в середине 2020 года, так и не был принят.