Организация Linux Foundation анонсировала лицензионное соглашение Community Data License Agreement (CDLA), призванное заполнить нишу в лицензировании общедоступных наборов данных. Соглашение разработано с оглядкой на модели совместной разработки открытого ПО и нацелено на обеспечение предоставления открытого доступа к данным по аналогии с распространением открытого кода.

Развиваемые последнее время технологии анализа больших объёмов данных, искусственного интеллекта и машинного обучения, кроме реализации алгоритмов в коде, очень сильно зависят от исходных наборов данных, моделей обучения и графов вычислений. Традиционные свободные лицензии на код не рассчитаны на организацию распространения и совместного создания подобных наборов данных, поэтому под эгидой Linux Foundation было разработано специализированное лицензионное соглашение CDLA, призванное решить возникшие проблемы.

Различные компании, организации, госструктуры и образовательные учреждения могут использовать CDLA для открытия и предоставления доступа к данным с целью формирования сообществ, которые могут открыто развивать и дорабатывать полученную информацию и обмениваться данными с другими сообществами. CDLA представляет собой соглашение между поставщиками данных (Data Provider) и лицами, получающими эти данные, которое предоставляет лицензию на использование или публикацию данных. Лицензия предоставляется только при соблюдении определённых в соглашении условий (например, передачу полученных данных третьим лицам только под тем же соглашением), при нарушении которых она отзывается.

Соглашение предложено в двух вариантах: CDLA Sharing и CDLA Permissive. Первый вариант подготовлен в стиле копилефт-лицензий и обязывает пользователей данных публиковать все вносимые в набор улучшения, например, в случае внесения изменений в модель обучения, данные изменения должны быть опубликованы под теми же условиями. Второй вариант построен по аналогии с пермиссивными лицензиями и допускает внесение изменений без их открытия. Важной особенностью CDLA также является предоставления права публикации результатов анализа данных.