Хедж-фонд Numerai, искусственный интеллект и безумный мир токенов

Проект Numerai создает хедж-фонд, в котором сетевые эффекты и технологии искусственного интеллекта призваны коренным образом изменить способы управления активами.

Существует множество инвестиционных стратегий, основанных на краудсорсинге, однако Numerai нельзя отнести ни к одному из известных видов. Платформа открывает доступ к наборам данных, зашифрованных таким образом, что их невозможно соотнести с реальными активами, анонимным работникам (исследователям данных), которые используют эти наборы для тестирования собственных математических моделей, использующих алгоритмы машинного обучения. Шифрование данных необходимо для того, чтобы исключить «подгонку» результатов.

Готовые модели участвуют в ежемесячных соревнованиях, и лучшие из них получают вознаграждение. Ранее, выплаты производились в биткойнах, поскольку это не требовало раскрытия личностей исследователей (по сравнению, например, с PayPal), но недавно Numerai создал собственный токен стандарта ERC20 на публичном блокчейне Эфириума: Numeraire (NMR).

Создание собственного токена преследует две основные цели: создание дополнительной ценности растущей сети исследователей данных, и мотивация совместной работы вместо враждебной конкуренции. NMR не продаются в ставшей стандартной модели ICO; вместо этого, 1.2 миллиона токенов из общего количества в 21 миллион распределяются среди исследователей данных посредством смарт-контракта.

Безумие токенов

Перед началом распределения токенов, основатель и CEO Numerai, Ричард Крейб (Richard Craib) достаточно трезво для нынешней истерической атмосферы вокруг ICO и токенов высказался по поводу эмиссии NMR. Он выразил надежду, что стоимость NMR «будет рациональной» и подчеркнул надежность смарт-контракта, добавив, что аудит проводил один из экспертов, заранее обнаруживших уязвимость в коде TheDAO.

В частности, Крейб сказал:

Даже если контракт надежен, все же существует опасность побочной мотивации, в результате которой Numeraire внезапно окажется спекулятивным инструментом, что может нанести вред всей системе. Поэтому нужно действовать очень осторожно. Конечно, пользователи нуждаются в ликвидности; токены должны иметь ценность, и я всячески надеюсь, что их стоимость будет разумной.

Буквально через пару дней после первой выплаты, цена токенов взлетела до 168 долларов, а их рыночная капитализация превысила 200 миллионов. В одном соревновании выплачивалось около 60 000 NMR, что означало 10 миллионов долларов или эквивалент 10 Netflix Prize, а это автоматически поставило Numerai на первое место в мире по выплатам среди всех конкурсов по исследованию данных.

Вброшенные на рынок токены продемонстрировали сразу несколько существенных факторов риска для нарождающейся экосистемы: хакеры получили соблазнительную мишень, а система тщательно выверенных целей проекта оказалась под угрозой. В дискуссиях на форумах было неоднократно высказано опасение, что спекуляции вокруг NMR могут помешать выполнению основной задачи – созданию эффективных предсказательных моделей и сетевых эффектов.

В ситуацию вмешался Фонд Numerai: он понизили выплаты в NMR на 90% до 1510 монет в неделю и увеличил выплаты по ставкам (пользователи могут «усиливать» возможное вознаграждение, делая ставки на собственные модели в NMR) в три раза до 3000 долларов в неделю. Это немедленно охладило рынок – на момент написания статьи, стоимость NMR
колеблется в районе 27 долларов.

Крейб признается, что он никак не ожидал подобного размаха спекуляций NMR на вторичных рынках. Однако, поскольку токены находятся в свободном обращении и принадлежат исследователям, то они вольны делать все, что им угодно. Он говорит:

Спекуляции не вредят использованию NMR, которые участники используют для ставок. То, что исследователи зарабатывают больше – это хорошо. Для некоторых исследователей это стало основным источником дохода, а кое-кто совместно со спекулянтами делает ставки на свои модели. Однако, высокие выплаты приводят к тому, что некоторые участники создают дублирующие аккаунты – мы обнаружили много таких случаев за последние несколько дней.

Отвечая на вопрос IBTimes, что бы он сделал по другому, если бы имел возможность начать все заново, Крейб ответил: 

«Ничего. Результаты во многом превзошли наши ожидания. Я весьма удовлетворен нашим подходом к распределению токенов по сравнению с моделью ICO».

Тестирование и подгонка

Помимо обсуждения токенов, Крейб остановился на некоторых уникальных аспектах Numerai, например технике шифрования данных.

Все обучающиеся алгоритмы тренированы на зашифрованных данных, что делает невозможным создание моделей, которые хорошо выглядят, но на самом деле представляют собой подогнанный результат. Это общая проблема количественного анализа данных при краудсорсинге – модели работают плохо, потому что они подогнаны. Если исследователь видит исходные данные, он может попытаться обмануть систему:

Данные в Numerai настолько абстрактны, что для результата нужна действительно хорошая модель. На самом деле, мы не занимаемся краудсорсингом количественного анализа; мы отдаем на краудсорсинг машинное обучение.

Общий подход к верификации результатов в машинном обучении заключается в разделении данных на тренировочный и тестовый наборы. Модель, обученная на тренировочном наборе, на следующем этапе проходит испытание на тестовом наборе. Однако, для статистической верификации, тестовый набор может быть использован только один раз. Если исследователь прогоняет тестовый набор много раз, и использует его показатели эффективности в качестве обратной связи для выбора модели, возникает риск получения модели, с результатом, слишком хорошо подогнанным под тестовый набор. В конечном счете, это плохо отражается на способности модели эффективно работать с новыми данными.

Нейрокриптография

Проблема решается, если исследователь не знает, что он моделирует. Обычным образом зашифрованные данные становятся бесполезными для исследователя, однако последние разработки в области нейрокриптографии, направленные на создание алгоритмов искусственных нейронных сетей, позволяют Numeraire успешно скрывать исходные данные, но в то же время, сохраняют их структуру. Поскольку исходные данные остаются скрыты, исследователь не сможет использовать их для сопоставления.

Отвечая на просьбу охарактеризовать 20 000 участников Numerai, Крейб сказал:

Нужно быть знакомым с машинным обучением. Знания в области финансов не помогут – слишком абстрактными выглядят наши данные. К нам присоединяются сотрудники хедж-фондов, мы видим это по их e-mail адресам. Постоянно встречаются почтовые адреса с доменом, принадлежащим Стэнфордскому Университету. Участники приходят со всего мира: много из России, Индии, вообще много молодежи. Правда, очень мало женщин – не более 3%.