Мнение об оптимизации: проблема Alpha Predator ™

Автор: Blockforce Capital Research

В нашем предыдущем посте [APM I] мы представили модель Alpha Predator ™ (APM) для систематической торговли цифровыми активами; извлечение выгоды из сложности и гибкости, чтобы захватить альфа-рынок и превзойти рынки. Однако, несмотря на то, что Alpha Predator является многомерным фантасмагорическим хищником, он одновременно и доброжелательный зверь, стремящийся распространить свое альфа-распространение по плодородным остаткам улучшенной рыночной экосистемы, оставшейся после него. Используя эти альфа-семена для развития сектора блокчейнов для инвесторов всех типов, мы должны сначала задействовать алгоритмы машинного обучения, чтобы оптимизировать лучший путь к прорастанию.

Напоминаем, что вот дерево решений APM, которое мы показали ранее в APM I:

У нас есть много вариантов, чтобы определить, как APM принимает решения, от корня (направление рынка) вверху до листьев (стохастические осцилляторы) внизу. В его нынешнем виде именно эти стохастические осцилляторы [подробнее здесь, и здесь] в конечном итоге принимают торговые решения, и мы хотели бы оптимизировать их параметры, чтобы принимать наилучшие возможные торговые решения.

С технической точки зрения, APM имеет динамические параметры, известные в физике как степени свободы, и нам нужно найти для них оптимальный выбор. Каждая степень свободы - это одно независимое направление, в котором может двигаться система, и оптимальное - это то, что дает нам наивысшую отдачу от инвестиций при контролируемом уровне риска. Для достижения этой цели нам необходимо найти тонкий баланс, при котором все взаимосвязано. Мы ищем пространство параметров и тестируем производительность, выполняя бэктесты, которые применяют APM к историческим ценовым данным и измеряют его производительность.

Давайте быстро посчитаем степени свободы на основе текущей версии APM, изображенной на рисунке:

Для диагностики рынка у нас есть направление, волатильность и спред. В другом будущем посте мы также поговорим о деталях этой диагностики. На данный момент мы посчитаем их параметры: Direction - пять, Volatility - четыре, Spread - тоже четыре, что в сумме дает 13 степеней свободы. Типичным параметром является выбор периода торговли, лежащего в основе диагностики. Этот период может составлять 30 минут. Тогда другие параметры часто являются целыми числами, кратными тому периоду, в течение которого выполняются все вычисления. Кроме того, они также могут быть пороговыми значениями, выше или ниже которых преобладают определенные условия.

13 степеней свободы, 10 триллионов возможностей и возраст Вселенной

Остановимся на минутку на диагностике и посчитаем. Мы хотим найти такие параметры, которые дают нам наилучшее описание рынка. В принципе, мы можем сделать это методом проб и ошибок. Допустим, для каждого из параметров диагностики мы хотим попробовать 10 различных значений, чтобы увидеть, к чему это приведет. Затем мы могли бы попробовать все возможные комбинации и отследить лучшие. Посчитаем, к чему это нас приведет:

Направление имеет 5 параметров с 10 вариантами для каждого. Получается 10 x 10 x 10 x 10 x 10 = 10⁵ = 100 000 различных шин. Не плохо. Параметры волатильности с десятью вариантами каждый доводят нас до 10 000. То же самое и для Spread. Опять же, это звучит неплохо.

Однако здесь есть загвоздка: направление, волатильность и спред работают согласованно, чтобы определить дерево решений APM. Итак, мы имеем дело с 100 000 x 10 000 x 10, 00 = 10¹³, или, говоря словами, 10 триллионами различных вариантов, которые нам нужно будет попробовать!

Никогда не следует недооценивать огромные масштабы, имея дело с триллионами. Например, один триллион долларовых купюр, положенных встык, превысит расстояние между Землей и Солнцем, а 10 триллионов - это одна оценка для общего числа галактик во Вселенной [подробнее здесь]. Для Alpha Predator с этими 10 триллионами вариантов выбора, если каждое вычисление занимает 10 секунд и мы используем один компьютер, мы будем работать с ним чуть больше 3 миллионов лет. Тем более, что это всего лишь Диагностика рынка.

При продвижении по дереву решений каждая ветвь ведет к 18 различным листам, и на каждом листе есть стохастический осциллятор, который принимает торговые решения. Обычно у нас есть четыре параметра для каждого стохастического осциллятора. К счастью, каждый Осциллятор не зависит от других, поэтому добавление 18 листьев к проблеме делает ее «всего» в 18 000 раз сложнее: 54 миллиарда лет для проверки всех возможных параметров дерева решений APM.

54,8 миллиарда лет больше возраста Вселенной (13,8 миллиарда лет)! Несмотря на то, что мы определяемся нашим утонченным терпеливым темпераментом, здесь мы ограничены возрастом Вселенной, поэтому у нас нет выбора, нам понадобится лучший способ оптимизировать APM намного, намного и раньше.

Машинное обучение с помощью байесовской оптимизации

К счастью, наша команда специалистов по вычислениям и данным имеет большой опыт в области машинного обучения. Это развивающаяся научная и инженерная дисциплина, которая использует возможности современных компьютеров и передовые методы математического моделирования, позволяя компьютерным алгоритмам учиться и принимать обоснованные решения.

Большинство алгоритмов машинного обучения имеют неизвестные параметры, которые необходимо настроить наилучшим образом. Наилучший из возможных способов определяется как некоторая функция потерь (см. Рис. 1), которую вы хотите минимизировать. В нашем случае это может быть отрицательная величина совокупной доходности. Таким образом, чтобы минимизировать функцию потерь, нам необходимо оптимизировать параметры. Однако, имея дело с недифференцируемыми фантасмагорическими животными, нам необходимо задействовать особый метод машинного обучения, известный как байесовская оптимизация.

Байесовская оптимизация немного отличается от стандартных процедур, таких как Метод Ньютона или BFGS с ограниченным объемом памяти, потому что это подход к оптимизации с помощью машинного обучения. Причина использования его вместо чего-то более стандартного в том, что APM - странная функция. Учитывая данные, мы оптимизируем параметры APM, чтобы максимизировать отдачу. Он не поддается более распространенным подходам к оптимизации, потому что для его выполнения требуется очень много времени (минуты по сравнению с секундами в традиционном подходе), и вы не можете использовать градиент исходной функции (вам действительно нужен градиент для того, чтобы делать небольшие шаги в макс / мин). Байесовская оптимизация создает эту суррогатную функцию, которая является гладкой и дифференцируемой. Построение суррогатной функции - это часть машинного обучения. Оптимизация - это доведение суррогатной функции до минимума.

Рис. 1 Пример двумерной суррогатной поверхности. Наименьшая потеря достигается на минимуме суррогатной поверхности - самой темной синей области, где 𝜃_1 = -2 и 𝜃_2 = 2.

Вот как это работает. С математической точки зрения, результат бэктеста APM (например, общий доход, максимальная просадка [подробнее здесь, и здесь] или любой другой показатель производительности по вашему выбору) - это функция f (x) переменных x = {x1, x2, x3, x4,…}, представляющих множество различных степеней свободы APM. Для простоты оставим Общий доход = f (x). Мы хотим максимизировать общий доход, найдя параметры x, которые дают глобальный максимум f (x).

Причина, по которой байесовская оптимизация работает для этой проблемы, основывается на двух предположениях: существует некоторый уровень гладкости в пространстве параметров, и этот уровень гладкости изотропен (везде одинаков). Степень гладкости или «уровень подобия» между соседними областями пространства параметров изучается в процессе оптимизации, так что первое предположение может быть проверено до некоторой степени. Следующая точка в пространстве параметров выбирается балансом двух целей: исследования и максимизации. В суррогатной функции преобладает неопределенность в неизученных областях пространства параметров. Иногда он выбирает точку поблизости, которая увеличивает f (x), иногда он пробует точку в регионе, который еще не исследован.

В качестве входных данных для процесса оптимизации нам необходимо предоставить возможный диапазон значений, которые может принимать каждый из параметров x. Например, мы можем решить, что хотим усреднить количество индикатора за n рыночных периодов, где мы можем позволить n варьироваться от 100 до 300. Итак, наш диапазон для этого параметра от 100 до 300. Мы определяем диапазон для всех параметров. Это дает нам многомерный гиперкуб, определяющий пространство, в котором будет работать оптимизатор. Кроме того, мы можем наложить ограничения на отношения между параметрами. Например, мы можем обеспечить, чтобы один параметр всегда был меньше другого, что важно при работе с долгосрочной и краткосрочной скользящей средней.

Мы готовим запуск байесовской оптимизации, выбирая значения параметров x из гиперкуба, чтобы были представлены все области гиперкуба. Затем мы запускаем APM для вычисления f (x). В этом примере оптимизатору предоставляется начальный набор значений x и f (x), с которыми можно работать. И снова наша цель - найти значение x, которое максимизирует f (x).

Затем на основе начального набора x и f (x) оптимизатор создает статистическую модель, которая приблизительно описывает, как f зависит от x. Это называется суррогатной моделью. Затем суррогатная модель используется для прогнозирования нового значения x, которое имеет высокую вероятность увеличения f (x). APM запускается с этим новым x, и результирующий f (x) записывается и используется на следующем шаге.

Изначально прогнозы не очень точны, но процесс повторяется. С каждым повторением к суррогатной модели добавляется больше информации, и она улучшается.

Он учится!

Таким образом, мы можем найти оптимальные параметры для APM с помощью всего нескольких сотен оценок f (x) по сравнению с триллионами, необходимыми, если бы мы использовали простой подход грубой силы без машинного обучения.

Байесовская оптимизация - надежный метод, поэтому неудивительно, что он нашел применение во многих областях науки и техники. Например, байесовская оптимизация использовалась для оптимизации установок для экспериментальных исследований и для поиска лучших параметров прогнозных моделей для гидродинамики или геофизики. Наша работа с APM показывает одно приложение того, как байесовская оптимизация может быть мощным инструментом в количественных финансах.

Заключение

По мере того, как хищник медленно ускользает, за зарождающимся садом размножения альфа, который он терпеливо возделывал, нам дается момент, чтобы перевести дух и поразмышлять над тем, что мы узнали. Используя технику машинного обучения байесовской оптимизации, мы можем минимизировать функцию потерь математической суррогатной поверхности, которую модель альфа-хищника охватывает в пространстве параметров, что позволяет нам оптимизировать возврат инвестиций при контролируемых уровнях риска. Эта оптимизация и реализация APM - лишь одна часть нашей общей количественной экосистемы Alpha Predator в Blockforce Capital, в которой мы также используем арбитраж и нашу собственную модель ротации токенов [обе будут обсуждаться в будущих статьях].

А пока вы выходите из сада, следите за своей походкой, так как хищник скрывается.

Blockforce Capital не предполагает, что информация, представленная в настоящем документе, может служить основой для любого инвестиционного решения. Информация представлена ​​в краткой форме и не претендует на полноту. Единственная цель этого материала - информировать и никоим образом не является предложением или приглашением купить или продать какие-либо ценные бумаги, другие инвестиции или услуги, или привлечь какие-либо средства или депозиты, а также не будут предлагаться или продаваться какие-либо ценные бумаги. любому лицу в любой юрисдикции, в которой предложение, ходатайство, покупка или продажа будут незаконными в соответствии с законами такой юрисдикции. Любое такое предложение будет делаться только квалифицированным аккредитованным инвесторам посредством официальных документов о предложении, условия которых будут иметь преимущественную силу во всех отношениях. Эта информация не является общим или личным советом по инвестициям и не учитывает индивидуальные финансовые обстоятельства или инвестиционные цели, или финансовые условия лиц, которые ее читают. Вас предостерегают от использования этой информации в качестве основы для принятия решения о покупке какой-либо ценной бумаги. Прошлые показатели не гарантируют будущих результатов.

Первоначально опубликовано на www.blockforcecapital.com.