В данной статье мы рассматриваем данные книги заявок уровня II наиболее торгуемого криптовалютного продукта - Контракт BitMEX XBTUSD. В частности, цель состоит в том, чтобы исследовать, как дисбаланс потока заказов влияет на изменение цены. Произведение имеет следующую структуру:

  1. Данные по сделкам и котировкам (TAQ) уровня I
  2. Несбалансированность потока заказов (OFI) и дисбаланс торгового потока (TFI)
  3. Результаты
  4. Обсуждение

1. Данные по сделкам и котировкам уровня I (TAQ)

Данные стандартной книги лимитных ордеров (LOB) обычно содержат набор цен покупателя, размера покупателя, цены продавца и размера аска. Данные уровня II состоят только из лучших уровней спроса и предложения, таким образом предоставляя цену, по которой можно продать (лучшее предложение), и цену, по которой можно купить (лучший спрос), и соответствующие объемы с течением времени:

Как видите, детализация данных очень высока - у нас есть временная метка с точностью до наносекунды. Каждая строка представляет собой одно изменение в верхней части книги заказов, также известное как тик. Другими словами, если есть лимит, отмена или рыночный ордер, который изменяет состояние данных Уровня I. В данных о сделках каждая строка представляет отдельный рыночный ордер:

Обратите внимание, что в обоих наборах данных столбец Объем представляет количество контрактов, а не количество биткойнов. Такие данные можно получить разными способами. Самый простой способ - подключиться к API обмена данными через протокол websocket и записать данные на удобный носитель. Библиотека Python Cryptofeed предоставляет отличный интерфейс для беспрепятственного подключения к ряду бирж, включая BitMEX, и управления данными книги заказов в реальном времени.

Данные, имеющиеся в нашем распоряжении, начинаются с 1 октября 2017 г. и заканчиваются 23 октября 2017 г. Данные по котировкам и сделкам содержат 81,3 миллиона и 38,9 точек данных соответственно. Исходные данные содержатся в простых CSV-файлах, а затем разбиваются на разделы по торговым дням и сохраняются в kdb +, высокочастотной базе данных в оперативной памяти.

2. Несбалансированность потока заказов и дисбаланс торговых потоков

Дисбаланс потока заказов (OFI) - это количественная оценка неравенства спроса и предложения в LOB в течение заданного периода времени (Cont et al, 2014). OFI основывается на том факте, что любое событие, которое изменяет состояние LOB, может быть классифицировано либо как событие, которое изменяет спрос, либо как событие, которое изменяет предложение, которое в настоящее время присутствует в LOB. А именно:

  • Увеличение спроса на LOB обозначается поступлением заявки на ограничение ставки.
  • Снижение спроса на LOB обозначается либо поступлением рыночного ордера на продажу, либо полной или частичной отменой лимитного ордера.
  • Увеличение предложения в LOB обозначается поступлением лимитного ордера на запрос.
  • Уменьшение предложения в LOB обозначается либо поступлением рыночного ордера на покупку, либо полной или частичной отменой лимитного ордера на продажу.

Мы хотели бы определить количество, которое будет отражать эти изменения спроса и предложения. Формально мы можем определить это как:

Количество e представляет собой изменение спроса / предложения между последовательными состояниями книги заказов и обусловлено ценами спроса и предложения, соответствующими приведенному ранее определению. Чтобы дать некоторое представление о механике e, если объем ставки увеличивается на некоторый объем v, что означает увеличение спроса посредством размещения ордера с ограничением ставок, e принимает значение

поскольку ни одна из лучших цен спроса и предложения фактически не изменилась. При построении данных котировок Уровня I между наблюдениями может произойти только одно событие, что означает, что объем предыдущего запроса будет равен текущему объему запроса, поэтому два аннулируются:

Это означает, что:

размер нового лимитного ордера, добавленного в очередь ставок v. Таким образом, e измеряет влияние на спрос / предложение события n -го порядка.

Дисбаланс потока заказов - это совокупность воздействий e на ряд событий, которые происходят в течение периода времени t:

где N (t) - количество событий, произошедших на Уровне I в течение периода времени [0, t]. OFI можно рассматривать как аккумулятор изменений спроса и предложения за определенный период времени. Переменная ответа - это одновременное среднеценовое изменение количества тиков за тот же период времени, что и OFI:

Где MP - среднее арифметическое значение между лучшими ценами спроса и предложения. Мы нормализуем результирующее изменение средней цены на размер тика, который в нашем случае составляет 0,10 доллара США. Соответствующий код Python для создания OFI и переменных изменения цены :

Модель должна соответствовать методу обыкновенных наименьших квадратов (МНК). Выбранные временные интервалы k: 1 секунда, 10 секунд, 1 минута, 5 минут, 10 минут и 1 час. Функция для подгонки и визуализации модели определяется следующим образом:

Мы также учитываем дисбаланс торговых потоков (TFI). Торговые события - это подмножество событий книги заявок, учитываемых в OFI. Интуиция подсказывает, что дисбаланс торговых потоков может не иметь такой большой объяснительной силы, как OFI, поскольку компоненты последнего являются надмножеством компонентов первого. Однако, когда кто-то размещает и отменяет ордер, он фактически не несет за это никаких затрат, тогда как для размещения сделки он платит комиссию и спред между ценой покупки и продажи. Дисбаланс торгового потока на временном интервале t определяется как:

куда

I - это функция условного тождества, которая различает рыночные ордера на продажу и покупку, подписывая их соответствующим образом. N (t) - количество событий, происходящих на уровне I в течение [0, t].

В этом исследовании будет изучено, в какой степени события торгового потока влияют на цену на рынках криптовалют с помощью следующей модели линейной регрессии:

И снова модель должна соответствовать регрессии OLS. Код Python для подгонки и визуализации подгонки:

3. Результаты

Несбалансированность потока заказов

1-секундная модель OFI демонстрирует упомянутый ранее момент - низкая частота поступления обновлений требует выборки в течение более длительного периода времени для наблюдения существенного изменения цены / дисбаланса потока заказов. Видно, что диаграмма разброса ниже представляет собой образование «скользящего креста», при котором не может развиваться большая активность, поскольку большинство точек расположены близко к осям графика. Соответственно, линейная зависимость между OFI и изменением цен в этом окне выборки плохая. R-квадрат соответствия 1-секундной линейной модели OFI составляет 7,1%. Все результаты представлены на рисунке в конце раздела.

Если для параметра k установлено значение 10 секунд, линейная модель подходит гораздо лучше - R² = 40,5%. Линейная зависимость начинает напоминать наблюдаемую Cont et al (2014). 1-минутный временной интервал обеспечивает еще более четкую демонстрацию линейной зависимости между изменением цены и дисбалансом потока ордеров.

Интерпретация 1-минутной модели очень интуитивно понятна: для 10000 единиц чистого потока ордеров ожидаемое среднее изменение средней цены составляет 0,65 тика (с использованием параметров, найденных в таблице результатов). Обратите внимание, что коэффициент влияния цены не делает различий между типами событий книги заказов, что делает его обобщающим для потоков отмены, размещения и объема торговых ордеров.

Дисбаланс торгового потока

Интервалы, которые используются для расчета TFI и одновременного изменения цены, такие же, как и интервалы, используемые при моделировании OFI: 1 секунда, 10 секунд, 5 минут, 10 минут и 1 час.

Первая модель регрессирует TFI на одновременных средних ценах MP, взятых с интервалом в 1 секунду. Модель дает коэффициент детерминации 12,8%, что выше, чем R², достигнутый для OFI за тот же период выборки. При 10-секундном интервале выборки R² модели TFI составляет 37,3%, что ниже, чем у его 10-секундного счетчика OFI, R² которого составляет 40,5%.

Однако для периодов выборки более 10 секунд TFI является неизменно лучшим средством оценки изменения цены, чем OFI. При 1-часовом времени выборки сетка R² составляет 75,2%, что на 20% выше, чем дисбаланс R² потока ордера для той же временной сетки. График разброса, представленный ниже, визуально демонстрирует, что соответствие более линейно, чем у OFI.

Эти результаты противоречат выводам Cont et al. (2014), которые обнаружили, что для всех 50 акций США, выбранных для их анализа, дисбаланс потока заказов имеет приоритет перед объяснением одновременного изменения цен для каждой из них. Исходная гипотеза о том, что совокупный дисбаланс потока заказов имеет более сильную объяснительную силу, чем дисбаланс торгового потока, отклоняется на основе этих результатов. Результаты в таблице 2 подтверждают, что оценки коэффициентов бета статистически значимы для всех периодов выборки k. Обратите внимание, что p-значения близки к нулю для всех коэффициентов TFI и OFI, и вместо того, чтобы сообщаться, вместо этого вычитаются из 100%, что дает вероятности коэффициентов не получается случайно. t -статистика также включена для каждого оценочного коэффициента.

4. Обсуждение

Дисбаланс потока заказов дает хорошее приближение для реального изменения средней цены, и есть несколько потенциальных причин, по которым OFI не обеспечивает лучшего соответствия. Прежде всего, это помогает понять, при каких обстоятельствах OFI дает худшую оценку одновременного изменения цен. Если говорить более грубо, то при каких предикатах точки данных окажутся во втором и четвертом квадрантах на диаграмме разброса, например, представленных в предыдущем разделе. Предположим, что в момент времени t имеется объем Vb и лучшая ставка и Va в лучшем случае продажи, так что Va › Vb. В момент времени t + 1 поступает ордер на отмену на стороне продавца, отменяя сумму qc ‹Va, таким образом, при прочих равных условиях, регистрируя положительный эффект на текущий расчет потока ордеров, и оставляя среднюю цену неизменной. В момент времени t + 2 существует рыночный ордер на продажу в количестве qm, такой что qm ›Vb и qm‹ qc . Этот рыночный ордер перемещает среднюю цену вниз, но поскольку qm ‹qc, текущее значение OFI по-прежнему положительно. Полученная точка данных окажется во втором квадранте диаграммы рассеяния. Таким образом, неравномерность объема по уровням цен на LOB усугубляет оценку изменения цен OFI.

Качество подгонки зависит от двух основных факторов: (а) глубины D на всех уровнях цен и (б), что более реалистично, дисперсии D, поскольку все реальные - рынки жизни будут иметь непостоянный D. Если уровни цен на LOB имеют очень «волатильный» D, эффекты потока заказов не будут одинаковыми, как если бы D не был таким рассредоточенным. На основании статистики и эмпирических данных можно сделать вывод, что на цены криптовалюты поток заказов влияет гораздо менее детерминированно, чем на устоявшихся рынках, из-за более низкого соответствия стилизованной модели LOB, которую предполагает это исследование.

Результаты также показывают, что влияние дисбаланса торговых потоков на цены сильнее, чем влияние дисбаланса потока заказов. Объясняющая сила TFI зависит от того же параметра глубины D и его дисперсии по уровням цен. Обстоятельства, при которых торговый поток не может служить хорошей оценкой изменения цены, поэтому аналогичны обстоятельствам, при которых поток заказов не может быть хорошей оценкой изменения цены.

Совокупный поток ордеров уже включает сделки, так почему же торговый поток сам по себе лучше объясняет движение цен? Аргумент сводится к тому факту, что, хотя совокупный поток заказов включает больше информации, в сфере микроструктуры рынка криптовалют, а также макроструктуры такая информация может иметь небольшую ценность из-за шума. Есть несколько возможных причин, которые могут помочь объяснить это явление, как макроструктурное, так и микроструктурное.

В отличие от акций США, которые подпадают под действие нескольких политик противодействия спуфингу, включая реформу Уолл-стрит Додда-Фрэнка (спуфинг представляет собой действие по размещению и отмене лимитных ордеров в быстрой последовательности, чтобы замаскировать намерение исполнения ордера), равных нет. регулирующие партнеры на рынках криптовалют. Это может иметь последствия для того, почему поток заказов может нести относительно меньшую информацию, чем торговый поток на рынках криптовалют. Трейдеры, которые отправляют и быстро отменяют ордера, чтобы имитировать намерение покупки / продажи, юридически не ограничены в этом. Следовательно, рыночные агенты более склонны размещать малоинформативные заказы любого масштаба в LOB, если это выгодно их повестке дня. Например, маркет-мейкер, который работает с большим запасом, может выбрать обман в том направлении, которое принесет пользу стоимости его чистых запасов. Это приводит к эфемерной ликвидности, то есть ордерам, которые не предназначены для исполнения и, следовательно, не влияют на изменение чистой цены. С другой стороны, чтобы выполнить рыночный ордер, трейдер будет платить комиссию, а также спред между покупателями и покупателями, что означает намерение с высокой степенью информированности, которое, как можно судить по результатам, оказывает значительное влияние на цену.

D и его дисперсия по уровням цен являются основными факторами, определяющими объясняющую силу как OFI, так и TFI. Результаты также показывают, что TFI имеет в целом лучшую объяснительную силу, чем OFI, в то время как составляющие события последнего являются надмножеством составляющих событий первого. Это явление в значительной степени связано с двумя вещами, которые, хотя и косвенно, являются функциями параметра D. Прежде всего, можно считать, что спрэд спроса и предложения влияет на низкую объяснительную способность OFI. Средний спред контракта XBTUSD составляет 2,87 тика со стандартным отклонением в 11 тиков, что является большим и разбросанным по сравнению с американскими акциями, где акции с большой капитализацией редко имеют средний спред, превышающий один тик. Когда спред большой, средней ценой можно манипулировать с небольшими затратами или бесплатно, размещая и отменяя лимитные ордера с лучшими ставками и асками, тогда как если спред почти всегда составляет один тик, нет никакого менее затратного способа манипулирования. цена точно так же. В таких обстоятельствах OFI, скорее всего, будет иметь слабую объяснительную способность. Cont et al. (2014) показывают, что акции CME Group, которые имеют средний спред в 103 тика (самый большой из выбранных акций), также имеют худший показатель OFI R² в 35% по сравнению с другими акциями, использованными в исследовании. Однако, вопреки нашим результатам, TFI CME имеет худшую объяснительную силу, чем его аналог OFI, что может быть связано с его отношением котировок к сделке ниже среднего, равным 27,14. XBTUSD, с другой стороны, имеет отношение котировок к сделке 2,08, что означает, что в среднем на сделку приходится только две котировки! Это говорит о том, что на криптовалютных рынках существует очень большая склонность к торговле (намного выше, чем в случае с акциями США). Эта склонность может означать нехватку маркет-мейкеров, которые могут обеспечить ликвидность и, следовательно, стабилизировать глубину всей книги заказов. Такие условия вполне могут оправдать щедрые скидки маркет-мейкера, которые BitMEX платит трейдерам, обеспечивающим ликвидность.

использованная литература

Конт, Р., Куканов, А., Стойков, С. (2014), «Влияние событий в книге заказов на цену», Журнал финансовой эконометрики 12 (1), 47–88.