Классификация криптоактивов: кластерный анализ на основе доходности

Классификация криптоактивов: кластерный анализ на основе доходности Каталог ICO

Что способы кластерного анализа могут поведать о Bitcoin, Ripple и остальных криптоактивах. отчет Binance Research.

Резюме

    • Используя корреляционную матрицу и иерархическую кластеризацию, класс цифровых активов можно поделить на несколько подсегментов.
    • В отношении недельной доходности большие криптоактивы, такие как Bitcoin и Ethereum, показывают высочайшую корреляцию, при всем этом Ripple указывает наименьший уровень корреляции и является наилучшим диверсификатором посреди криптоактивов с рыночной капитализацией выше 3 миллиардов баксов.
    • Форки Биткойна (Gold и Cash), Ethereum Classic и Litecoin образуют единый кластер, тогда как другие активы образуют группы на базе последующих эффектов:
      • “Binance-эффект”: Tezos и Dogecoin, два актива, не торгуемых на Binance, образуют один дочерний кластер.
      • Потенциальные географические эффекты, такие как дихотомия меж южноамериканскими и азиатскими криптоактивами.
      • «Эффект листинга на Coinbase»: некие активы, уже включенные в листинг Coinbase или о их говорилось, что Coinbase изучит возможность введения их поддержки, по-видимому, принадлежат к аналогичным группам.
      • Секретные койны (Dash и Monero) сформировывают единый кластер.
    • С иной стороны кластеризация способом k-средних на базе профиля риск/доходность всякого криптоактива не принесла сколько-нибудь важных результатов. Одно из вероятных разъяснений состоит в том, что профили доходности и волатильности не соединены с корреляцией курса активов в течение исследуемого периода.

В прошлом отчете (англ.) мы употребляли для анализа внутренних корреляций крипторынка и наблюдения повторяющихся паттернов способ, обхватывающий разные группы активов, и нашли, что маленький уровень внутренней корреляции меж активами в криптосфере нередко бывает обоснован идиосинкратическими факторами, в дополнение к механизму консенсуса монеты и возможному “Binance-эффекту”.

Но общая корреляция, наблюдаемая на рынке криптоактивов, возросла, что быть может соединено с ростом размеров стейблкойнов и, как следует, повышением количества торговых пар на всех рынках криптоактивов. Это отчет о кластерном анализе, проведенном Binance Research на базе данных о 12-ти торговых месяцах с марта 2018 по март 2019 года, чтоб найти, можно ли найти и, что еще важнее, интерпретировать кластеры криптоактивов способом неконтролируемого обучения.

1. Методология

«Кластерный анализ – это способ, применяемый для объединения в группы наборов объектов, имеющих идентичные свойства. Это рядовая практика в области статистики, но инвесторы могут применять способ для построения диверсифицированного портфолио. Активы, характеризующиеся высочайшей корреляцией доходности, попадают в одну корзину, несколько наименее высочайшей – в другую и т.д., пока любой актив не будет определен в ту либо иную категорию».

(: Investopedia)

1.1 Входные данные

Для 30 криптоактивов с большей рыночной капитализацией, на базе данных CoinMarketCap были получены цены в баксовом эквиваленте.

Стейблкойны исключены из анализа, равно как и любые криптоактивы, обеспеченными иными активами, будь то цифровыми либо физическими (включая индексы). Для рыночной капитализации криптоактивов «без обеспечения» было рассчитано 30-дневное скользящее среднее (по состоянию на 31 марта 2019 г.) и на базе приобретенных значений было выбрано 30 больших активов.

Период сбора данных обхватывает полный год с 31 марта 2018 по 31 марта 2019 года.

1.2 Выбор метода

Кластерные методы – это один из подвидов алгоритмов неконтролируемого обучения. В таблице ниже показаны различия меж 2-мя более всераспространенными кластерными методами: способом k-средних и иерархической кластеризацией. Подробнее о этом можно прочесть в данной статье (англ.).

Таблица 1: Сопоставление кластеризации способом k-средних и иерархической кластеризации

способ k-средних
Иерархическая кластеризация

Размер набора данных
Огромные наборы данных
Малые наборы данных

Определение количества кластеров
За ранее задано вручную
Автоматическое

Секционирование
Однократное
Неоднократное

Подход
Эвристический
Снизу ввысь (агломеративный)

Сверху вниз (дивизивный)

1.2.1 Методология иерархической кластеризации

1. Данные были за ранее обработаны при помощи корреляционной матрицы, основанной на недельной доходности в течение 1 года. Таковым образом, было получено 52 наблюдения. Эта корреляционная матрица фиксирует меняющиеся взаимодействия нормализованным образом. В итоге это упрощает расчеты за счет отсеивания огромного количества нерелевантной инфы.

2. Состав всякого кластера отражен на дендрограмме: неодиночный кластер связывается с дочерними средством U-образных перемычек. Высота U-образной перемычки представляет расстояние меж ее группами дочерних кластеров, также кофенетическое расстояние меж начальными наблюдениями в 2-ух группах дочерних кластеров.

Употребляется евклидово расстояние (т.е. L2-расстояние); способ связывания опирается на способ Варда («Ward»), минимизирующий внутрикластерную дисперсию.

1.2.1 Методология кластеризации способом k-средних

  • Недельная доходность рассчитывалась для 30 активов с большей рыночной капитализацией.
  • На базе этих значений недельной доходности рассчитывали годичную волатильность и среднегодовую доходность.

    годичная доходность = (1 + средняя недельная доходность)52 -1
    годичная волатильность = обычное отклонение недельной доходности x √ 52

  • Данные за ранее обрабатывались с внедрением масштабирования признаков (feature scaling), так что каждое
  • В конечном счете анализ строится на трехпроцессной методологии:
  • Инициализация: k-начальные центроиды генерируются случайным образом.
  • Предназначение: k-кластеры создаются методом сравнения всякого наблюдения с наиблежайшим центроидом.
  • Обновление: центроид кластеров становится новеньким средним.
    • 2-ой и 3-ий шаги повторяются до того времени, пока они не сходятся в решение, которое минимизирует сумму квадратичных ошибок меж точками и их надлежащими центроидами.
  • K-оптимальное количество кластеров выбирается на базе методологии «локтеобразной кривой» (elbow curve), которая выбирает наилучшее количество кластеров.
  • 2. Результаты
    2.1 Выбор активов

    В согласовании с методологией, описанной в разделе 1.1, были отобраны последующие цифровые активы:

    Топ-10 отобранных криптоактивов:

    Bitcoin (BTC), Ethereum (ETH), Ripple (XRP), Litecoin (LTC), EOS, Bitcoin Cash (BCHABC), Binance Coin (BNB), Stellar (XLM), Tron (TRX), Cardano (ADA)

    11-20 из отобранных криптоактивов:

    Monero (XMR), IOTA, DASH, Maker (MKR), NEO, Ethereum Classic (ETC), Ontology (ONT), NEM, Tezos (XTZ), ZCash (ZEC)

    21-30 из отобранных криптоактивов:

    Waves (WAVES), Basic Attention Token (BAT), Dogecoin (DOGE), Bitcoin Gold (BTG), Qtum (QTUM), OmiseGo (OMG), Decred (DCR), Lisk (LSK), ChainLink (LINK), 0x (ZRX)

    Классификация криптоактивов: кластерный анализ на основе доходности10 больших криптоактивов по 30-дневной средней рыночной капитализации (в миллиардов долл.) по состоянию на 31 марта 2019 г.

    Bitcoin, Ethereum и Ripple составляют огромную часть общей рыночной капитализации отрасли.

    Классификация криптоактивов: кластерный анализ на основе доходности11–30 наикрупнейшие криптоактивы по 30-дневной средней рыночной капитализации (в миллиардов долл.) по состоянию на 31 марта 2019 г.
    2.2 Матрица корреляции доходности активов за 52-недельный период
    Классификация криптоактивов: кластерный анализ на основе доходностиМатрица корреляции недельной доходности. (Интерактивная версия матрицы доступна в уникальной статье)

    Как сказано в первом разделе, в рамках этого анализа рассматривались топ-30 цифровых активов по 30-дневной средней рыночной капитализации по состоянию на 31 марта 2019 г.

    Как уже отмечалось в прошлых докладах Binance Research:

    • Корреляция посреди криптоактивов с высочайшей рыночной капитализацией очень высока.
    • Ethereum и Bitcoin также показывали очень высшую (0,872) корреляцию друг с другом.
    • Корреляция меж PoW-активами была выше, чем посреди не-PoW-активов.
    • наблюдение потенциального «Binance-эффекта»: Tezos и Dogecoin – единственные два актива, не торгуемые на Binance и показавшие наиболее низкую корреляцию с иными криптоактивами.

    Но было изготовлено несколько доп наблюдений:

    • Dogecoin (DOGE), Tezos (XTZ) и Ripple (XRP) проявили самую низкую корреляцию с иными цифровыми активами в исследуемый период. Броско, что в длительной перспективе Ripple показывает наименьший уровень корреляции, чем в прошлом исследовании на базе данных о дневной доходности в течение нескольких трехмесячных периодов.
    • Ripple обнаруживает сильную корреляцию со Stellar (0,73). Хотя вначале Stellar был построен на базе протокола Ripple, его программный код скоро был выведен в отдельную ветвь и существенно обновлен. На нынешний денек код Stellar и Ripple уже не основывается на одном общем ядре. И тем не наименее, меж этими 2-мя активами по прежнему есть определенное сходство, так как оба они ориентированы на «изменение глобальной промышленности валютных переводов».

    2.3 Результаты иерархической кластеризации
    Классификация криптоактивов: кластерный анализ на основе доходностиДендрограмма, основанная на корреляционной матрице (на базе квадратов евклидовых расстояний)

    Исходя из приведенной дендрограммы можно сказать, что некие кластеры, по-видимому, имеют идентичные свойства, такие как:

    • Сходство по географическому признаку: популярность койнов в определенных странах и положение самой команды могут оказывать воздействие на кластеры. к примеру, проекты Qtum (QTUM), Cardano (ADA), NEO и OmiseGo (OMG) базируются в Азии, и большая часть держателей их койнов тоже находятся в этом регионе. ICO Cardano было ориентировано на японских инвесторов, которые выкупили до 95% от общего числа предлагавшихся на ICO койнов. Не считая того, Emurgo (коммерческое подразделение проекта Cardano для поддержки стартапов) базируется в Токио. Аналогичным образом, Ripple (XRP), BAT (Basic Attention Token) либо Dogecoin (DOGE) – цифровые активы, большая часть установок и инвесторов которых находятся в Америке.
    • Секретные койны, такие как DASH и Monero (XMR) принадлежат к одному подкластеру. Stellar (XLM) и NEM являются платежными системами, и в итоге образуют единый кластер.
    • “Эффект листинга на Coinbase”: Ripple (XRP) и Basic Attention Token (BAT) были включены в листинг Coinbase в течение исследуемого периода. Не считая того, в ноябре 2018 г. Coinbase объявила о листинге Zcash (ZEC), а еще через несколько месяцев – о поддержке Stellar (XLM) и Maker (MKR). Эти три цифровых актива также образуют общую подгруппу, что гласит в пользу догадки о том, что, зависимо от времени листинга на одних и тех же биржах, койны в одних рыночных критериях могут показывать идентичные тенденции.
    • Форки блокчейнов и программного кода: Litecoin (LTC), Ethereum Classic (ETC), Bitcoin Cash (BCHABC), Bitcoin Gold (BTG) – они все имеют общую историю с 2-мя наикрупнейшими цифровыми активами – Биткойном (BTC) и Эфириумом (ETH) – и непринципиально, сохранена ли эта история в блокчейне либо нет.
      • Хотя Litecoin – не форк Биткойна, его код вначале был скопирован с маленькими переменами из Github-репозитория Биткойна. Bitcoin Cash и Bitcoin Gold же были образованы методом хард-форка.
      • Напротив, Ethereum Classic и Ethereum имеют общий генезисный блок. Хотя Ethereum Classic по праву можно именовать уникальной цепочкой, популярность и скорость развития Ethereum на нынешний денек намного выше.
      • тут, Bitcoin Cash относится к одному кластеру с Bitcoin Gold, тогда как Litecoin образует группу с Ethereum Classic.
    • Binance Coin представляет свой дочерний и родительский кластер первой очереди, находится в родительском кластере 2-ой очереди совместно с EOS, Tron (TRX), Lisk (LSK) и Decred (DCR).
    • Возможный “Binance-эффект”: Dogecoin (DOGE) и Tezos (XTZ), единственные два актива из исследуемых, не торгуемые на Binance, любой из которых является единственным компонентом в собственной дочерней группе.
    • “Наибольшая рыночная капитализация”: Bitcoin (BTC) и Ethereum (ETH), два больших цифровых актива, принадлежат к одному подкластеру.

    Но в отношении хоть какой из приведенных выше интерпретаций есть очевидные ограничения:

    • время листинга на Coinbase не совпадает. к примеру поддержка Ripple (XRP) и Basic Attention Token (BAT) была введена с различием наиболее чем в 5 месяцев.
    • Непонятные соответствия. По базовым признакам меж Waves (WAVES), Ontology (ONT) и Tezos (XTZ) не достаточно общего. Согласно методологии, они были объединены в одну группу, так как они все показывали наиболее низкую корреляцию с иными активами.
    • IOTA вошла в одну группу с Bitcoin (BTC) и Ethereum (ETH), хотя ее рыночная капитализация не сравнима с фаворитами крипторынка. Тем не наименее можно, пожалуй, сказать, что:
      • Bitcoin – 1-ый блокчейн 1.0 для цифровых средств
      • Ethereum – 1-ый блокчейн 2.0 с поддержкой смарт-контрактов
      • IOTA можно разглядывать как 1-ый блокчейн 3.0 для «веба вещей»
    • Если EOS, Tron (TRX) и Lisk (LSK) принадлежат к одному сектору рынка (“блокчейны с поддержкой смарт-контрактов”), то с Decred (DCR), который описывает себя как “автономная цифровая валюта”, они имеют не достаточно общего.

    2.4 Результаты анализа способом k-средних
    Классификация криптоактивов: кластерный анализ на основе доходностиЛоктеобразная кривая – выбор рационального количества кластеров

    Если отталкиваться от приведенной выше числа, то хорошим количеством кластеров представляется что-то около 6, так как маржинальное улучшение общей суммы квадратов расстояний снутри кластера при большем количестве кластеров становится очень малым.

    В итоге было выбрано 6 кластеров.

    Классификация криптоактивов: кластерный анализ на основе доходностиПрофили риск/доходность для первого кластера (A)
    Классификация криптоактивов: кластерный анализ на основе доходностиПрофили риск/доходность для второго кластера (B)

    Кластер B состоит из цифровых активов с высочайшей волатильностью, но отрицательной средней доходностью в исследуемый период.

    Классификация криптоактивов: кластерный анализ на основе доходностиПрофили риск/доходность для других 4 кластеров (C-F)

    Основываясь на обычных атрибутах риска и доходности, почти все криптоактивы имеют однообразные профили риск/доходность (кластеры B и C). кластер C составляют активы с очень высочайшей волатильностью, но доходностью в годичном исчислении или положительной, или слегка отрицательной (кроме IOTA).

    Кластеры C, D и E состоят из 1-го цифрового актива, к примеру:

    • кластер Bitcoin Cash (BCHABC), второго актива по уровню волатильности в группе, но с весьма маленький положительной доходностью. Таковой профиль риска разъясняется произошедшим в ноябре 2018 года форком Bitcoin Cash, который привел к созданию Bitcoin SV (BSV/BCHSV).
    • Кластеры E и F состоят любой из 1-го актива с очень высочайшей доходностью:
      • ChainLink (LINK) сформировывает кластер E.
      • Ontology (ONT) сформировывает кластер F. Так как недельная доходность Ontology обычно не распределяется (при экстремально больших положительных значениях), его средняя доходность в годичном исчислении очень тяготеет к увеличению.

    В целом, недочет этого способа состоит в том, что два актива могут принадлежать к одному кластеру без какой-нибудь корреляции меж собой. Поточнее, два актива могут демонстрировать отрицательную корреляцию, но при всем этом владеть в точности схожим профилем риск/доходность, в итоге чего же они относятся к одному кластеру.

    В дальнейшем этот подход следует расширить, так, чтоб учесть также последующие свойства:

    • Рыночная капитализация
    • Торговый размер
    • Коэффициент оборачиваемости

    Метрики самого блокчейна, такие как скорость хеширования, количество активных адресов, ончейн-транзакций либо активных узлов, тоже можно применять в качестве входных данных для кластерного анализа, чтоб узнать, что лежит в базе динамики, демонстрируемой криптоактивами.

    3. Заключение

    Кластерный анализ представляет собой неконтролируемый способ обучения, который обеспечивает упругость в систематизации объектов в группах без привнесения характерной человеку предвзятости. Для цифровых активов практическое применение кластерного анализа не было тщательно исследовано и этот отчет представляет собой одну из первых попыток систематизировать криптоактивы неконтролируемым способом.

    Иерархический кластерный анализ выявил потенциальные группы криптоактивов, основанные на таковых свойствах, как функция активов (к примеру, секретные токены), история блокчейна (к примеру, форки Биткойна) либо возможная дихотомия меж криптоактивами азиатского и южноамериканского происхождения. В конце концов, возможное существование «Binance-эффекта» тоже заносит в кластеризацию собственный вклад, равно как и наиболее новое явление, воздействие новостей, связанных с Coinbase (к примеру Ripple либо Basic Attention Token).

    Притом что некие из приобретенных результатов пересекаются с принятыми в отрасли практиками фундаментального анализа активов, сложность получения достоверных данных может задерживать инвесторов от проведения кропотливого анализа в этом направлении. Для сопоставления, классические рынки акций дают огромное количество метрик (к примеру, коэффициент стоимость/доходы, оборот, Рентабельность капитала), которые повсевременно употребляются в исследовательских отчетах.

    Доп кластерный анализ промышленности цифровых активов быть может выполнен с разных перспектив, а предстоящее исследование разных частей крипторынка по признаку рыночной капитализации (к примеру, активы со средней и малой рыночной капитализацией) с другими входными данными, таковыми как скорость хеширования либо количество ончейн-транзакций, поможет составить наиболее полную картину рынка криптоактивов в целом.

     

    Подписывайтесь на BitNovosti в Telegram!
    Делитесь вашим воззрением о данной статье в комментах ниже.

    Источник

    Оцените статью
    Добавить комментарий