Введение

В наши дни мы часто слышим термин «Веб 3.0». В чем отличие от традиционного Интернета? И как изменится наша работа по мере распространения Web 3.0? Я сам никогда не слышал о Web 3.0 до нескольких месяцев назад, но когда я изучил Web 3.0, я увидел множество захватывающих возможностей.

Итак, чтобы очистить голову, я объясню это с точки зрения науки о данных под заголовком «Наука о данных в Web 3.0». Причина этого в том, что я сам работаю в компании специалистом по данным, и появление Web 3.0, вероятно, окажет влияние, которое изменит способ работы специалистов по данным в будущем.

Краткое содержание этой статьи.

  • В Web 3.0 у специалистов по данным будет больше возможностей для работы
  • Персонализация будет приобретать все большее значение в Web 3.0

Эта статья основана на моей собственной интерпретации информации, которую я прочитал о Web 3.0, поэтому, пожалуйста, дайте мне знать, если есть какие-либо ошибки или комментарии. Я надеюсь, что эта статья передаст некоторые волнения Data Science в Web 3.0.

Что такое Веб 3.0?

Во-первых, позвольте мне кратко объяснить Web 3.0.

  • В Web 1.0 пользователи в основном читают цифровой контент через Интернет.
  • В Web 2.0, с появлением Twitter и Facebook, пользователи начали писать свой собственный контент, и возникли сообщества пользователей.
  • Помимо чтения и записи, Web 3.0 позволяет пользователям владеть цифровым контентом. Кроме того, такие действия, как покупка и продажа контента, выполняются в блокчейне и в принципе открыты для общественности.

В частности, мы рассмотрим разницу между Web 2.0 и Web 3.0 на примере NFT Market. В частности, мы сосредоточимся на «собственных данных пользователей» и «данные в принципе открыты для общественности».

Практический пример NFT Market HEN

Например, в Facebook, представителе Web 2.0, Facebook будет владеть данными, которые вы публикуете, и данными подключения ваших друзей. Поэтому, если Facebook прекратит работу, эти данные будут потеряны.

С другой стороны, в Web 3.0 в качестве эталона можно использовать сервис под названием HEN, который является рынком NFT. В качестве рынка NFT для иллюстраций и изображений было продано более 500 000 единиц контента.

Тем не менее, Hen был открыт для публики в марте 2021 года, но был внезапно закрыт в ноябре из-за системных проблем и других причин. Обычно, когда служба закрывается, данные теряются и транзакции становятся невозможными, но с Hen все транзакции записываются в блокчейн. Поэтому после закрытия сервиса волонтеры создают сайт-зеркало, и пользователи могут на нем торговать. Я думаю, что это уникальный пример Web 3.0.

(* Данные самого контента хранятся в P2P-сети под названием IPFS, и сохранение этих данных также является проблемой. Однако в этой статье этот вопрос не обсуждается, поэтому, если вас интересуют подробности, прочитайте здесь . )

Наука о данных в Web 3.0

В предыдущем разделе я объяснил, что в Web 3.0 данные в принципе открыты для общественности. Как это изменит способ анализа данных и участие специалистов по данным?

В этой статье [2022] Руководство по данным Web3: мышление, инструменты и команды четко объясняются различия между циклами данных Web 2.0 и Web 3.0.

Позвольте мне объяснить, как работает наука о данных в Web2: когда Facebook, Twitter, Amazon и другие компании хотят усовершенствовать алгоритмы своих сервисов, над этим работают их собственные группы исследований и разработок. Если им нужна информация извне, они публикуют часть своих данных. Например, на платформе Kaggle компании могут публиковать свои наборы данных с призами, чтобы специалисты по данным со всего мира могли соревноваться в разработке умных алгоритмов. (обведено оранжевым цветом в левом нижнем углу рисунка)

Однако передача данных в Kaggle требует времени и усилий, таких как объяснение значения раскрытия данных в Kaggle для внутреннего руководства своему руководителю и подтверждение в юридическом отделе того, что данные, которые должны быть опубликованы, не содержат личной информации. Данные, которые будут опубликованы, будут данными за определенный период времени для одной функции службы компании. Поэтому, если вы хотите улучшить другие функции, вам придется каждый раз повторять описанный выше процесс.

С другой стороны, в Web 3.0 данные в принципе общедоступны. Таким образом, вы можете анализировать данные в реальном времени по своему усмотрению. Например, венчурная компания Dune Analytics предоставляет инструменты, позволяющие анализировать данные из различных служб Web 3.0. (* В Dune Analytics работает 16 сотрудников, и в феврале этого года компания привлекла $69,42 млн в ходе раунда серии B.)

Эта приборная панель обобщает данные OpenSea для рынка NFT.

Удивительно, но такая информация, как ежемесячный объем транзакций и количество активных пользователей, может быть известна в режиме реального времени любому, кто пишет SQL; Dune Analytics позволяет проводить такой анализ данных для каждого сервиса, создавая более 20 000 информационных панелей.

Это означает, что специалисты по обработке и анализу данных могут сами анализировать сервисы, которыми они пользуются. Например, они могут использовать совместную фильтрацию для создания своих собственных механизмов рекомендаций или устанавливать цены на свои товары в диапазоне, который с большей вероятностью будет продаваться. Они также могут способствовать улучшению сервиса в целом. И вы даже можете получать за это финансовые поощрения. Это сильно отличается от мира Web 2.0, где данные были частично вырезаны.

Даже в академических кругах растет число исследований, анализирующих данные Web 3.0. Например, Барабаси и др., видный деятель сетевого анализа, провели исследование рынков NFT. Их исследование показывает, что кластеры богатых и бедных художников сформировались в сети транзакций NFT, при этом успешные художники неоднократно получали непропорциональные инвестиции от небольшого числа коллекционеров. Подобный ускоренный анализ сообщества поможет улучшить рынок NFT в будущем.

Таким образом, в эпоху Web 3.0 персонал, работающий с данными, вероятно, будет иметь больше возможностей играть активную роль. Например, следующие работы.

  • Аналитики данных создают информационные панели, такие как Dune Analytics.
  • Инженеры-аналитики проектируют витрины данных, используя dbt и т. д.
  • Инженеры данных создают механизмы потоковой обработки для помещения данных блокчейна в BigQuery или другие базы данных в режиме реального времени.
  • Инженеры по машинному обучению строят прогностические модели транзакций
  • Дизайн механизма разработки специалистов по данным

До сих пор инструменты выпускались в виде открытого исходного кода, и разработчики по всему миру совершенствовали их. С другой стороны, данные были закрыты внутри каждой компании, и специалисты по данным смогли проанализировать только часть данных, принадлежа к этой компании или через Kaggle и другие средства. Однако теперь, когда сами данные стали общедоступными в форме Web 3.0, задачи анализа данных могут в конечном итоге быть проанализированы и улучшены специалистами по данным по всему миру, а не ограничиваться самой компанией.

Другими словами, наука о данных в Web 2.0 в основном заключалась в извлечении ценности из данных, закрытых внутри каждой компании, но наука о данных в Web 3.0 может заключаться в извлечении ценности из данных, опубликованных в режиме реального времени кем-либо в мире, не будучи закрытым в каждой компании. .

Персонализация в Web 3.0

Наконец, я хотел бы объяснить персонализацию. (Я не продумывал это до конца, и могут быть некоторые логические скачки, но я надеюсь, что это передает чувство волнения.)

Одной из основных особенностей Web 3.0 является беспрепятственное использование адресов кошельков без регистрации членства. В прошлом для использования различных сайтов необходимо было регистрировать адрес электронной почты и пароль, но с Web 3.0 вы можете использовать различные службы с одним адресом кошелька, и ваши действия сохраняются на этом адресе кошелька.

В Web 2.0 данные для каждой службы, такой как Twitter и Facebook, использовались только внутри этих служб, но в Web 3.0 персонализация станет возможной на основе комплексного понимания действий в каждой службе. Другими словами, в мире, где распространилась Web 3.0, действия в широком спектре услуг, не ограничиваясь веб-сервисами, такими как образование и поиск работы, будут храниться в адресе кошелька каждого человека. В таком мире может стать возможной персонализация не фрагментарной и закрытой персонализации прошлого, а более оптимизированной под человека персонализации за счет использования цельных данных.

Как будет возможна такая персонализация? Здесь я хотел бы объяснить с точки зрения ограничений алгоритмов и важности человеческого курирования.

Ограничения алгоритмов

В эпоху Web 3.0 все данные доступны в режиме реального времени и могут использоваться повсеместно, поэтому можно подумать, что удивительные алгоритмы обеспечат максимальную персонализацию. Однако в Web 3.0 общедоступной является только информация о транзакциях, а информация и предыстория самого контента не становятся общедоступными автоматически. Кроме того, информация о транзакции также показывает, по какому адресу была совершена покупка, но не показывает пол или возраст человека, совершившего покупку.

Например, на рынке NFT OpenSea можно анализировать данные о том, сколько продается каждое произведение искусства, но невозможно узнать, какие произведения искусства чаще всего покупают японские мужчины в возрасте 30 лет. Также трудно предсказать, сколько будет стоить новое искусство. Если искусство очень важно в своем историческом контексте, оно поднимется выше, но алгоритму, вероятно, будет сложно сделать такое определение.

Таким образом, даже с Web 3.0 не все данные будут обнародованы, и важным будет вмешательство человека с глубоким пониманием контента и его авторов.

Курирование человека

Первоначально курирование представляло собой процесс, посредством которого кураторы музеев и галерей отбирали и выставляли экспонаты в простой для понимания форме. В последнее время он также используется для организации и представления необходимой информации из большого объема информации, как при курировании информации и т. д. В Web 3.0, я думаю, будет важно выбирать экспонаты и отображать их с какой-то историей как оригинал. значение.

Например, говорят, что в OpenSea транзакции сосредоточены на нескольких предметах, и большинство предметов никогда не торгуются. Чтобы донести такие материалы до более широкой аудитории, важно курирование людьми, которые действительно любят и хотят поддержать материал и его автора. Даже сегодня все больше и больше людей покупают товары по рекомендациям на Amazon, а также благодаря страстному кураторству со стороны ютуберов и инстаграмеров.

Однажды я провел анализ данных для проекта под названием «5 комиксов, которые составляют вас» для сайта комиксов.

В этом проекте 640 000 человек в Японии вошли в пять комиксов, из которых вы состоите, и разместили их в Твиттере. Это тоже своего рода курирование, и я даже купил мангу, увидев пять манг моего друга, потому что, как сказал этот друг, эта тоже должна быть интересной.

Глядя на данные того времени, регистрация смещена в сторону какой-то популярной манги, такой как «ONE PIECE», у которой было 40 000 регистраций, или около 6% из 640 000 зарегистрированных человек.

С другой стороны, есть тысячи манг, которые были зарегистрированы всего несколькими людьми, и они зарегистрированы людьми, которые действительно любят мангу. И люди, которым нравится такая манга, как правило, находят общий язык друг с другом.

В Web 3.0 также можно будет создавать поощрения, когда людям платят за такое курирование. Например, поддерживая автора, который еще не известен с самого начала, когда создатель станет известным, фанат также получит финансовую компенсацию. Этот механизм поощрения может быть гибким, так что даже если вы не обладаете влиянием, вы можете получить компенсацию за свою поддержку с самого начала.

Другими словами, в Web 3.0 курирование будет ускорено двумя способами: нишевые элементы будут легче обнаруживаться и доводиться до сведения большего числа людей, а люди, которым нравятся нишевые элементы, смогут легче узнать друг друга. Это может привести к миру, в котором люди смогут узнать больше о предметах и ​​встретить людей, которые лучше соответствуют их интересам, что приведет к лучшему благополучию.

Краткое содержание

В этой статье под названием «Наука о данных в Web 3.0» внимание сосредоточено на двух основных моментах.

  • В Web 3.0 у специалистов по данным будет больше возможностей для работы
  • Персонализация будет приобретать все большее значение в Web 3.0

Если у вас есть какие-либо комментарии по Data Science в Web 3.0, сообщите мне об этом в разделе комментариев или через Twitter DM (@masa_kazama)

Ссылка

В частности, я имею в виду следующие три сайта.