Блокчейн - будущее больших данных и машинного обучения?

Популярность блокчейна в последнее время резко возросла из-за модного эффекта ICO, но все они не стоят того времени и денег, в которые можно инвестировать. Давайте осознавать силу этой технологии и все, что можно было бы с ее помощью сделать до появления криптовалюты. торговля убивает его.

Быстрое определение

Для непосвященных (вас все меньше и меньше) напоминание о ключевых концепциях блокчейна и смарт-контракта:

  • Блокчейн: основной принцип прост. Первый блок данных используется для инициализации цепочки. Этот блок транслируется в сети узлов (серверов), которые заботятся о записи данных в цепочке. Каждый последующий блок содержит хэш (ссылку) предыдущего блока, а также другие данные (любые данные, если они соответствуют максимальному размеру блока). Серверы чтения / записи часто называют валидаторами (консенсус записи, используемый в большинстве каналов, Proof Of Work). В основном им платят за их работу, то есть за выполнение алгоритма, который доказывает, что транзакция подтверждена в сети.
  • Смарт-контракты: смарт-контракты - это эволюция предыдущей системы. Каждая транзакция связана с частью программы, которая обычно запускается при записи данных. Этот код может делать разные вещи, он относительно открытый. Например, можно проверить согласованность записи по сравнению с другими блоками или вызвать API. Обычно exmple проверяет, был ли произведен обмен для запуска платежа.

Ниже приведены несколько диаграмм, которые достаточно хорошо обобщают эти принципы:

Сила цепочки по сравнению с традиционными базами данных

Несколько проектов действительно используют сущность блокчейна: децентрализованная база данных, исторически сложившаяся по своей природе, неизменная. Нет возможности изменять регистры или повреждать их.

Децентрализованный, нет необходимости заботиться о репликации или резервном копировании. Все узлы оживляют цепочку. Каждый может легко получить доступ к данным, каждый может внести свой вклад.

Смарт-контракты и другие технологии блокчейн облегчают реализацию более сложных процессов проверки чтения и записи, которые потенциально могут срабатывать при добавлении данных в цепочку.

Отслеживание данных благодаря последовательности блоков создается естественным образом, что облегчает, например, отслеживание продукта или инцидента. Мы можем даже внутри блока ссылаться на другой, который не был бы прецедентом, но имел бы деловую связь для создания более сложной сетки.

Ниже приведен пример децентрализации банков с помощью блокчейна. Центробанк отсутствует, он больше не нужен:

Меньше усилий для открытых данных?

Исторически сложилось так, что компании осторожно относились к распространению своих общедоступных данных. Сегодня, с появлением машинного обучения, открытые данные - новая цель во многих секторах, особенно в общественной сфере, связанной с транспортом и здравоохранением. И все это благодаря инициативам, подобным инициативам M Macron во Франции.

Но сколько усилий и затрат нужно, чтобы добраться туда! Все компании стремятся извлекать свои исторические данные на порталах открытых данных на заказ, с разработкой нового дорогостоящего API, который необходимо поддерживать, документировать ... В глобальном масштабе это работа титана, которая стоит денег, и только усложняет обмен и восстановление данных.

Почему бы не использовать блокчейн для распространения этих данных? Часто упоминается случай использования в сфере здравоохранения. У потоковой передачи этих данных с помощью блокчейна будет много преимуществ:

  • Наблюдение за пациентом в разных учреждениях по всему миру
  • Стандартизация форматов медицинских данных
  • История болезни человека
  • Неизменяемая медицинская карта
  • Доступ для семьи, чтобы следить за близким

Возможности практически безграничны, и очевидно, что в больших масштабах такая организация не может существовать без децентрализации: количество участников в играх делает эту реализацию невозможной.

К гиперсвязному миру

Что, если бы весь мир писал в блокчейне? Все объекты IOT? Если бы все страны предоставили узлы для гигантской сети? Тогда у нас будет доступ к огромному всемирному озеру данных!

Вы говорите мегало и утопизм? Давайте будем честными: сегодня во всех крупных странах есть шпионские службы, которые собирают все данные, циркулирующие в Интернете. Пентагон даже извлекает выгоду из помощи Google в обработке видео с дронов. Между тем, ежедневными взломами серверов, недавними скандалами Facebook и Cambridge Analytica и так далее, утопия состоит в том, чтобы верить в то, что наши данные все еще могут быть защищены. Это время прошло. Если вы не живете в пещере без смартфона или Интернета, вы существуете или будете существовать в Интернете, нравится вам это или нет.

Почему бы не предлагать большую часть данных бесплатно? Конечно, они будут анонимными. Сегодня данные как золото для машинного обучения, все ищут новые варианты использования. Если большая часть этих данных станет общедоступной, будет гораздо меньше попыток получить их незаконным путем. Даже анонимизированные, эти данные будут иметь огромную ценность, особенно если они будут отформатированы в одной и той же цепочке блоков и доступны по всему миру.

Ограничения по стоимости и емкость хранилища

В настоящее время реальной проблемой для такой глобальной системы является стоимость. Как очень хорошо объясняется в этой статье, внедрение больших объемов данных в общедоступный блокчейн типа Ethereum стоит целое состояние из-за цены транзакций, подлежащих расчету, и бесконечного хранения данных:

Использование блокчейна, такого как HyperLedger, частично решает проблему, поскольку используется метод консенсуса PBFT, который позволяет вам не платить за запись в цепочку. Узлы записывают в цепочку благодаря системе, основанной на слухах, которая также позволяет избежать бесполезных вычислений на сервере.

По-прежнему существует проблема хранения: со временем цепочка растет все больше и больше, требуя машин для узлов, способных управлять этой историей. Риск для сети состоит в том, что всего несколько узлов с такой емкостью, а другие узлы имеют только часть цепочки для проверки недавних транзакций. Тогда мы вернемся к системе, которая, безусловно, децентрализована, но не распределена.

К счастью, различные методы решения этой проблемы находятся в стадии разработки или уже существуют:

  • Обрезка дерева состояний: этот метод заключается в сохранении только последних блоков, полезных для работы сети в узлах. Если блоки не используются или слишком старые, мы не сохраняем их в истории классических узлов. Только некоторые главные узлы поддерживают эту историю.
  • Шардинг: принцип шардинга - разбить историю на несколько подмножеств. Это позволяет иметь узлы, выделенные для этих наборов, которые, следовательно, требуют меньше места для хранения. Все еще есть главные узлы, но их функция - проверять целостность целого, а не управлять всеми транзакциями и их содержимым.
  • Каналы: в системе HyperLedger каналы используются для разделения транзакций по темам сразу после их создания. Узлам не нужно управлять всеми каналами, только теми, на которые они подписаны. Это автоматически уменьшает размер управляемой цепочки.

Остерегайтесь заносов

Честно говоря, есть много серьезных проблем, связанных с этим типом открытой глобальной сети. Но это больше касается регулирования использования, чем ограничения данных. Очевидным примером могут служить возможные дрейфы в страховой или банковской профессии. Системы обучения для определения того, сможет ли человек выплатить ссуду, например, исходя из состояния его здоровья, были бы совершенно аморальными. К сожалению, такая практика уже существует, и это не блокировка данных, которая сможет предотвратить ее: только строгое регулирование и полная прозрачность организмов позволит избежать этих отклонений.

Страх открытых данных в компаниях

Бизнес - это не только данные, это сервис. И сегодня пользователи ожидают предложить качественный сервис, объединяющий информацию в единую систему. Зачем ограничиваться отображением транспортных средств своей автобусной компании, если можно добавить общественный транспорт и конкурентов? Если ваше приложение лучшее, оно будет использоваться, именно там будут ваши клиенты. Ошибочно думать, что если вы контролируете свои данные, это дает вам монополию на бизнес. Это только побудит парсеров загрязнять трафик вашего сайта роботами.

Citymapper теперь предлагает собственное автобусное сообщение. В исходной точке Citymapper не имеет собственных данных, он всего лишь агрегатор и провайдер маршрутов. Создан новый бизнес.

Google объединяет все данные о транспорте в Карты для привлечения пользователей. В конце концов, продукт - это Карты, которые представляют собой законченный продукт, благодаря работе Google над данными.

Блокчейн открытых данных для физических лиц

Это раздражающая тема в данный момент, особенно с учетом правил GDPR, которые не за горами в Европе, скандала с Facebook, Cambridge Analytica и т. Д. Безусловно, данные пользователей должны быть анонимными. Но они останутся источником очень интересных данных для пересечения с другими бизнес-данными.

Другим вариантом использования для широкой публики может быть проверка информации типа слух. Узлы блокчейна позволяют подтверждать транзакцию с помощью разных алгоритмов. Можно представить себе создание данных, которые распространяются и проверяются несколькими пользователями.

Возьмем, к примеру, опоздавший поезд. Пользователь просит ввести эти данные в цепочку. Пока 5 пользователей не подтверждают данные, они не проверяются. Эти данные могут быть пересечены, например, с данными о пассажирах официального перевозчика.

Хэшграф, основанный на протоколе Practical Fault Tolerance Byzantine, может быть интересной технологией для этого типа сценария использования:



Что такое хешграф? Это «убийца блокчейнов?
Блокчейны стали одной из величайших технологических революций прошлого века. Используя этот замечательный… blog.springrole.com »



Ключ к мастеру искусственного интеллекта?

Представьте себе ИИ, подключенный к этому гигантскому озеру данных, где можно связать все объекты и события. Мы могли бы научить его сначала связывать блоки несвязанной информации и обнаруживать скрытые корреляции. И кто знает, как предсказывать будущее? Несомненно, можно было бы увидеть образцы эффекта бабочки, когда отдельный инцидент запускает несколько действий в более крупном масштабе.