Nano Hash - криптовалюты, майнинг, программирование

Почему Spark Structured Streaming идеально подходит для операций в реальном времени?

Я хочу создать приложение реального времени, но не знаю, следует ли мне использовать Spark Streaming или Spark Structured Streaming.

Я читал в Интернете, что структурированная потоковая передача идеально подходит для приложений реального времени, но не совсем понятно, почему...

Может ли кто-нибудь объяснить это?


Ответы:


1

Spark Streaming работает над тем, что мы называем микропакетами. ... Каждая партия представляет собой RDD. Структурированная потоковая передача работает на той же архитектуре опроса данных через некоторое время, в зависимости от вашего интервала запуска, но имеет некоторые отличия от потоковой передачи Spark, что делает ее более склонной к реальной потоковой передаче.

Для разработчиков все, что им нужно беспокоиться, это то, что при потоковой передаче Spark вы получите RDD, но при структурированной потоковой передаче Spark вы получите кадры данных и набор данных.
Если вы хотите операции очень низкого уровня (т. е. на запись), используйте для RDD (т. е. Spark Streaming), но ваше приложение может основываться на кадрах данных и запрашивать их, как SQL, в режиме реального времени, а затем переходить на DataFrames (т. е. Spark Structured Streaming)

В конечном итоге RDD можно преобразовать в кадры данных и наоборот.

27.04.2020
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..