Nano Hash - криптовалюты, майнинг, программирование

Хранимые процедуры в NOSQL

Мы разработали веб-приложение с использованием PostgreSQL. Недавно мы решили перейти на мир NOSQL (мы выбрали cassandra в качестве базы данных), используя преимущества Hadoop/MapReduce). Это позволит нам перейти в мир больших данных: мы обрабатываем огромное количество (миллиарды записей) данных, поступающих из разных источников.

Наше приложение содержит некоторые алгоритмы расчета, которые очень сложны. В реальной версии (с использованием postgresql) эти алгоритмы реализованы в хранимой процедуре. Теперь мы хотим перенести эту хранимую процедуру на cassandra.

У меня тоже вопрос:

1- Возможно ли это технически? 2- Как лучше всего проверить осуществимость? 3. Следует ли нам ожидать значительного повышения производительности при выполнении этой миграции.

Спасибо за вашу поддержку. Валид

30.07.2014

Ответы:


1

В Cassandra нет ничего эквивалентного хранимой процедуре, но недавно созданные Триггеры могут вам помочь. Триггеры могут быть написаны на любом языке JVM и могут быть размещены непосредственно на узле Cassandra. запускается ДО оператора, так что вы можете поместить свою логику здесь. Если триггеры не соответствуют вашим потребностям, единственной альтернативой, которую я вижу, является размещение логики непосредственно в приложении.

Что касается вопроса номер 3, это зависит. Cassandra предлагает линейную масштабируемость, это означает, что если X узлов поддерживает Y транзакций в секунду, NX узлов могут достигать NY транзакций в секунду, но повышение (или снижение) производительности невозможно предсказать без всей информации (и даже в этом случае будет непросто)

ХТХ, Карло

30.07.2014

2

С Aerospike вы можете использовать Определяемые пользователем функции. Пользовательские функции Aerospike могут работать с одной записью или работать только для чтения с набором записей.

31.07.2014
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..