Nano Hash - криптовалюты, майнинг, программирование

Долгосрочное хранение Solr или функция экспорта

Наше приложение Solr ежедневно добавляет около 1 ГБ данных в индекс Solr. Приложение получает доступ только к данным за последние N дней, однако все данные должны быть сохранены для использования в будущем. Для экономии места на основном сервере (дорого) я хотел бы экспортировать данные и сохранять их в локальном хранилище (дешево). MySQL имеет замечательную функцию mysqldump, которая позволяет легко экспортировать и импортировать данные по мере необходимости. Есть ли в Solr аналогичная функция, которую можно активировать, не закрывая приложение Solr?

Конкретные критические функции, которые меня интересуют:

  1. Работает во время работы Solr, без простоев.

  2. Экспорт подмножества данных, например datetime:[1356220800 TO 1356393600]

  3. Импорт данных

Конкретные некритические функции, которые меня интересуют:

  1. Возможность поиска в экспортированных данных, чтобы найти подмножество для вставки (используя либо общие инструменты GNU, такие как grep, либо небольшой автономный инструмент.

  2. Внутреннее сжатие данных.

26.12.2012

Ответы:


1

Вы можете проверить: -

  • Solr резервное копирование — позволит вам сделать резервную копию индекса на том же сервере. Вы можете повторно использовать индекс, так как это полноценный индекс Solr.
  • Репликация. Вы можете периодически выполнять репликацию и поддерживать индекс на другом сервере Solr. Это в основном экспорт и импорт, так как для этого требуется запущенный Solr, и он будет размещен для вас.
  • Вы всегда можете использовать запрос Delete для удаления (все записи до даты ) данные Solr.

Кроме того

  • Функции экспорта или дампа, зависящие от времени, отсутствуют. Однако вы можете выполнять вышеуказанное ежедневно, еженедельно, и у вас будут только данные за этот период.
  • Все вышеперечисленное будет работать на Solr без простоев.
  • Индекс можно запросить с помощью другого экземпляра Solr или Luke.
26.12.2012
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..