Nano Hash - криптовалюты, майнинг, программирование

Масштабирование DocumentDB с помощью секционированных коллекций

Я перехожу от управления несколькими отдельными разделами 10 ГБ на каждого арендатора к более масштабируемому решению, использующему ключи раздела (tenantId). Раньше я секционировал по коллекциям, но меня интересует экономия средств, которую я получу при переходе на секционированные коллекции, поскольку большинству моих арендаторов не потребуется больше 1–5 ГБ хранилища. Я настроил свою первоначальную коллекцию как экземпляр объемом 10 ГБ с самыми низкими настройками RU (для тестирования и экономии средств) следующим образом:

введите здесь описание изображения

Теперь, когда пришло время масштабировать, я вернулся на портал, нажал «Масштабировать» и не вижу способа увеличить мой 10-гигабайтный раздел до большей емкости:

введите здесь описание изображения

Ценовая категория заблокирована, и я не могу увеличить размер своей коллекции выше 10 ГБ.

Пара вопросов:

<сильный>1. Является ли единственным способом обойти это для меня, чтобы сделать запрос в службу поддержки? Портал сообщает об этом, если вы наведете значок информации, но в нем вскользь упоминается, что разрабатывается лучший способ масштабирования? Однако я ищу четкую информацию по этому поводу, поскольку запросы на поддержку нецелесообразны в производственных сценариях, поскольку мне может потребоваться увеличить (и уменьшить) мощность на лету!

<сильный>2. Существует ли (или будет ли) способ автоматического масштабирования разделов? Например, могу ли я разрешить автоматическое масштабирование моих первоначальных 10 ГБ до 50 ГБ с шагом 10 ГБ, но предупредите меня, чтобы он превышал 50 ГБ?

<сильный>3. Есть ли (или будет) способ программно масштабировать разделы с помощью C# SDK?

<сильный>4. Что такое инкрементная единица масштабирования? Я предполагаю, что она составляет 10 ГБ, но мне не удалось найти четкую документацию по этому вопросу.

<сильный>5. Должен ли я предполагать, что мой PartitonKey по-прежнему ограничен 10-гигабайтным хранилищем? Если да, то существует ли предстоящий (или существующий) сценарий, который позволил бы PartitionKey выйти за пределы этой границы в 10 ГБ? Опять же, здесь мне приходится делать предположения, поскольку документация является спорадической и очень расплывчатой!

27.02.2017

  • Если вам необходимо автоматическое масштабирование коллекций DocumentDb, загляните в CloudMonix @ cloudmonix.com — автоматическое масштабирование баз данных документов не доступно через Azure 28.02.2017

Ответы:


1

Из цены DocumentDB мы можем узнать, что за каждую коллекцию взимается почасовая оплата. на основе объема хранимых данных (в ГБ) и пропускной способности, зарезервированной в единицах 100 RU/сек. И, как вы сказали, в настоящее время это позволяет нам только регулировать уровень пропускной способности в колонке Масштабирование на портале Azure.

Кроме того, согласно вашему описанию, мы можем обнаружить, что вы создали однораздельную коллекцию с наименьшей пропускной способностью, если вы хотите масштабировать ее до более высокой пропускной способности (> 10 000 ЕЗ/с) или большего хранилища данных (> 10 ГБ), вы можно использовать средство переноса данных DocumentDB для переноса данных из коллекции с одним разделом в коллекцию с разделами. В этой статье показано, как перейти от однораздельной коллекции к многораздельной. См. ее.

28.02.2017
  • Согласно тому, что вы говорите, единственный способ, которым я могу начать использовать секционированные коллекции (не беспокоясь о миграции в более поздние сроки), — это начать с плана на 250 ГБ? Мне это кажется немного глупым. Тем более, что стоимость в 6 раз больше, если я установлю самый низкий уровень RU. Это также невероятное количество неиспользуемого хранилища, за которое я бы заплатил! 28.02.2017
  • Означает ли это также, что если я выберу план на 250 ГБ, а затем перерасту его, мне придется отправить запрос на увеличение этой суммы (скажем, 500 ГБ), а затем перенести 250 ГБ данных на новый план на 500 ГБ? 28.02.2017
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..