Nano Hash - криптовалюты, майнинг, программирование

Когда сохранять индекс — анализ статистики использования индекса в SQL Server 2008

Я делаю индексный отчет по моей базе данных MS SQL 2008 (щелкните правой кнопкой мыши базу данных -> Отчеты -> Статистика использования индекса)

Он говорит мне, что один из моих индексов использует: 88 пользователей ищут 0 пользователей сканируют 6 134 141 пользовательских обновлений

Может кто-нибудь объяснить мне:

  1. В чем разница между пользовательским поиском и пользовательским сканированием?
  2. Как мне определить, когда сохранить индекс или удалить его в зависимости от поиска пользователя + сканирования пользователя против обновлений пользователя?

Думаю в данном случае затраты на поддержание индекса того не стоят.


Ответы:


1
  1. Вот хорошая статья, посвященная поиску и сканированию (и индексированию в целом). Вероятно, это будет лучше, чем любой пост SO.
  2. Это может быть чем-то вроде искусства, определяющего, нужен ли вам индекс или нет. Если эти 88 поисковых запросов занимают абсолютно необходимые отчетные запросы от времени выполнения от 3 часов до 30 секунд, оставьте их. Я думаю, что первым шагом будет выяснить, какие запросы их используют, насколько индексы помогают этим запросам и насколько важны эти запросы.

Фрагмент из статьи (обязательно прочтите):

Сканирование

Сканирование индекса — это полное чтение всех листовых страниц индекса. Когда сканирование индекса выполняется для кластеризованного индекса, это сканирование таблицы во всем, кроме имени.

Когда сканирование индекса выполняется обработчиком запросов, это всегда полное чтение всех конечных страниц в индексе, независимо от того, возвращаются ли все строки. Это никогда не бывает частичным сканированием.

Сканирование включает не только чтение конечных уровней индекса, страницы более высокого уровня также считываются как часть сканирования индекса.

Ищет

Поиск по индексу — это операция, в которой SQL использует структуру b-дерева для поиска определенного значения или начала диапазона значений. Чтобы поиск по индексу был возможен, в запросе должен быть указан предикат SARGable3 и соответствующий (или частично соответствующий) индекс. Соответствующий индекс — это индекс, в котором предикат запроса использует левое подмножество столбцов индекса. Это будет рассмотрено более подробно в части 3 этой серии.

Операция поиска оценивается, начиная с корневой страницы. Используя строки на корневой странице, обработчик запросов определит, какая страница на следующем более низком уровне индекса содержит 1-ю искомую строку. Затем он будет читать эту страницу. Если это конечный уровень индекса, поиск на этом заканчивается. Если это не лист, то обработчик запросов снова определяет, какая страница на следующем более низком уровне содержит указанное значение. Этот процесс продолжается до тех пор, пока не будет достигнут уровень листа.

Как только обработчик запросов находит конечную страницу, содержащую либо указанное значение ключа, либо начало указанного диапазона значений ключа, он считывает конечные страницы до тех пор, пока не будут возвращены все строки, соответствующие предикату.

31.08.2010

2

Следует отметить один важный момент: статистика использования индекса сбрасывается каждый раз при запуске базы данных. Таким образом, трудно оценить ваши 88 поисков, не зная, когда вы в последний раз перезапускали. 88 поисков за последний час сильно отличаются от 88 поисков за последний месяц.

  1. Пользовательский поиск ищет определенную строку или набор строк в индексе, которые соответствуют критериям вашего запроса. Пользовательское сканирование считывает все строки в индексе. По очевидным причинам операции поиска предпочтительнее операций сканирования.
  2. Я не знаю каких-либо общих рекомендаций, в которых говорится: «Когда отношение поиска/обновления равно X, отбросить индекс». Посмотрите на свой индекс с точки зрения этих Общих рекомендаций по проектированию и сравните его перед и после выполнения ваших запросов, чтобы определить влияние удаления индекса.
31.08.2010
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..