Nano Hash - криптовалюты, майнинг, программирование

Соблюдает ли Java HashTable коэффициент загрузки (указываемый нами) при использовании пользовательской хеш-функции?

Java позволяет нам указать размер и требуемый коэффициент загрузки хеш-таблицы, которую мы хотим создать. Если мы используем собственный метод HashCode для самостоятельной генерации ключей, то коэффициент загрузки должен зависеть от эффективности/качества нашего HashCode. Как я узнаю, что требования к коэффициенту загрузки, которые я указал изначально, все еще выполняются?

Ниже коэффициента загрузки, который я хочу, составляет 0,67.

Hashtable<Long, String[]> ht = new Hashtable<>(100, 0.67f);

Однако, если я скажу следующее

public int hashCode(int n){
 int a = n%72;
 return a;}

Тогда сохранится ли коэффициент загрузки 0,67, даже если моя функция хэш-кода довольно плохая?



Ответы:


1

Согласно вашему вопросу, коэффициент загрузки 0,67 все еще сохраняется, даже если функция хэш-кода плохая. Коэффициент загрузки используется, чтобы решить, когда увеличить размер внутренней структуры для размещения нового набора данных. В случае плохой функции хэш-кода вы можете столкнуться со многими коллизиями.

Другие эксперты могут пролить больше света на это и помочь мне улучшить мой ответ.

18.07.2019

2

Вот ссылка на реализацию HashTable в Java8.
http://hg.openjdk.java.net/jdk8/jdk8/jdk/file/tip/src/share/classes/java/util/Hashtable.java . Это отличный ресурс, чтобы понять, что произойдет, если вы переопределите методы по умолчанию.

Что касается вашего вопроса: метод hashCode не влияет на коэффициент загрузки. Коэффициент загрузки используется каждый раз, когда вы помещаете запись в таблицу, чтобы проверить, нуждается ли коллекция в перефразировании. Емкость хэш-таблицы по умолчанию равна 11, а порог равен емкости * loadFactor. Если текущее количество записей в таблице превышает это значение, будет выполнено повторное хеширование с коллекцией, в два раза превышающей размер вашей исходной таблицы.
Метод hashCode не влияет на этот процесс, однако, как указано в предыдущем ответе, он контролирует коллизий, а также несет прямую ответственность за производительность вашей Hashtable. Плохая хеш-функция так же хороша, как хранение всех данных в нескольких LinkedList и итеративный поиск в соответствующем списке.

18.07.2019
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..