Соблюдает ли Java HashTable коэффициент загрузки (указываемый нами) при использовании пользовательской хеш-функции?

Java позволяет нам указать размер и требуемый коэффициент загрузки хеш-таблицы, которую мы хотим создать. Если мы используем собственный метод HashCode для самостоятельной генерации ключей, то коэффициент загрузки должен зависеть от эффективности/качества нашего HashCode. Как я узнаю, что требования к коэффициенту загрузки, которые я указал изначально, все еще выполняются?

Ниже коэффициента загрузки, который я хочу, составляет 0,67.

Hashtable<Long, String[]> ht = new Hashtable<>(100, 0.67f);

Однако, если я скажу следующее

public int hashCode(int n){
 int a = n%72;
 return a;}

Тогда сохранится ли коэффициент загрузки 0,67, даже если моя функция хэш-кода довольно плохая?

18.07.2019

Не связанные: используйте HashMap< /a> вместо Hashtable или используйте ConcurrentHashMap, если необходимо быть потокобезопасным. 18.07.2019

Ответы:

Согласно вашему вопросу, коэффициент загрузки 0,67 все еще сохраняется, даже если функция хэш-кода плохая. Коэффициент загрузки используется, чтобы решить, когда увеличить размер внутренней структуры для размещения нового набора данных. В случае плохой функции хэш-кода вы можете столкнуться со многими коллизиями.

Другие эксперты могут пролить больше света на это и помочь мне улучшить мой ответ.

18.07.2019

Вот ссылка на реализацию HashTable в Java8.
http://hg.openjdk.java.net/jdk8/jdk8/jdk/file/tip/src/share/classes/java/util/Hashtable.java . Это отличный ресурс, чтобы понять, что произойдет, если вы переопределите методы по умолчанию.

Что касается вашего вопроса: метод hashCode не влияет на коэффициент загрузки. Коэффициент загрузки используется каждый раз, когда вы помещаете запись в таблицу, чтобы проверить, нуждается ли коллекция в перефразировании. Емкость хэш-таблицы по умолчанию равна 11, а порог равен емкости * loadFactor. Если текущее количество записей в таблице превышает это значение, будет выполнено повторное хеширование с коллекцией, в два раза превышающей размер вашей исходной таблицы.
Метод hashCode не влияет на этот процесс, однако, как указано в предыдущем ответе, он контролирует коллизий, а также несет прямую ответственность за производительность вашей Hashtable. Плохая хеш-функция так же хороша, как хранение всех данных в нескольких LinkedList и итеративный поиск в соответствующем списке.

18.07.2019

Новые материалы

Кластеризация: более глубокий взгляд

Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме

Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности

Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest

Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..

Machine Learning JavaScript Blockchain Artificial Intelligence Data Science Cryptocurrency Software Development Python Web Development Coding Deep Learning AI Bitcoin React Software Engineering Ethereum Web3 Business Crypto Nodejs Solidity Development Front End Development Data Finance Money Java Trading Typescript Smart Contracts Productivity Tech Startup Investing Neural Networks Developer Computer Science NLP

Соблюдает ли Java HashTable коэффициент загрузки (указываемый нами) при использовании пользовательской хеш-функции?

Ответы:

Новые материалы

Кластеризация: более глубокий взгляд

Как написать эффективное резюме

Частный метод Python: улучшение инкапсуляции и безопасности

Как я автоматизирую тестирование с помощью Jest

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

Теги