Nano Hash - криптовалюты, майнинг, программирование

Является ли поточно-ориентированная ленивая инициализация ссылок, если записанное значение всегда одно и то же?

В моем приложении мне нужно лениво устанавливать переменную, поскольку у меня нет доступа к необходимым методам во время инициализации класса, но мне также нужно, чтобы это значение было доступно в нескольких потоках. Я знаю, что могу использовать двойную проверку блокировки для решить эту проблему, но это кажется излишним. Метод, который мне нужно вызвать для получения значения, является идемпотентным, и возвращаемое значение никогда не изменится. Я хотел бы лениво инициализировать ссылку, как если бы я находился в однопоточной среде. Похоже, это должно работать, поскольку чтение и запись в ссылки являются атомарными. [1] [2]

Вот пример кода того, что я делаю.

// views should only be accessed in getViews() since it is
// lazily initialized. Call getViews() to get the value of views.
private List<String> views;

/* ... */

private List<String> getViews(ServletContext servletContext) {

    List<String> views = this.views;

    if (views == null) {

        // Servlet Context context and init parameters cannot change after
        // ServletContext initialization:
        // https://docs.oracle.com/javaee/6/api/javax/servlet/ServletContext.html#setInitParameter(java.lang.String,%20java.lang.String)
        String viewsListString = servletContext.getInitParameter(
                "my.views.list.VIEWS_LIST");
        views = ListUtil.toUnmodifiableList(viewsListString);
        this.views = views;
    }

    return views;
}

Этот вопрос о 32-битных примитивах аналогичен, но я хочу подтвердить, что поведение то же самое для ссылок на такие объекты, как Strings и Lists.

По-видимому, это должно работать нормально, поскольку каждый поток либо увидит null и повторно вычислит значение (не проблема, поскольку значение никогда не изменится), либо увидит уже вычисленное значение. Я здесь упускаю какие-то подводные камни? Является ли этот код потокобезопасным?


  • Без синхронизации (блок синхронизации или изменчивый) вы можете получить каждый поток, имеющий свой собственный экземпляр списка (каждый поток может видеть этот views == null и инициализировать переменную и использовать свою собственную копию списка) 23.05.2018
  • Доступ к ссылкам и примитивам атомарный. Проблемы с атомарным доступом к 64-битным значениям были решены в Java 5.0. 23.05.2018
  • В соответствии с этой реализацией каждый поток может иметь отдельный экземпляр views. Все хорошо? 23.05.2018
  • @erickson, ах, я особо не думал об этом, технически все эти экземпляры будут содержать эквивалентные данные, но я предполагаю, что это может вызвать потенциальные проблемы с памятью. Ради вопроса, давайте предположим, что каждый поток получает собственный экземпляр - это нормально, но я рад принять во внимание эту ловушку. Спасибо! 23.05.2018
  • @ stiemannkj1 Хеш строки - это 32-битное значение с отложенной инициализацией без изменчивой семантики, поскольку гоночные вычисления дают тот же результат. Однако обычно такие уловки не стоят того, если они не изолированы от чрезвычайно безопасного и критичного для производительности кода. 24.05.2018

Ответы:


1

Этот вопрос о 32-битных примитивах аналогичен, но я хочу подтвердить, что поведение одинаково для ссылок на такие объекты, как строки и списки.

Да, потому что написание ссылок всегда атомарно по JLS:

Запись и чтение ссылок всегда атомарны, независимо от того, реализованы ли они как 32-битные или 64-битные значения.

Питер Лоури отмечает, что это действительно начиная с Java 5.

Но обратите внимание на Наблюдение Ивана:

Без синхронизации (блок синхронизации или изменчивый) вы можете получить каждый поток, имеющий свой собственный экземпляр списка (каждый поток может видеть этот views == null и инициализировать переменную и использовать свою собственную копию списка)

... и вопрос Эриксона:

В этой реализации каждый поток может иметь отдельный экземпляр views. Все хорошо?

23.05.2018
  • Последнее утверждение верно для Java 5.0. 23.05.2018
  • @PeterLawrey - Спасибо! Я не знал, что это никогда не было правдой. Я действительно использовал Java pre 5 (фактически, Java 1.0), но в первый раз мне пришлось это знать, должно быть, после выхода Java 5. :-) 23.05.2018
  • До Java 5.0 это зависело от реализации для 64-битных примитивов, однако версия x64 оказалась атомарной, что означает, что вы еще менее вероятно столкнетесь с проблемой. 23.05.2018

  • 2

    Ваш код не обязательно является потокобезопасным. Хотя [w] обряды и чтение ссылок всегда атомарны ..., [1] Модель памяти Java не гарантирует, что объект будет полностью инициализирован при обращении к нему другими потоками. Модель памяти Java гарантирует только то, что поля объекта final будут инициализированы до того, как какие-либо потоки смогут увидеть ссылку на него:

    Поток, который может видеть ссылку на объект только после того, как этот объект был полностью инициализирован, гарантированно увидит правильно инициализированные значения для конечных полей этого объекта.

    JSR-133: модель памяти Java и спецификация потока

    Таким образом, если реализация ListUtil.toUnmodifiableList(viewsListString); возвращает объект List, который имеет какие-либо незавершенные поля, возможно, что другие потоки увидят ссылку List до инициализации незавершенных полей.


    Так, например, предположим, что реализация метода toUnmodifiableList() выглядела примерно так:

    public static List<String> toUnmodifiableList(final String viewsString) {
        return new AbstractList<String>() {
            String[] viewsArray = viewsString.split(",");
            @Override
            public String get(final int index) {
                return viewsArray[index];
            }
        };
    }
    

    Поток A вызывает getViews(servletContext) и находит views как null, поэтому пытается инициализировать views.

    Во время вызова toUnmodifiableList() JVM выполняет оптимизацию и переупорядочивает инструкции так, чтобы произошло следующее выполнение:

    views = /* Reference to AbstractList<String> prior to initialization */
    this.views = views;
    /* new AbstractList<String>() occurs and viewsString.split(",") completes */
    

    Пока поток A выполняется, поток B вызывает getViews(servletContext) после того, как поток A выполняет this.views = views;, но до завершения viewsString.split(",").

    Теперь поток B имеет ссылку на this.views, где this.views.viewsArray равно null, поэтому любые вызовы this.views.get(index) приведут к NullPointerException.


    Чтобы обеспечить безопасность потоков, любой объект, возвращаемый getViews(), должен был бы гарантировать, что он имеет только final поля, чтобы гарантировать, что ни один поток никогда не увидит частично инициализированный объект (или вы можете гарантировать, что неинициализированные значения обрабатываются правильно в объекте , но это, скорее всего, невозможно). Я считаю, что вам нужно убедиться, что все Object ссылки в объекте, возвращаемом getViews(), также имеют только final поля. Поэтому, если вы вернули List, который содержал final ссылку на MyClass, вам нужно будет убедиться, что все члены MyClass тоже final.

    Для получения дополнительной информации посетите: Частично созданные объекты в памяти Java Модель.

    04.08.2020
    Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..