Nano Hash - криптовалюты, майнинг, программирование

Как изменить Hadoop HDFS для локального хранения файлов

Я нашел вопрос Где HDFS хранит файлы локально по умолчанию?.

Мои HDFS хранят данные в папке /tmp/, которая удаляется системой.

Я хочу изменить где HDFS локально хранит файлы .

Я ищу в hdfs-default.xml, но не могу найти dfs.data.dir

Выполнить bin/hadoop version

Hadoop 2.8.2
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r 66c47f2a01ad9637879e95f80c41f798373828fb
Compiled by jdu on 2017-10-19T20:39Z
Compiled with protoc 2.5.0
From source with checksum dce55e5afe30c210816b39b631a53b1d
This command was run using /usr/local/hadoop/share/hadoop/common/hadoop-common-2.8.2.jar

Редактировать
Я хочу узнать подробности о том, что:
Какой файл и как мне следует отредактировать, чтобы HDFS хранила файлы локально?

07.11.2017


Ответы:


1

Спасибо @ultimoTG за подсказку.

Итак, мое решение — найти имя файла hdfs-default.xml (этот файл только для справки, изменить конфигурацию здесь НЕ РАБОТАЕТ) в моем каталоге hadoop.

$HADOOP_HOME/share/doc/hadoop/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

Затем я копирую строку, которую хочу изменить, с hdfs-default.xml на $HADOOP_HOME/etc/hadoop/hdfs-site.xml перед изменением значения.

Это мой $HADOOP_HOME/etc/hadoop/hdfs-site.xml, который изменяет HDFS, хранит файлы локально в папке Download.

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--
  Licensed under the Apache License, Version 2.0 (the "License");
  you may not use this file except in compliance with the License.
  You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

  Unless required by applicable law or agreed to in writing, software
  distributed under the License is distributed on an "AS IS" BASIS,
  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  See the License for the specific language governing permissions and
  limitations under the License. See accompanying LICENSE file.
-->

<!-- Put site-specific property overrides in this file. -->

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>


<property>
  <name>dfs.namenode.name.dir</name>
  <value>/home/my_name/Downloads/hadoop_data/dfs/name</value>
  <description>Determines where on the local filesystem the DFS name node
      should store the name table(fsimage).  If this is a comma-delimited list
      of directories then the name table is replicated in all of the
      directories, for redundancy. </description>
</property>

<property>
  <name>dfs.datanode.data.dir</name>
  <value>/home/my_name/Downloads/hadoop_data/dfs/data</value>
  <description>Determines where on the local filesystem an DFS data node
  should store its blocks.  If this is a comma-delimited
  list of directories, then data will be stored in all named
  directories, typically on different devices. The directories should be tagged
  with corresponding storage types ([SSD]/[DISK]/[ARCHIVE]/[RAM_DISK]) for HDFS
  storage policies. The default storage type will be DISK if the directory does
  not have a storage type tagged explicitly. Directories that do not exist will
  be created if local filesystem permission allows.
  </description>
</property>

</configuration>
07.11.2017

2

Найдите dfs.datanode.data.dir. Документы здесь — http://hadoop.apache.org/docs/r2.8.2/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

07.11.2017
  • куда я должен поместить свой dfs.datanode.data.dir? (какой файл на моем ноутбуке) 07.11.2017

  • 3

    Когда вы впервые извлекаете свой файл hadoop, файл hdfs-site.xml присутствует в $HADOOP_HOME/etc/hadoop и по умолчанию пуст. Вы можете добавить следующую конфигурацию в файл hdfs-site.xml, чтобы изменить местоположение локального магазина:

    <property> 
          <name>dfs.data.dir</name> 
          <value>path_to_dir</value> 
    </property> 
    
    <property> 
          <name>dfs.name.dir</name> 
          <value>path_to_dir</value> 
    </property> 
    
    07.11.2017
    Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..