Мне нужно загрузить ~ 29 миллионов узлов из файла CSV (с ИСПОЛЬЗОВАНИЕМ ПЕРИОДИЧЕСКОЙ КОММИТИИ), но я получаю «Неизвестную ошибку» после загрузки первых узлов ~ 75 000. Я пытался изменить размер фиксации (250, 500 и 1000), увеличить кучу Java (-Xmx4096m) и использовать отображение памяти, но ничего не меняется (кроме количества загружаемых узлов - при размере фиксации 500 я получаю "Неизвестную ошибку" после 75 499 узлов, а при размере фиксации 250 я получаю «Неизвестная ошибка» после 75 749 узлов).
Я делаю это в браузере, используя Neoj4 2.1.7 на удаленной машине с 10 ГБ ОЗУ и Windows Server 2012. Вот мой код:
USING PERIODIC COMMIT 1000
LOAD CSV FROM "file:/C:/Users/thiago.marzagao/Desktop/CSVs/cnpj.csv" AS node
CREATE (:PessoaJuridica {id: node[0], razaoSocial: node[1], nomeFantasia: node[2], CNAE: node[3], porte: node[4], dataAbertura: node[5], situacao: node[6], dataSituacao: node[7], endereco: node[8], CEP: node[9], municipio: node[10], UF: node[11], tel: node[12], email: node[13]})
Плохо то, что файлы nioneo_logical.log
имеют какую-то странную кодировку, которую не может понять ни один текстовый редактор. Я вижу только eÿÿÿÿ414141
, ÿÿÿÿÿÿÿÿ
и т. д. Файл messages
, в свою очередь, заканчивается сотнями предупреждений о сборке мусора, вроде этих:
2015-02-05 17:16:54.596+0000 WARN [o.n.k.EmbeddedGraphDatabase]: GC Monitor: Application threads blocked for 304ms.
2015-02-05 17:16:55.033+0000 WARN [o.n.k.EmbeddedGraphDatabase]: GC Monitor: Application threads blocked for 238ms.
2015-02-05 17:16:55.471+0000 WARN [o.n.k.EmbeddedGraphDatabase]: GC Monitor: Application threads blocked for 231ms.
Я нашел несколько связанных вопросов но это не совсем то, что я ищу.
Что мне не хватает?
messages.log
, — это набор[org.neo4j]: GC Monitor: Application threads blocked for {200-700}ms.
сообщений. 08.02.2015