Вопросы по теме 'hdfs'
Шлюз HDFS NFS Нет доступных групп для предупреждений пользователей
Я использую службу шлюза NFS для загрузки некоторых данных в HDFS (CDH 5.4.5).
Казалось, все в порядке, пока я не получил сообщение с предупреждением о том, что в каталоге журналов очень мало свободного места. Я быстро просмотрел большие файлы...
579 просмотров
schedule
17.11.2023
Какова основная причина самоподавления, не разрешенного в Spark?
Когда искра записывала большой файл в HDFS с помощью saveAsTextFile, я получил ошибку: java.lang.IllegalArgumentException: Self-suppression not permitted at java.lang.Throwable.addSuppressed(Throwable.java:1043)
Caused by: java.io.IOException: All...
13303 просмотров
schedule
19.10.2023
Pyhdfs copy_from_local вызывает указание имени узла или имени сервера или неизвестную ошибку
Я использую следующий код Python для загрузки файла на удаленный HDFS из моей локальной системы с помощью pyhdfs
from pyhdfs import HdfsClient
client = HdfsClient(hosts='1.1.1.1',user_name='root')
client.mkdirs('/jarvis')...
1206 просмотров
schedule
09.10.2023
От zip до seq с помощью SPARK
Каждый день я получаю zip-архив «2018-06-26.zip» размером ок. Сжатый 250 Мб, содержащий 165-170 000 небольших файлов XML (КБ). Я загружаю zip-архив в HDFS (избегая проблемы с небольшими файлами) и использую SPARK для их извлечения из zip (zip-архивы...
140 просмотров
schedule
28.09.2023