Ниже приведено мое понимание InputSplits и их взаимодействия с картографами... пожалуйста, поправьте меня, если я где-то ошибаюсь...
InputFormat генерирует InputSplits, и задача карты создается для каждого inputsplit. Для локальности данных обычно выбирается слот карты на узле данных, который физически несет блок, на который ссылается этот InputSplit. Представьте, что здесь нет репликации данных.
Что произойдет, если на узле данных, где находится блок, нет доступного слота карты? Будет ли средство отслеживания заданий ждать получения пустого слота на этом узле данных, а затем запланировать сопоставление на этом узле данных, или он запланирует сопоставление на любом другом узле, где есть свободный слот карты, а затем будет передавать данные с первого узла данных?