Возникли проблемы с созданием воспроизводимого примера и я не могу поделиться данными, но я думаю, что наткнулся на ошибку в fread(). Попытка прочитать мой tsv-файл размером 1,658 ГБ, закодированный в Latin-1, приводит к следующей ошибке:
Error in fread("POANG.txt", header = TRUE, sep = "\t", sep2 = NULL, encoding = "Latin-1", :
Jump 949 did not finish counting rows exactly where jump 950 found its first good line start: prevEnd(0x14e51d6dc)<<>> != thisStart(prevEnd+180966)<<4908565 01 0 1 0 1999 1 TNMAT NMAC09 015 015 15.>>
Проблемной строкой является строка № 11129896, где есть отметка NUL, записанная как <0x00>
в Sublime Text и ^@
в Vi (не могу ее скопировать). Если я устанавливаю skip = 11129895
, fread выдает ту же ошибку, но теперь при «скачке 0», если я устанавливаю skip = 11129896
, все работает, но nrows=11129895
все равно выдает ту же ошибку.
A
s и все цифры на 1s. - person Pasha   schedule 24.10.2017