Вопросы по теме 'pyspark'
проверить, является ли значение строки нулевым в искровом кадре данных
Я использую пользовательскую функцию в pyspark, чтобы проверить условие для каждой строки в кадре данных искры и добавить столбцы, если условие истинно.
Код выглядит следующим образом:
from pyspark.sql.types import *
from pyspark.sql.functions...
26652 просмотров
schedule
30.09.2023
Чтение различных схем в структуре Parquet Partitioned Dir
У меня есть следующие разделенные паркетные данные на hdfs, написанные с помощью искры:
year
|---Month
|----monthlydata.parquet
|----Day
|---dailydata.parquet
Теперь, когда я читаю df from year path, искра читает...
818 просмотров
schedule
25.11.2023