Вопросы по теме 'apache-spark-sql'
Spark DataFrame и переименование нескольких столбцов (Java)
Есть ли более приятный способ префикса или переименования всех или нескольких столбцов одновременно данного SparkSQL DataFrame , чем вызов несколько раз dataFrame.withColumnRenamed() ?
Например, если я хочу обнаружить изменения (используя полное...
25198 просмотров
schedule
28.11.2023
Spark SQL: объем памяти кеш-памяти улучшается с помощью «упорядочить по»
У меня есть два сценария, в которых я 23 GB разделил parquet данные и читаю несколько columns & caching их заранее, чтобы впоследствии запустить серию последующих запросов.
Настройка :
Кластер: 12 узлов ЭМИ
Версия Spark: 1.6...
1154 просмотров
schedule
20.11.2023
Spark sql (1.4): получить текущую метку времени
Я знаю, что в Spark 1.5 и выше есть функция current_timestamp, но мы все еще на 1.4. Как добавить столбец в DataFrame, для которого задана «текущая временная метка»?
df.withColumn("date_inserted", ????)
1244 просмотров
schedule
20.11.2023
Программно преобразовать все столбцы определенных типов данных в другие типы данных в Scala Spark.
Я программно пытаюсь преобразовать типы данных столбцов и столкнулся с некоторыми проблемами кодирования.
Для этого я изменил используемый код здесь .
Данные >> любые числа читаются как строки.
Код >>
import org.apache.spark.sql...
63 просмотров
schedule
01.10.2023