Публикации по теме 'r'


Как бороться с выбросами в шумной популяции?
Определение выбросов может быть простой задачей. С другой стороны, решение о том, что с ними делать, всегда требует более глубокого изучения. Мотивация Данные могут быть зашумленными. Когда у вас небольшая (по отношению к размеру совокупности) случайная выборка совокупности, особенно шумной, создание модели, которая бы хорошо обобщала, может оказаться довольно сложной задачей, а то и невозможным. Представьте, что вы построили простую линейную модель, которая плохо работает с..

Что вам нужно знать, прежде чем начать изучать науку о данных
Сегодня наука о данных стала модным словом. Как вы все слышали, наука о данных - самая сексуальная работа 21 века. Все начинают проявлять интерес к изучению науки о данных с помощью онлайн-курсов, но прежде чем вы начнете, вам нужно кое-что знать. прежде чем вы начнете… что такое Data Science для начинающих? Наука о данных в основном включает в себя сочетание нескольких инструментов, математики, статистических принципов и алгоритмов машинного обучения. Люди часто задают вопрос:..

Почему R - лучший язык программирования (для всех нас)?
Почему R - лучший язык программирования (для всех нас)? Я пользуюсь R более 6 лет. Я познакомился с R на курсе доктора философии по моделированию методом Монте-Карло в финансах, проведенном Вольфгангом Хёрманном. У меня есть предыдущий опыт общения с другими языками; самым последним из них является C ++ (который мне тоже нравится). Но ни один из них не так удобен , как R. Прежде чем я начну перечислять, почему R - лучший язык для остальных из нас, позвольте мне прояснить..

Вопросы по теме 'r'

Как создать список с именами, но без записей в R/Splus?
Я хотел бы создать список с именованными записями, значения которых не инициализированы (я планирую добавить к ним что-то позже). Как люди обычно это делают? Я сделал: mylist.names <- c("a", "b", "c") mylist <- as.list(rep(NA,...
50922 просмотров
schedule 07.10.2023

Составьте таблицу частоты строк
Я пытаюсь сделать сводную таблицу из многих строк. Мои данные выглядят так: x<-c("a", "a", "b", "c", "c", "c", "d") Как бы я проанализировал повторение каждой строки сразу? В идеале создать такую ​​таблицу частоты (я полагаю, было бы...
14755 просмотров
schedule 24.12.2023

R не может преобразовать NaN в NA для большого фрейма данных
У меня есть набор данных приличного размера из ~ 60 столбцов, которые были случайно заполнены NaN вместо NA . Типы столбцов представляют собой сочетание символьных, числовых, факторных и целых чисел. Мне нужно преобразовать NaN в NA , так как...
1980 просмотров
r nan na
schedule 09.11.2023

Не удается увеличить размер заголовка и метки x/y на графике ggplot2, сохраненном в виде файла PNG, но он отлично работает на экране.
Я упираюсь в небольшую, но немаловажную кирпичную стену этим часто задаваемым вопросом и ответом на него. Я использую Rstudio 0.97.336 и R 3.0.0 в Linux. Я делаю (гораздо более сложный) график, чтобы поместить его в статью. Размер заголовка и...
1676 просмотров
schedule 04.12.2023

Как SE может быть выше 1000 в многоуровневой логистической регрессии?
Возможно, мой вопрос не будет конкретным, но при настройке модели glme (с использованием пакета lme4 в R) я получаю для одного из параметров SE = 1000 с оценочным параметром до 16. Переменная является дихотомической переменной. Мой вопрос заключается...
561 просмотров
schedule 27.10.2023

R: корреляция Пирсона rcorr(x,y) [x=матрица, y=вектор] игнорирует y
У меня есть матрица x (30x2000) из 2000 экспрессий генов в разных клеточных линиях и вектор y (30x1) с непрерывным переменным результатом. Я хочу рассчитать корреляцию Пирсона между каждым геном и результатом, поэтому я ожидаю вектор r-значений...
8370 просмотров
schedule 17.12.2023

Поддержка языков справа налево в R с использованием Mac
Мне интересно, есть ли поддержка языков с письмом справа налево в R при использовании Mac Например, предположим следующий код: x <- data.frame(a=runif(10),b=runif(10)) ggplot(x, aes(a,b)) + geom_point() + xlab("سلام") Вот результат:...
1219 просмотров
schedule 25.12.2023

объединить список фреймов данных по определенным столбцам и строкам
У меня есть данные о запасах за 12 месяцев, содержащиеся в списке из 12 фреймов данных. Каждый фрейм данных имеет следующую структуру: 'data.frame': 218680 obs. of 19 variables: $ Symbol : Factor w/ 3423 levels "AABC","AACB",..: 1...
96 просмотров
schedule 10.12.2023

как построить кластер временных рядов в цикле с разными цветами?
Я хотел бы знать, как я могу построить кластер временных рядов с разными цветами, когда я использую цикл. Я знаю, что процедура ggplot() делает это, но я не могу использовать ее перед циклом. Вот код: plot(units_sold[,1], t="l",...
388 просмотров
schedule 08.10.2023

Преобразование имени столбца (года) в переменные значения — Python, R
У меня есть CSV, который выглядит так: 1991 1992 1993 1991 1992 1993 VariableA VariableB VariableC VariableC VariableC VariableD VariableD VariableD lm mt 1 3...
108 просмотров
schedule 22.12.2023

Код R: Есть ли способ ускорить симуляцию Монте-Карло?
Представьте, что я даю вам шарик для пинг-понга с напечатанным на нем «-1». Затем я предлагаю вам вытащить еще один мячик для пинг-понга из сумки с надписью «Первая сумка». В этом мешке 30 000 мячей, некоторые из которых отмечены "-1", некоторые -...
1142 просмотров
schedule 24.12.2023

Агрегирование данных временных рядов за 15 минут
Я просмотрел здесь многие вопросы, связанные с агрегированием данных временных рядов, но, похоже, я не могу решить свою проблему. Мои данные выглядят так: Pings Adult Entertainment Female Information Lifestyle Male MAV.TV MeTV...
558 просмотров
schedule 03.12.2023

Подключение к службам Analysis Services из R или Nodejs
Я пытаюсь подключить службы Analysis Services либо через R, либо через Nodejs. Для R я нашел следующую библиотеку: https://github.com/overcoil/X4R Для Nodejs я нашел следующую библиотеку: https://github.com/rpbouman/xmla4js Сервер служб...
2145 просмотров
schedule 08.11.2023

Регулярное выражение, проанализированное с заменой grepl
Цель состоит в том, чтобы проанализировать регулярное выражение и заменить соответствующий шаблон. Рассмотрим этот пример: data <- c("cat 6kg","cat g250", "cat dog","cat 10 kg") Мне нужно найти все вхождения cat и числа [0-9] ....
307 просмотров
schedule 17.11.2023

Как прочитать большой файл dbf по частям с помощью R
У меня есть файл 23G DBF. Допустим, он имеет 3 столбца: x y z и 1000 строк (для иллюстрации). Мне нужны только строки, в которых есть y из следующего c("хорошо","отлично","идеально"). И сохранить строки как файл .csv. На самом деле, я не знаю,...
1055 просмотров
schedule 05.11.2023

Введите NA в фрейме данных
Я хотел бы ввести NAs в фрейме данных, установив определенное количество строк. Предположим, мне нужны две строки NAs Это мой вклад: df <- "col1 col2 col3" df <- read.table(text=df, header=T) > ncol(df) [1] 3 И ниже мой...
80 просмотров
r na
schedule 28.09.2023

Разделите строку в каждой строке и продублируйте эту строку
Во фрейме данных, над которым я работаю, есть один столбец строк, который может содержать «;». Я хочу найти их и разбить строку, разделенную знаком ";" и скопируйте эту строку и поместите разделенную строку в разные строки. Вот пример фрейма...
683 просмотров
r
schedule 29.10.2023

Удалить нули из нескольких списков в списке
У меня есть большой список ( A ) списков SpatialPolygonsDataFrames. Некоторые из списков имеют нулевые значения (означает, что SpatialPolygonsDataFrame отсутствует). Я попытался : A[!sapply(unlist(A, recursive=FALSE), is.null)] Но...
703 просмотров
schedule 11.12.2023

R: Внедрение рейтингов Эло для командной игры; присвоение значений нескольким переменным из цикла
У меня есть данные, которые выглядят так: a1 a2 a3 a4 a5 h1 h2 h3 h4 h5 a.evt.score h.evt.score 3311 4003 2737 3784 4177 2632 726 633 438 5444 0 1 1696 371 4471 2119 274 1947 5745 3622 438 5444...
933 просмотров
schedule 24.10.2023

Как захватить вывод html как png в R
Я использую интерактивный вывод, созданный пакетом networkD3 в R. Я знаю, как сохранить вывод в виде html-страницы, но мне также нужно сохранить «статическую» версию диаграммы в виде файла .png. Код выглядит следующим образом: # Load package...
10125 просмотров
schedule 06.11.2023