Публикации по теме 'r'
Как бороться с выбросами в шумной популяции?
Определение выбросов может быть простой задачей. С другой стороны, решение о том, что с ними делать, всегда требует более глубокого изучения.
Мотивация
Данные могут быть зашумленными. Когда у вас небольшая (по отношению к размеру совокупности) случайная выборка совокупности, особенно шумной, создание модели, которая бы хорошо обобщала, может оказаться довольно сложной задачей, а то и невозможным.
Представьте, что вы построили простую линейную модель, которая плохо работает с..
Что вам нужно знать, прежде чем начать изучать науку о данных
Сегодня наука о данных стала модным словом. Как вы все слышали, наука о данных - самая сексуальная работа 21 века. Все начинают проявлять интерес к изучению науки о данных с помощью онлайн-курсов, но прежде чем вы начнете, вам нужно кое-что знать. прежде чем вы начнете…
что такое Data Science для начинающих?
Наука о данных в основном включает в себя сочетание нескольких инструментов, математики, статистических принципов и алгоритмов машинного обучения.
Люди часто задают вопрос:..
Почему R - лучший язык программирования (для всех нас)?
Почему R - лучший язык программирования (для всех нас)?
Я пользуюсь R более 6 лет. Я познакомился с R на курсе доктора философии по моделированию методом Монте-Карло в финансах, проведенном Вольфгангом Хёрманном. У меня есть предыдущий опыт общения с другими языками; самым последним из них является C ++ (который мне тоже нравится). Но ни один из них не так удобен , как R.
Прежде чем я начну перечислять, почему R - лучший язык для остальных из нас, позвольте мне прояснить..
Вопросы по теме 'r'
Как создать список с именами, но без записей в R/Splus?
Я хотел бы создать список с именованными записями, значения которых не инициализированы (я планирую добавить к ним что-то позже). Как люди обычно это делают? Я сделал:
mylist.names <- c("a", "b", "c")
mylist <- as.list(rep(NA,...
50922 просмотров
schedule
07.10.2023
Составьте таблицу частоты строк
Я пытаюсь сделать сводную таблицу из многих строк. Мои данные выглядят так:
x<-c("a", "a", "b", "c", "c", "c", "d")
Как бы я проанализировал повторение каждой строки сразу? В идеале создать такую таблицу частоты (я полагаю, было бы...
14755 просмотров
schedule
24.12.2023
R не может преобразовать NaN в NA для большого фрейма данных
У меня есть набор данных приличного размера из ~ 60 столбцов, которые были случайно заполнены NaN вместо NA . Типы столбцов представляют собой сочетание символьных, числовых, факторных и целых чисел. Мне нужно преобразовать NaN в NA , так как...
1980 просмотров
schedule
09.11.2023
Не удается увеличить размер заголовка и метки x/y на графике ggplot2, сохраненном в виде файла PNG, но он отлично работает на экране.
Я упираюсь в небольшую, но немаловажную кирпичную стену этим часто задаваемым вопросом и ответом на него.
Я использую Rstudio 0.97.336 и R 3.0.0 в Linux. Я делаю (гораздо более сложный) график, чтобы поместить его в статью. Размер заголовка и...
1676 просмотров
schedule
04.12.2023
Как SE может быть выше 1000 в многоуровневой логистической регрессии?
Возможно, мой вопрос не будет конкретным, но при настройке модели glme (с использованием пакета lme4 в R) я получаю для одного из параметров SE = 1000 с оценочным параметром до 16. Переменная является дихотомической переменной. Мой вопрос заключается...
561 просмотров
schedule
27.10.2023
R: корреляция Пирсона rcorr(x,y) [x=матрица, y=вектор] игнорирует y
У меня есть матрица x (30x2000) из 2000 экспрессий генов в разных клеточных линиях и вектор y (30x1) с непрерывным переменным результатом. Я хочу рассчитать корреляцию Пирсона между каждым геном и результатом, поэтому я ожидаю вектор r-значений...
8370 просмотров
schedule
17.12.2023
Поддержка языков справа налево в R с использованием Mac
Мне интересно, есть ли поддержка языков с письмом справа налево в R при использовании Mac
Например, предположим следующий код:
x <- data.frame(a=runif(10),b=runif(10))
ggplot(x, aes(a,b)) + geom_point() + xlab("سلام")
Вот результат:...
1219 просмотров
schedule
25.12.2023
объединить список фреймов данных по определенным столбцам и строкам
У меня есть данные о запасах за 12 месяцев, содержащиеся в списке из 12 фреймов данных. Каждый фрейм данных имеет следующую структуру:
'data.frame': 218680 obs. of 19 variables:
$ Symbol : Factor w/ 3423 levels "AABC","AACB",..: 1...
96 просмотров
schedule
10.12.2023
как построить кластер временных рядов в цикле с разными цветами?
Я хотел бы знать, как я могу построить кластер временных рядов с разными цветами, когда я использую цикл. Я знаю, что процедура ggplot() делает это, но я не могу использовать ее перед циклом. Вот код:
plot(units_sold[,1], t="l",...
388 просмотров
schedule
08.10.2023
Преобразование имени столбца (года) в переменные значения — Python, R
У меня есть CSV, который выглядит так:
1991 1992 1993 1991 1992 1993
VariableA VariableB VariableC VariableC VariableC VariableD VariableD VariableD
lm mt 1 3...
108 просмотров
schedule
22.12.2023
Код R: Есть ли способ ускорить симуляцию Монте-Карло?
Представьте, что я даю вам шарик для пинг-понга с напечатанным на нем «-1». Затем я предлагаю вам вытащить еще один мячик для пинг-понга из сумки с надписью «Первая сумка». В этом мешке 30 000 мячей, некоторые из которых отмечены "-1", некоторые -...
1142 просмотров
schedule
24.12.2023
Агрегирование данных временных рядов за 15 минут
Я просмотрел здесь многие вопросы, связанные с агрегированием данных временных рядов, но, похоже, я не могу решить свою проблему. Мои данные выглядят так:
Pings Adult Entertainment Female Information Lifestyle Male MAV.TV MeTV...
558 просмотров
schedule
03.12.2023
Подключение к службам Analysis Services из R или Nodejs
Я пытаюсь подключить службы Analysis Services либо через R, либо через Nodejs.
Для R я нашел следующую библиотеку: https://github.com/overcoil/X4R
Для Nodejs я нашел следующую библиотеку: https://github.com/rpbouman/xmla4js
Сервер служб...
2145 просмотров
schedule
08.11.2023
Регулярное выражение, проанализированное с заменой grepl
Цель состоит в том, чтобы проанализировать регулярное выражение и заменить соответствующий шаблон.
Рассмотрим этот пример:
data <- c("cat 6kg","cat g250", "cat dog","cat 10 kg")
Мне нужно найти все вхождения cat и числа [0-9] ....
307 просмотров
schedule
17.11.2023
Как прочитать большой файл dbf по частям с помощью R
У меня есть файл 23G DBF. Допустим, он имеет 3 столбца: x y z и 1000 строк (для иллюстрации). Мне нужны только строки, в которых есть y из следующего c("хорошо","отлично","идеально"). И сохранить строки как файл .csv.
На самом деле, я не знаю,...
1055 просмотров
schedule
05.11.2023
Введите NA в фрейме данных
Я хотел бы ввести NAs в фрейме данных, установив определенное количество строк. Предположим, мне нужны две строки NAs
Это мой вклад:
df <- "col1 col2 col3"
df <- read.table(text=df, header=T)
> ncol(df)
[1] 3
И ниже мой...
80 просмотров
schedule
28.09.2023
Разделите строку в каждой строке и продублируйте эту строку
Во фрейме данных, над которым я работаю, есть один столбец строк, который может содержать «;». Я хочу найти их и разбить строку, разделенную знаком ";" и скопируйте эту строку и поместите разделенную строку в разные строки.
Вот пример фрейма...
683 просмотров
schedule
29.10.2023
Удалить нули из нескольких списков в списке
У меня есть большой список ( A ) списков SpatialPolygonsDataFrames. Некоторые из списков имеют нулевые значения (означает, что SpatialPolygonsDataFrame отсутствует). Я попытался :
A[!sapply(unlist(A, recursive=FALSE), is.null)]
Но...
703 просмотров
schedule
11.12.2023
R: Внедрение рейтингов Эло для командной игры; присвоение значений нескольким переменным из цикла
У меня есть данные, которые выглядят так:
a1 a2 a3 a4 a5 h1 h2 h3 h4 h5 a.evt.score h.evt.score
3311 4003 2737 3784 4177 2632 726 633 438 5444 0 1
1696 371 4471 2119 274 1947 5745 3622 438 5444...
933 просмотров
schedule
24.10.2023
Как захватить вывод html как png в R
Я использую интерактивный вывод, созданный пакетом networkD3 в R. Я знаю, как сохранить вывод в виде html-страницы, но мне также нужно сохранить «статическую» версию диаграммы в виде файла .png.
Код выглядит следующим образом:
# Load package...
10125 просмотров
schedule
06.11.2023