Вопросы по теме 'data.table'
Создайте уникальный идентификатор для разных групп строк
Я хочу пронумеровать определенные комбинации строк в кадре данных (который упорядочен по идентификатору и по времени)
tc <- textConnection('
id time end_yn number
abc 10 0 1
abc 11...
23.11.2023
Суммируйте пары столбцов по группам
Я хочу суммировать пары столбцов по группам. В приведенном ниже примере я хочу суммировать пары ( v1 и v2 ), ( v3 и v4 ) и ( v5 и v6 ), каждую по r1 , r2 и r3 .
Я могу сделать это, используя оператор sapply ниже, и я получу правильный...
16.11.2023
Разделение столбца таблицы данных
Интересно, как разделить столбец таблицы данных.
Можно легко разделить столбец data.frame с помощью следующего кода:
df <- data.frame(Test=c("A - B", "C - D"))
df
Test
1 A - B
2 C - D
library(reshape2)
reshape2:::colsplit(string =...
11.01.2024
R возвращает несколько таблиц данных из функции
Я хочу вернуть несколько объектов типа data.table из функции.
return(list(data.table(train), data.table(test))) и train = tt_list[1] не возвращают тип таблицы данных, а тип списка.
Я попытался выполнить преобразование, но либо произошла...
01.11.2023
Легко проверить, была ли цель записана в другую переменную?
У меня есть идентификатор клиента, product_id1 и product_id2. Данные содержат информацию о покупках клиентов и отсортированы по клиентам и времени, поэтому первая строка каждого клиента является самой старой записью. product_id1 включает в себя...
26.12.2023
Справочный столбец с назначенной переменной в data.table
Я хочу преобразовать столбец в моей таблице данных из факторных в числовые значения, но загвоздка в том, что я использую «словарь» (список), поэтому я хочу иметь возможность ссылаться на переменную столбца через «словарь»:
#my "dictionary"...
27.12.2023
вычисление квантилей по многим задачам в R data.table для нескольких столбцов вместе
DT = data.table(x=rep(c("b","a","c"),each=3), y=c(1,3,6), v=1:9)
# Desired output
rbind(cbind(id = "v", DT[x == "a", as.list(quantile(.SD, prob = c(0.05, .5, 0.95), na.rm = T)), by = x, .SDcols = c("v")]),
cbind(id = "y", DT[x == "a",...
07.01.2024
Найдите неперекрывающиеся значения из двух таблиц в R
У меня есть две таблицы:
library(data.table)
Input<-data.table("Date"=seq(1:10),"Cycle"=c(90,100,130,180,200,230,250,260,300,NA))
Date Cycle
1: 1 90
2: 2 100
3: 3 130
4: 4 180
5: 5 200
6: 6 230
7: 7...
16.11.2023
Передача слота data.tables j (имена переменных, функции, а также аргументы) в качестве аргумента
Я хотел бы дать функции, которые будут выполняться в j-м слоте data.table в качестве аргументов в стиле:
DT <- as.data.table(structure(list(peak.grp = c(1L, 2L, 2L, 2L, 2L), s = c(248, 264,
282, 304, 333), height = c(222772.8125,...
20.11.2023
Простой воспроизводимый пример передачи аргументов в data.table в самоопределяемой функции в R.
Я гуглил этот ответ в течение нескольких часов. Многие люди задавали подобные вопросы, но я не нашел ни достаточно простого вопроса, ни прямого ответа. Вот мой подход:
Предположим, что я хочу сделать простую группу в data.table :...
27.11.2023
Создайте несколько фреймов данных из другого фрейма данных в R
У меня есть фрейм данных с совокупными данными, и я хочу создать несколько фреймов данных из каждой строки основного фрейма данных.
df <- as.data.frame(matrix(0, ncol = 7, nrow = 10))
setnames(df, c("V1", "V2", "V3", "V4", "V5", "V6", "V7"),...
22.01.2024
подведение итогов data.table - создание нескольких подмножеств столбцов по дате в R
У меня есть данные о ID и соответствующем amount за несколько лет. Что-то вроде этого:
ID <- c(rep("A", 5), rep("B", 7), rep("C", 3))
amount <- c(sample(1:10000, 15))
Date <- c("2016-01-22","2016-07-25", "2016-09-22",...
23.11.2023
Как заставить людей заходить в магазин каждые 5 минут?
У меня есть таблица данных, как показано ниже:
library(data.table)
DT1<-data.table(
id=c(1,2,3,4,3,2),
in_time=c("2017-11-01 08:37:35","2017-11-01 09:07:44","2017-11-01 09:46:16","2017-11-01 10:32:29","2017-11-01 10:59:25","2017-11-01...
31.10.2023
Дневная таблица непредвиденных обстоятельств в R с использованием table()
У меня есть таблица данных с отметкой времени, температурой и столбцами состояния. Я пытаюсь найти таблицу непредвиденных обстоятельств в R, используя некоторые диапазоны частот. Теперь я получаю это. У меня есть столбец для метки времени в моих...
16.01.2024
Почему я должен везде использовать `[[1]]` с data.table?
После индексации столбца DT с именем переменной данные возвращаются как тип data.table data.frame , а столбец не является доступным вектором, я должен сначала удалить его из списка. Все ли я делаю, как задумано? Рассмотрим этот пример:...
02.11.2023
Сложная группа обработкой в data.table
Приносим извинения за нечеткое описание, но я не думаю, что однострочный текст может объяснить мое требование.
У меня есть таблица данных dt1 , как показано ниже:
id pg pd dt capp vt
1: 1111 hm <NA> 20-10-2020...
28.10.2023
Как связать список значений столбца data.table как дополнительные строки
У меня есть вопрос, связанный с R data.table. В моей таблице один столбец ('b') может содержать несколько значений. Для каждого значения, разделенного запятыми, я хотел бы иметь дополнительную строку в таблице данных со значением столбца «a» рядом с...
03.11.2023
Присоединитесь к двум кадрам данных с двумя столбцами [один из столбцов даты и времени] в R
У меня есть два df, и я пытаюсь присоединиться к ним влево или вправо на основе двух столбцов. Столбец идентификатора и даты и времени. как разрешить DateTime из другого df соответствовать первому df, даже если он находится в пределах 10-20 секунд...
18.01.2024
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..