Вопросы по теме 'dataframe'
случайным образом суммируйте значения из строк и назначьте их 2 столбцам в R
У меня есть data.frame с 8 столбцами. Одна предназначена для списка субъектов (одна строка на тему), а остальные 7 строк имеют оценку 1 или 0. Вот как выглядят данные:
>head(splitkscores)
subject block3 block4 block5 block6 block7 block8...
01.12.2023
Как разбить столбец строки фрейма данных на два столбца?
У меня есть фрейм данных с одним (строковым) столбцом, и я хотел бы разделить его на два (строковых) столбца, с одним заголовком столбца как ' fips' , а другим 'row'
Мой фрейм данных df выглядит так:
row
0 00000 UNITED STATES
1...
06.01.2024
импорт и работа с датами в excel r
Я импортировал базу данных из excel в r. У меня есть переменная с надписью «Дата рождения» в формате excel dd/mm/yyyy, и я хочу перейти в формат dd-mm-yyyy, чтобы можно было работать с типом класса Date.
> c
Athlete...
27.10.2023
Удалить пустые строки из CSV-файла, созданного в Excel
У меня есть фрейм данных, импортированный из excel csv. Пока это работает, однако csv всегда сохраняет 49 999 строк, хотя данных всего около 10 000 строк. Все остальные строки пусты.
Как теперь выбрать только ту часть фрейма данных, содержащую...
16.11.2023
R: скользящее/скользящее среднее по месяцам
Я пытаюсь рассчитать скользящее/скользящее среднее по месяцам. Например, используя экономические данные из пакета ggplot2, я хочу построить сопутствующий временной ряд, представляющий 3-летнее скользящее среднее значение каждого месяца....
09.01.2024
Агрегирование R по большому количеству столбцов без указания имен столбцов
Я не смог найти ответ на свой вопрос ни здесь, ни в Google.
У меня есть фрейм данных (ширина 500 столбцов, длина 200 000 строк) с несколькими строками на человека. Каждая ячейка (за исключением первого столбца с идентификатором человека) содержит...
11.12.2023
R: мультииндекс по столбцам и/или строкам
В python , а точнее в pandas , я могу работать с MultIndex в строках или столбцах. Есть ли эквивалент в R ? Я проверял несколько руководств, например, в https://en.wikibooks.org/wiki/R_Programming/Working_with_data_frames , но я не смог найти...
26.12.2023
График столбцов фрейма данных против первого столбца в R
Как в R можно построить все столбцы фрейма данных против первого столбца этого фрейма данных?
Если фрейм данных имеет 4 столбца, это должен быть один график из 3 наложенных друг на друга линий.
plot(df) создает матрицу диаграммы рассеяния, а...
21.11.2023
Переупорядочить фрейм данных, сжав 1 столбец и переместив оставшиеся столбцы
У меня есть небольшой кадр данных в R, который состоит из двух условий обработки, соответствующего момента времени и средней экспрессии определенного гена для этих образцов.
> RPmean
Источник: локальная база данных [8 x 3] Группы: Лечение...
01.01.2024
Как записать данные в Redshift, которые являются результатом фрейма данных, созданного в Python?
У меня есть фрейм данных в Python. Могу ли я записать эти данные в Redshift как новую таблицу? Я успешно создал соединение БД с Redshift и могу выполнять простые запросы sql. Теперь мне нужно написать на него кадр данных.
19.11.2023
R: любая функция для декартова произведения двух кадров данных?
Мне нужно сделать декартово произведение двух фреймов данных. Например,
A = id weight type
10 20 a
10 30 b
25 10 c
B = date report
2007 y
2008 n
тогда C будет похож на декартово...
21.12.2023
Нужно меньше паркетных напильников
Я делаю следующий процесс
rdd.toDF.write.mode(SaveMode.Append).partitionBy("Some Column").parquet(output_path)
Однако в каждом разделе слишком много файлов паркета, и каждый из них имеет очень маленький размер, из-за чего мои следующие шаги...
27.10.2023
Python Pandas: возврат более одного значения поля при применении функции к строке фрейма данных
Мне нужно применить несколько функций к строкам фрейма данных. Аргументы этих функций принимают значения из двух или более полей одной строки. Например:
d = {...
23.11.2023
R - найти последовательность элементов строки на основе временных ограничений в кадре данных
Рассмотрим следующий фрейм данных (отсортированный по идентификатору и времени):
df <- data.frame(id = c(rep(1,7),rep(2,5)), event = c("a","b","b","b","a","b","a","a","a","b","a","a"), time = c(1,3,6,12,24,30,32,1,2,6,17,24))
df
id event...
10.01.2024
Ошибка Pandas - истинное значение серии неоднозначно при использовании iloc
Я использую кадр данных pandas и пытаюсь выбрать строки, в которых yearID == 2001 и team_IDx == 'OAK' . Столбец yearID имеет тип int, а team_IDx является объектом. Вот выражение, которое я использую:
mergeddf.loc[(mergeddf['yearID'] ==...
06.01.2024
Python, как создать excel с автофильтром из pandas dataframe и openpyxl
Я попытался создать файл excel из фрейма данных Python pandas с автоматическим фильтром для отображения недопустимых данных по умолчанию.
Вот мой входной кадр данных df:
ITEM RESULT
A1 VALID
A2 VALID
A# INVALID
Я хочу добавить...
22.11.2023
Использование pandas для эффективного чтения большого CSV-файла без сбоев
Я пытаюсь прочитать файл .csv с именем ratings.csv с http://grouplens.org/datasets/movielens/20m/ размер файла на моем компьютере составляет 533,4 МБ.
Вот что я пишу в Jupyter Notebook
import pandas as pd
ratings =...
20.01.2024
вставлять строки между датами по группам
Я хочу вставить строки между двумя датами по группе. Мой способ сделать это настолько сложен, что я вставляю пропущенные значения путем переноса последнего наблюдения вперед, а затем объединяю. Мне было интересно, есть ли более простой способ...
14.12.2023
Сортировка фрейма данных Pandas по столбцу
У меня есть фрейм данных Python Pandas. В df есть 2 столбца, я хотел бы отсортировать df по второму столбцу.
Kappa_prod Angle
0 0.004511 -5.457840
1 0.003977 -5.312861
2 0.004476 -5.311292
3 0.003644 -117.579594
4...
16.12.2023
Объединение двух фреймов данных по столбцам
Я новичок в модулях Python и Pandas. Я работаю над проблемой статистики, в которой я хочу объединить два фрейма данных с определенными стилями.
Вот мой 1-й кадр данных для средних значений:
- 5.006 3.418 1.464 0.244
- 5.936 2.770...
29.10.2023
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..