Nano Hash - криптовалюты, майнинг, программирование

Вопросы по теме 'dataframe'

случайным образом суммируйте значения из строк и назначьте их 2 столбцам в R
У меня есть data.frame с 8 столбцами. Одна предназначена для списка субъектов (одна строка на тему), а остальные 7 строк имеют оценку 1 или 0. Вот как выглядят данные: >head(splitkscores) subject block3 block4 block5 block6 block7 block8...
01.12.2023

Как разбить столбец строки фрейма данных на два столбца?
У меня есть фрейм данных с одним (строковым) столбцом, и я хотел бы разделить его на два (строковых) столбца, с одним заголовком столбца как ' fips' , а другим 'row' Мой фрейм данных df выглядит так: row 0 00000 UNITED STATES 1...
06.01.2024

импорт и работа с датами в excel r
Я импортировал базу данных из excel в r. У меня есть переменная с надписью «Дата рождения» в формате excel dd/mm/yyyy, и я хочу перейти в формат dd-mm-yyyy, чтобы можно было работать с типом класса Date. > c Athlete...
27.10.2023

Удалить пустые строки из CSV-файла, созданного в Excel
У меня есть фрейм данных, импортированный из excel csv. Пока это работает, однако csv всегда сохраняет 49 999 строк, хотя данных всего около 10 000 строк. Все остальные строки пусты. Как теперь выбрать только ту часть фрейма данных, содержащую...
16.11.2023

R: скользящее/скользящее среднее по месяцам
Я пытаюсь рассчитать скользящее/скользящее среднее по месяцам. Например, используя экономические данные из пакета ggplot2, я хочу построить сопутствующий временной ряд, представляющий 3-летнее скользящее среднее значение каждого месяца....

Агрегирование R по большому количеству столбцов без указания имен столбцов
Я не смог найти ответ на свой вопрос ни здесь, ни в Google. У меня есть фрейм данных (ширина 500 столбцов, длина 200 000 строк) с несколькими строками на человека. Каждая ячейка (за исключением первого столбца с идентификатором человека) содержит...
11.12.2023

R: мультииндекс по столбцам и/или строкам
В python , а точнее в pandas , я могу работать с MultIndex в строках или столбцах. Есть ли эквивалент в R ? Я проверял несколько руководств, например, в https://en.wikibooks.org/wiki/R_Programming/Working_with_data_frames , но я не смог найти...
26.12.2023

График столбцов фрейма данных против первого столбца в R
Как в R можно построить все столбцы фрейма данных против первого столбца этого фрейма данных? Если фрейм данных имеет 4 столбца, это должен быть один график из 3 наложенных друг на друга линий. plot(df) создает матрицу диаграммы рассеяния, а...
21.11.2023

Переупорядочить фрейм данных, сжав 1 столбец и переместив оставшиеся столбцы
У меня есть небольшой кадр данных в R, который состоит из двух условий обработки, соответствующего момента времени и средней экспрессии определенного гена для этих образцов. > RPmean Источник: локальная база данных [8 x 3] Группы: Лечение...

Как записать данные в Redshift, которые являются результатом фрейма данных, созданного в Python?
У меня есть фрейм данных в Python. Могу ли я записать эти данные в Redshift как новую таблицу? Я успешно создал соединение БД с Redshift и могу выполнять простые запросы sql. Теперь мне нужно написать на него кадр данных.

R: любая функция для декартова произведения двух кадров данных?
Мне нужно сделать декартово произведение двух фреймов данных. Например, A = id weight type 10 20 a 10 30 b 25 10 c B = date report 2007 y 2008 n тогда C будет похож на декартово...
21.12.2023

Нужно меньше паркетных напильников
Я делаю следующий процесс rdd.toDF.write.mode(SaveMode.Append).partitionBy("Some Column").parquet(output_path) Однако в каждом разделе слишком много файлов паркета, и каждый из них имеет очень маленький размер, из-за чего мои следующие шаги...

Python Pandas: возврат более одного значения поля при применении функции к строке фрейма данных
Мне нужно применить несколько функций к строкам фрейма данных. Аргументы этих функций принимают значения из двух или более полей одной строки. Например: d = {...
23.11.2023

R - найти последовательность элементов строки на основе временных ограничений в кадре данных
Рассмотрим следующий фрейм данных (отсортированный по идентификатору и времени): df <- data.frame(id = c(rep(1,7),rep(2,5)), event = c("a","b","b","b","a","b","a","a","a","b","a","a"), time = c(1,3,6,12,24,30,32,1,2,6,17,24)) df id event...
10.01.2024

Ошибка Pandas - истинное значение серии неоднозначно при использовании iloc
Я использую кадр данных pandas и пытаюсь выбрать строки, в которых yearID == 2001 и team_IDx == 'OAK' . Столбец yearID имеет тип int, а team_IDx является объектом. Вот выражение, которое я использую: mergeddf.loc[(mergeddf['yearID'] ==...
06.01.2024

Python, как создать excel с автофильтром из pandas dataframe и openpyxl
Я попытался создать файл excel из фрейма данных Python pandas с автоматическим фильтром для отображения недопустимых данных по умолчанию. Вот мой входной кадр данных df: ITEM RESULT A1 VALID A2 VALID A# INVALID Я хочу добавить...

Использование pandas для эффективного чтения большого CSV-файла без сбоев
Я пытаюсь прочитать файл .csv с именем ratings.csv с http://grouplens.org/datasets/movielens/20m/ размер файла на моем компьютере составляет 533,4 МБ. Вот что я пишу в Jupyter Notebook import pandas as pd ratings =...

вставлять строки между датами по группам
Я хочу вставить строки между двумя датами по группе. Мой способ сделать это настолько сложен, что я вставляю пропущенные значения путем переноса последнего наблюдения вперед, а затем объединяю. Мне было интересно, есть ли более простой способ...
14.12.2023

Сортировка фрейма данных Pandas по столбцу
У меня есть фрейм данных Python Pandas. В df есть 2 столбца, я хотел бы отсортировать df по второму столбцу. Kappa_prod Angle 0 0.004511 -5.457840 1 0.003977 -5.312861 2 0.004476 -5.311292 3 0.003644 -117.579594 4...

Объединение двух фреймов данных по столбцам
Я новичок в модулях Python и Pandas. Я работаю над проблемой статистики, в которой я хочу объединить два фрейма данных с определенными стилями. Вот мой 1-й кадр данных для средних значений: - 5.006 3.418 1.464 0.244 - 5.936 2.770...

Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..