Nano Hash - криптовалюты, майнинг, программирование

сравнение листов excel в R

У меня есть два файла excel с несколькими листами. Имена листов и соответствующие им имена столбцов одинаковы для обоих файлов. Отличаться будут только значения в листах. Я хочу сравнить с помощью R, какие значения отличаются, и хочу отметить эти ячейки

23.05.2016


Ответы:


1

Для удовольствия, вот быстрый и грязный пример, на котором вы можете построить для своих конкретных нужд:

wbsCreate <- function(v) {
  wb <- createWorkbook()
  sheet <- createSheet(wb, "Sheet1")
  rows  <- createRow(sheet, rowIndex=1:5)
  cells <- createCell(rows, colIndex=1:5) 
  for (r in 1:5)
    for (c in 1:5)
      setCellValue(cells[[r, c]], value = v[(r-1)*5+c])
  saveWorkbook(wb, tf <- tempfile(fileext = ".xlsx"))
  return(tf)
}

wbsMarkDiff <- function(fn1, fn2) {
  fns <- c(fn1, fn2)
  wb <- lapply(fns, loadWorkbook)  
  cs <- lapply(wb, function(x) CellStyle(x) + 
                 Fill(backgroundColor="red", 
                      foregroundColor="red", 
                      pattern="SOLID_FOREGROUND"))
  sheets <- lapply(wb, getSheets)
  sheetnames <- do.call(intersect, lapply(sheets, names))
  for (sheetname in sheetnames) {
    sheet <- lapply(sheets, "[[", sheetname)
    rows <- lapply(sheet, getRows)
    cells <- lapply(rows, getCells)
    values <- lapply(cells, function(cell) lapply(cell, getCellValue))
    idx <- names(which(!mapply(identical, values[[1]], values[[2]])))
    for (s in 1:2) 
      for (i in idx) 
        setCellStyle(cells[[s]][[i]], cs[[s]])
    for (s in 1:2)
      saveWorkbook(wb[[s]], fns[s])
  }
}

library(xlsx)

# create to excel workbooks (same dimensions per sheet)    
v <- LETTERS[1:25]
tf1 <- wbsCreate(v)
v[c(3,6,9)] <- letters[c(3,6,9)]
tf2 <- wbsCreate(v)

# mark differences     
wbsMarkDiff(tf1, tf2)
shell.exec(tf1) # open file1 on windows
shell.exec(tf2) # open file2 on windows

Вы получаете справку по каждой команде, используя ?, например, ?createWorkbook дает вам файлы справки по этой функции.

23.05.2016
  • xlsx требует Java, возможен ли обходной путь с использованием openxlsx и writexlsx? 03.09.2020
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..