Nano Hash - криптовалюты, майнинг, программирование

Подмножество столбцов из фрейма данных в R

У меня относительно простой вопрос относительно столбцов подмножества в R.

У меня есть два фрейма данных, dat1 и dat2:

>dat1
      cities countries areakm2 populationk
1   Shanghai     China    2643       21766
2    Beijing     China    1368       21500
3        NYC       USA Unknown        8406
4         LA       USA    1302        3884
5     London        UK    1737     Unknown
6 Manchester        UK     116         255

> dat2
  Ozone Solar.R Wind Temp Month Day
1    41     190  7.4   67     5   1
2    36     118  8.0   72     5   2
3    12     149 12.6   74     5   3
4    18     313 11.5   62     5   4
5    NA      NA 14.3   56     5   5

Затем, если я хочу выделить первый столбец из dat1, я получаю следующее:

> dat1[,1]
[1] Shanghai   Beijing    NYC        LA         London     Manchester
Levels: Beijing LA London Manchester NYC Shanghai
> class(dat1[,1])
[1] "factor

Однако, если я сделаю то же самое с dat2, я получу вектор, а не фактор.

> dat2[,1]
[1] 41 36 12 18 NA
> class(dat2[,1])
[1] "integer"

Я не могу понять, в чем разница между этими двумя случаями. Я предполагаю, что это как-то связано с типами данных (в dat1 первый столбец состоит из символов, а в dat2 - целых чисел)

Спасибо

15.07.2015

Ответы:


1

На самом деле оба являются векторами. Один из множителей и один из целых чисел. Если вы хотите, чтобы R видел их как символы (другой тип, например, множители или целые числа), вы должны использовать

stringsAsFactors = FALSE

При создании вашего data.frame

15.07.2015
  • Но мне интересно, почему R показывает вывод по-другому в этих случаях? 15.07.2015
  • Это способ R отображать вектор факторов, он показывает лежащие в основе уровни. Но в дальнейших расчетах они оба будут рассматриваться одинаково. 15.07.2015
  • Спасибо! Теперь я могу это принять 15.07.2015
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..