Nano Hash - криптовалюты, майнинг, программирование

R, объединить несколько строк текстового фрейма данных в одну ячейку

У меня есть текстовый фрейм данных, который выглядит ниже.

> nrow(gettext.df)
[1] 3

> gettext.df
 gettext
 1 hello,
 2 Good to hear back from you.
 3 I've currently written an application and I'm happy about it

Я хотел объединить эти текстовые данные в одну ячейку (для анализа настроений), как показано ниже.

> gettext.df
  gettext
  1 hello, Good to hear back from you. I've currently written an application and I'm happy about it

поэтому я свернул ячейку, используя приведенный ниже код

paste(gettext.df, collapse =" ")

но похоже, что он объединяет эти текстовые данные в один фрагмент (как одно слово), поэтому я не могу сканировать предложение слово за словом.

Есть ли способ объединить эти предложения в набор предложений, не превращая их в один большой кусок слова?

31.12.2013

Ответы:


1

Вы должны преобразовать столбец фрейма данных в вектор символов перед использованием paste.

paste(unlist(gettext.df), collapse =" ")

Это возвращает:

[1] "hello, Good to hear back from you. I've currently written an application and I'm happy about it"
31.12.2013
  • Или просто работайте с вектором-столбцом: paste(gettext$gettext, collapse =" ") 08.11.2015
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..