Публикации по теме 'nlp'
Обработка естественного языка (NLP): расширенное руководство для начинающих (часть 15) — Создание спама…
В этой серии итераций, состоящей из нескольких разделов, вы познакомитесь с созданием детектора спама. Является продолжением 14 части серии.
Вы изучили все основные этапы предварительной обработки, необходимые для большинства приложений текстовой аналитики. В этом разделе вы узнаете, как применить эти шаги для создания детектора спама .
До сих пор вы узнали, как использовать библиотеку scikit-learn для обучения алгоритмов машинного обучения. Здесь Кришна продемонстрирует, как..
Сходство пар вопросов Quora: решение реальной проблемы НЛП
В этой статье я проведу вас через процесс решения реальной проблемы НЛП. Статья будет разделена на следующие части:
История проблемы и источник данных. Изучение набора данных и его формата. Очистка и предварительная обработка данных. Особенности. Визуализация функций и удаление лишних. Векторизация текстовых объектов. Применение машинного обучения для классификации.
Прежде чем мы углубимся в детали, я хочу остановиться на нескольких вещах. Я постараюсь изо всех сил, чтобы..
Будущее ИИ: тенденции, на которые следует обратить внимание
Искусственный интеллект (ИИ) быстро меняет наш мир: от автономных транспортных средств до голосовых помощников и многого другого. Поскольку искусственный интеллект продолжает развиваться, важно быть в курсе последних тенденций и разработок. В этом сообщении блога мы рассмотрим некоторые из самых интересных тенденций ИИ, на которые стоит обратить внимание в ближайшем будущем.
Машинное обучение и глубокое обучение
Машинное обучение и глубокое обучение — две самые интересные..
Рекомендация друзей из социальных сетей с использованием Graph Mining
Указатель содержания
Постановка задачи Источник данных и обзор Сопоставление проблемы реального мира с проблемой контролируемого машинного обучения Бизнес-цели и ограничения Метрика производительности EDA (исследовательский анализ данных) Постановка проблемы как проблемы классификации Поезд и тестовый сплит Разработка признаков на графиках Моделирование Последние мысли
1. Постановка задачи
(Прогноз ссылки на графике) Учитывая направленный социальный граф, мы должны..
8 предварительно обученных моделей для изучения обработки естественного языка (NLP)
В наши дни приложения Обработка естественного языка (NLP) стали повсеместными. Кажется, я регулярно натыкаюсь на веб-сайты и приложения, которые в той или иной форме используют НЛП. Короче говоря, это прекрасное время для участия в сфере НЛП.
Столь быстрое распространение НЛП произошло во многом благодаря концепции трансферного обучения, возможного с помощью предварительно обученных моделей . Трансферное обучение в контексте НЛП - это, по сути, способность обучать модель на одном..
Обработка естественного языка с помощью твитов-катастроф.
Мы собираемся использовать твиты о стихийных бедствиях, доступные в kaggle Datasets .
В этом соревновании вам предстоит создать модель машинного обучения, которая предсказывает, какие твиты посвящены реальным бедствиям, а какие нет. У вас будет доступ к набору данных из 10 000 твитов, классифицированных вручную.
Использование tensorflow и keras для создания модели, позволяющей предсказывать, связаны ли твиты с катастрофой или нет.
Во-первых, мы импортируем все необходимые библиотеки...
Связь между вычислениями и машинным обучением
Связь между вычислениями и машинным обучением
Исчисление — это раздел математики, который занимается скоростью изменения и анализом функций. Это фундаментальный инструмент, используемый во многих областях, включая физику, инженерию, экономику и информатику. В последние годы исчисление становится все более важным в области машинного обучения.
Машинное обучение — это тип искусственного интеллекта, который позволяет компьютерам учиться на данных без явного программирования. Он..
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..