Чтобы начать свое время с ИИ сегодня, я решил провести небольшое исследование любых инструментов и ресурсов ИИ, которые я мог найти в пределах досягаемости запроса чат-бота LLM или поиска DuckDuckGo. Отказ от ответственности. Мой анализ и исследование приведенного ниже списка не ограничивались поверхностным обзором маркетинговых материалов, быстрой регистрацией в сервисах и некоторыми сравнениями поиска между инструментами/ресурсами. Это ни в коем случае не исчерпывающий список ВСЕХ инструментов и ресурсов ИИ, доступных на сегодняшний день, а лишь ограниченный набор инструментов, которые выглядят достаточно интересными, чтобы я мог покопаться в них за 30 дней путешествия (большинство из которых я подобраны вручную, чтобы попытаться решить некоторые реальные проблемы или провести более глубокое исследование). Я также решил уделить большую часть своего первоначального внимания инструментам на основе LLM (инструменты типа большой языковой модели, такие как ChatGPT/GPT-3) и ресурсам.

Для тех, кто не знает контекста, это связано с серией блогов под названием 30 Days of AI, где я поставил перед собой задачу провести следующие 30 дней, чтобы больше узнать об AI.

Бесплатные онлайн-курсы по искусственному интеллекту

Существует большое количество бесплатных учебных материалов, с которыми можно начать работу для всех, кому нравится стиль обучения в классе и на лекциях. Вот некоторые из них, которые мне показались достаточно интересными, чтобы внести их в шорт-лист, и я могу сделать дополнительный обзор позже в этом путешествии.

  • Курс генеративного ИИ Google — Google предлагает бесплатный курс обучения генеративному ИИ с несколькими короткими лекциями. Регистрация бесплатна и выглядит довольно удобной для новичков для тех, кто не очень разбирается в технологиях.
  • Учебное пособие по написанию подсказок W3Schools AI — существует множество ресурсов для изучения того, как лучше писать подсказки (подсказки — это входные данные для ChatGPT, как инструменты) для чат-ботов. У W3Schools есть краткое руководство по этому вопросу с советами по нескольким различным инструментам, таким как ChatGPT 3.5/4 и Google Bard.
  • Введение IBM в ИИ — это еще один курс, похожий на курс Google, который знакомит с некоторыми терминами и идеями ИИ. Это охватывает немного больше, чем генеративный ИИ, поэтому выглядит как хорошее введение для людей, заинтересованных в том, чтобы узнать, что означают такие термины, как глубокое обучение, нейронные сети и т. д.
  • Курсы глубокого обучения fast.ai — этот набор курсов Джереми Ховарда гораздо более глубокий и предназначен для людей с глубоким опытом программирования/кодирования. В основном сосредоточен на глубоком обучении, но затрагивает такие вещи, как построение сверточных нейронных сетей (CNN) и другие более глубокие концепции искусственного интеллекта. Я бы порекомендовал изучить это только людям с глубоким техническим образованием.

Инструменты ИИ

Что касается инструментов ИИ, я собрал краткий список, который охватывает несколько разных тематических областей. Вот их разбивка и краткое описание.

Инструменты общего назначения для чат-ботов

Эти инструменты предназначены для общения в чате общего назначения или вопросов и ответов на различные темы. Вероятно, они уже знакомы большинству людей.

  • ChatGPT — чат-бот, с которого в прошлом году началось повальное увлечение ИИ. Отлично подходит для многих вопросов и ответов общего назначения по многим темам, учитывая правильные подсказки.
  • Google Bard — версия чат-бота LLM ChatGPT от Google.
  • Llama — версия чат-бота типа LLM от Meta. Здесь много последних обновлений, включая Llama 2, выпущенную в прошлом месяце, и партнерство между Meta и Microsoft. Llama немного отличается тем, что Meta выпустила его как самостоятельное решение, которое можно запускать на (почти) любом автономном компьютере. A16Z запускает развернутую версию для тех, кто хочет попробовать ее напрямую.

Инструменты для создания изображений

Они могут принимать текст в качестве входных данных и заставлять ИИ генерировать изображения на произвольные темы.

  • DALL-E — сервис генерации изображений OpenAI. Имеет довольно низкие ограничения для уровня бесплатного пользования, поэтому спрашивайте с умом.
  • Стабильная диффузия — очень мощный инструмент для создания изображений, который может делать сложные вещи, такие как редактирование изображений. Это один из инструментов, которые в настоящее время разрушают сцену разработки игр.
    Для тех, кто хочет легко опробовать, существует веб-версия инструмента.

Инструменты для создания видео

Они могут принимать текст и / или изображения в качестве входных подсказок для автоматического создания различных типов видео.

  • Lumen 5 — Может создавать видео из блогов и другого контента. Имеет бесплатный уровень, если вы согласны с водяным знаком на сгенерированных видео.
  • Gen-1 — еще один сервис генерации видео, который принимает слова, изображения или видео. Выглядит более передовым и использует некоторые очень недавно опубликованные технические документы в области технологий.
  • Canva — инструмент для проектирования, а не строго генерации изображений. Выглядит хорошо для создания профессионального дизайна для таких вещей, как веб-сайты и т. д.

Инструменты для редактирования фотографий

Они позволяют легко редактировать изображения, как в Adobe Photoshop, но бесплатно. По сути, следующее поколение заливки с учетом содержимого в Photoshop, объединенное в бесплатные сервисы.

  • Pixlr — Бесплатный онлайн-редактор изображений
  • Cleanup.pictures — сервис быстрого редактирования фотографий, который позволяет легко удалять объекты с фотографий.
  • Глубокая ностальгия — может анимировать фотографии людей, чтобы они выглядели более динамично (а иногда и жутко). Это становилось вирусным несколько раз в прошлом

Инструменты аудио и преобразования текста в речь

  • Естественный ридер — Конвертирует текст/pdf/и т.д. в разговорный звук
  • Resemble.ai — может клонировать голоса для озвучивания текста в речь. Это не бесплатно, но есть бесплатная пробная версия.
  • Murf — Преобразование реального текста в речь, клонирование и изменение голоса.
  1. Meta’s Audio Generation Suite — набор инструментов (AudioGen/MusicGen/EnCodec), которые Meta только что выпустила сегодня, которые могут генерировать музыку и звуки.
  2. Google cloud text-to-speech — сервис Google для преобразования текста в речь
  3. Microsoft Azure Text to Speech — взгляд Microsoft на службы преобразования текста в речь.
  4. Amazon Polly — взгляд Amazon на сервисы преобразования текста в речь

Инструменты автоматизации совещаний

Это делает встречи более терпимыми. Они делают такие вещи, как автоматическое отслеживание того, что говорится, делают заметки и позволяют задавать вопросы и ответы по истории встреч.

  • Fireflies.ai — выполняет преобразование текста в текст и сводку для встреч, подключается к Zoom/Teams/и т. д. Доступен бесплатный уровень.
  • Otter.ai — популярный инструмент, который объединяет Zoom/Google Meet/Teams/и т.д. и пишет/делится заметками
  • Существует множество подобных инструментов, так как это, кажется, горячая тема. Вот некоторые другие похожие инструменты, с которыми я столкнулся, но пока не особо вникал — Supernormal, MeetGeek, Colibri.

Для программистов

API для генеративных запросов ИИ

Это краткий список полезных API для создания приложений, использующих генеративные запросы ИИ. Для создания новых приложений на основе ИИ, использующих существующие генеративные технические сервисы ИИ. В основном это плата за использование, поэтому остерегайтесь квот и цен, прежде чем создавать что-то слишком большое.

  • PaLM — поддерживает Google Bard
  • OpenAI — возможности ChatGPT
  • LLaMA 2 — Упомянутая выше, это автономная реализация LLM для Meta. Он доступен на Microsoft Azure или напрямую для загрузки через Meta’s GitHub.
  • AWS Generative AI — сервисы генеративного ИИ в AWS (либо создайте собственную модель с собственными данными, либо используйте одну из собственных базовых моделей)

Плагины для кодирования

Они упрощают кодирование, автоматизируя множество утомительных задач или создавая код на основе подсказок непосредственно в кодовой базе.

  • Github Copilot — подход Microsoft к инструментам кода ИИ с такими функциями, как интеграция с Github и интеграция плагинов прямого редактора (например, VSCode и т. д.).
  • Tabnine — еще один помощник по программированию на основе ИИ, который имеет аналогичную прямую интеграцию во многие редакторы. Похоже на GPT-2.

‹‹ЭОМ››

Вот и все, что касается краткого изложения инструментов и ресурсов. Далее мы попробуем некоторые из них и узнаем больше о том, как они работают.