В Weave.ai мы строим будущее взаимодействия с ИИ, и мы тратим много времени на обсуждение того, как будет выглядеть операционная система, ориентированная на ИИ, поэтому мы хотели поделиться некоторыми внутренними заметками о том, что, по нашему мнению, будет следующий. Мы также пролили свет на то, над чем работаем.

Каков следующий сдвиг парадигмы в операционных системах?

Текущее поколение операционных систем и приложений предназначено для перевода словаря взаимодействия на устройство меньшего размера и сенсорный экран. Следующее поколение операционных систем будет доминировать в вычислительной технике в следующие 20 лет. Речь идет о преобразовании приложений и взаимодействий для использования возможностей искусственного интеллекта устройства и данных пользователя для планирования действий и понимания намерений.

Почему именно сейчас?

Время, затрачиваемое на работу с настольными компьютерами, достигло своего пика, а цикл обновления программного и аппаратного обеспечения замедляется, поскольку он дает минимальный предельный выигрыш с точки зрения производительности.

Мобильные устройства - это не мобильность, а удобство. Обычно они являются последним компьютерным устройством, используемым ночью и первым утром, часто для выполнения работы в постели. В офисе они используются также рядом с основным рабочим столом. Из-за этого время, затрачиваемое на настольные и портативные устройства, достигло своего пика и больше никогда не будет расти, в то время как время, затрачиваемое на мобильные устройства, постоянно увеличивается. Это основной стимул для внедрения новых технологий.

Необходимы более эффективные инструменты для повышения производительности на мобильных устройствах, поскольку сегодня невозможно выполнять все рабочие операции на мобильных устройствах, и в результате работа откладывается до тех пор, пока сотрудники не вернутся за свои рабочие места.

Также существует корреляция между размером экрана и личной производительностью на рабочем столе. Обычно у людей одновременно открыто несколько приложений, поэтому данные из одного приложения можно копировать в другое при чтении потоков коммуникационных данных.

При переходе на мобильное устройство поверхность дисплея уменьшается с ›20-дюймового экрана до‹ 5-дюймового, а механизм ввода переходит с полноценной клавиатуры и мыши / трекпада на большой палец.

Именно из-за этих ограничений форм-фактора ведущие приложения для повышения производительности в основном являются одноцелевыми. И самые успешные из них очень специфичны для решения одной задачи самым простым способом, в отличие от приложения с обширным набором функций.

В результате средний пользователь телефона имеет большое количество одноцелевых приложений: электронная почта, алгоритмические электронные письма, календари, приложения для организации встреч, обмена мгновенными сообщениями, путешествий и проживания. Кроме того, разные приложения используются в разных контекстах, поэтому на мобильном устройстве может быть несколько приложений для обмена мгновенными сообщениями: одно для семьи, одно для друзей, одно для работы и так далее.

Это вызывает умножение функций, которые могут быть предоставлены ОС, и загромождение системы уведомлений, которая не понимает обрабатываемых данных.

В Weave.ai мы уверены, что есть способ лучше.

Эволюция операционных систем

Каждые 20 лет в операционных системах происходит смена парадигмы, при которой предыдущий вычислительный уровень абстрагируется и принимается новая форма вычислений, которая дает преимущества операциям.

Переход между парадигмами всегда происходит поэтапно: подумайте о появлении графического интерфейса пользователя из DOS + Windows, а затем в Windows 95, где интерфейс командной строки больше не был основным методом взаимодействия. Или что iOS началась как форк OS X. Новая ОС, вероятно, будет форком Android (который, в свою очередь, произошел от Linux).

ОС AI-first

Быстрое развитие технологий искусственного интеллекта за последние 5 лет в сочетании с стремлением повысить производительность мобильных устройств создают основу для перехода к новой вычислительной парадигме.

По сути, это контекстная карточная система. Предыдущие попытки, такие как Windows Metro и Google Now, являются яркими примерами, и мы уверены, что Windows Metro была ближе к тому, что могло бы стать настоящей ОС следующего поколения.

Metro был пустым пользовательским интерфейсом, где карточки были простыми представлениями существующих папок и не давали никаких преимуществ по сравнению с более традиционным дисплеем, но у него был недостаток, заключающийся в изменении рабочего процесса пользователя.

Кроме того, не было никаких прогнозных или контекстных API-интерфейсов или инструментов разработчика, которые использовали бы преимущества нового дизайна.

Короче говоря, это была интересная концепция дизайна, но не хватало искусственного интеллекта для создания опыта нового поколения.

Войдите в WeaveOS

Weave.ai разрабатывает некоторые компоненты ОС, ориентированной на искусственный интеллект. Это сложная задача, требующая нескольких шагов, но основные технологические достижения, определяющие ОС следующего поколения:

  • Контекстные карточки и исчезающие приложения
  • Расширяемая семантическая структура
  • Моделирование пользователя
  • Грамматика ИИ

Контекстные подсказки и исчезающие приложения

Основным взаимодействием с новой ОС будет система карточек, где каждая карточка может представлять микроформат с динамическими данными, контекстным намерением и визуализацией упомянутых данных.

Карточки будут 1) ранжированы по важности для пользователя и 2) по намерению на основе шаблона исторических данных конкретного контекста.

Сдвиг здесь будет заключаться в исчезновении приложений в традиционном смысле, так что карточка может быть «вашей следующей встречей» и может включать людей, места и документы, связанные с ней. В зависимости от намерения пользователя карта может затем вызвать транспортный модуль (примерно эквивалентный сегодняшнему приложению Citymapper) для навигации к месту назначения или коммуникационный модуль, чтобы общаться с участниками встречи и автоматически предупреждать их о возможной задержке (снова извлекается автоматически. из API Citymapper). Эти модули представляют собой новый вид интерфейса между действиями, несущие контекст и намерения в функциях вашего устройства.

Ключевое отличие состоит в том, что данные карты хранятся в устройстве и что гипотетическое транспортное приложение представляет собой визуализацию этих данных пользовательским интерфейсом с некоторой специализированной обработкой API.

Это означает, что приложения в том виде, в каком мы их знаем, обязательно исчезнут, и весь опыт работы с продуктом будет происходить внутри карты или ее уведомления (опять же, граница между ними становится нечеткой, поскольку некоторые продукты могут восприниматься как уведомления, особенно если размер экрана больше сокращено AR и умными часами).

Главный вывод: адресатом становится карта, а не приложение, потому что карта связана с намерением.

Расширяемая семантическая структура

Приложения для навигации знают местоположение, приложения электронной почты знают, что такое файл или контакты и так далее. Сегодняшнее представление семантических данных в знаниях зависит от приложения, и в ОС описаны лишь несколько измерений (обычно время и пространство). В ОС, ориентированной на ИИ, модель перевернута с ног на голову, и ОС имеет внутреннее представление знаний, и приложения извлекают из него свою структуру данных.

Это позволяет различным приложениям обмениваться данными изначально (прямо сейчас ваше приложение может вызывать Uber только потому, что его разработчик вручную добавил Uber API или использует стороннее приложение, например Button), а также имеет побочный эффект, позволяющий ОС вызывать для работы несколько приложений. по проблеме.

Дальнейшее продвижение позволяет пользователю выражать свои желания, например, «пойти куда-нибудь пообедать», а ОС может создать план, в котором различные приложения или модули удовлетворяют каждому этапу плана.

Более того, поскольку необходимые функции определяются намерениями пользователя, выраженными на языке фреймворка, ОС может автоматически искать в «магазине функций» подходящую функциональность, если ее нет на устройстве.

Google Now не может понять, что такое объект, если Google не добавит карточку об этом специально в свою систему (например, для крикета или баскетбола). Чтобы избежать подобных ловушек, система должна иметь расширяемую семантическую структуру, в которой ОС имеет ряд примитивов, которые могут использоваться разработчиками приложений для описания новых объектов и расширения языка взаимодействия. Семантическое описание мира - это задача, которая обречена на провал, если она возложена на создателя ОС, поскольку крайние случаи почти бесконечны.

Главный вывод: ОС понимает все данные, которыми она управляет, и передает эти знания приложениям.

Моделирование пользователя

Другая большая тенденция, которая уже происходит, - это переход на ОС, моделируемую с использованием пользовательских данных. В какой-то степени в операционных системах всегда существовал определенный уровень настройки, будь то сценарии или цветовые предпочтения, но следующий шаг - это система, считывающая данные пользователя, понимая их, классифицируя их, сопоставляя и затем реагируя на них.

Пользовательское моделирование лежит в основе набора прогнозирующих API, которые должны быть доступны разработчикам, например «что дальше» (которое само по себе является контейнером для нескольких возможных вариантов в зависимости от того, будет ли следующее действие путешествия, общение, чтение и т. д.). Новый Google Awareness API является примером этого.

Кроме того, этот общий API позволит пользователям получать обратную связь по всем действиям, поскольку ОС может объяснить, почему она дает рекомендацию, а пользователь может выделить или отклонить некоторые критерии. Это превратит то, что сегодня является пассивным действием (получение рекомендации), в интерактивное построение запросов, которые наверняка будут гораздо более релевантными потребностям пользователя.

Ключевой вывод: ОС сможет понимать пользователя, его уникальность и быть в курсе текущих действий пользователя.

Грамматика искусственного интеллекта

Все предыдущие ключевые технологии, описанные здесь, объединяются в то, что, по нашему мнению, в Weave.ai станет лакмусовой бумажкой для ОС следующего поколения, ориентированной на ИИ: независимая грамматика ИИ.

Под грамматикой AI мы подразумеваем набор операторов, таких как What, When и Where, которые могут применяться к данным.

Часть этой грамматики уже является частью нашей повседневной жизни: каждый раз, когда мы ищем в Google, мы выполняем «What» + наш поисковый запрос. С появлением мобильных устройств и календарей можно ответить на вопросы Когда и Где.

Большой прогресс был достигнут в сборе информации и составлении планов, позволяющих ответить на вопрос Как.

Но все эти операции выполняются черным ящиком, где пользователь должен принять результаты ИИ. Хотя мы не думаем с точки зрения Почему при выдаче команд ИИ, это становится очевидным, когда запрос не выполняется, и мы не можем сказать системе Почему нет. В архитектуре, в которой пользователь может объяснить себя системе, неудавшийся запрос можно превратить в обучающие данные.

Это необходимо, когда приложение неверно предугадывает, чего хочет пользователь.

Но именно сочетание всех этих технологий обеспечит поистине революционный опыт нового поколения и предоставит пользователям устройство, способное понимать их желания и помогать их выполнять.

Эта грамматика не обязательно должна быть вербальной. Его можно сопоставить с системой НЛП или встроить в контекстную карточную систему. Как только система сможет обрабатывать грамматику для коммуникации, пользователю будет в некоторой степени вторичным, как информация будет отображаться.

Ключевой вывод: ОС должна иметь символьную грамматику ИИ, и «почему» - это оператор, который разблокирует связь с ИИ

Какова роль Weave.ai?

В Weave.ai мы разрабатываем WeaveOS, набор технологий искусственного интеллекта, которые могут использоваться в операционных системах следующего поколения. У нас есть многолетний опыт в исследованиях, архитектуре искусственного интеллекта и ориентированном на пользователя дизайне. Если это похоже на то, что вас заинтересует, свяжитесь с нами.

PS. Я написал этот пост с помощью моих соучредителей Стефана Бура и Миккеля Биркегора Андерсена. Спасибо Брайану «Psychochild» Грину, Дэвиду Фошье, Питеру Руду и Франческе Вудхаус за рецензирование раннего черновика.