Тайна, связанная с доступом ChatGPT в Интернет.

Несмотря на подавляющее количество контента, связанного с ИИ, в моей ленте LinkedIn в последнее время, похоже, все еще существует неопределенность в отношении способности ChatGPT получить доступ к Интернету. В этой статье мы определим, может ли сам знаменитый чат-бот дать окончательный ответ на этот вопрос.

OpenAI, компания, стоящая за ChatGPT, утверждает, что ChatGPT не подключен к Интернету (Общие вопросы и ответы по ChatGPT). Тем не менее, некоторые утверждали обратное. Поразительная точность ответов ChatGPT привела к предположению, что он должен быть в какой-то степени подключен к Интернету. Чтобы ответить на этот вопрос, мы решили провести исследование через призму информатики.

Катализатором этого стремления стала статья, обнаруженная нами на прошлой неделе, целью которой было продемонстрировать, что ChatGPT действительно подключен к Интернету. Применив его подход, мы успешно опровергли идею о том, что ChatGPT связан с Интернетом. Однако в процессе мы обнаружили гораздо более интригующее явление.

Автор вышеупомянутой статьи, Майкл Кинг, представляет инновационный подход к демонстрации возможностей ChatGPT, используя его в качестве терминала, выдавая следующую подсказку:

Я хочу, чтобы вы выступали в роли терминала Linux,

Я буду вводить команды, а вы будете отвечать тем, что должен показать терминал.

Я хочу, чтобы вы ответили выводом терминала внутри уникального блока кода и ничего больше.

не пишите пояснений.

не вводите команды, если я не прикажу вам сделать это.

Когда мне нужно сказать вам что-то на английском языке, я буду помещать текст в фигурные скобки {примерно так}.

моя первая команда pwd.

(Король, 2023)

Для тех, кто еще не пытался сделать такой запрос, ответ ChatGPT может вас искренне удивить. Он отвечает так же, как компьютерный терминал.

Если у вас есть базовые знания о терминалах и компьютерах, перед вами открываются потрясающие возможности. Как упоминалось ранее, одной из таких возможностей является проверка того, подключен ли ChatGPT к Интернету. Проводя следующие тесты, мы стремимся продемонстрировать, что он может даже потенциально подключаться к чему-то еще более увлекательному, параллельному измерению Интернета.

Мой коллега и я настроили нашу собственную терминальную подсказку в ChatGPT и сначала были убеждены. Мы полагали, что нашли доказательства того, что ChatGPT все-таки был подключен к Интернету, поскольку смоделированный терминал мог отправлять и получать пинг-запросы, сделанные на веб-адреса:

Это означало, что до сих пор результаты, полученные в статье Майкла Кинга, можно было проверить и воспроизвести. Точность ответа ChatGPT, включая правильный IP-адрес Google, интригует. Похоже, это говорит о том, что ChatGPT подключен к Интернету. Даже когда мы пытаемся получить информацию о веб-странице с помощью команды curl, результаты еще больше подтверждают это мнение.

Однако после дальнейшего изучения мы поняли, что эти ответы не обязательно являются доказательством подключения ChatGPT к Интернету. На самом деле, еще раз просмотрев запрос curl, мы обнаружили произвольные две строки выделенного серым цветом кода-заполнителя там, где должны были быть вложены фактические элементы HTML. Наши результаты, скорее всего, демонстрируют способность ChatGPT воспроизводить веб-ответы на основе огромного количества снимков экрана и данных веб-скрейпинга, на которых он обучался.

Чтобы проверить эту теорию, нам нужно было бы проверить ответ ChatGPT на сервере, который не был установлен во время его обучения, или на веб-сайте с незначительным трафиком, чтобы гарантировать включение в данные обучения ИИ.

Поэтому мы решили разместить наш SSH-сервер, который разрешал подключения только к порту 4070 и требовал от клиентов ввода пароля для любой попытки подключения. Затем мы отправили ChatGPT следующий запрос: (адрес сервера опущен из соображений безопасности)

Вы можете возразить, что этот ответ игнорирует интернет-возможности ChatGPT. Однако это обычный результат для SSH-сервера, особенно при наличии брандмауэра. Как и в случае с нашим первоначальным тестовым сервером, мы точно настроили наши методы, чтобы иметь возможность проверить нашу гипотезу.

Наш следующий шаг заключался в изучении способности ChatGPT собирать данные с веб-сайтов с более низким трафиком по сравнению с Amazon или Google. Чтобы точно определить возможности ChatGPT, нам нужно было посмотреть, сможет ли он по-прежнему хорошо работать на менее популярном сайте, поскольку обучающие данные, скорее всего, будут состоять из широко посещаемых веб-сайтов.

Для этого теста мы выбрали в качестве темы веб-сайт нашего работодателя www.pekuna.de. Мы полагали, что, хотя ChatGPT, возможно, был обучен на огромном количестве веб-сайтов и информации, маловероятно, что он столкнулся с берлинским крипто-налоговым стартапом, подобным нашему. Таким образом, наша подсказка была создана так: curl https://pekuna.de

Чтобы обеспечить точку сравнения, мы сначала запустили команду на наших машинах. Наш терминал вернул полный HTML-код нашего веб-сайта:

Переходя к более интригующему тесту, мы ввели нашу подсказку в ChatGPT, и получили ответ, который освещал:

Как показано на рисунке выше, ChatGPT вернул неверный ответ — страницу начальной настройки для веб-сервера Nginx. Это говорит о том, что ChatGPT сделал прогноз того, что может содержать наш тестовый веб-сайт, что не совсем неверно, учитывая, что наш тестовый веб-сайт создан на WordPress и использует Nginx. Мы кратко продолжили тест, задав несколько вопросов о Pekuna и нашем основателе Вернере Хоффманне, однако мы узнали, что чат-бот также не располагал информацией о них. Обладая этими знаниями, ИИ мог бы сделать более точное предположение о содержании нашего веб-сайта.

Наши результаты показывают, что, хотя ChatGPT не подключен напрямую к Интернету, он создает симулированную среду, которая напоминает частично точную и частично функциональную сеть Интернет. Это означает, что если чат-боту не хватает критической информации, необходимой для ответа на запрос, он создаст прогноз, наиболее точно отражающий реальность. Эти частично информированные ответы являются широко наблюдаемым явлением с тех пор, как стал доступен инструмент ИИ. См. (Ломас, 2022).

В то время как наши исследования опровергают гипотезу Майкла Кинга о доступе к Интернету ChatGPT, открытие его виртуального Интернета приводит нас к гораздо более интересным вопросам. Учитывая, что знания ChatGPT ограничены статической версией Интернета, мешает ли это его потенциалу в качестве ценного инструмента? Стоит отметить, что даже люди могут давать неадекватные ответы, когда сталкиваются с ограниченной информацией. Таким образом, несмотря на то, что в настоящее время он ограничен своей параллельной интернет-реальностью, еще неизвестно, сможет ли ChatGPT обновить свои прогнозы, если он, наконец, подключится к Интернету в целом.

Я хотел бы поблагодарить своего работодателя, компанию Pekuna GmbH, за предоставленную нам время и ресурсы компании для изучения этого вопроса. Ознакомьтесь с ними на www.pekuna.de. Они предлагают невероятные услуги тем, кто хочет профессионально облагать налогом свои криптовалютные запасы в Германии.

Более того, с помощью ChatGPT были переписаны многие разделы этой статьи, чтобы они звучали более красноречиво, вплоть до этого самого предложения.

Особая благодарность компании Merel Zoet за конструктивную критику и творческие предложения, которые значительно улучшили эту статью.

Источники, использованные в этой статье:

Часто задаваемые вопросы по CHATGPT. Справочный центр OpenAI. (н.д.). Получено 1 февраля 2023 г. с https://help.openai.com/en/articles/6783457-chatgpt-general-faq.

Кинг, М. (31 января 2023 г.). Я знал это! CHATGPT имеет доступ к Интернету — доказательство — симулятор терминала Linux? Середина. Получено 1 февраля 2023 г. с https://medium.com/@neonforge/i-knew-it-chatgpt-has-access-to-internet-linux-terminal-simulator-is-the-proof-2d6c9476bd99

Ломас, Н. (5 декабря 2022 г.). Чатгпт пожал плечами. TechCrunch. Получено 1 февраля 2023 г. с https://techcrunch.com/2022/12/05/chatgpt-shrugged/?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAJmRpy7_lhCxZxsdl-f8. 8g68EXjmlNdKRL6kdiQ58Apz8U5w3hbjM2gfHqSBAvX-GOjTeT3n9nuWEXTd8NxrsbUda9Htr6HvkDxV5bWk9yxATu7-lYdGBgGW5YQkUiAfo-bAJW7sHdnj7yJWLaNhn2M-JMogYMxm7 uJjgeeZ5s_Y»