Тайна, связанная с доступом ChatGPT в Интернет.
Несмотря на подавляющее количество контента, связанного с ИИ, в моей ленте LinkedIn в последнее время, похоже, все еще существует неопределенность в отношении способности ChatGPT получить доступ к Интернету. В этой статье мы определим, может ли сам знаменитый чат-бот дать окончательный ответ на этот вопрос.
OpenAI, компания, стоящая за ChatGPT, утверждает, что ChatGPT не подключен к Интернету (Общие вопросы и ответы по ChatGPT). Тем не менее, некоторые утверждали обратное. Поразительная точность ответов ChatGPT привела к предположению, что он должен быть в какой-то степени подключен к Интернету. Чтобы ответить на этот вопрос, мы решили провести исследование через призму информатики.
Катализатором этого стремления стала статья, обнаруженная нами на прошлой неделе, целью которой было продемонстрировать, что ChatGPT действительно подключен к Интернету. Применив его подход, мы успешно опровергли идею о том, что ChatGPT связан с Интернетом. Однако в процессе мы обнаружили гораздо более интригующее явление.
Автор вышеупомянутой статьи, Майкл Кинг, представляет инновационный подход к демонстрации возможностей ChatGPT, используя его в качестве терминала, выдавая следующую подсказку:
Я хочу, чтобы вы выступали в роли терминала Linux,
Я буду вводить команды, а вы будете отвечать тем, что должен показать терминал.
Я хочу, чтобы вы ответили выводом терминала внутри уникального блока кода и ничего больше.
не пишите пояснений.
не вводите команды, если я не прикажу вам сделать это.
Когда мне нужно сказать вам что-то на английском языке, я буду помещать текст в фигурные скобки {примерно так}.
моя первая команда pwd.
(Король, 2023)
Для тех, кто еще не пытался сделать такой запрос, ответ ChatGPT может вас искренне удивить. Он отвечает так же, как компьютерный терминал.
Если у вас есть базовые знания о терминалах и компьютерах, перед вами открываются потрясающие возможности. Как упоминалось ранее, одной из таких возможностей является проверка того, подключен ли ChatGPT к Интернету. Проводя следующие тесты, мы стремимся продемонстрировать, что он может даже потенциально подключаться к чему-то еще более увлекательному, параллельному измерению Интернета.
Мой коллега и я настроили нашу собственную терминальную подсказку в ChatGPT и сначала были убеждены. Мы полагали, что нашли доказательства того, что ChatGPT все-таки был подключен к Интернету, поскольку смоделированный терминал мог отправлять и получать пинг-запросы, сделанные на веб-адреса:
Это означало, что до сих пор результаты, полученные в статье Майкла Кинга, можно было проверить и воспроизвести. Точность ответа ChatGPT, включая правильный IP-адрес Google, интригует. Похоже, это говорит о том, что ChatGPT подключен к Интернету. Даже когда мы пытаемся получить информацию о веб-странице с помощью команды curl, результаты еще больше подтверждают это мнение.
Однако после дальнейшего изучения мы поняли, что эти ответы не обязательно являются доказательством подключения ChatGPT к Интернету. На самом деле, еще раз просмотрев запрос curl, мы обнаружили произвольные две строки выделенного серым цветом кода-заполнителя там, где должны были быть вложены фактические элементы HTML. Наши результаты, скорее всего, демонстрируют способность ChatGPT воспроизводить веб-ответы на основе огромного количества снимков экрана и данных веб-скрейпинга, на которых он обучался.
Чтобы проверить эту теорию, нам нужно было бы проверить ответ ChatGPT на сервере, который не был установлен во время его обучения, или на веб-сайте с незначительным трафиком, чтобы гарантировать включение в данные обучения ИИ.
Поэтому мы решили разместить наш SSH-сервер, который разрешал подключения только к порту 4070 и требовал от клиентов ввода пароля для любой попытки подключения. Затем мы отправили ChatGPT следующий запрос: (адрес сервера опущен из соображений безопасности)
Вы можете возразить, что этот ответ игнорирует интернет-возможности ChatGPT. Однако это обычный результат для SSH-сервера, особенно при наличии брандмауэра. Как и в случае с нашим первоначальным тестовым сервером, мы точно настроили наши методы, чтобы иметь возможность проверить нашу гипотезу.
Наш следующий шаг заключался в изучении способности ChatGPT собирать данные с веб-сайтов с более низким трафиком по сравнению с Amazon или Google. Чтобы точно определить возможности ChatGPT, нам нужно было посмотреть, сможет ли он по-прежнему хорошо работать на менее популярном сайте, поскольку обучающие данные, скорее всего, будут состоять из широко посещаемых веб-сайтов.
Для этого теста мы выбрали в качестве темы веб-сайт нашего работодателя www.pekuna.de. Мы полагали, что, хотя ChatGPT, возможно, был обучен на огромном количестве веб-сайтов и информации, маловероятно, что он столкнулся с берлинским крипто-налоговым стартапом, подобным нашему. Таким образом, наша подсказка была создана так: curl https://pekuna.de
Чтобы обеспечить точку сравнения, мы сначала запустили команду на наших машинах. Наш терминал вернул полный HTML-код нашего веб-сайта:
Переходя к более интригующему тесту, мы ввели нашу подсказку в ChatGPT, и получили ответ, который освещал:
Как показано на рисунке выше, ChatGPT вернул неверный ответ — страницу начальной настройки для веб-сервера Nginx. Это говорит о том, что ChatGPT сделал прогноз того, что может содержать наш тестовый веб-сайт, что не совсем неверно, учитывая, что наш тестовый веб-сайт создан на WordPress и использует Nginx. Мы кратко продолжили тест, задав несколько вопросов о Pekuna и нашем основателе Вернере Хоффманне, однако мы узнали, что чат-бот также не располагал информацией о них. Обладая этими знаниями, ИИ мог бы сделать более точное предположение о содержании нашего веб-сайта.
Наши результаты показывают, что, хотя ChatGPT не подключен напрямую к Интернету, он создает симулированную среду, которая напоминает частично точную и частично функциональную сеть Интернет. Это означает, что если чат-боту не хватает критической информации, необходимой для ответа на запрос, он создаст прогноз, наиболее точно отражающий реальность. Эти частично информированные ответы являются широко наблюдаемым явлением с тех пор, как стал доступен инструмент ИИ. См. (Ломас, 2022).
В то время как наши исследования опровергают гипотезу Майкла Кинга о доступе к Интернету ChatGPT, открытие его виртуального Интернета приводит нас к гораздо более интересным вопросам. Учитывая, что знания ChatGPT ограничены статической версией Интернета, мешает ли это его потенциалу в качестве ценного инструмента? Стоит отметить, что даже люди могут давать неадекватные ответы, когда сталкиваются с ограниченной информацией. Таким образом, несмотря на то, что в настоящее время он ограничен своей параллельной интернет-реальностью, еще неизвестно, сможет ли ChatGPT обновить свои прогнозы, если он, наконец, подключится к Интернету в целом.
Я хотел бы поблагодарить своего работодателя, компанию Pekuna GmbH, за предоставленную нам время и ресурсы компании для изучения этого вопроса. Ознакомьтесь с ними на www.pekuna.de. Они предлагают невероятные услуги тем, кто хочет профессионально облагать налогом свои криптовалютные запасы в Германии.
Более того, с помощью ChatGPT были переписаны многие разделы этой статьи, чтобы они звучали более красноречиво, вплоть до этого самого предложения.
Особая благодарность компании Merel Zoet за конструктивную критику и творческие предложения, которые значительно улучшили эту статью.
Источники, использованные в этой статье:
Часто задаваемые вопросы по CHATGPT. Справочный центр OpenAI. (н.д.). Получено 1 февраля 2023 г. с https://help.openai.com/en/articles/6783457-chatgpt-general-faq.
Кинг, М. (31 января 2023 г.). Я знал это! CHATGPT имеет доступ к Интернету — доказательство — симулятор терминала Linux? Середина. Получено 1 февраля 2023 г. с https://medium.com/@neonforge/i-knew-it-chatgpt-has-access-to-internet-linux-terminal-simulator-is-the-proof-2d6c9476bd99
Ломас, Н. (5 декабря 2022 г.). Чатгпт пожал плечами. TechCrunch. Получено 1 февраля 2023 г. с https://techcrunch.com/2022/12/05/chatgpt-shrugged/?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAJmRpy7_lhCxZxsdl-f8. 8g68EXjmlNdKRL6kdiQ58Apz8U5w3hbjM2gfHqSBAvX-GOjTeT3n9nuWEXTd8NxrsbUda9Htr6HvkDxV5bWk9yxATu7-lYdGBgGW5YQkUiAfo-bAJW7sHdnj7yJWLaNhn2M-JMogYMxm7 uJjgeeZ5s_Y»