Если вы видите льва перед собой, вы можете обнаружить, что есть еще один лев, скрытый от глаз, крадущийся позади вас и ожидающий, когда вы столкнетесь с его челюстями. Глядя на модели нейронных сетей и машинного обучения, вы видите, что такая возможная корреляция является, хотя и редкой, просто возможным типом корреляции, которую специалисты по статистике беспокоятся об отсутствии, поэтому включили ее в свои нейронные слои, когда они связывали все со всем. Конечно, это делает алгоритмы машинного обучения очень неэффективными и трудными для масштабирования, а также требует значительно больше данных для обучения; но каковы альтернативы и может ли помочь философия?

Философия сильно зависит от анализа смысла, и обычно он разбивается на описательное содержание, такое как изображение, или обозначение, такое как имя; но что такое нейронная сеть? Это что-то новое, что бросит вызов нашей философии? Если бы мы были бинарными, мы могли бы сказать, что нейронные сети — это не имена, поскольку в большинстве нейронных сетей есть просто веса между узлами (номера триггеров), содержащие информацию; поэтому, возможно, числа являются описанием (возможно, как новые наборы, которые вы найдете у людей [см. блог 1]). Это описание, иногда представленное в виде массива чисел от 0 до 1, представлено в новом формате, который явно непонятен людям. Составная картина тренировочных данных звучит кубистски, но как она будет выглядеть, если описать ее математически?

Честно говоря, я точно не знаю, как должна выглядеть описательная модель нейронной сети, хотя существует множество сетевых визуализаций того, как она могла бы выглядеть. Однако мне кажется, и на практике это так, что вы можете скомпилировать свою нейронную сеть, удалив слабые связи с низкими весами и неиспользуемые узлы, чтобы помочь сети работать более эффективно. Это концептуально упростило бы ваши определения наборов. Это означает, что вы можете предсказать вероятность появления льва позади вас, но вряд ли вы будете делать прогнозы о чем-либо еще позади вас. Вам может понадобиться многоэтапный процесс: 1) Обучите модель на данных. 2) Обрезать и перекомпилировать модель. 3) Оцените «форму» модели и внесите изменения в новую модель в лучшей форме, добавляя и удаляя узлы и связи. 4) Повторяйте шаги 1–3, пока модель не станет достаточно эффективной.

Итак, как я могу думать об этих вещах на философской основе, если я не заядлый компьютерный ученый? Я предлагаю вам кое-что сказать, когда вы «читаете» нейронную сеть. Например, высокий трафик через определенные узлы или очень высокие веса, вероятно, требуют большего количества узлов на этом уровне в сети, и наоборот. Разрозненное поведение предполагает, что слоев слишком много, в то время как сильно распределенная активность предполагает, что слоев недостаточно. Также, я думаю, вы могли бы оценивать вещи исходя из поставленной задачи. Давайте возьмем гипотетический ввод, который представляет собой текст: в зависимости от алфавита первый слой, вероятно, довольно мал; следующие слои, вероятно, представляют собой единицы значения и наименования — это было бы массивно; наконец, были бы слои, где значения связаны вместе, чтобы сделать понятия, это было бы просто большим. Я подозреваю, что специалистов по статистической информатике этот анализ не впечатлит, но дело в том, что вы должны быть в состоянии определить эффективный размер сети, количество слоев, тип узла и связи, создав процесс обратной связи по алгоритму, основанному на шагах с 1 по 4. На мой взгляд, это движение от простой нейронной сети к машинному обучению, и оно отражает не столько массивные данные, сколько интеллектуальное моделирование.

Есть и другие примеры интеллектуального моделирования и некоторые подобные примеры, где его не хватает: например, в зрении животных, вероятно, существует близость между оптическими нервами, когда они попадают в область обработки. Это вдохновило на создание типа репликации путем разбиения изображений из точек на разные типы краев в качестве формы предварительной обработки, которая значительно повышает производительность. Тем не менее, когда мы смотрим, например, на образец для учащихся в TensorFlow (март 2019 г.) (уважаемая ведущая библиотека с открытым исходным кодом искусственного интеллекта, запущенная Google), мы видим попытку определить типы обуви, просто используя пиксели и нейронный слой, который соединяет все со всем: Таким образом, этот пример по большей части очень неэффективен, поскольку он не исключает отсутствия близости и должен требовать большого внимания к разбиению оттенков серого на формы. Если вы посмотрите на вероятность быть правильным в примере с TensorFlow, вы увидите, что вероятность ошибки довольно низка, даже для ошибок, как указано на их сайте (например, > 80% вероятности быть правильным). Эти статистические данные коррелируют с объемом надежной работы, проделанной моделью? Я не уверен, что мы можем точно сказать, но он определенно усердно работал над некоторыми довольно простыми данными.

Я думаю, будет справедливо сказать, что в философии упор делается на небольшие данные и сложные концептуальные модели, тогда как в статистических вычислениях упор делается на массивные данные. В одном из моих предыдущих блогов [блог 5] я упомянул, что у использования вероятности есть как недостатки, так и преимущества. Однако я не уверен, что создание концепции настолько сложно по сравнению, скажем, с разложением цветного видеоизображения HD на составные части. Итак, что нам нужно сделать, чтобы упростить работу нейронной сети? Можно предложить ряд вещей: Во-первых, вы можете предварительно обработать близость. Во-вторых, вы можете предварительно обработать причинно-следственную связь объектов. В-третьих, вы можете попытаться сфокусировать модель на выявлении эффектов и изменений и их связи с предыдущими объектами во времени, добавив временной ритм, возможно, с помощью слоя метаобработки. В-пятых, вы могли бы добавить более высокие нейронные слои меньшего размера, возможно, в качестве вторичного процесса, чтобы смоделировать логические шаги, подобные тому, что происходит, если обувь рассматривается как сандалии и кроссовки. В-шестых, вы можете попробовать тестировать и отслеживать концепции; например, понятие сандалии может быть определено как обувь с дырками. Есть ли у вашей нейронной сети эта концепция? Возможно, вам нужно подчеркнуть или вырезать несколько пробелов, чтобы подчеркнуть суть обучающих данных — как вы могли бы сделать с ребенком. Это все очень хорошо, если смотреть на ярлыки, но человеческие описания часто состоят из туманных исторических определений не меньше, чем из простых ассоциаций.

Отступление в машинное обучение было достаточно долгим — а как же философия? Есть кое-что интересное, например, действительно ли наш мозг похож на нейронные сети, описанные в коротком фрагменте компьютерного кода? Что ж, в философии на протяжении веков было потрачено немало чернил на то, как и даже воспринимаем ли мы вещи: с положительной стороны, машинное обучение даже сейчас доказывает, что вы можете получить с помощью механизма способ восприятия и идентификации людей, объектов. , речь и т. д. Поэтому, хотя я подозреваю, что фактический код, управляющий сегодня машинным обучением, не так уж сильно похож на мозг млекопитающих, я все же думаю, что у него есть некоторые общие вычислительные функции, в основном способность обрабатывать и хранить информацию с помощью чистого эффекта.

Я хотел бы сделать краткую обличительную речь против картезианского дуализма, предполагавшего, что умы отделены от механических тел, потому что эта религиозно мотивированная точка зрения отодвинула философию по этой теме настолько далеко назад, что она мало что может сказать в мейнстриме вплоть до тысячелетие. Конечно, я надеюсь, что в философии появятся интересные теории о том, как сетевой язык, истинные и ложные убеждения и т. д. применяются к тому, как компьютерные алгоритмы обрабатывают данные. Кроме того, я надеюсь, что философы смогут создать целую новую эпоху в эпистемологии — в том, как мы понимаем и знаем о мире. Надеюсь, это будет основано на перестройке наших моделей и сфер мышления на основе доказательств и проверяемой рабочей функциональности.

В заключение мы должны сказать, что машинное обучение превзошло ожидания самых известных западных философов в отношении того, что было возможно, даже несмотря на то, что оно отстало от предсказаний многих сторонников вычислений ИИ. Это происходит главным образом потому, что философы обычно считают мысль очень сложной и часто даже необъяснимой темой. Тем не менее, ученым-компьютерщикам также удалось придумать несколько необъяснимых систем, которые в какой-то степени хорошо работают. Однако мне кажется, что в существующей парадигме все еще можно внести значительные улучшения в машинное обучение, поскольку существующие модели довольно неэффективны и даже расплывчаты. Однако это происходит главным образом потому, что мысль — сложная тема для реализации, а не потому, что мы глупы.

Этот блог доступен для публикации как часть качественной коллекции: www.amazon.com/dp/B0B1B6MDLM.