Новые признаки того что вселенная это нейросеть
Наша Вселенная — огромная нейронная сеть, и вот почему
10 сентября 2020 года мир облетела новость о том, что мир, по мнению физика Виталия Ванчурина, может быть огромной нейронной сетью. Специально к старту новых потоков курса «Machine Learning» и версии для подготовленных спецов «Machine Learning Pro + Deep Learning» представляем вам перевод материала — рассуждения о таком подходе к модели мира в свете других современных и порой весьма смелых теорий.
Несколько дней назад я прочитал статью Виталия Ванчурина на arXiv «Мир как нейронная сеть». Моей первой мыслью было, что это будет что-то о гипотезе симуляции, но, прочитав часть статьи, я понял, что она не совсем об этом. Сегодня в физике наиболее популярна теория струн (или теории, потому что их много).
Согласно теории струн, пространство имеет 9 или более измерений и фундаментальный объект — это суперструна. Струны вибрируют в пространстве высокой размерности, а каждая частица Вселенной — это вибрация суперструны. Фундаментальный объект в теории Ванчурина — нейрон; Вселенная может описываться как нейронная сеть.
Нейронные сети — это тренируемые математические структуры, вдохновлённые человеческим мозгом. Нейрон такой сети — несложный блок обработки, который обычно описывается простой математической функцией. Нейронная сеть — это также граф, его нейроны зависят от силы соединения (настраиваемых самой нейронной сетью весов). Итак, нейронная сеть — это нечто, похожее на компьютер, который программируется весами. Ванчурин в своей статье показывает, что Вселенная может описываться как нейронная сеть, и он может вывести из неё и квантовую механику, и общую теорию относительности. Это по крайней мере такая же хорошая модель Вселенной, как струны или что-то другое. Статья Ванчурина полна математики и читать её трудно, если вы не математик или физик. Ниже — суть в двух словах.
Теория Ванчурина очень впечатляет, и важно отметить, что модель нейронной сети в этой работе — не «думающая машина», она не распознаёт паттерны и т. д., которые мы используем в компьютерных технологиях. Ванчурин применяет модель нейронной сети как математическую модель частиц.
Но что, если частицы и даже пространство и время не фундаментальны во Вселенной? Нефундаментальность пространства-времени необычна, но не нова. Дональд Хоффман — большой проповедник теории «сознательной Вселенной». В его теории фундаментальная вещь — сознательный агент, а пространство-время — возникающие свойства сознательного опыта.
В конце XIX века Эйнштейн дал новое определение пространства и времени, которые были неприкасаемыми фундаментальными свойствами реальности. Он предположил, что скорость света постоянна для каждого наблюдателя, и этот закон более фундаментален, чем независимость времени.
На этом основывалась специальная теория относительности. Другой пример — квантовая механика, где нелокальность кванта предполагает нечто отличное от нашего повседневного опыта.
Хотя теория пространства и времени Хоффмана более радикальна, эти случаи — хорошие примеры того, что иногда сомнение в фундаментальных вещах может быть основой хорошей теории. В теории Хоффмана фундаментальная реальность — это иерархическая структура сознательных агентов, а вся переживаемая реальность с её пространством и временем представляет собой что-то вроде «гарнитуры» в нашем сознании, поэтому теория очень близка к гипотезе симуляции.
Несколько лет назад я написал эссе на тему «Как построить симулированную реальность?!». В этом эссе я попытался представить будущее, в котором реальна загрузка разума, и задал вопрос: каков оптимальный способ создания симулированных реальностей для загруженных сознаний?
Впервые я прочитал о выгрузке сознаний в знаменитой книге Рэя Курцвейла The Singularity is near. Выгрузка разума — это полная цифровизация человеческого мозга. Технология, где мозг копируется нейроном за нейроном и моделируется на цифровом компьютере. Если человеческий разум — это результат работы мозга, то эта имитированная копия будет полностью идентична человеческому разуму. Итак, если выгрузка разума возможна, как можно создать оптимальную симулированную реальность для оцифрованных разумов?
Первое решение
Первое решение — моделирование реальности по частям, но это очень расточительно и требует невероятно огромных вычислительных мощностей.
Тогда что можно сделать?
Можно сделать так, как делается в любой компьютерной игре: отображать только то, что видит пользователь. У нас 5 чувств, поэтому визуализации недостаточно, нужны запахи, звуки и т. д. Но модель та же: воспроизводится только то, что мы наблюдаем.
Некоторые интерпретации квантовой механики говорят нечто подобное о реальности. В этих интерпретациях реальны только наблюдаемые вещи. Но этот «трюк» не решает проблему вычислительной мощности, потому что смоделированная реальность будет согласованной только в том случае, если частицы моделируются, когда они не наблюдаются.
Например, если я держу яблоко в руке и закрываю глаза, яблоко должно быть в руке, когда я снова открываю глаза. В квантовой механике волновая функция описывает частицы, когда их никто не наблюдает, и она коллапсирует в реальный объект, когда наблюдатель наблюдает за ними.
Для моделирования волновой функции также потребуются огромные (почти бесконечные) вычислительные мощности. К счастью, есть еще один «трюк» для решения этой проблемы. Если целью является моделирование реальности для наблюдателя, достаточно учесть ожидания наблюдателя. Если мы будем придерживаться примера с яблоком, когда я открываю глаза, я ожидаю, что яблоко будет в руке.
Итак, если система знает о моих ожиданиях, она может имитировать для меня полностью согласованную реальность. Передача ожиданий — это что-то вроде проецирования реальности. Человеческий мозг делает это изо дня в день. Мы всегда воспринимаем только частички реальности, а наш мозг добавляет к ней недостающие части. Но что, если эти части реальности происходят не извне, а из проекции другого разума?
Если вам интересно, как наш мозг проецирует реальность, посмотрите выступление Анила Сета на TED по этой теме.
Моя гипотетическая система симуляции ничего не симулирует, а только «объединяет» проекции разных сознаний, чтобы создать из них непротиворечивую реальность, поэтому я называю эту симуляцию «машиной согласованности». Машина согласованности собирает прогнозы из загруженных сознаний отдельных людей, объединяет их и представляет им согласованную реальность. Машине согласования не нужна внешняя память, и ей не нужно моделировать какие-либо частицы. Она передаёт только стимулы для пяти чувств из объединённых проекций.
Но что, если машина согласованности не сможет объединить прогнозы потому, что между ними существует основное противоречие? В этом случае машина согласованности должна изменить ожидания, чтобы синхронизировать их. Ожидания индивидуального разума исходили из прошлого опыта, поэтому манипулирование разумом и изменение ожиданий — это что-то вроде путешествия во времени. Машина согласованности «возвращается в прошлое» и меняет события, чтобы синхронизировать ожидания. Это также идеальное решение для защиты модели. Если бы кто-то смог доказать, что мы живем в симуляции, машина согласованности могла бы вернуться в прошлое и залатать «дыру в безопасности». Таким образом, в этой системе вы никогда не сможете доказать, что система — симуляция.
В 2012 году Рэй Курцвейл опубликовал теорию о том, как работает человеческий разум. Согласно этой теории, неокортекс человеческого мозга построен из модулей распознавания образов. Модуль — это группа нейронов, способных распознать паттерн. Эти модули связаны между собой в иерархическую структуру. Модули нижнего уровня распознают примитивные шаблоны и отправляют сигналы вперед модулям более высокого уровня, а модули более высокого уровня, в свою очередь, могут также отправлять сигналы модулям нижнего уровня для их активации.
В этой модели мышление представляет собой что-то вроде ассоциативной цепочки активаций распознавателя образов. Во многих случаях распознаватели образов конкурируют друг с другом, и на более высоком уровне решается, какой модуль выиграл. Также в этой модели сознательный опыт является результатом конкуренции на верхнем уровне иерархии. Модель способна обеспечить согласованность на верхнем уровне. Если есть несоответствие на каком-либо уровне, распознаватель шаблонов отправляет сигналы модулям нижнего уровня, чтобы заблокировать их или изменить активации нижнего уровня.
Распознаватели образов Курцвейла — это что-то вроде сознательных агентов Хоффмана. Разница в том, что агенты Хоффмана представляют собой более абстрактные фундаментальные объекты, а распознаватели Курцвейла — это примитивные модули, построенные из группы нейронов.
Обе теории утверждают, что человеческое сознание — результат иерархии. Иерархическая сеть модулей, которая приводит к последовательному сознательному опыту, очень похожа на машину согласованности. Что, если индивидуальный разум (я) находится не на верхнем уровне в иерархии модулей, а в структуре только среднего уровня? Здесь вершина иерархии — не индивидуальный разум, а глобальное сознание верхнего уровня, содержащее индивидуальные сознания и поддерживающее согласованность переживаемой ими реальности. Это что-то вроде гигантского мозга со множеством личностей.
Хотя множественность личностей звучит странно, она не так уж необычна, как можно подумать. Один из любимых примеров Хоффмана — эксперименты с разделенным мозгом. Каллозотомия — это хирургическая процедура для лечения резистентной с медицинской точки зрения эпилепсии. При этой процедуре мозолистое тело перерезается, чтобы ограничить распространение эпилептической активности между двумя половинами мозга. После процедуры во многих случаях пациент ощущает себя двумя личностями. Такие эксперименты предполагают, что каждый человеческий мозг состоит из двух сознательных сущностей, но если две половины мозга связаны между собой, они образуют одну последовательную личность.
В модели глобального сознания индивидуальные сознания взаимосвязаны одинаково, что воспринимается этими сознаниями как непротиворечивая реальность. В такой модели пространство, время, частицы и каждый элемент реальности — результат взаимосвязи сознаний.
Если пространство-время и частицы являются только результатом взаимосвязанных сознаний, то что можно сказать о «внешней» объективной реальности? Почти ничего. Но если предположить, что глобальное сознание построено из абстрактных нейроноподобных математических структур, то можно сравнить его с текущей физической моделью.
В современной модели физического мира Вселенная возникла из ничего во время Большого взрыва, и ее самый фундаментальный строительный блок — суперструна.
Суперструны — это математические структуры большой размерности, которые образуют частицы. Каждую частицу можно описать вектором состояния, и физические законы являются операторами этих векторов. Со временем эти операторы непрерывно преобразуют векторы состояния.
Сознание — результат эволюции, а причина его образования — антропный принцип. Антропный принцип — это простой и элегантный ответ на вопрос, почему существует наша Вселенная и почему она адаптирована для осознанной разумной жизни.
Возможно, в мультивселенной есть множество вселенных, но во вселенных, которые не созданы для сознательной разумной жизни, некому спросить: «Почему моя вселенная построена именно так?». Мультивселенная играет в лотерею, и наша Вселенная выиграла джекпот: это мы. Нейросеть Вселенной подобна этому. Она также могла возникнуть из ничего, но построена из нейронов, а не из частиц. На самом низком уровне нейроны и частицы очень похожи.
И нейроны, и частицы представляют собой описываемые вектором состояния математические структуры, который непрерывно трансформируется по законам нейронов через их взаимодействия. Возможно, существует много пустых нейронных Вселенных, но некоторые из них подходят для некоей эволюции и в ней развиваются сознательные сущности.
Корректна ли эта модель для нашей Вселенной? Может быть и так, и, как написано выше, возможно, мы никогда не сможем доказать или опровергнуть, что наша Вселенная является нейронной сетью или нет.
Что можно сделать, исходя из этой теории? Если Хоффман прав и пространство-время не является фундаментальным, то, по его словам, возможно, мы сможем как-то «взломать Вселенную».
Если он не прав и сознание — результат функции мозга и может быть объяснено физическими законами, тогда мы сможем смоделировать их и в будущем построить наши собственные реальности. Так что правильный вопрос: «Когда мы будем жить в симуляции или мы уже живем в ней?»
Физик: Вся Вселенная представляет собой нейронную сеть
«Идея определенно безумная, но достаточно ли она безумна, чтобы быть правдой? Это еще предстоит выяснить».
Не каждый день мы сталкиваемся с исследованием, которое пытается переопределить реальность.
Но в провокационной статье, загруженной на arXiv этим летом, профессор физики из Миннесотского университета в Дулуте по имени Виталий Ванчурин пытается переосмыслить реальность особенным способом — предполагая, что мы живем внутри массивной нейронной сети, которая управляет всем вокруг. Другими словами, как он написал в статье, «вполне возможно, что вся Вселенная на самом фундаментальном уровне представляет собой нейронную сеть».
В течение многих лет физики пытались совместить квантовую механику и общую теорию относительности. Первое утверждает, что время универсально и абсолютно, а второе, что время относительно, связано с тканью пространства-времени.
В своей статье Ванчурин утверждает, что искусственные нейронные сети могут «демонстрировать примерное поведение» обеих универсальных теорий. Поскольку квантовая механика «является чрезвычайно успешной парадигмой для моделирования физических явлений в широком диапазоне масштабов, — пишет он, — широко распространено мнение, что на самом фундаментальном уровне вся Вселенная управляется правилами квантовой механики, и даже гравитация должна каким-то образом выйти из этого».
«Мы не просто говорим, что искусственные нейронные сети могут быть полезны для анализа физических систем или для открытия физических законов, мы говорим, что именно так на самом деле работает мир вокруг нас», — говорится в обсуждении статьи.
Концепция настолько смелая, что большинство физиков и экспертов по машинному обучению, к которым мы обратились, отказались комментировать исследование, ссылаясь на скептицизм по поводу выводов статьи. Но в интервью с Futurism, Ванчурин склонился к полемике — и рассказал нам больше о своей идее.
Футуризм: в вашей статье утверждается, что Вселенная может быть нейронной сетью. Как бы вы объяснили свои рассуждения тому, кто не очень разбирается в нейронных сетях или физике?
Виталий Ванчурин: На ваш вопрос можно ответить двумя способами.
Первый способ — начать с точной модели нейронных сетей, а затем изучить поведение сети в пределе большого количества нейронов. Я показал, что уравнения квантовой механики довольно хорошо описывают поведение системы вблизи состояния равновесия, а уравнения классической механики довольно хорошо описывают, как система удаляется от равновесия. Стечение обстоятельств? Может быть, но, насколько нам известно, квантовая и классическая механика — это именно то, как работает физический мир.
Второй способ — начать с физики. Мы знаем, что квантовая механика довольно хорошо работает в малых масштабах, а общая теория относительности довольно хорошо работает в больших масштабах, но пока нам не удалось согласовать две теории в единой системе. Это известно как проблема квантовой гравитации. Ясно, что нам не хватает чего-то большого, но, что еще хуже, мы даже не знаем, как обращаться с наблюдателями. Это известно как проблема измерения в контексте квантовой механики и проблема меры в контексте космологии.
Тогда можно возразить, что есть не два, а три явления, которые необходимо объединить: квантовая механика, общая теория относительности и наблюдатели. 99% физиков скажут вам, что квантовая механика является основной и все остальное должно каким-то образом возникать из нее, но никто точно не знает, как это можно сделать. В этой статье я рассматриваю еще одну возможность того, что микроскопическая нейронная сеть является фундаментальной структурой, а все остальное, то есть квантовая механика, общая теория относительности и макроскопические наблюдатели, вытекает из нее. Пока все выглядит многообещающе.
Что впервые навело вас на эту идею?
Сначала я просто хотел лучше понять, как работает глубокое обучение, и поэтому написал статью под названием «К теории машинного обучения». Первоначальная идея заключалась в применении методов статистической механики для изучения поведения нейронных сетей, но оказалось, что в определенных пределах динамика обучения нейронных сетей очень похожа на квантовую динамику, которую мы видим в физике. В то время я был в творческом отпуске и решил исследовать идею о том, что физический мир на самом деле является нейронной сетью.
Идея определенно безумная, но достаточно ли безумная, чтобы быть правдой? Это еще предстоит выяснить.
В статье вы написали, что для доказательства ошибочности теории «все, что нужно, — это найти физическое явление, которое не может быть описано нейронными сетями». Что ты имеешь в виду? Почему такое «легче сказать, чем сделать»?
Существует множество «теорий всего», и большинство из них, должно быть, ошибочны. По моей теории, все, что вы видите вокруг себя, является нейронной сетью, и поэтому, чтобы доказать, что это неверно, все, что нужно, — это найти явление, которое невозможно смоделировать с помощью нейронной сети. Но если подумать, это очень сложная задача, потому что мы очень мало знаем о том, как ведут себя нейронные сети и как на самом деле работает машинное обучение. Вот почему я в первую очередь попытался разработать теорию машинного обучения.
Как ваше исследование связано с квантовой механикой и обращается ли оно к эффекту наблюдателя?
Существует два основных направления мысли: интерпретация квантовой механики Эвереттом (или многомировая) и интерпретация Бома (или скрытых переменных). Мне нечего сказать нового о многомировой интерпретации, но я думаю, что могу внести свой вклад в теории скрытых переменных. В квантовой механике, которую я рассматривал, скрытые переменные — это состояния отдельных нейронов, а обучаемые переменные (такие как вектор смещения и матрица весов) — квантовые переменные. Обратите внимание, что скрытые переменные могут быть очень нелокальными, поэтому неравенства Белла нарушаются. Ожидается, что появится приближенная пространственно-временная локальность, но, строго говоря, каждый нейрон может быть связан с любым другим нейроном, и поэтому система не обязательно должна быть локальной.
Не могли бы вы подробнее рассказать о том, как эта теория связана с естественным отбором? Как естественный отбор влияет на эволюцию сложных структур / биологических клеток?
Я говорю очень просто. Есть структуры (или подсети) микроскопической нейронной сети, которые более стабильны, а есть другие структуры, которые менее стабильны. Более стабильные структуры переживут эволюцию, а менее стабильные структуры будут уничтожены. Я ожидаю, что в самых маленьких масштабах естественный отбор должен произвести некоторые структуры очень низкой сложности, такие как цепочки нейронов, но в больших масштабах структуры будут более сложными. Я не вижу причин, по которым этот процесс должен быть ограничен определенной шкалой длины, и поэтому утверждается, что все, что мы видим вокруг нас (например, частицы, атомы, клетки, наблюдатели и т. д.), Является результатом естественного отбора.
Мы были заинтригованы вашим первым письмом, где вы сказали, что сами, возможно, не все понимаете. Что вы имели в виду? Вы имели в виду сложность самой нейронной сети или что-то более философское?
Да, я говорю только о сложности нейронных сетей. У меня даже не было времени подумать о философском подтексте результатов.
Нужно спросить: означает ли эта теория, что мы живем в симуляции?
Нет, возможно мы живем в нейронной сети, но никогда не заметим разницы.
Нейросеть-это мозг вселенной. Если к ней подключиться, то можно получить все знания, накопленные Вселенной, но этому препятствуют аннуннаки. Аннуннаки нас от неё отгородили, установив в головах барьер.