автор: Pipa
Полагаю, что рассмотреть принципы работы нейросети имеет смысл, т.к. компьютерные аналогии, к сожалению, часто уводят мысль в неправильном направлении. Все-таки мы, человеки, по своей природе именно таковы, что именно нейросеть находится в фундаменте работы нашего сознания. Кроме того, даже поверхностное ознакомление с ее свойствами открывает далеко идущие аналогии, которые на мой взгляд дают очень интересные пересечения с учением КК/ДХ.
Принцип работы нейросети легче всего понять, если представить себе карту автомобильных дорог большого города. Тогда каждый нейрон будет эквивалентен регулируемому перекрестку с проходящими через него отрезками дорог (до следующего перекрестка). Прохождение нервного импульса по сети будет отличается от движения автомобиля тем, что он не ожидает на перекрестке разрешающего сигнала светофора в нужном ему направлении движения, а следует в том направлении, куда в данный момент светофор разрешает ехать. Можно даже сказать, что нервный импульс не знает места своего назначения и потому двигается, неостанавливаясь на всем своем пути, туда, куда разрешают ему двигаться светофоры. Именно поэтому пробки на тех путях никогда не образуются, ведь двигаются нейроимпульсы всегда с одной и той же скоростью и на перекрестках никогда не тормозят (желтого света на тех светофорах не бывает, как и тормозов у участников движения). В том случае, если же вдруг светофоры полностью перекроют движение, пробка все равно не образуется, т.к. участники движения при этом делают себе харакири, кончая с собой в кювете :-) .
Въехавший в такой странный город нейроимпульс представляет собой входной сигнал (например, от сенсора), а если ему посчастливится этот город покинуть, то станет импульсом некоторого действия (например, вызовет сокращение участка мускулатуры). Легко догадаться, что вся соль здесь в карте дорог и в алгоритме работы светофоров.
В то время, как дорожные карты у разных людей очень похожи (все-таки лепились наши тела по одному проекту), именно работа светофоров ответственна за нашу индивидуальность, способность к обучению и за все прочее, что может представлять для нас интерес. Поэтому рассмотрим работу этих светофоров более подробно.
Первой особенностью регулирования движения в этом нейрогороде является то, что каждый перекресток там регулируется автономно собственным регулировщиком, который сидит там в стеклянной будочке и скучает :-), т.к. светофоры сами автоматически переключаются по таймеру: столько-то времени для проезда по одной дороге, и столько-то по другой. Причем интервалы пропускания по каждой из пересекающихся дорог в общем случае разные. Ту дорогу, которая открыта дольше другой, можно назвать привилегированной. Например, если светофор работает в режиме 40%:60%, то это значит, что 40% грузопотока он пропускает по первой дороге, а остальные 60% по другой. Соответственно этому, вторая дорога будет находиться в привилегированном положении.
Если действие, сгенерированное нейросетью, признается ошибочным (вопрос об ошибках очень сложен, и я его рассматривать сейчас не стану), то те (и только те!) регулировщики, через чьи перекрестки прошел тот нейроимпульс, ставший ошибочным действием, получают нагоняй :-). И обязаны изменить режим регулирования так, чтобы урезать грузопоток по той трассе, по которой проходил неудачник. Насколько они его урежут заранее определить сложно, зависеть это будет от их трусливости и строгости нагоняя :-). Однако может вполне статься, что привилегированная дорога после этого лишиться своих преимуществ и привилегии могут перейти к другой дороге. Соответственно этому, в случаях удачи и успеха регулировщики могут получить поощрение, в ответ на которое они совершат обратное действие – увеличат грузопоток по «удачливой» трассе.
Вот таким образом работает, так называемый, принцип «обратного распространения ошибок». Можно представлять дело так, что тот нагоняй или поощрение посылается в обратную сторону только что дошедшего до назначения нейроимпульса, т.е. когда все светофоры на его пути еще сохраняют свое состояние. Дороги, пропустившие груз, в случае успеха поощряются, а в случае провала наказываются, И в результате такого «обучения» нейросеть обретает способность находить пути решения задач, в общем-то не используя логику.
Чем же принцип нейросети может быть интересен здесь, для участников этого форума?
1. Во-первых, это решение споров о «линейной логике». Как мы видим из принципа работы нейросети, в ней могут существовать (и реально существуют) «правительственные» трассы :-), на всем протяжении которых всегда горит зеленый свет. Такие трассы соответствуют безусловным рефлексам. Могут существовать и трассы с ограниченным числом переключателей движения (вариантов). Эти трассы соответствуют тому, что мы относим к логике, поскольку обычно в состоянии бываем понять довольно простой принцип такого приключения, а порой и пересчитать возможные варианты. И, наконец, тот предельный случай, когда бывают задействованы большие участки сети. В последнем случае решение не может быть описано комбинацией логических операций и представляет собой нечто вроде функции многих переменных. Назовем этот вариант ... женской логикой :-).
Как бы ни было смешно, но «женская логика», в ее общепринятом понимании, представляет собой как раз типичный пример общего нейросетевого решения. Тут результат умножения 2х2 будет зависеть не только от этих двух сомножителей, а еще от умопомрачительного количества других обстоятельств, типа жмут ли туфли на ноге (конечно же я сильно утрирую). Именно это непостоянство решения (раздражающее мужчин :-) обязано тому, что на результат влияют факторы, которые по условию задачи должны быть исключены. Но нейросеть не знает исключений. Оттого-то так трудно дается выучивание таблицы умножения. Для решения арифметических задач, типа 2х2=4, в нейросистеме следует организовать выше описанные «правительственные трассы» только для цифр (!). И вот только тогда с арифметикой будет полный ажур.
Как видим, школьное обучение фактически сводится к прорезанию в мозгу/нейросети бульдозером просек, на которых нет светофоров, или последние установлены на 100%-ное пропускание. Такой режим приводит к деградации участка нейросистемы, как части общей сети, и появлению зон, где действует «линейная логика».
2. Второй аспект непосредственно связан в нашими преставления о причинности, т.е. в «объяснении» происхождения тех или иных событий. Магия тоже имеет к этому вопросу самое непосредственное отношение.
В самом деле, человек по своей природе не может не проецировать свою собственную сущность на Мир. Иначе говоря, мы видим Мир таким, как «настроены» сами. И если нам требуется больше истины и реальности, то настройку собственной нейросети надо во многом менять. Причем так, чтобы с одной стороны не деградировать к простой логической схеме (и уж тем более к условному рефлексу или привычке), а с другой стороны, чтобы цвет туфель и содержимое желудка не влияли на наши умозаключения о Мире :-) .
В соответствии со сказанным, представления о причинности в окружающем нас мире базируются на наложении на Мир нашей собственной линейности мышления. В том числе и тех самых просек, проложенных бульдозером. Напротив, наложение на Мир ВСЕЙ нашей нейросети привело бы к такому представлению о Мире, когда «все связано со всем», где нет жестких причинно-следственных связей. А точнее, эти связи настолько множественны и разветвлены, что проследить за ними не представляется никакой возможности. Вселенная начинает выглядеть для нас как сеть!
Очень похоже, что «магический взгляд на мир» ДХ имеет много общего как раз со вторым случаем. Неописуемость Мира состоит тут еще и в том, что описывать линейную логику мы уже с горем пополам научились (поскольку это делать проще), а описание состояния нейросетей до сих пор находится в зачаточном состоянии.
3. Третьим аспектом, на который проливает свет принцип работы нейросетей является перепросмотр.
Надо сказать, что те светофоры справляются с переключением движения только до тех пор, пока есть чего переключать. Я имею тут ввиду, что как только одна из дорог уменьшит свою пропускную способность до 0% (т.е. движение по ней будет полностью приостановлено), то в дальнейшем этот перекресток перестает быть регулированным. Это, так называемый, эффект «пробоя нейрона». Можно сказать, что тут нейрон подыхает. Такое случается при шоковых состояниях (регулировщик настолько напуган разносом, что полностью перекрывает трассу и сбегает с поста :-). Упоминание о проявлении подобных случаев в психике человека хорошо описано у Хаббарда в «Дианетике». Способ предложенный им хорошо укладывается в стратегию оптимизации нейтросети, однако обсуждать его подробно сейчас нет времени. Перепросмотр, несомненно, имеет общие корни с этой проблемой. То и другое по отношению к нейросети представляют собой более тонкую коррекцию – пересмотр оценок ситуаций, ранее скороспело признанных ошибочными или удачными. Проще говоря, пересмотр наложенных на регулировщиков поощрений и взысканий.
4. Четвертый аспект это воспитание. Как видим, линейное знание легко передается из поколение в поколение, будучи по своей сути алгоритмом. А вот настройку одной нейросети передать другой в общем случае не удается. Мешает тут с одной стороны баснословный объем информации, не позволяющей создать полную копию (передать ВСЕ свои знания другой). А с другой стороны – принципиальная невозможность вычленения из нейросистемы одного конкретного знания для передачи. Хотя кое-какие частичные варианты, я полагаю, все же можно было бы предложить. Причем все они вытекают именно из нейросетевой модели.
5. Пятый аспект – сталкерство и безупречность :-). С позиций нейросети путь к безупречности выглядит как совершенствование ее в сторону универсальности. Т.е. более «безупречна» та система, которая обучалась не на узком классе однотипных задач, а на как можно более широком поле деятельности. А расширение сферы деятельности, переход от привычных занятий к каким-то иным, к принципиально новой деятельности – это и есть сталкинг.
В какой-то мере об этом можно было бы догадаться уже по самому принципу действия нейтросети. Ведь чем конкретнее решаемая задача, тем более эффективен для ее решения специфический линейный алгоритм, и тем избыточнее и неэффективнее будет применение «универсального решателя». А нейросеть по своей сути является именно тем самым универсальным решателем! Т.е. проявляет во всей силе свои преимущества как раз тогда, когда задача становится настолько сложной (в смысле огромного размера условий той задачи), что последовательный (процедурный) алгоритм ее решения не может быть составлен. Например, человек гораздо лучше играет в шахматы, чем перемножает в уме большие числа. А вот калькулятор, напротив, быстро умножает числа, но плохо играет в шахматы.
Кроме того, особо следует упомянуть о способность нейросетей решать все задачи! Кажется невероятным, но это так. Я ведь не сказала, что эти решения всегда должны быть правильными :-))). Нейросеть никогда не становится «буридановым ослом», она всегда готова дать мгновенный ответ. Вот только насколько верен будет тот ответ – полностью зависит от настройки сети, ее опыта. В противоположность этому, любой алгоритм не способен всегда давать ответы. В этом и его преимущества, и его недостатки. Способность давать только гарантированно правильные ответы и пасовать во всех остальных случаях – очень крупный недостаток в тех случаях, когда имеешь дело с неизвестным. Тут уж лучше иметь хоть какое-нибудь решение, хоть на самую малость более вероятное, чем случайный выбор. Нейросеть – именно то, что полностью удовлетворяет этой спецификации.
6. Шестой аспект – это «безмолвное» знание. Достаточно очевидно, что нейросеть не мыслит, в полном смысле этого слова. Скорее всего нейросеть более похожа на однопроходный матричный решатель (умножение вектора входных данных на решающую матрицу). В этом смысле, любую задачу нейросеть решает всегда с одной и той же скоростью – скоростью прохождения нейроимпульса! Не слабо однако! :-). Отсюда понятно, что ответы нейросети только «безмолвными» и могут быть. И никакими другими. А все «мысли» это лишь трассировка линейных алгоритмов («сначала поехал туда, потом свернул сюда»), а сетевой отклик в общем случае проследить нельзя. Тут сказывается примитивность моей аналогии с автомобильными дорогами: в реальной нейросети на перекрестке с таймированием 40%:60% случается и так, что 40% груза уедет по первой дороге, а 60% по другой :-). Т.е. реально входная информация как бы вливается огромную по размеру систему оросительных каналов, и там, где она выливается уже не возможно сказать какая молекула воды с какого входа приплыла.
И в самом деле, прислушайтесь к себе. Разве не знаете вы ответов на все вопросы (путь даже никакой уверенности в их правильности нет)? :-)
7. Седьмой аспект – «ограниченность тоналя». Глядючи на работу нейросети, можно заключить, что единственной ее болезнью может быть – утрата способности к обучению. Сеть продолжает успешно решать старые задачи, но старые ответы не подходят для новых задач. Т.е. это является на самом деле не пороком тоналя, а пороком всей нейросети. И проявляться тот порок будет во всех ее аспектах. Может быть просто на тонале он сильнее заметен? :-)
8. Вопрос о маркировке нервных волокон тоже становится совершенно ясным. Не нуждается нейросеть ни в каких маркировках, т.к. настраивается именно на ту конфигурацию входных/выходных потоков, которые заданы ее схемой. Фактически при любой исходной «разводке» дорог нейросеть созрела бы примерно до той же самой кондиции, если получила бы тот же самый «жизненный» опыт.
9.... Тут еще много чего можно добавлять, но надо же на чем-то остановиться? И так, я думаю, мой пост никто внимательно читать не станет. Так стоит ли распинаться?
P.S. Специалист по нейросетям пришел бы в ужас, прочтя то, что я тут понаписала :-), но такова уж участь всех популяризаторов – быть обруганными со всех сторон...