Вещь не различается субъектом, а узнаётся. В этом моменте у вас онтологическая неувязочка случилась. Нельзя что-либо различить прежде не опознав это.
Объясните
правильный онтологический смысл терминов «опознать» и «различить». Может я действительно чего-то не понимаю.
Выскажу на этот счет своё мнение, но если у кого идиосинкразия к науке или математике, то дальше лучше не читать
.
Так уж получилось, что я сейчас (а точнее около месяца назад) занялась "кластерным анализом". Перекрывание этой области знания с затронутыми в этой теме вопросами чисто случайное. Хотя у меня есть такая черта характера, когда в дискуссиях свожу разговор к тому, что знаю или чем интересуюсь. Меня за это часто ругают, полагая, что я не слушаю собеседника, а гну свою линию. Вероятно, по этой же причине здесь оказались мною затронуты вопросы про ИИ, хотя тема изначально была про любовь и красоту
.
"Кластерный анализ" (КЛ) меня заинтересовал тем, у меня для него появилась задача (с созданием роботов никак не связанная
), а в открытом доступе в то время появился обновленный пакет от Intel для сложных математических расчетов (до испытания первой версии этого пакета, вышедшего в начале года, руки у меня так и не дошли). Цитирую:
Кластеризация предполагает деление набора точек данных на непересекающиеся группы, или кластеры, в пределах которых точки «больше похожи» друг на друга, чем на точки в других кластерах. Термин «больше похож», применительно к кластерным точкам, как правило, означает близость. Когда набор данных кластеризован, каждая точка включается в определенный кластер и может быть охарактеризована одной описательной точкой, как правило, средней точкой в кластере. Любое конкретное разделение всех точек данных в кластеры называется разбиением.
Одним из наиболее известных приложений кластеризации является классификация растений или животных в отдельные группы или виды.
http://masters.donntu.org/2012/fknt/dryndik/library/article10.html Изначально эта задача подразумевала применение ИИ, но я отказалась от этой идеи в пользу классического КЛ, позволяющего решать эту задачу без предварительного обучения. Сейчас поясню, почему считаю это важным. Дело в том, что обучение любого типа в какой-то степени зависит от учителя. Т.е. даже без наличия специального умысла учитель может заражать ученика своим субъективизмом. Оно и в человеческом обществе так - те, кто обучались с детства в церковных школах или монастырях, становятся религиозно-верующими - признающими существование много из того, чего в реальности не существует. Аналогично можно предположить, что если обучение будет происходить в техническом ВУЗе, то могут появиться заморочки противоположного толка, когда ученик станет отрицать явления, имеющие место в реальности, но до сих пор не нашедшие научного объяснения. Ну, а в случае моей задачи очень хотелось, чтобы ее решение было найдено без давления со стороны метода обучения.
Короче говоря, было бы со всех сторон полезно знать ответ на вопрос: "что может ИИ извлечь из внешнего мира, когда информацию о нем он получать может, но его никто ничему прежде не обучал?". Этот же вопрос очень интересен в связи с тем, что обыватели
сильно напирают на вариант переноса человеческого сознания в ИИ (обучение у человека - это один вариантов навязывания ИИ человеческих заморочек). То бишь так много желающих сделать из ИИ человека, что среди них затерялась мысль о том, что мышление человека несовершенно, а ИИ создавался затем, чтобы он не повторял человеческих ошибок, а был от них свободен.
Так вот оказалось, что методами КЛ возможно классифицировать информацию, не имея о ней никакого априорного знания! Отсюда следует, что
"различить" появилось раньше, чем "узнавать". Причем это различение можно быть реализовано до примитивности просто - раз уж ИИ имеет возможность получать входную информацию в числовом виде, то арифметическая разность между двумя измерениями уже станет мерой различия. Ну, а если измерений множество, то тем только лучше. Тем самым "различить" объекты друг от друга возможно уже лишь потому, что их "обмеры" дают разные результаты.
Затем все эти измерения можно подвергнуть методам КЛ для группировки их по кластерам. Кластеры это разбиение измерений на отдельные группы (они-то и называются кластерами), внутри которых измерения имеют слабое различие, тогда как между разными группами различие велико. Например, если ИИ выдать альбом фотографий ... кошек и собак
, но он в процессе их классификации поместит кошек и собак в разные кластеры, но не потому, что прежде что-то знал о кошках и собаках, а только потому, что все кошки друг на друга похожи сильнее, чем на собак. То же самое можно сказать и о собаках - от кошек они по внешнему виду достаточно сильно отличаются. Причем, вероятнее всего, кластеров окажется не два, а больше из-за того, что между породами собак имеет место довольно сильное различие.
Если всем этим кластерам дать имена, то мы получим ... "инвентарный список" (по дону Хуану) с одной стороны и язык с другой стороны.
В том случае, когда поток внешних данных продолжает поступать, то их ассимиляция продолжается в динамическом режиме, используя ранее образованные кластеры. При этом ранее отклассифицированные данные обычно не меняют своего положения, а новые данные распределяются по имеющимся кластерам на этот раз по максимальному сходству с содержимым кластера (обычно с его центром тяжести).
Вот это уже и есть то самое "узнавание". Тем не менее, может возникнуть случай, когда какие-то из данных ни в один кластер не лезут, и тогда на лету может быть создан новый кластер, а в сложных случаях содержимое ближайших (наиболее схожих) кластеров может быть слито воедино с новыми данными, перетасовано и подвергнуто повторному разбиению на кластеры.
Человеческий мозг/сознание работают на том же принципе, только реализованном на нейросетевой архитектуре. Но будучи биологическим организмом, у человека возникают энергетические трудности, когда ранее образованные кластеры приходится ломать/перестраивать. А потому где-то во второй половине жизни новые кластеры практически больше не создаются из-за того, что к этому времени уже образовалось так много кластеров (а размеры их расширились настолько, что промежутков между ними не осталось), что в большинстве случаев новой информации почти всегда можно найти место среди существующих кластеров, не создавая новых. Причем эта "леность" человеческого мозга в корне неистребима, т.к. биологическому организму перенапрягаться нельзя. И потому на первом месте находится минимизация расхода усилий/ресурсов, а не качество мышления.