02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Страница 4 из 5
Страница 4 из 5 • 1, 2, 3, 4, 5
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ГЛАВА 7. ЭКСПЕРИМЕНТЫ С М-АВТОМАТОМ РЭМ
#1. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ М-АВТОМАТА РЭМ-1
На этом этапе исследовалось влияние некоторых параметров, определяющих тип автомата, т.е. его отношение к объектам среды, на построение планов двигательного поведения. Рассматривалось поведение автоматов Tl, T2 и T3, имеющих различные соотношения оценок объектов среды. Автоматы функционировали в среде, содержащей три типа объектов - "положительные" (P1), "сильно отрицательные" (P2) и "слабо отрицательные" (P3) (рис.26). Задание типа автомата производилось подбором соотношений оценок объектов среды (табл. 2).
Рис.26. Среда автомата РЭМ-1 (o - объект P1, x - объект P2, * - объект P3).
Таблица 2
Поскольку планирование поведения осуществлялось автоматом для достижения цели, представляло интерес исследовать влияние "силы цели" на выбор плана передвижения в среде. Силы цели задавались в диапазоне от 10 до 100усл.ед. Исследование проводилось в двух режимах: 1) достижение определенной клетки среды, расположенной внутри осматриваемого автоматом участка; 2) построение плана достижения клетки, расположенной вне осматриваемого участка. Во втором случае выбор клетки "подцель" производился автоматом и, как показали эксперименты, зависел от его типа и "силы" главной цели. На рис.27 показан пример изменения положения клетки "подцель" и планы, построенные автоматом T3 при силах главной цели A.1=10, A.2=30, A.3=50 (при A=70 и A=90 положение подцели совпадало с выбранным при А = 50, поскольку эта клетка расположена на прямой, соединяющей исходную клетку автомата и цель).
Рис.27. Планы поведения, построенные автоматом T3 (режим 2) при различных "силах цели".
ВЛИЯНИЕ ТИПА АВТОМАТА НА ВЫБОР ПЛАНА. Примеры планов, построенных автоматами с различными соотношениями оценок объектов среды при одинаковой силе цели A=90, показаны на рис.28 (планы построены для случая, когда главная цель находится вне осматриваемого участка). Как видно из рисунка, автоматы Tl, T2 и T3 выбрали в качестве подцели различные клетки. Подцель, выбранная автоматом T3, расположена на прямой, соединяющей исходную клетку автомата и главную цель. Подцели автоматов T2 и T1 несколько удалены от нее. Выбранные автоматами планы также значительно отличаются друг от друга. Если планы автоматов T3 и T2 проходят через участки среды, содержащие объекты P2 и P3, то автомат T1 "избегает" отрицательных раздражителей и учитывает только расположение объектов P1. Участки среды, содержащие объекты P3 и, тем более, P2, автомат T1 "старается обходить". Соответственно план его передвижения значительно длиннее планов, построенных автоматами T2 и T3. В этой связи необходимо еще раз подчеркнуть, что единственным различием между автоматами было "индивидуальное" задание исходной информации о среде, выраженное в различных оценках объектов среды (см. табл.2). Поскольку объекты P1 для всех трех типов автоматов оценивались одинаково, можно предположить, что поведение последних определялось в основном наличием в среде объекта P2 ("сильно отрицательного"). Можно говорить, что в этом отношении автомат T3 проявил наиболее "решительный" характер, а автомат T1 - наиболее "осторожный".
Рис.28. Планы поведения, построенные автоматами с различными "характерами" (режим 2).
Представляет также интерес сопоставление планов поведения автоматов T1, T2 и T3, построенных ими в режиме 1 (цель находится внутри осматриваемого участка). Пример планов для силы цели А=30 приведен на рис.29. Видно, что автомат T3 и в этом случае строит наиболее короткий план достижения цели.
Рис.29. Планы поведения, построенные автоматами с различными "характерами" (режим 1).
ВЛИЯНИЕ "СИЛЫ ЦЕЛИ". Эксперименты показали, что выбираемые автоматами планы передвижения в среде существенно зависят от "силы цели". С увеличением последней автоматы всех типов "стремятся" сократить путь. Пример изменения плана (в режиме 1) автоматом T1 показан на рис.30 для A.1=10, A.2=30, A.3=70 и A.4=90. Если при A=10 план автомата состоял из 11 этапов и предусматривал обход участка среды с объектами P2 и P3, то при A=90 он оказался сокращенным до четырех этапов и проходит через "неприятные" для автомата участки. Увеличение "силы цели" вынуждает даже автомат с "осторожным" характером предпринимать (планировать) все более "решительные" действия. При этом оказываются весьма близкими планы, построенные "решительным" автоматом при малых "силах цели" и "осторожным" - при больших.
Рис.30. Планы поведения, построенные автоматом T1 при различных "силах цели".
При описании М-автомата были выделены два компонента "стремления" автомата достичь цель. Действие одного из них - "силы цели" - рассмотрено нами выше. Второй компонент - "установка" на достижение цели (B) - также оказывает значительное влияние на выбор плана передвижения (см. описание работы алгоритма "K"). На рис.31 показано изменение планов, выбираемых автоматом T1 в режиме 1 при A=90 для B.1=150 и B.2=200усл.ед. С увеличением BB повышается "целеустремленность" поведения автомата. (Все предыдущие рисунки планов даны для B=150).
Рис. 31. Планы поведения, построенные автоматом T1 при различных установках на достижение цели.
ВЛИЯНИЕ ТИПА АВТОМАТА И "СИЛЫ ЦЕЛИ" НА КОЛИЧЕСТВО ВАРИАНТОВ ПЛАНА. При выборе того или иного плана поведения автомат, как правило, предварительно просматривает несколько возможных вариантов. В проведенных экспериментах количество вариантов плана не превышало трех. Для всех автоматов замечена определенная корреляция между "силой цели" и количеством просматриваемых вариантов: чем выше "сила цели", тем меньшее количество вариантов плана строит автомат. Аналогичный эффект характерен и для планов поведения человека. Эксперименты показали, что наибольшее количество вариантов строит автомат T1. На рис.32 показаны варианты плана передвижения, просмотренные автоматами T1 и T3 для A=10 и B=150. Варианты строились в порядке, указанном цифрами на рисунке. После построения каждого из вариантов автомат подсчитывал и запоминал его показатель ценности. Так, для планов, построенных автоматом T1, показатели ценности были равны соответственно 899, 995 и 983усл.ед. В качестве окончательного выбран второй вариант. Для автомата T3 показатели ценности построенных им планов были равны соответственно 1396 и 1286усл.ед. Выбран первый вариант. Критерий ценности планов для автоматов всех типов и при всех "силах цели" задавался одинаковым и равным 5000 усл. ед. Выбор критерия ценности, заведомо превосходящего показатель ценности любого из просматриваемых автоматами планов, позволил сравнить "способность" различных автоматов к построению вариантов плана.
Рис. 32. Варианты плана поведения, построенные автоматами с различными "характерами": а - автоматом T1; б - автоматом T3.
Как показали эксперименты, на количество и выбор построенных автоматом вариантов плана оказывает существенное влияние параметр В. На рис.33 приведены планы автомата T1 в режимах 1 (правые части рисунков) и 2 (левые части рисунков) при A=90 и B=150; A=90 и B=200. При B=150 в обоих режимах просмотрено по два варианта. Порядок просмотра вариантов соответствует их нумерации на рисунке. Выбранными оказались второй вариант в режиме 1 и первый вариант в режиме 2. В то же время при B=200 были выбраны планы, соответствующие отвергнутым вариантам при B=150. Более длинные планы, выбранные автоматом при B=150, в этом случае вообще не просматривались.
Рис.33. Планы поведения, построенные автоматом T1 при различных установках B на достижение цели в режимах 1 и 2: а - B=150; б - B=200.
Интересно изменение вариантов плана, построенных автоматом T1 в режиме 1, при увеличении параметра B и A=10 (на рис.32.a, B=150, на рис.34 В=200). В обоих случаях просмотрено по три варианта, но конфигурация планов, как видно из сравнения рисунков, различна. Порядок просмотра вариантов соответствует их нумерации на рисунке. В обоих случаях выбраны вторые варианты. (Напомним, что для автомата среда имеет вид цилиндра с винтовым расположением клеток. Этим обстоятельством объясняется переход плана на рисунках из правой части среды в левую).
Рис. 34. Варианты плана поведения, построенные автоматом T1 в режиме 1 (A=10, B=200).
СОПОСТАВЛЕНИЕ ПЛАНОВ ПОВЕДЕНИЯ ЧЕЛОВЕКА И АВТОМАТА. Сопоставление планов, построенных автоматами, с планами, выбранными людьми в аналогичной условной среде, показало хорошее совпадение. На рис.35 представлены планы, выбранные различными испытуемыми (сплошные линии) и автоматами (штриховые линии) при планировании поведения в одинаковых средах.
Рис.35. Планы поведения, построенные испытуемыми (сплошные линии) и автоматами (пунктирные линии).
Мы полагаем, что оценка адекватности планов на основе сравнения психологических и машинных экспериментов может рассматриваться как модификация выдвинутого Тьюрингом критерия оценки "разумности" поведения машин (моделей). Процедура, предложенная Тьюрингом, предусматривает распознавание человеком-наблюдателем поведения модели и моделируемого объекта (человека) по ряду внешних признаков этого поведения. Из рис.35 видно, что в условиях проведенного нами эксперимента поведения модели и человека-испытуемого практически неразличимы.
В психологическом эксперименте для некоторых испытуемых были получены планы поведения, не соответствующие планам, построенным автоматами при оценках, указанных в табл.2. Примеры таких планов показаны на рис.36. При анализе отчетов испытуемых, показавших эти результаты, было сделано предположение, что имеется существенное отличие в оценках, субъективно даваемых испытуемым различно окрашенным клеткам, и оценках объектов среды, заданных автомату по табл.2. Введение четвертого типа автомата - T4 со следующими оценками (объект P4 обозначает пустую клетку среды) P1=35, P2=-100, P3=-50, P4=20 позволило получить в модельном эксперименте планы (рис.37), близкие к показанным на рис.36.
Рис.36. Планы, построенные испытуемыми (режим 1).
Рис.37. Планы поведения, построенные автоматом T4 (режим 1).
Итак, на основании анализа планов поведения, построенных М-автоматом, и сравнения их с планами, выбираемыми испытуемыми в психологическом эксперименте, может быть сделан вывод о правомерности исходных предположений относительно процесса построения человеком планов двигательного поведения. Однако ряд введенных в М-автомат ограничений (например, объединение на высших уровнях внутренней модели среды ячеек нижних уровней не по их "содержанию", а только по пространственному признаку) свидетельствует о том, что автомат еще не достаточно полно отражает специфику построения планов двигательного поведения человеком и не учитывает некоторых (возможно, важных) механизмов этого рода деятельности. На устранение указанных недостатков было направлено дальнейшее совершенствование автомата.
#2. СЕМАНТИКА М-СЕТИ АВТОМАТА
Для того чтобы иметь возможность оценивать адекватность внешних и внутренних реакций автомата в процессе передвижения в среде, принята определенная содержательная интерпретация объектов среды. Соответственно этой интерпретации выбрана и семантика элементов М-сети автомата, что позволило определенным образом задать ее организацию.
Три типа объектов среды - "положительный" P1, "сильно отрицательный" P2 и "слабо отрицательный" P3 содержательно интерпретировались как "пища", "зверь" и "лес".
Структура М-сети автомата схематически изображена на рис.38. В соответствии с семантической интерпретацией i-моделей в сети выделены четыре взаимосвязанные сферы - логическая, эмоциональная, двигательная и сфера "желаний".
Рис.38. Структура М-сети автомата РЭМ: ---> усиливающая связь; -=-> тормозная связь.
Первый уровень логической сферы составляют три группы по девять i-моделей (с 1-й по 27-ю i-модель на схеме рис.38 ), соответствующие пространственным положениям объектов среды ("пища слева", "лес сверху", "зверь снизу" и т.д.). Обобщение воспринимаемой извне информации происходит на втором и третьем уровнях логической сферы. Каждая группа i-моделей первого уровня (пространственные положения одного объекта) представлена одной i-моделью на втором уровне - понятия "пища" (i-модель 30), "зверь" (i-модель 28 ) и "лес" (i-модель 29). (В дальнейшем вместо выражения "i-модель..." будем в скобках писать только соответствующий этой i-модели номер на схеме структуры автомата). Семантика остальных i-моделей логической сферы выбрана следующей: "лес вокруг" (37), "опасность снизу" (31), "опасность слева" (32), "опасность сверху" (33), "опасность справа" (34), общее понятие "опасность" (38 ), "любопытство" (39), "отсутствие объектов" (46), "зверь встречается часто" (35).
Эмоциональная сфера М-автомата представлена i-моделями "гнев" (40), "страх" (41), "удовольствие" (42) и интегральными центрами эмоциональной оценки "приятно" - Пр (43) и "неприятно" - НПр (44).
Двигательная сфера М-автомата представлена тремя уровнями i-моделей - простые действия (51-58 ), сложные действия (59-66) и составное действие (77).
В сферу "желаний" включены i-модели "действовать" (49), "не действовать" (50), "действовать быстро" (67), "двигаться по плану" (76) и "нападать" (45).
Возбуждение i-моделей "действовать" и "не действовать" оказывает существенное влияние на двигательное поведение автомата. В начальном состоянии возбуждена i-модель "не действовать", что приводит к торможению i-моделей простых действий. При восприятии из среды информации об окружающих объектах повышается возбуждение i-модели "действовать", "затормаживается" i-модель "не действовать" и возбуждение i-моделей простых действий повышается. Если при этом одно из действий выбирается СУТ или превышает некоторый установленный экспериментатором уровень, оно выполняется п автомат перемещается в среде. В процессе функционирования автомата i-модель "не действовать" может быть опять возбуждена при наличии достаточно сильного возбуждения связанной с ней i-модели "удовольствие".
Связи от первого уровня логической сферы к первому уровню двигательной сферы устанавливались, исходя из следующих соображений: автомат стремится попасть в клетку с объектом "пища"; избегает проходить через клетку с объектом "зверь", может проходить через клетку с объектом "лес", но "знает", что это связано с определенной опасностью (i-модель "лес" связана с i-моделью "опасность").
Связи между первыми уровнями логической и двигательной сфер дают возможность получения "безусловнорефлекторного" ответа автомата на воспринимаемый объект. Коррекция этого ответа происходит благодаря наличию соответствующего распределения возбуждений на более высоких уровнях М-сети автомата. В результате "скорректированный" ответ может не совпадать и даже противоречить "безусловнорефлекторному". Так, например, при отсутствии плана движения автомат, как правило, не входит в клетку с объектом "лес", однако в том случае, когда задан план и для его выполнения необходимы действия, связанные с прохождением через клетки, содержащие объект "лес", автомат выполняет такие действия. При определенных условиях автомат может не заходить в клетки с объектом "пища" и заходить в клетки с объектом "зверь". Последнее считается допустимым только в том случае, если в М-сети автомата возбуждены i-модели "гнев" и "нападать". В противном случае действие рассматривается как "нелогичное" и производится коррекция проходимостей соответствующих связей.
#1. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ М-АВТОМАТА РЭМ-1
На этом этапе исследовалось влияние некоторых параметров, определяющих тип автомата, т.е. его отношение к объектам среды, на построение планов двигательного поведения. Рассматривалось поведение автоматов Tl, T2 и T3, имеющих различные соотношения оценок объектов среды. Автоматы функционировали в среде, содержащей три типа объектов - "положительные" (P1), "сильно отрицательные" (P2) и "слабо отрицательные" (P3) (рис.26). Задание типа автомата производилось подбором соотношений оценок объектов среды (табл. 2).
Рис.26. Среда автомата РЭМ-1 (o - объект P1, x - объект P2, * - объект P3).
Таблица 2
Поскольку планирование поведения осуществлялось автоматом для достижения цели, представляло интерес исследовать влияние "силы цели" на выбор плана передвижения в среде. Силы цели задавались в диапазоне от 10 до 100усл.ед. Исследование проводилось в двух режимах: 1) достижение определенной клетки среды, расположенной внутри осматриваемого автоматом участка; 2) построение плана достижения клетки, расположенной вне осматриваемого участка. Во втором случае выбор клетки "подцель" производился автоматом и, как показали эксперименты, зависел от его типа и "силы" главной цели. На рис.27 показан пример изменения положения клетки "подцель" и планы, построенные автоматом T3 при силах главной цели A.1=10, A.2=30, A.3=50 (при A=70 и A=90 положение подцели совпадало с выбранным при А = 50, поскольку эта клетка расположена на прямой, соединяющей исходную клетку автомата и цель).
Рис.27. Планы поведения, построенные автоматом T3 (режим 2) при различных "силах цели".
ВЛИЯНИЕ ТИПА АВТОМАТА НА ВЫБОР ПЛАНА. Примеры планов, построенных автоматами с различными соотношениями оценок объектов среды при одинаковой силе цели A=90, показаны на рис.28 (планы построены для случая, когда главная цель находится вне осматриваемого участка). Как видно из рисунка, автоматы Tl, T2 и T3 выбрали в качестве подцели различные клетки. Подцель, выбранная автоматом T3, расположена на прямой, соединяющей исходную клетку автомата и главную цель. Подцели автоматов T2 и T1 несколько удалены от нее. Выбранные автоматами планы также значительно отличаются друг от друга. Если планы автоматов T3 и T2 проходят через участки среды, содержащие объекты P2 и P3, то автомат T1 "избегает" отрицательных раздражителей и учитывает только расположение объектов P1. Участки среды, содержащие объекты P3 и, тем более, P2, автомат T1 "старается обходить". Соответственно план его передвижения значительно длиннее планов, построенных автоматами T2 и T3. В этой связи необходимо еще раз подчеркнуть, что единственным различием между автоматами было "индивидуальное" задание исходной информации о среде, выраженное в различных оценках объектов среды (см. табл.2). Поскольку объекты P1 для всех трех типов автоматов оценивались одинаково, можно предположить, что поведение последних определялось в основном наличием в среде объекта P2 ("сильно отрицательного"). Можно говорить, что в этом отношении автомат T3 проявил наиболее "решительный" характер, а автомат T1 - наиболее "осторожный".
Рис.28. Планы поведения, построенные автоматами с различными "характерами" (режим 2).
Представляет также интерес сопоставление планов поведения автоматов T1, T2 и T3, построенных ими в режиме 1 (цель находится внутри осматриваемого участка). Пример планов для силы цели А=30 приведен на рис.29. Видно, что автомат T3 и в этом случае строит наиболее короткий план достижения цели.
Рис.29. Планы поведения, построенные автоматами с различными "характерами" (режим 1).
ВЛИЯНИЕ "СИЛЫ ЦЕЛИ". Эксперименты показали, что выбираемые автоматами планы передвижения в среде существенно зависят от "силы цели". С увеличением последней автоматы всех типов "стремятся" сократить путь. Пример изменения плана (в режиме 1) автоматом T1 показан на рис.30 для A.1=10, A.2=30, A.3=70 и A.4=90. Если при A=10 план автомата состоял из 11 этапов и предусматривал обход участка среды с объектами P2 и P3, то при A=90 он оказался сокращенным до четырех этапов и проходит через "неприятные" для автомата участки. Увеличение "силы цели" вынуждает даже автомат с "осторожным" характером предпринимать (планировать) все более "решительные" действия. При этом оказываются весьма близкими планы, построенные "решительным" автоматом при малых "силах цели" и "осторожным" - при больших.
Рис.30. Планы поведения, построенные автоматом T1 при различных "силах цели".
При описании М-автомата были выделены два компонента "стремления" автомата достичь цель. Действие одного из них - "силы цели" - рассмотрено нами выше. Второй компонент - "установка" на достижение цели (B) - также оказывает значительное влияние на выбор плана передвижения (см. описание работы алгоритма "K"). На рис.31 показано изменение планов, выбираемых автоматом T1 в режиме 1 при A=90 для B.1=150 и B.2=200усл.ед. С увеличением BB повышается "целеустремленность" поведения автомата. (Все предыдущие рисунки планов даны для B=150).
Рис. 31. Планы поведения, построенные автоматом T1 при различных установках на достижение цели.
ВЛИЯНИЕ ТИПА АВТОМАТА И "СИЛЫ ЦЕЛИ" НА КОЛИЧЕСТВО ВАРИАНТОВ ПЛАНА. При выборе того или иного плана поведения автомат, как правило, предварительно просматривает несколько возможных вариантов. В проведенных экспериментах количество вариантов плана не превышало трех. Для всех автоматов замечена определенная корреляция между "силой цели" и количеством просматриваемых вариантов: чем выше "сила цели", тем меньшее количество вариантов плана строит автомат. Аналогичный эффект характерен и для планов поведения человека. Эксперименты показали, что наибольшее количество вариантов строит автомат T1. На рис.32 показаны варианты плана передвижения, просмотренные автоматами T1 и T3 для A=10 и B=150. Варианты строились в порядке, указанном цифрами на рисунке. После построения каждого из вариантов автомат подсчитывал и запоминал его показатель ценности. Так, для планов, построенных автоматом T1, показатели ценности были равны соответственно 899, 995 и 983усл.ед. В качестве окончательного выбран второй вариант. Для автомата T3 показатели ценности построенных им планов были равны соответственно 1396 и 1286усл.ед. Выбран первый вариант. Критерий ценности планов для автоматов всех типов и при всех "силах цели" задавался одинаковым и равным 5000 усл. ед. Выбор критерия ценности, заведомо превосходящего показатель ценности любого из просматриваемых автоматами планов, позволил сравнить "способность" различных автоматов к построению вариантов плана.
Рис. 32. Варианты плана поведения, построенные автоматами с различными "характерами": а - автоматом T1; б - автоматом T3.
Как показали эксперименты, на количество и выбор построенных автоматом вариантов плана оказывает существенное влияние параметр В. На рис.33 приведены планы автомата T1 в режимах 1 (правые части рисунков) и 2 (левые части рисунков) при A=90 и B=150; A=90 и B=200. При B=150 в обоих режимах просмотрено по два варианта. Порядок просмотра вариантов соответствует их нумерации на рисунке. Выбранными оказались второй вариант в режиме 1 и первый вариант в режиме 2. В то же время при B=200 были выбраны планы, соответствующие отвергнутым вариантам при B=150. Более длинные планы, выбранные автоматом при B=150, в этом случае вообще не просматривались.
Рис.33. Планы поведения, построенные автоматом T1 при различных установках B на достижение цели в режимах 1 и 2: а - B=150; б - B=200.
Интересно изменение вариантов плана, построенных автоматом T1 в режиме 1, при увеличении параметра B и A=10 (на рис.32.a, B=150, на рис.34 В=200). В обоих случаях просмотрено по три варианта, но конфигурация планов, как видно из сравнения рисунков, различна. Порядок просмотра вариантов соответствует их нумерации на рисунке. В обоих случаях выбраны вторые варианты. (Напомним, что для автомата среда имеет вид цилиндра с винтовым расположением клеток. Этим обстоятельством объясняется переход плана на рисунках из правой части среды в левую).
Рис. 34. Варианты плана поведения, построенные автоматом T1 в режиме 1 (A=10, B=200).
СОПОСТАВЛЕНИЕ ПЛАНОВ ПОВЕДЕНИЯ ЧЕЛОВЕКА И АВТОМАТА. Сопоставление планов, построенных автоматами, с планами, выбранными людьми в аналогичной условной среде, показало хорошее совпадение. На рис.35 представлены планы, выбранные различными испытуемыми (сплошные линии) и автоматами (штриховые линии) при планировании поведения в одинаковых средах.
Рис.35. Планы поведения, построенные испытуемыми (сплошные линии) и автоматами (пунктирные линии).
Мы полагаем, что оценка адекватности планов на основе сравнения психологических и машинных экспериментов может рассматриваться как модификация выдвинутого Тьюрингом критерия оценки "разумности" поведения машин (моделей). Процедура, предложенная Тьюрингом, предусматривает распознавание человеком-наблюдателем поведения модели и моделируемого объекта (человека) по ряду внешних признаков этого поведения. Из рис.35 видно, что в условиях проведенного нами эксперимента поведения модели и человека-испытуемого практически неразличимы.
В психологическом эксперименте для некоторых испытуемых были получены планы поведения, не соответствующие планам, построенным автоматами при оценках, указанных в табл.2. Примеры таких планов показаны на рис.36. При анализе отчетов испытуемых, показавших эти результаты, было сделано предположение, что имеется существенное отличие в оценках, субъективно даваемых испытуемым различно окрашенным клеткам, и оценках объектов среды, заданных автомату по табл.2. Введение четвертого типа автомата - T4 со следующими оценками (объект P4 обозначает пустую клетку среды) P1=35, P2=-100, P3=-50, P4=20 позволило получить в модельном эксперименте планы (рис.37), близкие к показанным на рис.36.
Рис.36. Планы, построенные испытуемыми (режим 1).
Рис.37. Планы поведения, построенные автоматом T4 (режим 1).
Итак, на основании анализа планов поведения, построенных М-автоматом, и сравнения их с планами, выбираемыми испытуемыми в психологическом эксперименте, может быть сделан вывод о правомерности исходных предположений относительно процесса построения человеком планов двигательного поведения. Однако ряд введенных в М-автомат ограничений (например, объединение на высших уровнях внутренней модели среды ячеек нижних уровней не по их "содержанию", а только по пространственному признаку) свидетельствует о том, что автомат еще не достаточно полно отражает специфику построения планов двигательного поведения человеком и не учитывает некоторых (возможно, важных) механизмов этого рода деятельности. На устранение указанных недостатков было направлено дальнейшее совершенствование автомата.
#2. СЕМАНТИКА М-СЕТИ АВТОМАТА
Для того чтобы иметь возможность оценивать адекватность внешних и внутренних реакций автомата в процессе передвижения в среде, принята определенная содержательная интерпретация объектов среды. Соответственно этой интерпретации выбрана и семантика элементов М-сети автомата, что позволило определенным образом задать ее организацию.
Три типа объектов среды - "положительный" P1, "сильно отрицательный" P2 и "слабо отрицательный" P3 содержательно интерпретировались как "пища", "зверь" и "лес".
Структура М-сети автомата схематически изображена на рис.38. В соответствии с семантической интерпретацией i-моделей в сети выделены четыре взаимосвязанные сферы - логическая, эмоциональная, двигательная и сфера "желаний".
Рис.38. Структура М-сети автомата РЭМ: ---> усиливающая связь; -=-> тормозная связь.
Первый уровень логической сферы составляют три группы по девять i-моделей (с 1-й по 27-ю i-модель на схеме рис.38 ), соответствующие пространственным положениям объектов среды ("пища слева", "лес сверху", "зверь снизу" и т.д.). Обобщение воспринимаемой извне информации происходит на втором и третьем уровнях логической сферы. Каждая группа i-моделей первого уровня (пространственные положения одного объекта) представлена одной i-моделью на втором уровне - понятия "пища" (i-модель 30), "зверь" (i-модель 28 ) и "лес" (i-модель 29). (В дальнейшем вместо выражения "i-модель..." будем в скобках писать только соответствующий этой i-модели номер на схеме структуры автомата). Семантика остальных i-моделей логической сферы выбрана следующей: "лес вокруг" (37), "опасность снизу" (31), "опасность слева" (32), "опасность сверху" (33), "опасность справа" (34), общее понятие "опасность" (38 ), "любопытство" (39), "отсутствие объектов" (46), "зверь встречается часто" (35).
Эмоциональная сфера М-автомата представлена i-моделями "гнев" (40), "страх" (41), "удовольствие" (42) и интегральными центрами эмоциональной оценки "приятно" - Пр (43) и "неприятно" - НПр (44).
Двигательная сфера М-автомата представлена тремя уровнями i-моделей - простые действия (51-58 ), сложные действия (59-66) и составное действие (77).
В сферу "желаний" включены i-модели "действовать" (49), "не действовать" (50), "действовать быстро" (67), "двигаться по плану" (76) и "нападать" (45).
Возбуждение i-моделей "действовать" и "не действовать" оказывает существенное влияние на двигательное поведение автомата. В начальном состоянии возбуждена i-модель "не действовать", что приводит к торможению i-моделей простых действий. При восприятии из среды информации об окружающих объектах повышается возбуждение i-модели "действовать", "затормаживается" i-модель "не действовать" и возбуждение i-моделей простых действий повышается. Если при этом одно из действий выбирается СУТ или превышает некоторый установленный экспериментатором уровень, оно выполняется п автомат перемещается в среде. В процессе функционирования автомата i-модель "не действовать" может быть опять возбуждена при наличии достаточно сильного возбуждения связанной с ней i-модели "удовольствие".
Связи от первого уровня логической сферы к первому уровню двигательной сферы устанавливались, исходя из следующих соображений: автомат стремится попасть в клетку с объектом "пища"; избегает проходить через клетку с объектом "зверь", может проходить через клетку с объектом "лес", но "знает", что это связано с определенной опасностью (i-модель "лес" связана с i-моделью "опасность").
Связи между первыми уровнями логической и двигательной сфер дают возможность получения "безусловнорефлекторного" ответа автомата на воспринимаемый объект. Коррекция этого ответа происходит благодаря наличию соответствующего распределения возбуждений на более высоких уровнях М-сети автомата. В результате "скорректированный" ответ может не совпадать и даже противоречить "безусловнорефлекторному". Так, например, при отсутствии плана движения автомат, как правило, не входит в клетку с объектом "лес", однако в том случае, когда задан план и для его выполнения необходимы действия, связанные с прохождением через клетки, содержащие объект "лес", автомат выполняет такие действия. При определенных условиях автомат может не заходить в клетки с объектом "пища" и заходить в клетки с объектом "зверь". Последнее считается допустимым только в том случае, если в М-сети автомата возбуждены i-модели "гнев" и "нападать". В противном случае действие рассматривается как "нелогичное" и производится коррекция проходимостей соответствующих связей.
Последний раз редактировалось: Gudleifr (Пн Сен 04, 2023 12:37 am), всего редактировалось 2 раз(а)
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#3. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ М-АВТОМАТА РЭМ-2
В автомате РЭМ-2 отражены основные положения исходной гипотезы о программах и механизмах переработки информации мозгом человека. Теоретически такой автомат должен быть способен к организации целесообразной и целенаправленной деятельности в любой среде, содержащей объекты, представленные в его сфере восприятий. Однако было неясно, удастся ли практически подобрать такие значения параметров i-моделей, связей и СУТ, которые обеспечат адекватность реакций автомата. Сложность модели и использование в ней множества неформализованных пока данных исключали возможность строгого анализа и основанного на этом анализе задания "рабочего режима" автомата, т.е. такого набора параметров, который должен обеспечить как адекватность его реакций на различные ситуации среды, так и целесообразность поведения в целом. Единственным доступным способом исследования практической возможности использования М-автоматов, в частности разработанного автомата РЭМ, для решения поставленной ранее задачи организации разумного поведения было проведение серии экспериментов, направленных на выявление особенностей функционирования автоматов такого типа.
Как уже упоминалось, РЭМ был первым из разработанных нами М-автоматов. Поэтому заранее не было известно, удастся ли вообще нужным образом организовать М-сеть автомата, насколько сложной окажется эта задача и даст ли нужный эффект работа СУТ. Все эти вопросы должны были быть решены в ходе экспериментального исследования РЭМа. Кроме того, в случае положительного их решения необходимо было выяснить, насколько устойчив рабочий режим автомата, т.е. допустимы ли изменения параметров i-моделей и связей и, если допустимы, то к каким изменениям в поведении автомата они приводят.
При описании общей задачи формирования двигательного поведения были выдвинуты два критерия оценки поведения М-автоматов: целесообразность внешних проявлений поведения, т.е. передвижения в среде, и целесообразность "внутренних" проявлений, т.е. хода мышления. Соответственно, рабочий режим автомата должен быть выбран таким образом, чтобы удовлетворять обоим критериям. Это означает, что при подборе значений параметров i-моделей, связей и СУТ мы должны добиваться адекватности не только двигательных актов, но и предшествующих им "осознанных мыслей" автомата. Именно с этих позиций мы и будем в дальнейшем оценивать поведение РЭМа в различных экспериментальных ситуациях.
НАСТРОЙКА АВТОМАТА. Целесообразность поведения необучающегося М-автомата, по существу, полностью зависит от выбора значений различных параметров его М-сети и СУТ. Поскольку теоретический расчет этих величин не представляется возможным, была проведена экспериментальная настройка автомата, заключающаяся в подборе проходимостей связей и характеристик i-моделей сети, обеспечивающих адекватность реакций автомата на отдельные типичные ситуации среды. План поведения автомату при этом не задавался. При настройке автомат помещался в отдельные заранее выбранные клетки среды, и исследовалось его поведение до выполнения первого двигательного акта. Целесообразность поведения автомата оценивалась по реакциям двух типов - внешней и внутренней.
Напомним, что внешняя реакция представляет собой действие, предпринимаемое автоматом в ответ на восприятие данной ситуации. Внутренняя реакция есть возбуждение i-моделей сети автомата, интерпретируемое как возникновение определенных "мыслей". Часть "мыслей", выделенная СУТ, считается "осознанной". Последовательность "осознанных мыслей" мы называем "ходом мышления" автомата, предшествующим выбору определенной двигательной (внешней) реакции. Наличие содержательных интерпретаций i-моделей сети и объектов среды позволяет оценить "логичность" как внешних, так и внутренних реакций автомата.
Настройка автомата предполагает подбор таких значений параметров связей, i-моделей и СУТ, которые обеспечивают логичность внешних и внутренних реакций автомата при заданной содержательной интерпретации элементов сети автомата и среды, в которой происходит его функционирование.
В табл.3 приведены условные обозначения возбуждений некоторых i-моделей сети, используемые в дальнейшем при графических изображениях внутренних реакций автомата. Моменты времени, соответствующие на графике внутренних реакций выполнению автоматом определенных действий, отмечены стрелками, указывающими направление перемещения автомата. Вертикальными стрелками будем отмечать возбуждения i-моделей действий, выбранных СУТ. Поскольку не все i-модели сети являются одинаково важными для понимания мотивации поведения автомата, при графическом представлении внутренних реакций ограничимся изображением изменения возбуждений только некоторых из них.
Таблица 3
Результаты экспериментального исследования адекватности реакций автомата на отдельные ситуации среды (тесты) приведены в табл.4. Исследование проводилось с автоматом, "объем внимания" которого обеспечивал одновременное выделение СУТ нескольких (не более пяти) наиболее возбужденных i-моделей. В табл.4 показан ход мышления автомата в различных тестовых ситуациях. Названия одновременно выделяемых СУТ i-моделей объединены внутри скобок. Последовательность переключений СУТ соответствует последовательности записи выражений.
Таблица 4
На рис.39 в качестве примера дано графическое изображение внутренних реакций автомата в ситуации 4 табл.4. Автомат воспринимает пять объектов "лес" и два объекта "пища". В первый момент возникает "осознанная мысль" о "лесе" и "пище" и "неосознанное" представление об "опасности слева и справа". В следующий момент "осознается" общее отношение к воспринятой ситуации - "любопытство". Одновременно возникает представление о "лесе вокруг", возможной "опасности" и необходимости "действовать". Осознанная мысль "действовать" возникает в третий момент, наряду с возвращением внимания к факту наличия в ситуации "леса" и осознанием общего эмоционального состояния - "удовольствия", вызванного, очевидно, восприятием объектов "пища". В подсознании остается представление об "опасности", "лесе вокруг" и ассоциативно возникающее представление о "звере". Возбуждаются центры интегральной оценки эмоционального состояния - Пр и НПр. Потенциальная опасность, связанная с наличием "леса", вызывает появление в подсознании чувства "страха". Однако, поскольку реальной опасности все же нет, в четвертый момент "страх" исчезает и автомат с "мыслью" о "пище" делает шаг вниз в ячейку, содержащую этот объект. Возбуждение i-моделей "опасность", "зверь", НПр снижается, возбуждение i-модели Пр возрастает. Нам кажется, что такой ход внутренних реакций автомата и его окончательная внешняя реакция - действие в общих чертах соответствуют логике поведения и рассуждения человека в аналогичной ситуации.
Рис.39. Внутренние реакции РЭМа-2 в тестовой ситуации 4.
Изменение проходимостей связей и характеристик i-моделей существенно изменяет ход процессов в М-сети (внутренние реакции), а следовательно, и внешнее поведение автомата. Таким образом, можно говорить, что задание определенных значений параметров, характеризующих М-сеть, соответствует заданию определенного "характера" автомата, проявляющегося во внутренних и внешних реакциях последнего. В качестве предварительного примера (подробно влияние "характера" на поведение автомата будет рассмотрено ниже) приведем "ход мышления" двух автоматов с различными "характерами" в ситуации 3 табл.4. Эксперимент, в отличие от описанного выше, проводился с автоматами, имеющими малый "объем внимания". "Ход мышления" первого автомата: "лес вокруг" - "опасность" - "действовать" - шаг. "Ход мышления" второго автомата: "лес вокруг" - "опасность" - "действовать" - "любопытство" - "действовать" - шаг. Графическое изображение внутренних реакций автоматов приведено на рис.40,а и б соответственно для первого и второго автоматов. Интересно изменение возбуждения i-модели "страх". Если у первого автомата "страх" растет, то у второго возбуждение i-модели "страх" резко падает, что позволяет предположить у него наличие более "оптимистической" оценки среды. Об этом же свидетельствует и изменение общей оценки предъявленной автомату ситуации (первая реакция - "опасность", затем переоценка ситуации - "любопытство").
Рис.40. Внутренние реакции М-автоматов с разными "характерами" в тестовой ситуации 3.
Значительное изменение параметров М-сети автомата может привести к возникновению "патологических", неадекватных реакций, а в граничном случае - к исчезновению каких-либо реакций вообще (например, при очень малых проходимостях связей и больших порогах возбуждения i-моделей). Естественно, что определение точных границ "нормы" и "патологии" является одной из наиболее интересных и важных задач при исследовании М-автоматов.
Рис.41. Внешние реакции М-автомата "норма" (А - исходное положение М-автомата).
ВАРИАНТ "НОРМА". Путем настройки М-сети автомата в тестовых ситуациях выбран вариант М-автомата, поведение которого (внутренние и внешние реакции) принято за "норму". Исследовалось поведение автомата на участке среды, показанном на рис.41. Автомату задавалось общее направление движения ("вверх") и план, предусматривающий достижение определенной (целевой) клетки среды (план показан на рисунке пунктиром). Траектория передвижения автомата в среде, т.е. последовательность выполняемых им простых действий, обозначена на рисунке стрелками. На рис.42 графически изображены внутренние реакции автомата в процессе двигательного поведения. (Стрелки указывают направление шагов, выполненных М-автоматом в соответствующие моменты времени).
Рис.42. Внутренние реакции М-автомата "норма".
В исходном состоянии автомат находится в ситуации, не содержащей каких-либо объектов. Реакцией на такую ситуацию является возбуждение i-модели "отсутствие объектов", что, в свою очередь, вызывает возбуждение i-моделей "действовать" и "любопытство". Автомат выполняет действие "вправо-вверх", удовлетворяющее одновременно как общему направлению движения, так и направлению плана на данном этапе. В новой клетке среды автомат воспринимает объекты "лес" и "зверь", что приводит к "осознанию" опасности и возбуждению чувства "страх". Возбуждение i-модели "любопытство" несколько уменьшается. У автомата появляется "желание" "двигаться быстро". Выполняется шаг "вправо". Автомат больше не видит "зверя", и возбуждение соответствующей i-модели уменьшается. Однако достаточно высокое возбуждение i-модели "опасность" усиливает "страх" и поддерживает "желание" "двигаться быстро". Общая эмоциональная оценка ситуации - "неприятно" (i-модель Пр вообще пока не возбуждена). В этой же ситуации автомат воспринимает и объект "пища", однако наличие общего отрицательного эмоционального фона приводит к тому, что реакцией на "пищу" является только усиление возбуждения i-модели "любопытство". Автомат делает шаг "вправо", затем "вправо-вверх" (по плану) и проходит через клетку "пища" без значительных изменений своего состояния. В новой ситуации автомат воспринимает уже два объекта "пища" и осознает этот факт. Уменьшается "страх", поддерживается на высоком уровне возбуждение i-модели "любопытство", "желание" "действовать быстро" несколько уменьшается, снижается возбуждение i-модели "опасность". В этой же ситуации автомат видит и объект "зверь", однако наличие двух объектов "пища" оказывает на состояние М-сети автомата гораздо более сильное влияние.
Несмотря на то что план на данном этапе предусматривает движение "вправо-вверх", автомат выбирает действие "влево-вверх" и заходит в клетку с объектом "пища", результатом чего является возбуждение i-модели "удовольствие". Из этой клетки автомат продолжает движение в направлении последнего этапа плана. Поскольку отклонение от плана было незначительным, автомат уже через два шага входит в клетку, предусмотренную следящей системой "по результатам" и продолжает движение по плану. Возбуждение i-модели "удовольствие" снижается до тех пор, пока автомат не входит в следующую клетку с объектом "пища". Реакцией автомата на новый объект "пища" является резкое увеличение "удовольствия". Возбуждение центра Пр также увеличивается и превосходит возбуждение центра НПр. Несколько уменьшаются "страх" и "желание" "двигаться быстро". Автомат продолжает движение к цели. Сделав 14 шагов за 20 тактов, автомат достигает поставленной цели. Общая оценка автоматом пройденного пути может быть охарактеризована разностью сумм возбуждений центров Пр и НПр за весь период движения:
ф = СУММА[i=1..n]П.Пр - СУММА[i=1..n]П.НПр, (7.1)
(n - количество тактов). Для описанного эксперимента эта оценка составила -240усл.ед.
Учитывая то обстоятельство, что разные пути автомат проходит за различное количество тактов, введем также "удельную оценку" пути:
ф.1 = ф/n. (7.2)
В данном случае ф.1=-12, что свидетельствует о некотором преобладании у автомата "отрицательных эмоций" при выполнении описанного маршрута.
Как видно из графика внутренних реакций, основная переработка информации производится на "подсознательном" уровне. Особенно явно это выражено в промежуток времени с t.11 по t.20, когда автомат при каждом такте производил какое-либо действие. Только анализ "подсознания" автомата позволяет понять причину этих действий. Например, тот факт, что у автомата не возникало в этот промежуток времени никаких "осознанных мыслей", кроме "мыслей" о действиях, может быть объяснен наличием возбуждения i-модели "действовать быстро". В момент t.10, по всей вероятности, тоже было бы выполнено действие, если бы был воспринят один, а не два объекта "пища". Восприятие же двух достаточно сильных раздражителей, даже при значительном возбуждении i-модели "двигаться быстро", вызвало у автомата в момент t.10 "мысль о пище". Высоким возбуждением i-модели "страх" объясняется то обстоятельство, что при прохождении через клетку с объектом "пища" в момент t.8 у автомата не возбудилась i-модель "удовольствие".
Анализ изменения состояния i-моделей сети позволяет, таким образом, производить оценку тех или иных действий автомата не только по сопровождающим эти действия "осознанным мыслям", но и по "подсознательным" побуждениям и мотивам.
ИМИТАЦИЯ "ХАРАКТЕРА". При настройке описанного выше автомата "норма" подбирались такие параметры М-сети, которые обеспечивали ему условно-нормальные поведенческие реакции, выраженные в определенном отношении к объектам среды. Очевидно, изменением этих параметров можно получить автоматы, в определенной мере соответствующие различным типам реакций человека. Для проверки этого предположения были построены два автомата - A1 и A2,- отличающиеся от "нормы" величиной проходимостей отдельных связей в М-сети (введенные изменения показаны в табл.5, прочерк означает, что величина связи такая же, как у варианта "норма").
Таблица 5
Экспериментальное исследование автоматов A1 и A2 проводилось в тех же условиях, что и автомата "норма", т.е. каждый из них помещался в ту же среду и ему задавался такой же, как для "нормы", план передвижения. Как показали эксперименты, траектории передвижения всех трех автоматов ("норма", A1 и A2) почти полностью совпали. Благодаря такому совпадению (оно не задавалось и не предвиделось заранее) оказалось возможным сопоставить состояния М-сети автоматов в промежутках между любыми двумя последовательными шагами и проанализировать причину изменения тех или иных внутренних реакций автоматов.
Как видно из сравнения рис.43 и 44, на которых графически изображены внутренние реакции "нормы", A1 и A2, автоматы проявляют различное отношение к объектам среды. Автомат A1 совершенно не испытывает чувства "страха". Восприятие объекта "зверь" только в начальный момент возбуждает у него мысль об опасности, но даже эта мысль находится глубоко в подсознании и постепенно исчезает. Все поведение автомата A1 имеет четко выраженный положительный фон. Каждое прохождение через объект "пища" сопровождается резким повышением "удовольствия" и фиксацией внимания на этом чувстве. Выполнение заданного плана заняло у автомата A1 23 такта. При этом сумма возбуждений i-модели НПр равнялась нулю, а сумма возбуждений Пр - 2000усл.ед., т.е. для автомата A1 ф=2000 и ф.1=83усл.ед.
Рис.43. Внутренние реакции М-автомата A1.
Рис.44. Внутренние реакции М-автомата A2.
...
В автомате РЭМ-2 отражены основные положения исходной гипотезы о программах и механизмах переработки информации мозгом человека. Теоретически такой автомат должен быть способен к организации целесообразной и целенаправленной деятельности в любой среде, содержащей объекты, представленные в его сфере восприятий. Однако было неясно, удастся ли практически подобрать такие значения параметров i-моделей, связей и СУТ, которые обеспечат адекватность реакций автомата. Сложность модели и использование в ней множества неформализованных пока данных исключали возможность строгого анализа и основанного на этом анализе задания "рабочего режима" автомата, т.е. такого набора параметров, который должен обеспечить как адекватность его реакций на различные ситуации среды, так и целесообразность поведения в целом. Единственным доступным способом исследования практической возможности использования М-автоматов, в частности разработанного автомата РЭМ, для решения поставленной ранее задачи организации разумного поведения было проведение серии экспериментов, направленных на выявление особенностей функционирования автоматов такого типа.
Как уже упоминалось, РЭМ был первым из разработанных нами М-автоматов. Поэтому заранее не было известно, удастся ли вообще нужным образом организовать М-сеть автомата, насколько сложной окажется эта задача и даст ли нужный эффект работа СУТ. Все эти вопросы должны были быть решены в ходе экспериментального исследования РЭМа. Кроме того, в случае положительного их решения необходимо было выяснить, насколько устойчив рабочий режим автомата, т.е. допустимы ли изменения параметров i-моделей и связей и, если допустимы, то к каким изменениям в поведении автомата они приводят.
При описании общей задачи формирования двигательного поведения были выдвинуты два критерия оценки поведения М-автоматов: целесообразность внешних проявлений поведения, т.е. передвижения в среде, и целесообразность "внутренних" проявлений, т.е. хода мышления. Соответственно, рабочий режим автомата должен быть выбран таким образом, чтобы удовлетворять обоим критериям. Это означает, что при подборе значений параметров i-моделей, связей и СУТ мы должны добиваться адекватности не только двигательных актов, но и предшествующих им "осознанных мыслей" автомата. Именно с этих позиций мы и будем в дальнейшем оценивать поведение РЭМа в различных экспериментальных ситуациях.
НАСТРОЙКА АВТОМАТА. Целесообразность поведения необучающегося М-автомата, по существу, полностью зависит от выбора значений различных параметров его М-сети и СУТ. Поскольку теоретический расчет этих величин не представляется возможным, была проведена экспериментальная настройка автомата, заключающаяся в подборе проходимостей связей и характеристик i-моделей сети, обеспечивающих адекватность реакций автомата на отдельные типичные ситуации среды. План поведения автомату при этом не задавался. При настройке автомат помещался в отдельные заранее выбранные клетки среды, и исследовалось его поведение до выполнения первого двигательного акта. Целесообразность поведения автомата оценивалась по реакциям двух типов - внешней и внутренней.
Напомним, что внешняя реакция представляет собой действие, предпринимаемое автоматом в ответ на восприятие данной ситуации. Внутренняя реакция есть возбуждение i-моделей сети автомата, интерпретируемое как возникновение определенных "мыслей". Часть "мыслей", выделенная СУТ, считается "осознанной". Последовательность "осознанных мыслей" мы называем "ходом мышления" автомата, предшествующим выбору определенной двигательной (внешней) реакции. Наличие содержательных интерпретаций i-моделей сети и объектов среды позволяет оценить "логичность" как внешних, так и внутренних реакций автомата.
Настройка автомата предполагает подбор таких значений параметров связей, i-моделей и СУТ, которые обеспечивают логичность внешних и внутренних реакций автомата при заданной содержательной интерпретации элементов сети автомата и среды, в которой происходит его функционирование.
В табл.3 приведены условные обозначения возбуждений некоторых i-моделей сети, используемые в дальнейшем при графических изображениях внутренних реакций автомата. Моменты времени, соответствующие на графике внутренних реакций выполнению автоматом определенных действий, отмечены стрелками, указывающими направление перемещения автомата. Вертикальными стрелками будем отмечать возбуждения i-моделей действий, выбранных СУТ. Поскольку не все i-модели сети являются одинаково важными для понимания мотивации поведения автомата, при графическом представлении внутренних реакций ограничимся изображением изменения возбуждений только некоторых из них.
Таблица 3
Результаты экспериментального исследования адекватности реакций автомата на отдельные ситуации среды (тесты) приведены в табл.4. Исследование проводилось с автоматом, "объем внимания" которого обеспечивал одновременное выделение СУТ нескольких (не более пяти) наиболее возбужденных i-моделей. В табл.4 показан ход мышления автомата в различных тестовых ситуациях. Названия одновременно выделяемых СУТ i-моделей объединены внутри скобок. Последовательность переключений СУТ соответствует последовательности записи выражений.
Таблица 4
На рис.39 в качестве примера дано графическое изображение внутренних реакций автомата в ситуации 4 табл.4. Автомат воспринимает пять объектов "лес" и два объекта "пища". В первый момент возникает "осознанная мысль" о "лесе" и "пище" и "неосознанное" представление об "опасности слева и справа". В следующий момент "осознается" общее отношение к воспринятой ситуации - "любопытство". Одновременно возникает представление о "лесе вокруг", возможной "опасности" и необходимости "действовать". Осознанная мысль "действовать" возникает в третий момент, наряду с возвращением внимания к факту наличия в ситуации "леса" и осознанием общего эмоционального состояния - "удовольствия", вызванного, очевидно, восприятием объектов "пища". В подсознании остается представление об "опасности", "лесе вокруг" и ассоциативно возникающее представление о "звере". Возбуждаются центры интегральной оценки эмоционального состояния - Пр и НПр. Потенциальная опасность, связанная с наличием "леса", вызывает появление в подсознании чувства "страха". Однако, поскольку реальной опасности все же нет, в четвертый момент "страх" исчезает и автомат с "мыслью" о "пище" делает шаг вниз в ячейку, содержащую этот объект. Возбуждение i-моделей "опасность", "зверь", НПр снижается, возбуждение i-модели Пр возрастает. Нам кажется, что такой ход внутренних реакций автомата и его окончательная внешняя реакция - действие в общих чертах соответствуют логике поведения и рассуждения человека в аналогичной ситуации.
Рис.39. Внутренние реакции РЭМа-2 в тестовой ситуации 4.
Изменение проходимостей связей и характеристик i-моделей существенно изменяет ход процессов в М-сети (внутренние реакции), а следовательно, и внешнее поведение автомата. Таким образом, можно говорить, что задание определенных значений параметров, характеризующих М-сеть, соответствует заданию определенного "характера" автомата, проявляющегося во внутренних и внешних реакциях последнего. В качестве предварительного примера (подробно влияние "характера" на поведение автомата будет рассмотрено ниже) приведем "ход мышления" двух автоматов с различными "характерами" в ситуации 3 табл.4. Эксперимент, в отличие от описанного выше, проводился с автоматами, имеющими малый "объем внимания". "Ход мышления" первого автомата: "лес вокруг" - "опасность" - "действовать" - шаг. "Ход мышления" второго автомата: "лес вокруг" - "опасность" - "действовать" - "любопытство" - "действовать" - шаг. Графическое изображение внутренних реакций автоматов приведено на рис.40,а и б соответственно для первого и второго автоматов. Интересно изменение возбуждения i-модели "страх". Если у первого автомата "страх" растет, то у второго возбуждение i-модели "страх" резко падает, что позволяет предположить у него наличие более "оптимистической" оценки среды. Об этом же свидетельствует и изменение общей оценки предъявленной автомату ситуации (первая реакция - "опасность", затем переоценка ситуации - "любопытство").
Рис.40. Внутренние реакции М-автоматов с разными "характерами" в тестовой ситуации 3.
Значительное изменение параметров М-сети автомата может привести к возникновению "патологических", неадекватных реакций, а в граничном случае - к исчезновению каких-либо реакций вообще (например, при очень малых проходимостях связей и больших порогах возбуждения i-моделей). Естественно, что определение точных границ "нормы" и "патологии" является одной из наиболее интересных и важных задач при исследовании М-автоматов.
Рис.41. Внешние реакции М-автомата "норма" (А - исходное положение М-автомата).
ВАРИАНТ "НОРМА". Путем настройки М-сети автомата в тестовых ситуациях выбран вариант М-автомата, поведение которого (внутренние и внешние реакции) принято за "норму". Исследовалось поведение автомата на участке среды, показанном на рис.41. Автомату задавалось общее направление движения ("вверх") и план, предусматривающий достижение определенной (целевой) клетки среды (план показан на рисунке пунктиром). Траектория передвижения автомата в среде, т.е. последовательность выполняемых им простых действий, обозначена на рисунке стрелками. На рис.42 графически изображены внутренние реакции автомата в процессе двигательного поведения. (Стрелки указывают направление шагов, выполненных М-автоматом в соответствующие моменты времени).
Рис.42. Внутренние реакции М-автомата "норма".
В исходном состоянии автомат находится в ситуации, не содержащей каких-либо объектов. Реакцией на такую ситуацию является возбуждение i-модели "отсутствие объектов", что, в свою очередь, вызывает возбуждение i-моделей "действовать" и "любопытство". Автомат выполняет действие "вправо-вверх", удовлетворяющее одновременно как общему направлению движения, так и направлению плана на данном этапе. В новой клетке среды автомат воспринимает объекты "лес" и "зверь", что приводит к "осознанию" опасности и возбуждению чувства "страх". Возбуждение i-модели "любопытство" несколько уменьшается. У автомата появляется "желание" "двигаться быстро". Выполняется шаг "вправо". Автомат больше не видит "зверя", и возбуждение соответствующей i-модели уменьшается. Однако достаточно высокое возбуждение i-модели "опасность" усиливает "страх" и поддерживает "желание" "двигаться быстро". Общая эмоциональная оценка ситуации - "неприятно" (i-модель Пр вообще пока не возбуждена). В этой же ситуации автомат воспринимает и объект "пища", однако наличие общего отрицательного эмоционального фона приводит к тому, что реакцией на "пищу" является только усиление возбуждения i-модели "любопытство". Автомат делает шаг "вправо", затем "вправо-вверх" (по плану) и проходит через клетку "пища" без значительных изменений своего состояния. В новой ситуации автомат воспринимает уже два объекта "пища" и осознает этот факт. Уменьшается "страх", поддерживается на высоком уровне возбуждение i-модели "любопытство", "желание" "действовать быстро" несколько уменьшается, снижается возбуждение i-модели "опасность". В этой же ситуации автомат видит и объект "зверь", однако наличие двух объектов "пища" оказывает на состояние М-сети автомата гораздо более сильное влияние.
Несмотря на то что план на данном этапе предусматривает движение "вправо-вверх", автомат выбирает действие "влево-вверх" и заходит в клетку с объектом "пища", результатом чего является возбуждение i-модели "удовольствие". Из этой клетки автомат продолжает движение в направлении последнего этапа плана. Поскольку отклонение от плана было незначительным, автомат уже через два шага входит в клетку, предусмотренную следящей системой "по результатам" и продолжает движение по плану. Возбуждение i-модели "удовольствие" снижается до тех пор, пока автомат не входит в следующую клетку с объектом "пища". Реакцией автомата на новый объект "пища" является резкое увеличение "удовольствия". Возбуждение центра Пр также увеличивается и превосходит возбуждение центра НПр. Несколько уменьшаются "страх" и "желание" "двигаться быстро". Автомат продолжает движение к цели. Сделав 14 шагов за 20 тактов, автомат достигает поставленной цели. Общая оценка автоматом пройденного пути может быть охарактеризована разностью сумм возбуждений центров Пр и НПр за весь период движения:
ф = СУММА[i=1..n]П.Пр - СУММА[i=1..n]П.НПр, (7.1)
(n - количество тактов). Для описанного эксперимента эта оценка составила -240усл.ед.
Учитывая то обстоятельство, что разные пути автомат проходит за различное количество тактов, введем также "удельную оценку" пути:
ф.1 = ф/n. (7.2)
В данном случае ф.1=-12, что свидетельствует о некотором преобладании у автомата "отрицательных эмоций" при выполнении описанного маршрута.
Как видно из графика внутренних реакций, основная переработка информации производится на "подсознательном" уровне. Особенно явно это выражено в промежуток времени с t.11 по t.20, когда автомат при каждом такте производил какое-либо действие. Только анализ "подсознания" автомата позволяет понять причину этих действий. Например, тот факт, что у автомата не возникало в этот промежуток времени никаких "осознанных мыслей", кроме "мыслей" о действиях, может быть объяснен наличием возбуждения i-модели "действовать быстро". В момент t.10, по всей вероятности, тоже было бы выполнено действие, если бы был воспринят один, а не два объекта "пища". Восприятие же двух достаточно сильных раздражителей, даже при значительном возбуждении i-модели "двигаться быстро", вызвало у автомата в момент t.10 "мысль о пище". Высоким возбуждением i-модели "страх" объясняется то обстоятельство, что при прохождении через клетку с объектом "пища" в момент t.8 у автомата не возбудилась i-модель "удовольствие".
Анализ изменения состояния i-моделей сети позволяет, таким образом, производить оценку тех или иных действий автомата не только по сопровождающим эти действия "осознанным мыслям", но и по "подсознательным" побуждениям и мотивам.
ИМИТАЦИЯ "ХАРАКТЕРА". При настройке описанного выше автомата "норма" подбирались такие параметры М-сети, которые обеспечивали ему условно-нормальные поведенческие реакции, выраженные в определенном отношении к объектам среды. Очевидно, изменением этих параметров можно получить автоматы, в определенной мере соответствующие различным типам реакций человека. Для проверки этого предположения были построены два автомата - A1 и A2,- отличающиеся от "нормы" величиной проходимостей отдельных связей в М-сети (введенные изменения показаны в табл.5, прочерк означает, что величина связи такая же, как у варианта "норма").
Таблица 5
Экспериментальное исследование автоматов A1 и A2 проводилось в тех же условиях, что и автомата "норма", т.е. каждый из них помещался в ту же среду и ему задавался такой же, как для "нормы", план передвижения. Как показали эксперименты, траектории передвижения всех трех автоматов ("норма", A1 и A2) почти полностью совпали. Благодаря такому совпадению (оно не задавалось и не предвиделось заранее) оказалось возможным сопоставить состояния М-сети автоматов в промежутках между любыми двумя последовательными шагами и проанализировать причину изменения тех или иных внутренних реакций автоматов.
Как видно из сравнения рис.43 и 44, на которых графически изображены внутренние реакции "нормы", A1 и A2, автоматы проявляют различное отношение к объектам среды. Автомат A1 совершенно не испытывает чувства "страха". Восприятие объекта "зверь" только в начальный момент возбуждает у него мысль об опасности, но даже эта мысль находится глубоко в подсознании и постепенно исчезает. Все поведение автомата A1 имеет четко выраженный положительный фон. Каждое прохождение через объект "пища" сопровождается резким повышением "удовольствия" и фиксацией внимания на этом чувстве. Выполнение заданного плана заняло у автомата A1 23 такта. При этом сумма возбуждений i-модели НПр равнялась нулю, а сумма возбуждений Пр - 2000усл.ед., т.е. для автомата A1 ф=2000 и ф.1=83усл.ед.
Рис.43. Внутренние реакции М-автомата A1.
Рис.44. Внутренние реакции М-автомата A2.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Для автомата A2 характерно более "критическое" отношение к среде. Прежде всего в сети автомата A2 оказались возбужденными i-модели "зверь встречается часто", "гнев" и "нападать". В клетки, содержащие объект "зверь", автомат не заходил, однако возбуждение указанных i-моделей существенно повлияло на ход его внутренних реакций. Все выполнение плана передвижения заняло у автомата A2 17 тактов. При этом никаких "осознанных" мыслей, кроме мыслей о действиях, не наблюдалось. На последнем этапе плана двигательные реакции у A2 несколько отличались от таковых у "нормы" и A1, однако окружающие ситуации изменились при этом незначительно, так что можно сравнить внутренние реакции A2 с внутренними реакциями A1 и "нормы". Если относительно быстрое передвижение в среде "нормы" можно объяснить возбуждением i-модели "двигаться быстро", вызванным чувством "страха", то у автомата A2 такое передвижение связано с возбуждением i-модели "нападать". Только при восприятии первого "зверя" у автомата A2 возбудилось чувство "страха", однако вслед за этим возбудилась i-модель "гнев" и "страх" был подавлен. На протяжении всего пути у автомата возбуждена i-модель "опасность", но, в отличие от "нормы", это вызывает не пассивную реакцию - "страх", а активную-"нападать". При восприятии объекта "пища" и прохождении через соответствующие клетки среды автомат проявляет адекватную реакцию в виде умеренного возбуждения чувства "удовольствия". За время выполнения маршрута сумма возбуждений i-модели Пр для автомата A2 составила 970усл.ед., сумма возбуждений i-модели НПр - 190усл.ед., т.е. для A2 ф=780 и ф.1=43усл.ед.
Сравнительный анализ поведений трех описанных автоматов позволяет говорить, что автомат A1 имеет "оптимистичный характер", а автомат A2 - "решительный", с несколько развитыми "агрессивными" чертами.
ВЛИЯНИЕ РЕЖИМА РАБОТЫ СУТ НА ВНУТРЕННИЕ РЕАКЦИИ АВТОМАТА. Система усиления - торможения имитирует в М-автомате действие механизма внимания. С целью проверки эффективности деятельности СУТ как системы, упорядочивающей и организующей процесс переработки информации, было проведено экспериментальное исследование влияния изменения различных параметров СУТ на ход процессов в сети.
На рис.45 показаны внутренние реакции автомата "норма", выполняющего описанный выше план передвижения в среде (см. рис.41) при увеличении "зоны внимания" (параметр Z в формуле (6.7) равен 10усл.ед.: в предыдущем случае автомат "норма" работал с Z=1усл.ед.).
Рис.45. Внутренние реакции М-автомата "норма" при увеличении "зоны внимания".
Автомат с увеличенной "зоной внимания" выполнил план за 18 тактов, т.е. на два такта быстрее, чем при "зоне внимания", равной 1усл.ед. Как видно из сопоставления рис.42 и 45, изменились и внутренние реакции автомата. Если при малой "зоне внимания" СУТ в каждый момент времени выделяла не более одной i-модели, то при увеличении зоны максимальный объем СУТ составил четыре i-модели. Разность суммарных возбуждений центров Пр и НПр увеличилась с -240 до 230усл.ед., т.е. с -12 до 13усл.ед. на один такт. Это обстоятельство позволяет сделать вывод о том, что с увеличением объема внимания не только повышается интенсивность, но и качественно изменяется ход переработки информации (в М-сети это выражается в вовлечении в процесс переработки "осознаваемой" информации новых i-моделей).
Исследование изменения реакций автомата при изменении "глубины" внимания проводилось с автоматом "норма", выполняющим тот же, что и в предыдущем случае, план передвижения при "зоне внимания", равной 1усл.ед. Изменялось дополнительное возбуждение от СУТ (параметр П.s в формуле (6.8 )), добавляемое в каждый момент времени к возбуждению выделенных СУТ i-моделей. Внутренние реакции автоматов с 9-го по 15-й такт при П.s=0 и П.s=100усл.ед. показаны на рис.46,а и б соответственно.
Рис. 46. Внутренние реакции М-автомата "норма" яри различных дополнительных возбуждениях i-модели от СУТ: а - П.s=0; б - П.s=100.
Автомат, у которого П.s=0, за выбранный промежуток времени выполнил 5 шагов. При этом общее "эмоциональное" состояние автомата характеризовалось устойчивым возбуждением центра НПр и отсутствием возбуждения i-моделей Пр и "удовольствие", несмотря на то что автомат видел "пищу" и проходил через клетку, содержащую этот объект. Автомат, у которого П.s=100усл.ед., за этот же отрезок времени выполнил 4 шага; суммарное возбуждение центра Пр составило для него почти 200усл.ед.
Проведенные эксперименты показали, что изменение различных параметров СУТ ("свойств внимания") существенно влияет на ход процесса переработки информации в М-сети. При увеличении объема и "глубины" внимания повышается общая активность сети, что в результате приводит к изменениям внешних реакций автомата и его "отношения" к объектам среды.
ИМИТАЦИЯ "НАСТРОЕНИЯ". При экспериментальном исследовании М-автомата было замечено, что, несмотря на отсутствие самообучения, процессы в М-сети существенно зависят от "предыстории" автомата, причем особое влияние оказывают начальные ситуации. Было предположено, что поскольку в исходном состоянии возбуждения всех i-моделей сети равны нулю, "память" (затухание возбуждения) первых возбужденных i-моделей оказывает существенное влияние на последующий процесс переработки информации.
Пользуясь некоторыми психологическими аналогиями (влияние первого впечатления, зависимость настроения человека в течение дня от первых утренних впечатлений и настроения и т.п.), можно интерпретировать такую зависимость в М-автомате, как выработку определенного "настроения". Тогда можно говорить, что поведение и процесс переработки информации зависят не только от "характера", но и от "настроения" автомата.
Для проверки этого предположения был проведен эксперимент следующего содержания. Автомат "норма" помещался в клетку s.1 среды, участок которой показан на рис.47. Задавалось направление движения - "вверх". В процессе движения автомат должен был достичь одной из клеток верхней границы среды. После окончания эксперимента по передвижению из клетки s.1 тот же автомат (с нулевыми начальными возбуждениями i-моделей) помещался в клетку s.2 и эксперимент повторялся.
Рис.47. Зависимость внешних реакций М автомата "норма" от "настроения".
Находясь в клетке s.1, автомат воспринимал ситуацию, содержащую объекты P1, P2 и P3. Наличие большого количества объектов P3 ("лес") и объекта P2 ("зверь") обусловило достаточно сильное возбуждение i-моделей "страх" и "опасность", которые, в свою очередь, значительно повлияли на дальнейшее состояние М-сети автомата.
Клетка s.2 расположена в окрестности s.1, однако, находясь в ней, автомат воспринимает гораздо более "положительную" ситуацию - два объекта "пища" и объекты P3. Этим обстоятельством объясняется преимущественное возбуждение "положительных" эмоций и, соответственно, более положительная оценка не только начальной ситуации, но и пути в целом. При движении из клетки s.1 автомат достиг цели за 14 тактов; разность суммарного возбуждения центров Пр и НПр составила -38усл.ед. на такт. При движении из клетки s.2 путь был пройден за 20 тактов; разность суммарного возбуждения центров Пр и НПр составила 9усл.ед. на такт. Таким образом, в описанном эксперименте выявилось существенное влияние начального "настроения" на ход дальнейшей переработки информации.
ВЛИЯНИЕ "ПРОШЛОГО ОПЫТА". В обучающемся М-автомате накопление опыта происходит благодаря изменению проходимостей связей и характеристик i-моделей. При отсутствии этого типа обучения память в М-сети проявляется в виде затухания возбуждения i-моделей, так или иначе связанных с ситуациями, воспринятыми автоматом в предыдущие моменты времени. Можно полагать, что при функционировании автомата в среде общий характер последней, т.е. преимущественное содержание объектов определенного качества, формирует и характер "прошлого опыта" автомата. Подобные соображения высказывались при построении "искусственной личности Олдос" и были подтверждены в экспериментах с этой моделью. Аналогичный эксперимент был проведен и нами с автоматом "норма".
Исследовалось изменение поведения автомата в среде, содержащей участки сосредоточения определенных (положительных пли отрицательных) объектов. Эксперимент проводился следующим образом.
Были заданы две среды - S.A и S.B, каждая из которых состояла из участков S.1 и S.2 (рис.48 ). В клетках участка S.1 расположены объекты P1 ("пища") и P3 ("лес"); в S2 - P2 ("зверь") и P3. Расположение объектов P1 и P2 на соответствующих участках среды задавалось одинаковым. Среда S.A формировалась из последовательности участков S.1 и S.2; S.B - из последовательности S.2 и S.1. В первом эксперименте автомат "норма" помещался в клетку А среды S.A и задавался план передвижения, заключающийся в переходе из S.1 в S.2 (направление движения - "вверх"). Проводился машинный эксперимент. Затем автомат помещался в клетку В среды S.B и проводился аналогичный эксперимент по передвижению из S.2 в S.1. Внутренние реакции автомата при передвижении в среде S.A показаны на рис.49, при передвижении в S.B - на рис.50. Траектории движения автоматов показаны на рис.48 стрелками. В обоих случаях время движения составило 14 тактов.
Рис.48. Внешние реакции М-автомата "норма" в средах S.A и S.B.
Рис.49. Внутренние реакции М-автомата "норма" в среде S.A.
Рис.50. Внутренние реакции М-автомата "норма" в среде S.B.
Сопоставление внутренних реакций автомата показало, что при "положительном" прошлом опыте автомат оказывается гораздо более "оптимистичным", чем при "отрицательном". При движении в S.A и S.B разность суммарного возбуждения центров Пр и НПр составила соответственно 64 и -6 усл.ед. на такт.
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ. Поведение человека в естественной среде является результатом переработки не только зрительной информации, но и той, которая поступает в мозг по другим каналам. Очевидно, что чем большее число каналов участвует в восприятии информации, тем выше вероятность адекватной реакции индивида. В этой связи представляется интересным исследовать поведение М-автомата, имеющего более одного канала восприятия информации, в среде, содержащей раздражители различного типа. Будем называть раздражители, соответствующие зрительным образам, т.е. конкретным объектам среды, локальными, а раздражители, соответствующие слуховым, осязательным и т.п. восприятиям,- нелокальными признаками среды. Описанные выше эксперименты являются исследованием поведения М-автомата в среде, содержащей только локальные раздражители. При этом в каждую клетку среды записывается номер соответствующей i-модели М-сети автомата, причем в каждой клетке может быть расположен не более чем один объект.
При наличии в среде нелокальных признаков каждая клетка может содержать любое их количество; она характеризуется не только наличием или отсутствием определенного признака, но и интенсивностью последнего. В связи с этим удобно представлять распределение в среде каждого нелокального признака путем задания отдельной к-среды (канал-среды), содержание клеток которой соответствует интенсивности данного признака. Обращение автомата к такого типа среде можно рассматривать как включение соответствующего канала информации. Естественно, что таким образом количество каналов информации в М-автомате может быть сделано сколь угодно большим; оно ограничивается в основном возможностями семантической интерпретации и объемом памяти используемой вычислительной машины.
Рассмотренные эксперименты с автоматом РЭМ-2, естественно, не являются полным и исчерпывающим исследованием необучающихся М-автоматов. Тем не менее, некоторые важные и принципиальные вопросы в ходе этого исследования были решены. Прежде всего, оказалось, что задание рабочего режима автомата практически осуществимо. Приступая к экспериментам по передвижению автомата в среде, мы не были уверены в том, что настройка в тестовых ситуациях будет достаточной для обеспечения адекватности реакций автомата в процессе движения. Действительно, при проведении первых экспериментов с автоматом "норма" пришлось дополнительно корректировать некоторые параметры М-сети, однако эти коррекции были вызваны в основном стремлением минимизировать "удельную оценку" пути. В целом же настройка М-автомата в отдельных типичных ситуациях среды оказалась весьма эффективным способом задания "хорошей" организации М-сети.
Проведенные эксперименты еще не дают возможности сделать сколько-нибудь определенные выводы относительно величины диапазона возможных изменений различных параметров М-сети, не приводящих к нарушению целесообразности поведения. Пока можно сказать только то, что, по всей вероятности, этот диапазон достаточно велик. В противном случае нам вообще вряд ли удалось бы настроить автомат. Разумеется, этот эмпирический вывод нуждается в более корректном рассмотрении, однако в ближайшее время строгое решение вопроса о величине диапазона допустимых изменений различных параметров в такой взаимосвязанной и многопараметрической системе, как М-сеть, вряд ли будет получено. В то же время описанные результаты могут быть уже использованы в дальнейших работах но созданию более сложных М-автоматов, поскольку показывают принципиальную возможность и основные пути гибкой настройки М-автоматов на нужный тип поведения. Незначительными изменениями структуры или значений параметров отдельных элементов М-сети можно получить автоматы, существенно отличающиеся типом поведения,- "осторожные" или "решительные", "агрессивные" или "доверчивые" и т.п.
Одним из наиболее важных результатов экспериментального исследования автомата РЭМ-2 можно считать демонстрацию эффективности применения СУТ как системы, упорядочивающей процесс переработки информации. Именно СУТ обеспечивает автомату дифференциацию внутренних и внешних реакций. Содержательность этих реакций, т.е. наличие зафиксированной семантики всех, в том числе и выделяемых СУТ, i-моделей сети, позволяет оценивать целесообразность поведения автомата не только но его двигательным реакциям, но и по адекватности предшествующего им "хода мышления". Эксперименты с автоматом РЭМ-2 показали существенную зависимость поведения автомата от величины различных параметров его СУТ. Оказалось, что изменение типа поведения автомата может быть получено путем изменения как его структуры, так и значений отдельных параметров СУТ. Этот вывод представляется нам весьма важным, так как, во-первых, является косвенным подтверждением установленной нами аналогии между СУТ и вниманием и, во-вторых, дает дополнительные возможности коррекции поведения автомата.
Исследование автомата РЭМ-2 показало перспективность дальнейшего совершенствования и развития М-автоматов как одного из направлений создания систем ПР. Прежде всего, такое совершенствование должно быть связано с усложнением среды и введением функций самообучения и самоорганизации. Уже при проведении экспериментов с необучающимся М-автоматом (исследование влияния "прошлого опыта" и "настроения") оказалось, что некоторый эффект обучения может быть получен при использовании только механизма изменения кратковременной памяти (возбужденности i-моделей). Естественно, что в автомате такого типа "прошлый опыт" и "настроение" сильно взаимосвязаны и их влияние распространяется лишь на незначительный промежуток времени, зависящий от характеристик затухания соответствующих i-моделей сети. Однако можно полагать, что введение в автомат алгоритмов самообучения, связанных с изменением проходимостей связей и характеристик i-моделей сети, позволит автомату более эффективно и адекватно использовать обучающее воздействие среды для повышения степени "разумности" своего поведения.
Заканчивая рассмотрение автомата РЭМ-2, отметим важность введения в структуру его М-сети элементов, содержательно интерпретируемых как "эмоциональные" состояния. Благодаря наличию "эмоциональной" сферы автомат способен самостоятельно оценивать воспринимаемую извне информацию и согласовывать задачу, поставленную экспериментатором, т.е. движение в среде и достижение определенной цели, с задачей "самосохранения". Это обстоятельство кажется нам чрезвычайно важным при использовании физических аналогов М-автоматов для решения практических задач в реальной среде.
Сравнительный анализ поведений трех описанных автоматов позволяет говорить, что автомат A1 имеет "оптимистичный характер", а автомат A2 - "решительный", с несколько развитыми "агрессивными" чертами.
ВЛИЯНИЕ РЕЖИМА РАБОТЫ СУТ НА ВНУТРЕННИЕ РЕАКЦИИ АВТОМАТА. Система усиления - торможения имитирует в М-автомате действие механизма внимания. С целью проверки эффективности деятельности СУТ как системы, упорядочивающей и организующей процесс переработки информации, было проведено экспериментальное исследование влияния изменения различных параметров СУТ на ход процессов в сети.
На рис.45 показаны внутренние реакции автомата "норма", выполняющего описанный выше план передвижения в среде (см. рис.41) при увеличении "зоны внимания" (параметр Z в формуле (6.7) равен 10усл.ед.: в предыдущем случае автомат "норма" работал с Z=1усл.ед.).
Рис.45. Внутренние реакции М-автомата "норма" при увеличении "зоны внимания".
Автомат с увеличенной "зоной внимания" выполнил план за 18 тактов, т.е. на два такта быстрее, чем при "зоне внимания", равной 1усл.ед. Как видно из сопоставления рис.42 и 45, изменились и внутренние реакции автомата. Если при малой "зоне внимания" СУТ в каждый момент времени выделяла не более одной i-модели, то при увеличении зоны максимальный объем СУТ составил четыре i-модели. Разность суммарных возбуждений центров Пр и НПр увеличилась с -240 до 230усл.ед., т.е. с -12 до 13усл.ед. на один такт. Это обстоятельство позволяет сделать вывод о том, что с увеличением объема внимания не только повышается интенсивность, но и качественно изменяется ход переработки информации (в М-сети это выражается в вовлечении в процесс переработки "осознаваемой" информации новых i-моделей).
Исследование изменения реакций автомата при изменении "глубины" внимания проводилось с автоматом "норма", выполняющим тот же, что и в предыдущем случае, план передвижения при "зоне внимания", равной 1усл.ед. Изменялось дополнительное возбуждение от СУТ (параметр П.s в формуле (6.8 )), добавляемое в каждый момент времени к возбуждению выделенных СУТ i-моделей. Внутренние реакции автоматов с 9-го по 15-й такт при П.s=0 и П.s=100усл.ед. показаны на рис.46,а и б соответственно.
Рис. 46. Внутренние реакции М-автомата "норма" яри различных дополнительных возбуждениях i-модели от СУТ: а - П.s=0; б - П.s=100.
Автомат, у которого П.s=0, за выбранный промежуток времени выполнил 5 шагов. При этом общее "эмоциональное" состояние автомата характеризовалось устойчивым возбуждением центра НПр и отсутствием возбуждения i-моделей Пр и "удовольствие", несмотря на то что автомат видел "пищу" и проходил через клетку, содержащую этот объект. Автомат, у которого П.s=100усл.ед., за этот же отрезок времени выполнил 4 шага; суммарное возбуждение центра Пр составило для него почти 200усл.ед.
Проведенные эксперименты показали, что изменение различных параметров СУТ ("свойств внимания") существенно влияет на ход процесса переработки информации в М-сети. При увеличении объема и "глубины" внимания повышается общая активность сети, что в результате приводит к изменениям внешних реакций автомата и его "отношения" к объектам среды.
ИМИТАЦИЯ "НАСТРОЕНИЯ". При экспериментальном исследовании М-автомата было замечено, что, несмотря на отсутствие самообучения, процессы в М-сети существенно зависят от "предыстории" автомата, причем особое влияние оказывают начальные ситуации. Было предположено, что поскольку в исходном состоянии возбуждения всех i-моделей сети равны нулю, "память" (затухание возбуждения) первых возбужденных i-моделей оказывает существенное влияние на последующий процесс переработки информации.
Пользуясь некоторыми психологическими аналогиями (влияние первого впечатления, зависимость настроения человека в течение дня от первых утренних впечатлений и настроения и т.п.), можно интерпретировать такую зависимость в М-автомате, как выработку определенного "настроения". Тогда можно говорить, что поведение и процесс переработки информации зависят не только от "характера", но и от "настроения" автомата.
Для проверки этого предположения был проведен эксперимент следующего содержания. Автомат "норма" помещался в клетку s.1 среды, участок которой показан на рис.47. Задавалось направление движения - "вверх". В процессе движения автомат должен был достичь одной из клеток верхней границы среды. После окончания эксперимента по передвижению из клетки s.1 тот же автомат (с нулевыми начальными возбуждениями i-моделей) помещался в клетку s.2 и эксперимент повторялся.
Рис.47. Зависимость внешних реакций М автомата "норма" от "настроения".
Находясь в клетке s.1, автомат воспринимал ситуацию, содержащую объекты P1, P2 и P3. Наличие большого количества объектов P3 ("лес") и объекта P2 ("зверь") обусловило достаточно сильное возбуждение i-моделей "страх" и "опасность", которые, в свою очередь, значительно повлияли на дальнейшее состояние М-сети автомата.
Клетка s.2 расположена в окрестности s.1, однако, находясь в ней, автомат воспринимает гораздо более "положительную" ситуацию - два объекта "пища" и объекты P3. Этим обстоятельством объясняется преимущественное возбуждение "положительных" эмоций и, соответственно, более положительная оценка не только начальной ситуации, но и пути в целом. При движении из клетки s.1 автомат достиг цели за 14 тактов; разность суммарного возбуждения центров Пр и НПр составила -38усл.ед. на такт. При движении из клетки s.2 путь был пройден за 20 тактов; разность суммарного возбуждения центров Пр и НПр составила 9усл.ед. на такт. Таким образом, в описанном эксперименте выявилось существенное влияние начального "настроения" на ход дальнейшей переработки информации.
ВЛИЯНИЕ "ПРОШЛОГО ОПЫТА". В обучающемся М-автомате накопление опыта происходит благодаря изменению проходимостей связей и характеристик i-моделей. При отсутствии этого типа обучения память в М-сети проявляется в виде затухания возбуждения i-моделей, так или иначе связанных с ситуациями, воспринятыми автоматом в предыдущие моменты времени. Можно полагать, что при функционировании автомата в среде общий характер последней, т.е. преимущественное содержание объектов определенного качества, формирует и характер "прошлого опыта" автомата. Подобные соображения высказывались при построении "искусственной личности Олдос" и были подтверждены в экспериментах с этой моделью. Аналогичный эксперимент был проведен и нами с автоматом "норма".
Исследовалось изменение поведения автомата в среде, содержащей участки сосредоточения определенных (положительных пли отрицательных) объектов. Эксперимент проводился следующим образом.
Были заданы две среды - S.A и S.B, каждая из которых состояла из участков S.1 и S.2 (рис.48 ). В клетках участка S.1 расположены объекты P1 ("пища") и P3 ("лес"); в S2 - P2 ("зверь") и P3. Расположение объектов P1 и P2 на соответствующих участках среды задавалось одинаковым. Среда S.A формировалась из последовательности участков S.1 и S.2; S.B - из последовательности S.2 и S.1. В первом эксперименте автомат "норма" помещался в клетку А среды S.A и задавался план передвижения, заключающийся в переходе из S.1 в S.2 (направление движения - "вверх"). Проводился машинный эксперимент. Затем автомат помещался в клетку В среды S.B и проводился аналогичный эксперимент по передвижению из S.2 в S.1. Внутренние реакции автомата при передвижении в среде S.A показаны на рис.49, при передвижении в S.B - на рис.50. Траектории движения автоматов показаны на рис.48 стрелками. В обоих случаях время движения составило 14 тактов.
Рис.48. Внешние реакции М-автомата "норма" в средах S.A и S.B.
Рис.49. Внутренние реакции М-автомата "норма" в среде S.A.
Рис.50. Внутренние реакции М-автомата "норма" в среде S.B.
Сопоставление внутренних реакций автомата показало, что при "положительном" прошлом опыте автомат оказывается гораздо более "оптимистичным", чем при "отрицательном". При движении в S.A и S.B разность суммарного возбуждения центров Пр и НПр составила соответственно 64 и -6 усл.ед. на такт.
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ. Поведение человека в естественной среде является результатом переработки не только зрительной информации, но и той, которая поступает в мозг по другим каналам. Очевидно, что чем большее число каналов участвует в восприятии информации, тем выше вероятность адекватной реакции индивида. В этой связи представляется интересным исследовать поведение М-автомата, имеющего более одного канала восприятия информации, в среде, содержащей раздражители различного типа. Будем называть раздражители, соответствующие зрительным образам, т.е. конкретным объектам среды, локальными, а раздражители, соответствующие слуховым, осязательным и т.п. восприятиям,- нелокальными признаками среды. Описанные выше эксперименты являются исследованием поведения М-автомата в среде, содержащей только локальные раздражители. При этом в каждую клетку среды записывается номер соответствующей i-модели М-сети автомата, причем в каждой клетке может быть расположен не более чем один объект.
При наличии в среде нелокальных признаков каждая клетка может содержать любое их количество; она характеризуется не только наличием или отсутствием определенного признака, но и интенсивностью последнего. В связи с этим удобно представлять распределение в среде каждого нелокального признака путем задания отдельной к-среды (канал-среды), содержание клеток которой соответствует интенсивности данного признака. Обращение автомата к такого типа среде можно рассматривать как включение соответствующего канала информации. Естественно, что таким образом количество каналов информации в М-автомате может быть сделано сколь угодно большим; оно ограничивается в основном возможностями семантической интерпретации и объемом памяти используемой вычислительной машины.
Рассмотренные эксперименты с автоматом РЭМ-2, естественно, не являются полным и исчерпывающим исследованием необучающихся М-автоматов. Тем не менее, некоторые важные и принципиальные вопросы в ходе этого исследования были решены. Прежде всего, оказалось, что задание рабочего режима автомата практически осуществимо. Приступая к экспериментам по передвижению автомата в среде, мы не были уверены в том, что настройка в тестовых ситуациях будет достаточной для обеспечения адекватности реакций автомата в процессе движения. Действительно, при проведении первых экспериментов с автоматом "норма" пришлось дополнительно корректировать некоторые параметры М-сети, однако эти коррекции были вызваны в основном стремлением минимизировать "удельную оценку" пути. В целом же настройка М-автомата в отдельных типичных ситуациях среды оказалась весьма эффективным способом задания "хорошей" организации М-сети.
Проведенные эксперименты еще не дают возможности сделать сколько-нибудь определенные выводы относительно величины диапазона возможных изменений различных параметров М-сети, не приводящих к нарушению целесообразности поведения. Пока можно сказать только то, что, по всей вероятности, этот диапазон достаточно велик. В противном случае нам вообще вряд ли удалось бы настроить автомат. Разумеется, этот эмпирический вывод нуждается в более корректном рассмотрении, однако в ближайшее время строгое решение вопроса о величине диапазона допустимых изменений различных параметров в такой взаимосвязанной и многопараметрической системе, как М-сеть, вряд ли будет получено. В то же время описанные результаты могут быть уже использованы в дальнейших работах но созданию более сложных М-автоматов, поскольку показывают принципиальную возможность и основные пути гибкой настройки М-автоматов на нужный тип поведения. Незначительными изменениями структуры или значений параметров отдельных элементов М-сети можно получить автоматы, существенно отличающиеся типом поведения,- "осторожные" или "решительные", "агрессивные" или "доверчивые" и т.п.
Одним из наиболее важных результатов экспериментального исследования автомата РЭМ-2 можно считать демонстрацию эффективности применения СУТ как системы, упорядочивающей процесс переработки информации. Именно СУТ обеспечивает автомату дифференциацию внутренних и внешних реакций. Содержательность этих реакций, т.е. наличие зафиксированной семантики всех, в том числе и выделяемых СУТ, i-моделей сети, позволяет оценивать целесообразность поведения автомата не только но его двигательным реакциям, но и по адекватности предшествующего им "хода мышления". Эксперименты с автоматом РЭМ-2 показали существенную зависимость поведения автомата от величины различных параметров его СУТ. Оказалось, что изменение типа поведения автомата может быть получено путем изменения как его структуры, так и значений отдельных параметров СУТ. Этот вывод представляется нам весьма важным, так как, во-первых, является косвенным подтверждением установленной нами аналогии между СУТ и вниманием и, во-вторых, дает дополнительные возможности коррекции поведения автомата.
Исследование автомата РЭМ-2 показало перспективность дальнейшего совершенствования и развития М-автоматов как одного из направлений создания систем ПР. Прежде всего, такое совершенствование должно быть связано с усложнением среды и введением функций самообучения и самоорганизации. Уже при проведении экспериментов с необучающимся М-автоматом (исследование влияния "прошлого опыта" и "настроения") оказалось, что некоторый эффект обучения может быть получен при использовании только механизма изменения кратковременной памяти (возбужденности i-моделей). Естественно, что в автомате такого типа "прошлый опыт" и "настроение" сильно взаимосвязаны и их влияние распространяется лишь на незначительный промежуток времени, зависящий от характеристик затухания соответствующих i-моделей сети. Однако можно полагать, что введение в автомат алгоритмов самообучения, связанных с изменением проходимостей связей и характеристик i-моделей сети, позволит автомату более эффективно и адекватно использовать обучающее воздействие среды для повышения степени "разумности" своего поведения.
Заканчивая рассмотрение автомата РЭМ-2, отметим важность введения в структуру его М-сети элементов, содержательно интерпретируемых как "эмоциональные" состояния. Благодаря наличию "эмоциональной" сферы автомат способен самостоятельно оценивать воспринимаемую извне информацию и согласовывать задачу, поставленную экспериментатором, т.е. движение в среде и достижение определенной цели, с задачей "самосохранения". Это обстоятельство кажется нам чрезвычайно важным при использовании физических аналогов М-автоматов для решения практических задач в реальной среде.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#4. ВЛИЯНИЕ ВЫРАБОТАННОГО ПЛАНА НА ПОВЕДЕНИЕ АВТОМАТА
Выбранный автоматом план передвижения в среде представляет собой последовательность сложных действий, выполнение которых должно привести к достижению поставленной цели. Этапы плана представлены в структуре М-сети РЭМа-2 следующим образом. В сети автомата имеется некоторое количество i-моделей, каждая из которых содержательно интерпретируется как номер этапа плана. Соответствующее каждому этапу плана конкретное направление движения фиксируется связью, устанавливаемой от i-модели "этап плана номер..." к i-модели определенного действия двигательной сферы; i-модель элемента плана высшего уровня связывается с i-моделью соответствующего ему действия третьего уровня двигательной сферы; i-модели элементов плана низшего уровня - с i-моделями действий второго уровня.
При выполнении каждого этапа плана соответствующей i-модели приписывается определенное начальное возбуждение. При движении автомата в среде величина этого возбуждения может корректироваться в зависимости от состояния М-сети. Величина возбуждения i-моделей элементов плана может быть интерпретирована как "желание" автомата точно следовать выработанному плану. Коррекция возбуждения осуществляется следующим образом. В структуру "сферы желаний" М-сети автомата введена i-модель "выполнять план" (76), получающая возбуждение от i-моделей Пр (43) и "отсутствие объектов" (46) и торможение от i-модели НПр (44). Возбуждение i-модели "выполнять план" суммируется с начальным возбуждением i-модели выполняемого в данный момент этапа плана (i-модели остальных этапов плана в это время тормозятся). Таким образом, возбуждение i-модели выполняемого этапа плана в каждый момент времени отражает состояние автомата и его "субъективное" отношение к плану.
Высший уровень плана соответствует общему направлению к цели, к i-модель этого элемента плана возбуждена в течение всего процесса передвижения автомата в среде - до момента достижения цели. i-Модели этапов низшего уровня плана возбуждаются при помощи специального алгоритма только на время выполнения соответствующего этапа плана. По связям от i-моделей этапов плана возбуждение передается к i-моделям действий. Поскольку между i-моделями действий различных уровней двигательной сферы имеются связи, направленные от высших уровней к низшим, дальнейшее распространение возбуждения в сети приводит к тому, что в распределении возбуждений на первом уровне двигательной сферы оказывается отраженным влияние различных уровней плана. Такое влияние и обусловливает целенаправленность конкретных действий автомата.
В психологическом эксперименте по построению планов двигательного поведения было замечено, что испытуемые в процессе построения плана запоминают расположение отдельных "объектов" среды и в дальнейшем используют их в качестве ориентиров при воспроизведении плана. В реальных условиях человек, как правило (сознательно или бессознательно), производит контроль результатов предпринимаемых действий и сравнение их (результатов) с предполагавшимися ранее. При этом оцениваются не только объективные результаты действия, но и изменения субъективного состояния индивида. Так, например, возможна ситуация, при которой объективный результат действия совпадает с намеченным ранее, но на выполнение этого действия затрачивается гораздо больше усилий, чем предполагалось первоначально. Общая эмоциональная оценка такого действия может оказаться отрицательной.
Поскольку контроль выполнения действий является необходимым элементом двигательного поведения человека, сделана попытка упрощенно воспроизвести этот аспект поведения в М-автомате РЭМ.
В процессе планирования, т.е. при выборе этапов плана, автомат использует только обобщенное представление о среде, отраженное в конечной P-поверхности второго уровня. При реализации плана - передвижения в среде - и восприятии конкретных ситуаций выполняемые автоматом действия могут отличаться от действий, предусмотренных планом. Контроль выполнения плана, т.е. обратная связь от среды к автомату и плану, осуществляется при помощи специальных следящих систем, названных нами следящими системами "по результатам" и "по чувствам".
Следящая система "по результатам" предусматривает контроль за соответствием реального положения автомата в среде ранее запланированному. Как уже отмечалось выше, при построении плана автомат использует трехуровневую внутреннюю модель среды; нижний уровень плана представляет собой последовательность переходов из одной клетки второго уровня внутренней модели в другую. Выбор конкретного плана фиксирует и определенную последовательность клеток второго уровня внутренней модели среды, через которые должен проходить реальный путь движения автомата. Эта последовательность клеток ориентиров автоматом запоминается. При выполнении плана внутренняя модель используется автоматом для определения своего места нахождения, т.е. ориентации в среде. Произведя какой-либо шаг, автомат "мысленно" передвигается и по внутренней модели среды. При этом в каждый момент времени он может определить свое положение в среде на различных уровнях внутренней модели. Эта информация и используется автоматом для сравнения с тем положением в среде, которое предусмотрено планом.
Таким образом, в процессе движения автомат производит постоянный контроль соответствия своего положения в среде ранее запланированному. В тех случаях, когда оказывается, что положение автомата не соответствует ни одной из клеток-ориентиров, сформированный план считается нарушенным и следящая система "по результатам" включает специальные аварийные программы коррекции. Действие этих программ состоит в следующем. С момента обнаружения рассогласования автомат начинает отсчет действий-шагов, продолжая движение в прежнем направлении. После выполнения определенного, заранее заданного экспериментатором, числа шагов и при условии, что за это время не достигнута ни одна из клеток-ориентиров, автомат перестает выполнять план низшего уровня и начинает движение по плану высшего уровня, т.е. по общему направлению к цели (при этом сохраняется возбуждение только i-модели элемента высшего уровня плана, а возбуждение i-моделей этапов плана низшего уровня приравнивается нулю). Если и в этом случае после выполнения заранее заданного количества шагов автомат не попадает в одну из клеток, предусмотренных планом, пли не достигает цели, движение прекращается и из последней клетки план перестраивается заново. При перестройке плана могут быть использованы сформированные ранее P-поверхности.
Следящая система "по чувствам" в процессе движения автомата постоянно сравнивает уровень возбуждения i-модели НПр с некоторым "критическим" уровнем, величина которого зависит от предполагаемого на данном этапе плана "эмоционального" состояния автомата. "Критический" уровень для каждого этапа определяется как сумма некоторой, начально задаваемой, постоянной величины (характеризующей "прошлый опыт" и "характер" автомата) и добавки, линейно зависящей от среднего уровня P-поверхности на соответствующем этапу участке среды. Если уровень возбуждения i-модели НПр превышает "критический", автомат прекращает движение и из последней клетки перестраивает план заново.
#5. ВЗАИМОДЕЙСТВИЕ МОДЕЛЕЙ ПЛАНИРОВАНИЯ И ПЕРЕДВИЖЕНИЯ
Предыдущие эксперименты с автоматами РЭМ-1 и РЭМ-2 были проведены на участке среды, ограниченном "полем зрения" РЭМа в режиме стратегического осмотра. В общем случае автомат помещается в среду произвольных размеров и его поведение состоит из следующих этапов: стратегического осмотра участка среды; построения плана поведения на этом участке; выполнения плана (в результате автомат оказывается на одной из границ участка); стратегического осмотра нового участка и т.д. до достижения главной цели.
Рассмотрим этот процесс более подробно на примере исследования поведения М-автомата "норма" в среде, часть которой изображена на рис.51 (утолщенные линии показывают границы пространства, соответствующего клеткам второго уровня внутренней модели среды). Клетка среды, являющаяся главной целью автомата, отмечена буквой F.3. Стрелками различной величины показаны: составные действия, выбранные автоматом для достижения промежуточных целей; сложные действия (план поведения, выбираемый на каждом участке) и, наконец, выполненные автоматом конкретные действия-шаги. На рис.51 приведены только II и III участки среды. Нижний участок (I) совпадает со средой, описанной при рассмотрении предыдущих экспериментов. В этой среде проводилось детальное исследование реакций автомата и его настройка. Не останавливаясь повторно на описании поведения автомата на участке I, отметим только, что выработанный им план поведения был выполнен: автомат достиг предусмотренной планом промежуточной цели - клетки F.1.
Рис.51. Построение и выполнение планов М-автоматом РЭМ.
Из клетки Fi - первой промежуточной цели - автомат произвел стратегический осмотр участка II и выбрал общее направление движения - "вправо-вниз". Клетка F.2 являлась второй промежуточной целью. В соответствии с этим был построен план передвижения (последовательность сложных действий) для достижения F.2. Однако в процессе движения под влиянием внешних условий, выраженных в расположении объектов "пища", автомат нарушил план. В районе клетки А следящая система "по результатам" зафиксировала несовпадение положения автомата с запланированным. В этих условиях автомат должен был продолжать движение в направлении последнего этапа ("вправо-вниз") до достижения одной из клеток, зафиксированных в следящей системе "по результатам", или до выполнения определенного, заданного экспериментатором, количества шагов, которое характеризует "степень доверия" автомата выбранному плану. В описываемом эксперименте количество шагов было задано равным четырем. Выполнив их, автомат, однако, не вышел ни в одну из запланированных клеток. Программой автомата в таких случаях предусмотрено полное уничтожение влияния плана нижнего уровня (элементы плана не получают возбуждения) и усиление влияния плана верхнего уровня, т.е. общего направления движения. В соответствии с этим автомат продолжал движение "вправо" в течение трех шагов (количество шагов, как и в предыдущем случае, задавалось экспериментатором). После выполнения трех шагов автомат оказался в клетке F.2' и из нее произвел стратегический осмотр нового участка (III) среды.
На участке III был выбран план достижения клетки F.3, содержащей главную цель. При передвижении в среде автоматом был опять нарушен выработанный план. Двигаясь в направлении последнего этапа, автомат вышел в клетку В второго уровня, предусмотренную следящей системой "по результатам" в качестве результатов одного из этапов плана. Как видно из рисунка, план не предусматривал перехода автомата пз начальной клетки участка III сразу в клетку В. Однако, поскольку автомат все же попадает в нее, он начинает выполнять этап плана по передвижению из клетки В в следующую запланированную. Автомат выполняет оставшиеся этапы и приходит в клетку F.3, содержащую главную цель.
В процессе достижения главной цели автоматом было выполнено 46 простых действий-шагов за 81 такт функционирования. При этом суммарная разность возбуждений центров Пр и НПр составила 35усл.ед. на такт. На I участке среды план выполнен автоматом без значительных нарушений; на II участке автомат "сбился" с намеченного пути и вынужден был построить новый план, не достигнув промежуточной цели (F.2); на III участке отклонение от намеченного пути не привело к окончательному нарушению плана и автомат пришел в клетку F3, содержащую главную цель.
Необходимо еще раз отметить, что структура автомата "норма" в процессе его движения в среде не изменялась. В этой связи можно говорить, что адекватность полученных на участках II и III реакций автомата свидетельствует о возможности его нормального функционирования в любой из сред выбранного класса (т.е. содержащих только объекты выбранного типа). Наличие нарушений плана на этих участках не должно рассматриваться как следствие "новизны" среды. Более того, среда была специально организована таким образом, чтобы способствовать нарушению планов. Это обстоятельство было вызвано необходимостью проверки функционирования следящих систем автомата.
Как видно пз описания эксперимента, автомат РЭМ вполне успешно справляется с задачей целенаправленного передвижения в среде, содержащей "знакомые" для него объекты. Это позволяет считать, что построение физических устройств по типу необучающихся М-автоматов уже в настоящее время может оказаться эффективным для решения ряда практических задач, связанных с автономным передвижением роботов в реальных средах с ограниченным разнообразием объектов.
Выбранный автоматом план передвижения в среде представляет собой последовательность сложных действий, выполнение которых должно привести к достижению поставленной цели. Этапы плана представлены в структуре М-сети РЭМа-2 следующим образом. В сети автомата имеется некоторое количество i-моделей, каждая из которых содержательно интерпретируется как номер этапа плана. Соответствующее каждому этапу плана конкретное направление движения фиксируется связью, устанавливаемой от i-модели "этап плана номер..." к i-модели определенного действия двигательной сферы; i-модель элемента плана высшего уровня связывается с i-моделью соответствующего ему действия третьего уровня двигательной сферы; i-модели элементов плана низшего уровня - с i-моделями действий второго уровня.
При выполнении каждого этапа плана соответствующей i-модели приписывается определенное начальное возбуждение. При движении автомата в среде величина этого возбуждения может корректироваться в зависимости от состояния М-сети. Величина возбуждения i-моделей элементов плана может быть интерпретирована как "желание" автомата точно следовать выработанному плану. Коррекция возбуждения осуществляется следующим образом. В структуру "сферы желаний" М-сети автомата введена i-модель "выполнять план" (76), получающая возбуждение от i-моделей Пр (43) и "отсутствие объектов" (46) и торможение от i-модели НПр (44). Возбуждение i-модели "выполнять план" суммируется с начальным возбуждением i-модели выполняемого в данный момент этапа плана (i-модели остальных этапов плана в это время тормозятся). Таким образом, возбуждение i-модели выполняемого этапа плана в каждый момент времени отражает состояние автомата и его "субъективное" отношение к плану.
Высший уровень плана соответствует общему направлению к цели, к i-модель этого элемента плана возбуждена в течение всего процесса передвижения автомата в среде - до момента достижения цели. i-Модели этапов низшего уровня плана возбуждаются при помощи специального алгоритма только на время выполнения соответствующего этапа плана. По связям от i-моделей этапов плана возбуждение передается к i-моделям действий. Поскольку между i-моделями действий различных уровней двигательной сферы имеются связи, направленные от высших уровней к низшим, дальнейшее распространение возбуждения в сети приводит к тому, что в распределении возбуждений на первом уровне двигательной сферы оказывается отраженным влияние различных уровней плана. Такое влияние и обусловливает целенаправленность конкретных действий автомата.
В психологическом эксперименте по построению планов двигательного поведения было замечено, что испытуемые в процессе построения плана запоминают расположение отдельных "объектов" среды и в дальнейшем используют их в качестве ориентиров при воспроизведении плана. В реальных условиях человек, как правило (сознательно или бессознательно), производит контроль результатов предпринимаемых действий и сравнение их (результатов) с предполагавшимися ранее. При этом оцениваются не только объективные результаты действия, но и изменения субъективного состояния индивида. Так, например, возможна ситуация, при которой объективный результат действия совпадает с намеченным ранее, но на выполнение этого действия затрачивается гораздо больше усилий, чем предполагалось первоначально. Общая эмоциональная оценка такого действия может оказаться отрицательной.
Поскольку контроль выполнения действий является необходимым элементом двигательного поведения человека, сделана попытка упрощенно воспроизвести этот аспект поведения в М-автомате РЭМ.
В процессе планирования, т.е. при выборе этапов плана, автомат использует только обобщенное представление о среде, отраженное в конечной P-поверхности второго уровня. При реализации плана - передвижения в среде - и восприятии конкретных ситуаций выполняемые автоматом действия могут отличаться от действий, предусмотренных планом. Контроль выполнения плана, т.е. обратная связь от среды к автомату и плану, осуществляется при помощи специальных следящих систем, названных нами следящими системами "по результатам" и "по чувствам".
Следящая система "по результатам" предусматривает контроль за соответствием реального положения автомата в среде ранее запланированному. Как уже отмечалось выше, при построении плана автомат использует трехуровневую внутреннюю модель среды; нижний уровень плана представляет собой последовательность переходов из одной клетки второго уровня внутренней модели в другую. Выбор конкретного плана фиксирует и определенную последовательность клеток второго уровня внутренней модели среды, через которые должен проходить реальный путь движения автомата. Эта последовательность клеток ориентиров автоматом запоминается. При выполнении плана внутренняя модель используется автоматом для определения своего места нахождения, т.е. ориентации в среде. Произведя какой-либо шаг, автомат "мысленно" передвигается и по внутренней модели среды. При этом в каждый момент времени он может определить свое положение в среде на различных уровнях внутренней модели. Эта информация и используется автоматом для сравнения с тем положением в среде, которое предусмотрено планом.
Таким образом, в процессе движения автомат производит постоянный контроль соответствия своего положения в среде ранее запланированному. В тех случаях, когда оказывается, что положение автомата не соответствует ни одной из клеток-ориентиров, сформированный план считается нарушенным и следящая система "по результатам" включает специальные аварийные программы коррекции. Действие этих программ состоит в следующем. С момента обнаружения рассогласования автомат начинает отсчет действий-шагов, продолжая движение в прежнем направлении. После выполнения определенного, заранее заданного экспериментатором, числа шагов и при условии, что за это время не достигнута ни одна из клеток-ориентиров, автомат перестает выполнять план низшего уровня и начинает движение по плану высшего уровня, т.е. по общему направлению к цели (при этом сохраняется возбуждение только i-модели элемента высшего уровня плана, а возбуждение i-моделей этапов плана низшего уровня приравнивается нулю). Если и в этом случае после выполнения заранее заданного количества шагов автомат не попадает в одну из клеток, предусмотренных планом, пли не достигает цели, движение прекращается и из последней клетки план перестраивается заново. При перестройке плана могут быть использованы сформированные ранее P-поверхности.
Следящая система "по чувствам" в процессе движения автомата постоянно сравнивает уровень возбуждения i-модели НПр с некоторым "критическим" уровнем, величина которого зависит от предполагаемого на данном этапе плана "эмоционального" состояния автомата. "Критический" уровень для каждого этапа определяется как сумма некоторой, начально задаваемой, постоянной величины (характеризующей "прошлый опыт" и "характер" автомата) и добавки, линейно зависящей от среднего уровня P-поверхности на соответствующем этапу участке среды. Если уровень возбуждения i-модели НПр превышает "критический", автомат прекращает движение и из последней клетки перестраивает план заново.
#5. ВЗАИМОДЕЙСТВИЕ МОДЕЛЕЙ ПЛАНИРОВАНИЯ И ПЕРЕДВИЖЕНИЯ
Предыдущие эксперименты с автоматами РЭМ-1 и РЭМ-2 были проведены на участке среды, ограниченном "полем зрения" РЭМа в режиме стратегического осмотра. В общем случае автомат помещается в среду произвольных размеров и его поведение состоит из следующих этапов: стратегического осмотра участка среды; построения плана поведения на этом участке; выполнения плана (в результате автомат оказывается на одной из границ участка); стратегического осмотра нового участка и т.д. до достижения главной цели.
Рассмотрим этот процесс более подробно на примере исследования поведения М-автомата "норма" в среде, часть которой изображена на рис.51 (утолщенные линии показывают границы пространства, соответствующего клеткам второго уровня внутренней модели среды). Клетка среды, являющаяся главной целью автомата, отмечена буквой F.3. Стрелками различной величины показаны: составные действия, выбранные автоматом для достижения промежуточных целей; сложные действия (план поведения, выбираемый на каждом участке) и, наконец, выполненные автоматом конкретные действия-шаги. На рис.51 приведены только II и III участки среды. Нижний участок (I) совпадает со средой, описанной при рассмотрении предыдущих экспериментов. В этой среде проводилось детальное исследование реакций автомата и его настройка. Не останавливаясь повторно на описании поведения автомата на участке I, отметим только, что выработанный им план поведения был выполнен: автомат достиг предусмотренной планом промежуточной цели - клетки F.1.
Рис.51. Построение и выполнение планов М-автоматом РЭМ.
Из клетки Fi - первой промежуточной цели - автомат произвел стратегический осмотр участка II и выбрал общее направление движения - "вправо-вниз". Клетка F.2 являлась второй промежуточной целью. В соответствии с этим был построен план передвижения (последовательность сложных действий) для достижения F.2. Однако в процессе движения под влиянием внешних условий, выраженных в расположении объектов "пища", автомат нарушил план. В районе клетки А следящая система "по результатам" зафиксировала несовпадение положения автомата с запланированным. В этих условиях автомат должен был продолжать движение в направлении последнего этапа ("вправо-вниз") до достижения одной из клеток, зафиксированных в следящей системе "по результатам", или до выполнения определенного, заданного экспериментатором, количества шагов, которое характеризует "степень доверия" автомата выбранному плану. В описываемом эксперименте количество шагов было задано равным четырем. Выполнив их, автомат, однако, не вышел ни в одну из запланированных клеток. Программой автомата в таких случаях предусмотрено полное уничтожение влияния плана нижнего уровня (элементы плана не получают возбуждения) и усиление влияния плана верхнего уровня, т.е. общего направления движения. В соответствии с этим автомат продолжал движение "вправо" в течение трех шагов (количество шагов, как и в предыдущем случае, задавалось экспериментатором). После выполнения трех шагов автомат оказался в клетке F.2' и из нее произвел стратегический осмотр нового участка (III) среды.
На участке III был выбран план достижения клетки F.3, содержащей главную цель. При передвижении в среде автоматом был опять нарушен выработанный план. Двигаясь в направлении последнего этапа, автомат вышел в клетку В второго уровня, предусмотренную следящей системой "по результатам" в качестве результатов одного из этапов плана. Как видно из рисунка, план не предусматривал перехода автомата пз начальной клетки участка III сразу в клетку В. Однако, поскольку автомат все же попадает в нее, он начинает выполнять этап плана по передвижению из клетки В в следующую запланированную. Автомат выполняет оставшиеся этапы и приходит в клетку F.3, содержащую главную цель.
В процессе достижения главной цели автоматом было выполнено 46 простых действий-шагов за 81 такт функционирования. При этом суммарная разность возбуждений центров Пр и НПр составила 35усл.ед. на такт. На I участке среды план выполнен автоматом без значительных нарушений; на II участке автомат "сбился" с намеченного пути и вынужден был построить новый план, не достигнув промежуточной цели (F.2); на III участке отклонение от намеченного пути не привело к окончательному нарушению плана и автомат пришел в клетку F3, содержащую главную цель.
Необходимо еще раз отметить, что структура автомата "норма" в процессе его движения в среде не изменялась. В этой связи можно говорить, что адекватность полученных на участках II и III реакций автомата свидетельствует о возможности его нормального функционирования в любой из сред выбранного класса (т.е. содержащих только объекты выбранного типа). Наличие нарушений плана на этих участках не должно рассматриваться как следствие "новизны" среды. Более того, среда была специально организована таким образом, чтобы способствовать нарушению планов. Это обстоятельство было вызвано необходимостью проверки функционирования следящих систем автомата.
Как видно пз описания эксперимента, автомат РЭМ вполне успешно справляется с задачей целенаправленного передвижения в среде, содержащей "знакомые" для него объекты. Это позволяет считать, что построение физических устройств по типу необучающихся М-автоматов уже в настоящее время может оказаться эффективным для решения ряда практических задач, связанных с автономным передвижением роботов в реальных средах с ограниченным разнообразием объектов.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
РАЗДЕЛ IV. М-АВТОМАТ МОД. ИССЛЕДОВАНИЕ АДАПТИВНОГО ПОВЕДЕНИЯ
Результаты экспериментального исследования описанного ранее М-автомата РЭМ-2 показали, что использование полного М-автомата в качестве системы, формирующей двигательное поведение, позволяет успешно решать задачу автоматического управления целенаправленным передвижением различного рода объектов в некотором классе сред. Мы видели также, что решение этой задачи с помощью необучающегося М-автомата, каковым является РЭМ-2, предполагает использование при его задании информации о среде, в которой автомату предстоит функционировать. При этом, чем полнее используется такая информация, тем "лучшим" оказывается поведение, формируемое необучающимся М-автоматом. В ряде случаев, однако, полная априорная информация о среде может отсутствовать. Ситуации такого рода характерны для некоторых практически важных задач автоматизации. Поэтому представляет значительный интерес изучение принципов построения таких М-автоматов, которые могли бы начинать свое функционирование на основе зафиксированной в их структуре неполной информации о среде, а затем "улучшали" бы свое поведение, используя накапливаемый ими опыт. Речь идет, таким образом, о создании М-автоматов, способных формировать адаптивное поведение.
Формирование М-автоматом адаптивного поведения связано, очевидно, с реализацией в его М-сети процессов обучения и самоорганизации. Изучение этих процессов в М-сетях и составило основное содержание работ по дальнейшему развитию модели двигательного поведения. Результатом этих работ явилось построение и экспериментальное исследование полного самообучающегося и самоорганизующегося М-автомата МОД.
В предыдущей работе высказано теоретическое предположение о том, что сравнительно простые операции изменения весов связей в М-сети, осуществляемые по-разному в зависимости от состояния интегрирующих центров оценочной сферы (Пр и НПр), могут обеспечить существенное увеличение эффективности работы рассматриваемых систем. Это предположение нуждалось в экспериментальной проверке по следующим основным причинам.
1. Хорошо известны работы по исследованию обучения путем изменения весов связей в системах типа персептрон. Однако использовать имеющиеся здесь результаты для случая М-автоматов невозможно, поскольку рассматриваемые нами системы отличаются от персептронов следующими существенными моментами: а) М-сети содержат некоторое множество уровней, или "слоев", i-моделей, между которыми имеются как прямые (в направлении рецепторы - эффекторы), так и многочисленные обратные связи; это обстоятельство само по себе еще не составляет принципиального отличия М-сети от персептрона, тем не менее свойства персептронов с обратными связями исследовались крайне мало; б) на работу М-сети оказывает существенное влияние система усиления - торможения (СУТ), в общем случае многоуровневая; то, что СУТ действительно изменяет ход процессов переработки информации в М-сети, было экспериментально показано ранее (см. раздел III); в) М-сеть является сетью с семантикой и в начальном состоянии организована определенным образом во всех своих сферах; г) в ходе работы М-сети возникают новые i-модели, роль которых в обучении весьма велика. "Растущие" персептроны также до сих пор не изучались. Перечисленные отличия не допускают прямого перенесения результатов, полученных на персептронах, на случай М-сетей, и специальное исследование свойств последних становится необходимым.
2. Известны исследования процесса обучения автоматов в средах, генерирующих сигналы типа "штраф" и "не штраф". Существенным отличием рассматриваемых систем от таких автоматов является расширение набора сигналов, воспринимаемых ими от среды. Кроме того, сигнальные значения могут приобретать любые воспринимаемые М-автоматом объекты среды. Сведение сигналов среды к оценкам Пр и НПр в оценочной сфере автомата выполняется по весьма гибким и меняющимся в ходе работы автомата правилам (реализуемым изменяющейся структурой М-сети). Таким образом, интерпретация автоматом сигналов среды в "штрафы" и "не штрафы" зависит от его предыстории и не является жесткой. Это обстоятельство, а также свойства М-сети, перечисленные в п.1, исключают возможность описания М-автоматов в терминах автоматов, минимизирующих сумму штрафов, и, следовательно, прямое перенесение на рассматриваемый случай имеющихся в этой области результатов оказывается невозможным.
3. Построение модели в виде М-автомата предполагает определенную предорганизацию ее структуры. В разделе III показано, что необучающиеся модели могут быть предорганизованы таким образом, что обеспечивают требуемое поведение. Процессы обучения в М-сети приводят к образованию новых структур, накладывающихся па структуры предорганизации и искажающих их. Соответственно изменяется и поведение модели. Было неясно, существуют ли режимы обучения, приводящие к улучшению поведения и, если существуют, то удастся ли определить области допустимых значений соответствующих параметров. Для ответа на эти вопросы также необходимо было провести экспериментальное исследование.
4. Экспериментальный характер исследования диктовался следующими соображениями. Хотя описание процессов обучения М-сети в общем виде, безусловно, предпочтительнее, однако М-сеть является "неудобным" для формализации объектом. Прежде всего, это связано с тем, что упрощение ее характеристик, неизбежное при формализации, может привести к существенному изменению ее свойств. Далее, представлялось затруднительным или мало перспективным использовать существующие в настоящее время методы формального описания объектов такого рода. Так, ряд методов, предложенных для описания процессов в сетевых структурах, применим только для регулярных (например, типа решеток) или однородных (относительно свойств элементов) сетей, в то время как М-сеть не является ни регулярной, ни однородной. Разработанные методы синтеза сетей из пороговых нейронов также неудобны в нашем случае, поскольку предусматривают предварительное формально-логическое описание требуемых функций сети (а мы как раз и хотим исследовать, какие функции сеть в состоянии реализовать). Кроме того, существующие алгоритмы синтеза обеспечивают построение сетей весьма небольшого объема.
Как упоминалось выше, нашей задаче не соответствуют языки описания персептронов и автоматов с линейной тактикой. Определенные возможности имеются при использовании методов синтеза конечных автоматов. Здесь необходимо представление в качестве элементарных автоматов i-моделей и связей сети, что создает определенные трудности и обусловливает различного рода упрощения. Значительные трудности связаны с представлением в этом языке функций СУТ. Кроме того, проведению работ по формализации, требующих значительных усилий, представлялось целесообразным предпослать доказательство существования решения, которое могло быть дано экспериментальным исследованием модели сети.
Процессы в сети могут быть естественным образом описаны дифференциальными уравнениями, хотя и здесь значительные трудности связаны с представлением многоуровневой СУТ. Заранее ясно, что число уравнений в системе, описывающей достаточно сложную сеть, окажется весьма большим. Это потребует применения для решения этой системы численных методов, так что преимущества такого подхода оказываются сомнительными. Использованные нами потактовые расчеты состояния М-сети, по существу, эквивалентны численному решению некоторой системы уравнений каким-либо из шаговых методов. Отметим, что при этом сохраняется наглядность представления сети, а ее функциональные характеристики задаются без существенных упрощений.
ГЛАВА 8. МОДЕЛЬ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ МОД
Для проведения экспериментального исследования процессов обучения была разработана и реализована в виде программы для ЦВМ вычислительная модель М-автомата. При этом был использован тот же, что и в предыдущих случаях, общий "сюжет" двигательного поведения: МОД помещался в среду и, передвигаясь в ней, должен был выполнить заранее заданный ему план действий. Имеющиеся в среде шесть типов объектов в различной степени "опасны" или "полезны" для автомата. МОД может активно воздействовать на среду, изменяя существующее в ней расположение объектов.
#1. ОБЩАЯ СХЕМА М-АВТОМАТА
Каждая ячейка среды, в которой находится М-автомат, может быть либо пустой, либо содержать один из раздражителей. Последние можно классифицировать по признаку их значения для автомата. Для того чтобы содержательно интерпретировать процессы, происходящие в автомате, введем условные обозначения элементов среды (табл.6). Каждой ячейке среды приписывается пара чисел, характеризующих интенсивности заданных в среде "привлекательного" (А) и "непривлекательного" (В) запахов. Еще пара чисел, одинаковых для всех ячеек, задает интенсивность признаков "общего состояния" среды, например "светло" и "тепло". В процессе функционирования модели интенсивность этих признаков меняется в некоторой функции времени.
Таблица 6
Автомат строят свое поведение, последовательно выполняя действия-шаги, переводящие его из одной ячейки среды в другую, соседнюю. Имеется также шаг, не изменяющий положения автомата. Таким образом, осуществление каждого шага связано с выбором одного из девяти возможных. Выбор осуществляется на основе информации о состоянии среды в окрестности автомата, т.е. на основе "восприятия ситуации", и зависит от внутреннего состояния автомата в момент выбора.
В структуру автомата введена некоторая организация в виде наличия определенного набора i-моделей и связей между ними.
Совокупность введенных связей задает автомату систему "безусловных рефлексов", направленных на "выживание" н "сохранение целостности", например: "избегать опасности", "приближаться к пище" и т.п. Таким образом, начальная организация автомата определяет мотивацию его поведения.
Не забывая о том, что автомат представляет собой единую М-сеть, условно выделим в нем семь основных блоков. Схема взаимодействия блоков представлена на рис.52. Здесь Р - блок приема информации, ПО - блок понятийных обобщений, ПС - блок памяти ситуации, Э - блок эмоций, Ж - блок желаний, Д - блок действий и СУТ - система усиления-торможения.
Рис.52. Схема взаимодействия блоков М-сети автомата МОД.
БЛОК ПРИЕМА ИНФОРМАЦИИ содержит некоторое множество i-моделей, каждая из которых поставлена в соответствие одному из раздражителей. Если в ячейках окрестности автомата содержатся некоторые из этих раздражителей, то соответствующие им i-модели возбуждаются. Между i-моделями раздражителей и i-моделями возможных шагов автомата, имеющимися в блоке Д, существуют заранее вводимые и необучаемые связи, которые образуют систему "безусловных рефлексов" автомата. Блок содержит также i-модели "ощущений" автомата. Так, если в занимаемой автоматом ячейке среды имеется раздражитель, одним из заданных свойств которого является свойство вызывать "боль", то соответствующая этому ощущению i-модель окажется возбужденной. В блоке имеются также i-модели, возбуждающиеся при восприятии запахов А и В, а также i-модели характеристик "общего состояния" среды.
В исследованном варианте автомата i-модели блока Р позволяют ему воспринимать: раздражители шести типов; четыре вида ощущений ("больно", "вкусно", "невкусно", "удобно"); два типа запахов различной интенсивности; четыре характеристики "общего состояния" среды ("тепло", "холодно", "светло", "темно") и их градации. Восприятие ситуации осуществляется автоматом в каждый момент дискретного времени. Между возбужденными i-моделями могут возникать "ассоциативные" связи. Воспринятая в блоке Р информация передается для обработки в блоки понятийных обобщений, памяти ситуаций и эмоций.
БЛОК ПОНЯТИЙНЫХ ОБОБЩЕНИЙ. Раздражители, содержащиеся в среде, могут быть объединены в различные группы и классы. Каждой из групп и классам ставятся в соответствие определенные i-модели. Таким образом, блок содержит i-модели понятий различного уровня. Исследование механизмов представления понятий и систем понятий в М-сетях составляет отдельную задачу. Для изучения этих механизмов разработана специальная модель, обсуждение которой удобно провести ниже. Поэтому будем считать пока, что некоторая начальная структура блока задана. Начальная совокупность связей между i-моделями понятий составляет "систему знаний" автомата. Последняя имеет иерархическую организацию. Связи, из которых она состоит, характеризуются высокой проходимостью. В процессе функционирования автомата на "систему знаний" могут накладываться "ассоциативные" связи. Между i-моделями понятий и i-моделями действий в блоке Д могут устанавливаться связи, обеспечивающие "условнорефлекторные" реакции автомата.
БЛОК ПАМЯТИ СИТУАЦИЙ. Ряд i-моделей этого блока в начальном состоянии не имеет содержательной интерпретации, связей друг с другом и с другими i-моделями ("резервные" элементы). На множестве этих элементов задана закономерность "спонтанных" возбуждений. Блок содержит i-модели, относящиеся к двум уровням. i-Модели первого уровня сохраняют состояние возбуждения (кратковременная память) в течение n моментов времени. Память i-моделей второго уровня составляет kn единиц времени, где k - целое и к>1. Таким образом, если в некоторый момент времени автомат воспринимает ситуацию и одна из i-моделей первого уровня оказывается возбужденной, между ней и i-моделями блока Р устанавливаются связи. В дальнейшем повторное восприятие той же пли сходной ситуации всегда будет приводить к возбуждению этой i-модели, т.е. она становится представителем, моделью ситуации. Аналогичным образом та же i-модель связывается с i-моделью действия, выполненного автоматом в воспринятой ситуации. Так происходит запоминание реакции на ситуацию. В дальнейшем между i-моделями различных ситуаций могут устанавливаться ассоциативные связи по сходству или временной близости, так что восприятие одной ситуации может вызвать возбуждение целого ряда i-моделей других ситуаций.
Возбуждение i-моделей второго уровня происходит в k раз реже, чем первого. Поэтому спонтанно возбужденная i-модель второго уровня может связаться с k i-моделями первого и стать их представителем. Между i-моделями обобщенных ситуаций могут устанавливаться ассоциативные связи. Кроме того, они связываются и с элементами блока действия.
В предлагаемом варианте автомата блок содержит 150 i-моделей первого уровня и 50 второго. i-Модели блока могут связываться также с элементами блока ПО. Таким образом, совокупность связей, направленных от i-моделей каких-либо ситуаций к i-моделям блоков Р и ПО, определяет "содержание" ситуаций, а их связи с блоком эмоций - "значение" ситуаций для автомата.
БЛОК ЭМОЦИЙ содержит 14 i-моделей различных эмоциональных состояний и чувств (недовольство, гнев, беспокойство, страх, удовлетворение, неудовлетворение, любопытство, неуверенность, уверенность, безопасность, радость, близость цели, голод, усталость). Кроме того, в блок входят i-модели интегральных оценок "приятно" (Пр) и "неприятно" (НПр). Между некоторыми i-моделями блока заданы связи, отражающие наблюдающиеся у животных н человека взаимодействия между эмоциональными состояниями. Например, возбуждение i-модели "гнев" тормозит возбуждение i-модели "усталость". Заданы также некоторые "врожденные" связи с i-моделями блока Р. Таким образом, восприятие ситуации изменяет состояние эмоциональной сферы автомата.
Связи, устанавливающиеся в процессе функционирования автомата между элементами блока эмоций и блоков ПС и ПО, обеспечивают влияние эмоционального состояния на весь ход переработки информации и, следовательно, выбор автоматом действий. В свою очередь, остальные блоки влияют на состояние блока эмоций.
Возбуждение i-моделей "голод" и "усталость" отражает состояние "тела" автомата. Возбуждение i-модели "голод" дискретно увеличивается в каждый момент времени, но снижается до нуля, если автомат находится в клетке, содержащей раздражитель группы "пища", и выполняет действие "есть". Возбуждение i-модели "усталость" дискретно увеличивается при каждом шаге автомата, но снижается до нуля при выполнении им действия "спать". Элементы блока эмоций связаны с i-моделями блока желаний.
БЛОКИ ЖЕЛАНИЙ И ДЕЙСТВИЙ. "Желание" мы рассматриваем как обобщенное, недифференцированное действие. В соответствии с этим в автомат включены i-модели желаний "действовать" и "не действовать", а также их уточнения - i-модели желаний "действовать быстро", "действовать спокойно", "стоять на месте" и "отдыхать". Возбуждение i-моделей желаний обусловливается состоянием элементов блока эмоций и передается непосредственно на i-модели действий.
Блок действий включает в себя i-модели 22 действий, доступных автомату. Среди них имеется 9 i-моделей шагов, переводящих автомат в одну из клеток окрестности. Кроме того, имеется 8 i-моделей действий-шагов "нападать". Действие "нападать" связано с переходом автомата в новую ячейку. При этом, если, например, раздражитель "зверь А" по условиям "опасен" для системы, то при обычном шаге автомат не должен входить в ячейку, занятую этим раздражителем, и такой шаг рассматривается как ошибка, свидетельствующая о неверном выборе структуры или алгоритмов обучения. Если же этот шаг выполняется как действие "нападать", то указанное ограничение снимается. "Нападение" связано с увеличением возбуждения i-моделей "усталость" и "больно". В блоке имеются также i-модели следующих действий: 1) рыть; при выполнении этого действия в некоторой ячейке в последнюю вносится раздражитель "убежище", i-модель которого связана с i-моделями "удобно", "не действовать" и т.п.; 2) спать; при выполнении этого действия возбуждение i-модели "усталость" снижается до нуля и возбуждается "удовлетворение"; 3) есть; снижается до нуля возбуждение "голода" и повышается "удовлетворение"; 4) нести; после выполнения этого действия в какой-либо непустой ячейке дальнейшее перемещение автомата в среде сопровождается соответствующим перемещением находившегося в исходной ячейке раздражителя, а также повышением возбуждения i-модели "усталость"; 5) бросить; прекращает действие "нести".
Кроме указанных, блок содержит также восемь i-моделей "обобщенных" действий, каждая из которых связана с i-моделями шагов, при помощи которых соответствующее "обобщенное" действие может быть реализовано, и с i-моделями обобщенных ситуаций в блоке ПС (связи с блоком ПС устанавливаются в ходе функционирования автомата). Состояние блока действий является результатом переработки информации во всей сети. Выбор одного из возможных действий осуществляется по определенным правилам, которые будут описаны ниже.
СИСТЕМА УСИЛЕНИЯ-ТОРМОЖЕНИЯ. В предлагаемом автомате СУТ реализована в виде двухуровневой системы. Ее первый уровень составляют "частные" подсистемы, каждая из которых действует на i-моделях одного из блоков автомата. Будем обозначать их, приписывая к слову СУТ название соответствующего блока (СУТж, СУТпо и т.п.). Второй уровень СУТ (СУТ-2) представлен в виде подсистемы, в каждый момент времени выбирающей наиболее возбужденный блок автомата. i-Модели всех остальных блоков равномерно притормаживаются (в том числе и i-модели, выбранные "частными" СУТ этих блоков). Возбужденность всех i-моделей выбранного СУТ-2 блока увеличивается.
#2. ДИНАМИКА М-АВТОМАТА
Пусть в некоторый момент времени в М-сети возбуждено определенное количество i-моделей, и пусть шаг был выполнен автоматом в предыдущий момент. Работа автомата начинается с восприятия ситуации, что приводит к возбуждению ряда i-моделей блока Р. Затем происходит очередной пересчет М-сети, при котором определяются новые значения проходимостей связей н возбужденностей i-моделей. При этом спонтанно возбужденная i-модель в блоке ПС связывается с возбужденными i-моделямп блока Р. После определения возбужденностей i-моделей начинает работать СУТ, в результате чего картина возбуждений изменяется. По измененным возбужденностям проверяется, будут ли выполняться условия действия и, если они не выполняются, повторяется восприятие ситуации и цикл выполняется вновь.
В ходе пересчетов возбуждение, возникаюшее в блоке Р, распространяется по всей сети. При этом одновременно с формированием i-моделей ситуаций в блоке ПС пдет "узнавание" воспринятых раздражителей в блоке ПО и формируется эмоциональная оценка в блоке Э. Затем возбуждение достигает блока Д, причем отдельные его i-модели возбуждаются неодинаково. Это обстоятельство используется для выбора действия. Определенное действие осуществляется при выполнении одного из следующих условий: 1) СУТ-2 выбирает блок Д; при этом выполняется действие, i-модель которого выбрана СУТд; 2) СУТ-2 выбирает не блок Д, но возбужденность i-модели, выбранной СУТд, превышает некоторый заранее выбранный уровень. Если выполняется одно из этих условий и СУТж выделяет i-модель "действовать быстро", то в результате шага автомат перемещается не в одну из соседних клеток, а дальше - в клетку следующего слоя. За выполнением действия следует восприятие новой ситуации и описанные выше циклы повторяются. Блок действий включает в себя также системы, следящие за выполнением плана, которые позволяют автомату корректировать план или отказываться от его выполнения.
Уточним понятие "ход мышления" автомата. В каждый момент времени СУТ выделяет i-модели в различных сферах М-сети. То обстоятельство, что М-сеть является сетью с семантикой, позволяет каждой из выбранных СУТ i-моделей поставить в соответствие определенное слово естественного языка. В ходе работы М-автомата СУТ последовательно выделит некоторый ряд i-моделей. Последовательность слов, соответствующих выделяемым СУТ i-моделям, мы и будем называть "ходом мышления" автомата.
МОД рассчитан на совместную работу с системой, моделирующей переработку информации в процессе построения плана двигательного поведения. Для этого М-автомат дополняется блоком, обеспечивающим влияние выработанного плана на выбор действий. Последний включает в себя системы, следящие за выполнением плана и позволяющие автомату корректировать план или отказаться от его выполнения.
Необходимо еще раз отметить, что содержательные обозначения элементов среды и i-моделей автомата выбраны, вообще говоря, произвольно для того, чтобы сделать возможной содержательную интерпретацию процессов, происходящих в автомате, и облегчить оценку адекватности его поведения. Будем по возможности и в дальнейшем придерживаться этих обозначений.
Результаты экспериментального исследования описанного ранее М-автомата РЭМ-2 показали, что использование полного М-автомата в качестве системы, формирующей двигательное поведение, позволяет успешно решать задачу автоматического управления целенаправленным передвижением различного рода объектов в некотором классе сред. Мы видели также, что решение этой задачи с помощью необучающегося М-автомата, каковым является РЭМ-2, предполагает использование при его задании информации о среде, в которой автомату предстоит функционировать. При этом, чем полнее используется такая информация, тем "лучшим" оказывается поведение, формируемое необучающимся М-автоматом. В ряде случаев, однако, полная априорная информация о среде может отсутствовать. Ситуации такого рода характерны для некоторых практически важных задач автоматизации. Поэтому представляет значительный интерес изучение принципов построения таких М-автоматов, которые могли бы начинать свое функционирование на основе зафиксированной в их структуре неполной информации о среде, а затем "улучшали" бы свое поведение, используя накапливаемый ими опыт. Речь идет, таким образом, о создании М-автоматов, способных формировать адаптивное поведение.
Формирование М-автоматом адаптивного поведения связано, очевидно, с реализацией в его М-сети процессов обучения и самоорганизации. Изучение этих процессов в М-сетях и составило основное содержание работ по дальнейшему развитию модели двигательного поведения. Результатом этих работ явилось построение и экспериментальное исследование полного самообучающегося и самоорганизующегося М-автомата МОД.
В предыдущей работе высказано теоретическое предположение о том, что сравнительно простые операции изменения весов связей в М-сети, осуществляемые по-разному в зависимости от состояния интегрирующих центров оценочной сферы (Пр и НПр), могут обеспечить существенное увеличение эффективности работы рассматриваемых систем. Это предположение нуждалось в экспериментальной проверке по следующим основным причинам.
1. Хорошо известны работы по исследованию обучения путем изменения весов связей в системах типа персептрон. Однако использовать имеющиеся здесь результаты для случая М-автоматов невозможно, поскольку рассматриваемые нами системы отличаются от персептронов следующими существенными моментами: а) М-сети содержат некоторое множество уровней, или "слоев", i-моделей, между которыми имеются как прямые (в направлении рецепторы - эффекторы), так и многочисленные обратные связи; это обстоятельство само по себе еще не составляет принципиального отличия М-сети от персептрона, тем не менее свойства персептронов с обратными связями исследовались крайне мало; б) на работу М-сети оказывает существенное влияние система усиления - торможения (СУТ), в общем случае многоуровневая; то, что СУТ действительно изменяет ход процессов переработки информации в М-сети, было экспериментально показано ранее (см. раздел III); в) М-сеть является сетью с семантикой и в начальном состоянии организована определенным образом во всех своих сферах; г) в ходе работы М-сети возникают новые i-модели, роль которых в обучении весьма велика. "Растущие" персептроны также до сих пор не изучались. Перечисленные отличия не допускают прямого перенесения результатов, полученных на персептронах, на случай М-сетей, и специальное исследование свойств последних становится необходимым.
2. Известны исследования процесса обучения автоматов в средах, генерирующих сигналы типа "штраф" и "не штраф". Существенным отличием рассматриваемых систем от таких автоматов является расширение набора сигналов, воспринимаемых ими от среды. Кроме того, сигнальные значения могут приобретать любые воспринимаемые М-автоматом объекты среды. Сведение сигналов среды к оценкам Пр и НПр в оценочной сфере автомата выполняется по весьма гибким и меняющимся в ходе работы автомата правилам (реализуемым изменяющейся структурой М-сети). Таким образом, интерпретация автоматом сигналов среды в "штрафы" и "не штрафы" зависит от его предыстории и не является жесткой. Это обстоятельство, а также свойства М-сети, перечисленные в п.1, исключают возможность описания М-автоматов в терминах автоматов, минимизирующих сумму штрафов, и, следовательно, прямое перенесение на рассматриваемый случай имеющихся в этой области результатов оказывается невозможным.
3. Построение модели в виде М-автомата предполагает определенную предорганизацию ее структуры. В разделе III показано, что необучающиеся модели могут быть предорганизованы таким образом, что обеспечивают требуемое поведение. Процессы обучения в М-сети приводят к образованию новых структур, накладывающихся па структуры предорганизации и искажающих их. Соответственно изменяется и поведение модели. Было неясно, существуют ли режимы обучения, приводящие к улучшению поведения и, если существуют, то удастся ли определить области допустимых значений соответствующих параметров. Для ответа на эти вопросы также необходимо было провести экспериментальное исследование.
4. Экспериментальный характер исследования диктовался следующими соображениями. Хотя описание процессов обучения М-сети в общем виде, безусловно, предпочтительнее, однако М-сеть является "неудобным" для формализации объектом. Прежде всего, это связано с тем, что упрощение ее характеристик, неизбежное при формализации, может привести к существенному изменению ее свойств. Далее, представлялось затруднительным или мало перспективным использовать существующие в настоящее время методы формального описания объектов такого рода. Так, ряд методов, предложенных для описания процессов в сетевых структурах, применим только для регулярных (например, типа решеток) или однородных (относительно свойств элементов) сетей, в то время как М-сеть не является ни регулярной, ни однородной. Разработанные методы синтеза сетей из пороговых нейронов также неудобны в нашем случае, поскольку предусматривают предварительное формально-логическое описание требуемых функций сети (а мы как раз и хотим исследовать, какие функции сеть в состоянии реализовать). Кроме того, существующие алгоритмы синтеза обеспечивают построение сетей весьма небольшого объема.
Как упоминалось выше, нашей задаче не соответствуют языки описания персептронов и автоматов с линейной тактикой. Определенные возможности имеются при использовании методов синтеза конечных автоматов. Здесь необходимо представление в качестве элементарных автоматов i-моделей и связей сети, что создает определенные трудности и обусловливает различного рода упрощения. Значительные трудности связаны с представлением в этом языке функций СУТ. Кроме того, проведению работ по формализации, требующих значительных усилий, представлялось целесообразным предпослать доказательство существования решения, которое могло быть дано экспериментальным исследованием модели сети.
Процессы в сети могут быть естественным образом описаны дифференциальными уравнениями, хотя и здесь значительные трудности связаны с представлением многоуровневой СУТ. Заранее ясно, что число уравнений в системе, описывающей достаточно сложную сеть, окажется весьма большим. Это потребует применения для решения этой системы численных методов, так что преимущества такого подхода оказываются сомнительными. Использованные нами потактовые расчеты состояния М-сети, по существу, эквивалентны численному решению некоторой системы уравнений каким-либо из шаговых методов. Отметим, что при этом сохраняется наглядность представления сети, а ее функциональные характеристики задаются без существенных упрощений.
ГЛАВА 8. МОДЕЛЬ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ МОД
Для проведения экспериментального исследования процессов обучения была разработана и реализована в виде программы для ЦВМ вычислительная модель М-автомата. При этом был использован тот же, что и в предыдущих случаях, общий "сюжет" двигательного поведения: МОД помещался в среду и, передвигаясь в ней, должен был выполнить заранее заданный ему план действий. Имеющиеся в среде шесть типов объектов в различной степени "опасны" или "полезны" для автомата. МОД может активно воздействовать на среду, изменяя существующее в ней расположение объектов.
#1. ОБЩАЯ СХЕМА М-АВТОМАТА
Каждая ячейка среды, в которой находится М-автомат, может быть либо пустой, либо содержать один из раздражителей. Последние можно классифицировать по признаку их значения для автомата. Для того чтобы содержательно интерпретировать процессы, происходящие в автомате, введем условные обозначения элементов среды (табл.6). Каждой ячейке среды приписывается пара чисел, характеризующих интенсивности заданных в среде "привлекательного" (А) и "непривлекательного" (В) запахов. Еще пара чисел, одинаковых для всех ячеек, задает интенсивность признаков "общего состояния" среды, например "светло" и "тепло". В процессе функционирования модели интенсивность этих признаков меняется в некоторой функции времени.
Таблица 6
Автомат строят свое поведение, последовательно выполняя действия-шаги, переводящие его из одной ячейки среды в другую, соседнюю. Имеется также шаг, не изменяющий положения автомата. Таким образом, осуществление каждого шага связано с выбором одного из девяти возможных. Выбор осуществляется на основе информации о состоянии среды в окрестности автомата, т.е. на основе "восприятия ситуации", и зависит от внутреннего состояния автомата в момент выбора.
В структуру автомата введена некоторая организация в виде наличия определенного набора i-моделей и связей между ними.
Совокупность введенных связей задает автомату систему "безусловных рефлексов", направленных на "выживание" н "сохранение целостности", например: "избегать опасности", "приближаться к пище" и т.п. Таким образом, начальная организация автомата определяет мотивацию его поведения.
Не забывая о том, что автомат представляет собой единую М-сеть, условно выделим в нем семь основных блоков. Схема взаимодействия блоков представлена на рис.52. Здесь Р - блок приема информации, ПО - блок понятийных обобщений, ПС - блок памяти ситуации, Э - блок эмоций, Ж - блок желаний, Д - блок действий и СУТ - система усиления-торможения.
Рис.52. Схема взаимодействия блоков М-сети автомата МОД.
БЛОК ПРИЕМА ИНФОРМАЦИИ содержит некоторое множество i-моделей, каждая из которых поставлена в соответствие одному из раздражителей. Если в ячейках окрестности автомата содержатся некоторые из этих раздражителей, то соответствующие им i-модели возбуждаются. Между i-моделями раздражителей и i-моделями возможных шагов автомата, имеющимися в блоке Д, существуют заранее вводимые и необучаемые связи, которые образуют систему "безусловных рефлексов" автомата. Блок содержит также i-модели "ощущений" автомата. Так, если в занимаемой автоматом ячейке среды имеется раздражитель, одним из заданных свойств которого является свойство вызывать "боль", то соответствующая этому ощущению i-модель окажется возбужденной. В блоке имеются также i-модели, возбуждающиеся при восприятии запахов А и В, а также i-модели характеристик "общего состояния" среды.
В исследованном варианте автомата i-модели блока Р позволяют ему воспринимать: раздражители шести типов; четыре вида ощущений ("больно", "вкусно", "невкусно", "удобно"); два типа запахов различной интенсивности; четыре характеристики "общего состояния" среды ("тепло", "холодно", "светло", "темно") и их градации. Восприятие ситуации осуществляется автоматом в каждый момент дискретного времени. Между возбужденными i-моделями могут возникать "ассоциативные" связи. Воспринятая в блоке Р информация передается для обработки в блоки понятийных обобщений, памяти ситуаций и эмоций.
БЛОК ПОНЯТИЙНЫХ ОБОБЩЕНИЙ. Раздражители, содержащиеся в среде, могут быть объединены в различные группы и классы. Каждой из групп и классам ставятся в соответствие определенные i-модели. Таким образом, блок содержит i-модели понятий различного уровня. Исследование механизмов представления понятий и систем понятий в М-сетях составляет отдельную задачу. Для изучения этих механизмов разработана специальная модель, обсуждение которой удобно провести ниже. Поэтому будем считать пока, что некоторая начальная структура блока задана. Начальная совокупность связей между i-моделями понятий составляет "систему знаний" автомата. Последняя имеет иерархическую организацию. Связи, из которых она состоит, характеризуются высокой проходимостью. В процессе функционирования автомата на "систему знаний" могут накладываться "ассоциативные" связи. Между i-моделями понятий и i-моделями действий в блоке Д могут устанавливаться связи, обеспечивающие "условнорефлекторные" реакции автомата.
БЛОК ПАМЯТИ СИТУАЦИЙ. Ряд i-моделей этого блока в начальном состоянии не имеет содержательной интерпретации, связей друг с другом и с другими i-моделями ("резервные" элементы). На множестве этих элементов задана закономерность "спонтанных" возбуждений. Блок содержит i-модели, относящиеся к двум уровням. i-Модели первого уровня сохраняют состояние возбуждения (кратковременная память) в течение n моментов времени. Память i-моделей второго уровня составляет kn единиц времени, где k - целое и к>1. Таким образом, если в некоторый момент времени автомат воспринимает ситуацию и одна из i-моделей первого уровня оказывается возбужденной, между ней и i-моделями блока Р устанавливаются связи. В дальнейшем повторное восприятие той же пли сходной ситуации всегда будет приводить к возбуждению этой i-модели, т.е. она становится представителем, моделью ситуации. Аналогичным образом та же i-модель связывается с i-моделью действия, выполненного автоматом в воспринятой ситуации. Так происходит запоминание реакции на ситуацию. В дальнейшем между i-моделями различных ситуаций могут устанавливаться ассоциативные связи по сходству или временной близости, так что восприятие одной ситуации может вызвать возбуждение целого ряда i-моделей других ситуаций.
Возбуждение i-моделей второго уровня происходит в k раз реже, чем первого. Поэтому спонтанно возбужденная i-модель второго уровня может связаться с k i-моделями первого и стать их представителем. Между i-моделями обобщенных ситуаций могут устанавливаться ассоциативные связи. Кроме того, они связываются и с элементами блока действия.
В предлагаемом варианте автомата блок содержит 150 i-моделей первого уровня и 50 второго. i-Модели блока могут связываться также с элементами блока ПО. Таким образом, совокупность связей, направленных от i-моделей каких-либо ситуаций к i-моделям блоков Р и ПО, определяет "содержание" ситуаций, а их связи с блоком эмоций - "значение" ситуаций для автомата.
БЛОК ЭМОЦИЙ содержит 14 i-моделей различных эмоциональных состояний и чувств (недовольство, гнев, беспокойство, страх, удовлетворение, неудовлетворение, любопытство, неуверенность, уверенность, безопасность, радость, близость цели, голод, усталость). Кроме того, в блок входят i-модели интегральных оценок "приятно" (Пр) и "неприятно" (НПр). Между некоторыми i-моделями блока заданы связи, отражающие наблюдающиеся у животных н человека взаимодействия между эмоциональными состояниями. Например, возбуждение i-модели "гнев" тормозит возбуждение i-модели "усталость". Заданы также некоторые "врожденные" связи с i-моделями блока Р. Таким образом, восприятие ситуации изменяет состояние эмоциональной сферы автомата.
Связи, устанавливающиеся в процессе функционирования автомата между элементами блока эмоций и блоков ПС и ПО, обеспечивают влияние эмоционального состояния на весь ход переработки информации и, следовательно, выбор автоматом действий. В свою очередь, остальные блоки влияют на состояние блока эмоций.
Возбуждение i-моделей "голод" и "усталость" отражает состояние "тела" автомата. Возбуждение i-модели "голод" дискретно увеличивается в каждый момент времени, но снижается до нуля, если автомат находится в клетке, содержащей раздражитель группы "пища", и выполняет действие "есть". Возбуждение i-модели "усталость" дискретно увеличивается при каждом шаге автомата, но снижается до нуля при выполнении им действия "спать". Элементы блока эмоций связаны с i-моделями блока желаний.
БЛОКИ ЖЕЛАНИЙ И ДЕЙСТВИЙ. "Желание" мы рассматриваем как обобщенное, недифференцированное действие. В соответствии с этим в автомат включены i-модели желаний "действовать" и "не действовать", а также их уточнения - i-модели желаний "действовать быстро", "действовать спокойно", "стоять на месте" и "отдыхать". Возбуждение i-моделей желаний обусловливается состоянием элементов блока эмоций и передается непосредственно на i-модели действий.
Блок действий включает в себя i-модели 22 действий, доступных автомату. Среди них имеется 9 i-моделей шагов, переводящих автомат в одну из клеток окрестности. Кроме того, имеется 8 i-моделей действий-шагов "нападать". Действие "нападать" связано с переходом автомата в новую ячейку. При этом, если, например, раздражитель "зверь А" по условиям "опасен" для системы, то при обычном шаге автомат не должен входить в ячейку, занятую этим раздражителем, и такой шаг рассматривается как ошибка, свидетельствующая о неверном выборе структуры или алгоритмов обучения. Если же этот шаг выполняется как действие "нападать", то указанное ограничение снимается. "Нападение" связано с увеличением возбуждения i-моделей "усталость" и "больно". В блоке имеются также i-модели следующих действий: 1) рыть; при выполнении этого действия в некоторой ячейке в последнюю вносится раздражитель "убежище", i-модель которого связана с i-моделями "удобно", "не действовать" и т.п.; 2) спать; при выполнении этого действия возбуждение i-модели "усталость" снижается до нуля и возбуждается "удовлетворение"; 3) есть; снижается до нуля возбуждение "голода" и повышается "удовлетворение"; 4) нести; после выполнения этого действия в какой-либо непустой ячейке дальнейшее перемещение автомата в среде сопровождается соответствующим перемещением находившегося в исходной ячейке раздражителя, а также повышением возбуждения i-модели "усталость"; 5) бросить; прекращает действие "нести".
Кроме указанных, блок содержит также восемь i-моделей "обобщенных" действий, каждая из которых связана с i-моделями шагов, при помощи которых соответствующее "обобщенное" действие может быть реализовано, и с i-моделями обобщенных ситуаций в блоке ПС (связи с блоком ПС устанавливаются в ходе функционирования автомата). Состояние блока действий является результатом переработки информации во всей сети. Выбор одного из возможных действий осуществляется по определенным правилам, которые будут описаны ниже.
СИСТЕМА УСИЛЕНИЯ-ТОРМОЖЕНИЯ. В предлагаемом автомате СУТ реализована в виде двухуровневой системы. Ее первый уровень составляют "частные" подсистемы, каждая из которых действует на i-моделях одного из блоков автомата. Будем обозначать их, приписывая к слову СУТ название соответствующего блока (СУТж, СУТпо и т.п.). Второй уровень СУТ (СУТ-2) представлен в виде подсистемы, в каждый момент времени выбирающей наиболее возбужденный блок автомата. i-Модели всех остальных блоков равномерно притормаживаются (в том числе и i-модели, выбранные "частными" СУТ этих блоков). Возбужденность всех i-моделей выбранного СУТ-2 блока увеличивается.
#2. ДИНАМИКА М-АВТОМАТА
Пусть в некоторый момент времени в М-сети возбуждено определенное количество i-моделей, и пусть шаг был выполнен автоматом в предыдущий момент. Работа автомата начинается с восприятия ситуации, что приводит к возбуждению ряда i-моделей блока Р. Затем происходит очередной пересчет М-сети, при котором определяются новые значения проходимостей связей н возбужденностей i-моделей. При этом спонтанно возбужденная i-модель в блоке ПС связывается с возбужденными i-моделямп блока Р. После определения возбужденностей i-моделей начинает работать СУТ, в результате чего картина возбуждений изменяется. По измененным возбужденностям проверяется, будут ли выполняться условия действия и, если они не выполняются, повторяется восприятие ситуации и цикл выполняется вновь.
В ходе пересчетов возбуждение, возникаюшее в блоке Р, распространяется по всей сети. При этом одновременно с формированием i-моделей ситуаций в блоке ПС пдет "узнавание" воспринятых раздражителей в блоке ПО и формируется эмоциональная оценка в блоке Э. Затем возбуждение достигает блока Д, причем отдельные его i-модели возбуждаются неодинаково. Это обстоятельство используется для выбора действия. Определенное действие осуществляется при выполнении одного из следующих условий: 1) СУТ-2 выбирает блок Д; при этом выполняется действие, i-модель которого выбрана СУТд; 2) СУТ-2 выбирает не блок Д, но возбужденность i-модели, выбранной СУТд, превышает некоторый заранее выбранный уровень. Если выполняется одно из этих условий и СУТж выделяет i-модель "действовать быстро", то в результате шага автомат перемещается не в одну из соседних клеток, а дальше - в клетку следующего слоя. За выполнением действия следует восприятие новой ситуации и описанные выше циклы повторяются. Блок действий включает в себя также системы, следящие за выполнением плана, которые позволяют автомату корректировать план или отказываться от его выполнения.
Уточним понятие "ход мышления" автомата. В каждый момент времени СУТ выделяет i-модели в различных сферах М-сети. То обстоятельство, что М-сеть является сетью с семантикой, позволяет каждой из выбранных СУТ i-моделей поставить в соответствие определенное слово естественного языка. В ходе работы М-автомата СУТ последовательно выделит некоторый ряд i-моделей. Последовательность слов, соответствующих выделяемым СУТ i-моделям, мы и будем называть "ходом мышления" автомата.
МОД рассчитан на совместную работу с системой, моделирующей переработку информации в процессе построения плана двигательного поведения. Для этого М-автомат дополняется блоком, обеспечивающим влияние выработанного плана на выбор действий. Последний включает в себя системы, следящие за выполнением плана и позволяющие автомату корректировать план или отказаться от его выполнения.
Необходимо еще раз отметить, что содержательные обозначения элементов среды и i-моделей автомата выбраны, вообще говоря, произвольно для того, чтобы сделать возможной содержательную интерпретацию процессов, происходящих в автомате, и облегчить оценку адекватности его поведения. Будем по возможности и в дальнейшем придерживаться этих обозначений.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#3. РЕАЛИЗАЦИЯ М-АВТОМАТА
М-автомат МОД реализован в виде комплекса программ для ЦВМ БЭСМ-6. В настоящем параграфе описываются наиболее важные участки программы, а также блок-схемы, необходимые для понимания ее структуры.
При реализации М-автомата на его структуру и алгоритмы наложен ряд ограничений. Некоторые из них связаны с выбором конкретного вида характеристик i-моделей и связей. Эти ограничения зафиксированы в виде совокупности условий и неравенств, приведенных ниже. Часть ограничений вводится путем включения в алгоритм функционирования М-сети ряда вспомогательных процедур, краткое описание которых также дано в настоящем параграфе. Существенное ограничение, далее, состоит в том, что мы будем считать пренебрежимо малыми значения остаточных составляющих усиливающей и тормозной компонент связей, т.е. всегда r.(0)ij ~ ~r.(0)ij ~ 0 (см. гл.4). Введение этого ограничения обусловлено тем обстоятельством, что объем затрат машинного времени при экспериментальном исследовании модели двигательного поведения не позволяет исследовать работу М-сети в течение столь больших промежутков времени, чтобы изменения этих составляющих можно было считать существенными. С тем же обстоятельством связан и отказ от реализации в программе характеристик гипертрофии и адаптации возбудимости i-моделей. Таким образом, в рамках настоящей работы мы не будем исследовать упомянутые механизмы долговременной памяти М-сети.
ХАРАКТЕРИСТИКИ ЭЛЕМЕНТОВ М-СЕТИ. Основные характеристики i-моделей и связей между ними реализованы следующим образом.
Рис.53. Связи между i-моделями.
ХАРАКТЕРИСТИКА ПЕРЕДАЧИ СВЯЗЕЙ принята линейной, т.е. для случая, показанного на рис.53,
E.i = СУММА[j=1..n]П.j*r.ij,
~E.i = СУММА[j=1..n]П.j*~r.ij, (8.1)
ХАРАКТЕРИСТИКА ЗАТУХАНИЯ i-моделей имеет вид
zПt.i = П[t-1].i*a.i, (8.2)
где а.i - коэффициент затухания i-й i-модели, 0<=а.i<1; zПi - возбужденность i-й i-модели при условии Еt.i=~Et.i=0.
ХАРАКТЕРИСТИКА ВОЗБУЖДЕНИЯ i-моделей принята логарифмической и для i-й i-модели
vПt.i* = Kt.i * ln(Et.i), (8.3)
где Kt.i - коэффициент пропорциональности; vПt.i - возбужденность i-й i-модели при условии Пt.i=0, ~Еt.i=0.
ХАРАКТЕРИСТИКА ТОРМОЖЕНИЯ i-моделей принята линейной, так что
Kt.i = K.нi - m*~Et.i, (8.4)
где K.нi - "начальное" значение K.i, K.рi=const; m - коэффициент пропорциональности.
Каждая i-модель характеризуется порогом возбуждения O.i.
При определении величин возбуждений i-моделей сети в момент t+1 величины vПt.i и zПt.i нелинейно суммируются, так что в общем виде
Пt.i = Р = (K.нi-m*~Et.i)ln(exp(П[t-1].i*a.i/K.нi)+Et.i-O.i). (8.5)
Основываясь на нейрофизиологической аналогии (существование "верхнего порога" возбуждения нейрона), примем, что величина возбуждения i-моделей ограничена сверху некоторым постоянным, задаваемым заранее значением П.max. С целью экономии затрат машинного времени будем считать пренебрежимо малыми те возбуждения, величина которых не превосходит некоторого постоянного задаваемого заранее значения П.min. Таким образом,
П[t+1]i=
П.max при Р>П.max,
Р при П.min<=Р<=П.max,
0 при Р<П.min
Процесс определения возбужденности всех i-моделей сети с помощью формулы (8.5) будем называть пересчетом сети, а соответствующий алгоритм - алгоритмом пересчета.
Как упоминалось выше, характеристика проторения связей (4.2) может иметь различный вид для связей проторенных и непроторенных (точнее, проторяемых впервые). В исходном состоянии М-сети между отдельными i-моделями существуют заранее заданные связи, имеющие некоторую проходимость. Будем полагать, что между всеми остальными i-моделями также имеются связи, начальная проходимость которых равна нулю. При выполнении определенных условий эти связи могут проторяться. Процесс их проторения естественно называть установлением связей, а соответствующий алгоритм - алгоритмом установления.
Алгоритм установления связей между i-й и j-й i-моделями работает в том случае, если выполняется условие установления, т.е. является истинным выражение
(Пt.i>=П.u)&(Пt.j>=П.u), (8.7)
где П.u - задаваемый заранее порог.
Введем обозначение: Dt=Пt.Пр-Пt.Нпр. Пусть в момент t для i-моделей i и j выполнено условие (8.7), а также r.ij=0 и ~r.ij=0. Алгоритм установления реализует функцию (4.2), заданную в виде
rt.ij = k.0(Пt.i+Пt.j) + k.1*Dt, (8.8а)
~rt.ij = ~k.0(Пt.i+Пt.j) - ~k.1*Dt, (8.8б)
где k.0, k.1, ~k.0, ~k.1 - масштабные коэффициенты.
Если значение rt.ij (~rt.ij) оказывается меньше нуля, то оно принимается равным нулю, т.е. всегда rt.ij>=0 и ~rt.ij>=0.
ХАРАКТЕРИСТИКА ЗАТУХАНИЯ СВЯЗИ задается следующими соотношениями:
zr[t+1].ij = b*rt.ij, 0<b<=1, (8.9а)
~zr[t+1].ij = ~b*~rt.ij, 0<b<=1, (8.9б)
Где zr[t+1].ij и ~zr[t+1].ij - "затухшие" значения компонент rt.ij и ~rt.ij.
Если в момент t некоторая связь Rt.ij!=0, то характеристика проторения этой связи задается в виде
r[t+1].ij = zrt.ij + k.2*rt.ij(Пt.i+Пt.j]Dt, (8.10а)
~r[t+1].ij = ~zrt.ij + ~k.2*~rt.ij(Пt.i+Пt.j]Dt, (8.10б)
где k.2, ~k.2 - коэффициенты пропорциональности.
АЛГОРИТМЫ ФУНКЦИОНИРОВАНИЯ М-АВТОМАТА. Для удобства дальнейшего изложения введем обозначения и дадим краткое описание основных подблоков алгоритма А.
А.с - АЛГОРИТМ ПЕРЕСЧЕТА, реализующий функции (8.5).
А.R - АЛГОРИТМ УСТАНОВЛЕНИЯ СВЯЗЕЙ, реализующий функции (8.8 ) при выполнении условия (8.7).
А.p - АЛГОРИТМ ПРОТОРЕНИЯ СВЯЗЕЙ, реализующий функции (8.10).
А.СУТ - АЛГОРИТМ, РЕАЛИЗУЮЩИЙ ФУНКЦИИ СИСТЕМЫ УСИЛЕНИЯ-ТОРМОЖЕНИЯ.
A.g - АЛГОРИТМ, ВЫЧИСЛЯЮЩИЙ ФУНКЦИЮ ЦЕЛИ. Пусть в момент t М-автомат находится в вершине g.i среды и задана "целевая" вершина g.ц. Входной информацией для A.g являются сведения о g.i и g.ц. В результате работы A.g дополнительное возбуждение получает i-модель того сложного действия, выполнение которого необходимо для передвижения автомата из g.i в g.ц. Таким образом, алгоритм A.g отображает в сферу действий автомата его положение относительно цели, реализуя "функцию цели" g(g.i, g.ц).
A.V - АЛГОРИТМ ВОСПРИЯТИЯ. Входной информацией для A.V являются сведения о среде Р и местоположении автомата в данный момент. В результате работы A.V оказываются возбужденными до величины П.V i-модели раздражителей, находящихся в окрестности автомата. Совокупность возбужденных i-моделей соотнесем воспринятой ситуации S.t. Таким образом, алгоритм восприятия осуществляет отображение в сферу восприятия М-автомата ситуации, в которой последний находится.
A.D - алгоритм выбора действия. На вход A.D подается информация о распределении возбуждений в сфере действий М-сети и зафиксированные правила выбора действия. Используя эти правила, A.D либо выбирает некоторую i-модель действия, либо не выбирает никакой i-модели. Таким образом, действия могут осуществляться автоматом не на каждом такте его работы.
А.e - множество "эффекторных" алгоритмов. Каждому действию d.i из D соответствует единственный "эффекторный" алгоритм А.ei из А.e. После выбора алгоритмом A.D i-модели некоторого действия начинает работать соответствующий этому действию алгоритм А.ei, который в зависимости от вида действия может или изменить положение автомата в среде, или изменить расположение объектов, или сделать и то и другое.
Обобщенная блок-схема алгоритма А представлена на рис.54, где двойные стрелки указывают направления обмена информацией между блоками системы.
Рис.54. Обобщенная блок-схема алгоритма функционирования М-автомата.
Уточним понятие такта работы М-автомата. Будем полагать, что один такт составляют все операции, выполняемые между двумя последовательными вхождениями в блок A.D. Из рис.54 видно, что в зависимости от результатов работы A.D в такт может не включаться выполнение алгоритмов А.е, A.V, A.g.
Кроме указанных на рис. 54, в программу введен ряд вспомогательных алгоритмов, выполняющих некоторые функции, выражение которых в языке М-сети оказывается неудобным с точки зрения машинной реализации. Опишем наиболее важные из этих функций.
АСИММЕТРИЯ СВЯЗЕЙ R.ij и R.ji вводится для того, чтобы обеспечить М-автомату возможность воспроизведения последовательностей. Пусть в момент t i-модели i и j возбуждены до Пt.i и Пt.j соответственно и Пt.j>Пt.j. Для операций установления (8.8 ) и проторения (8.10) связен принято: если Пt.i<Пt.j, то
rt.ij = rt.ij + а.s(Пt.j-Пt.i) (8.11a)
и
~rt.ij = ~rt.ij + а.s(Пt.j-Пt.i), (8.11б)
здесь a.s - коэффициент асимметрии.
Очевидно, что при установлении или проторении связи Rt.ji справедливо Пt.j>Пt.i, и операции (8.11) над Rt.jt не выполняются. Получаем, таким образом, Rt.ij>Rt.ji.
Пусть в момент t М-автоматом воспринят некоторый образ и соответствующая ему i-модель k возбуждена до определенного значения П.v: Пt.k=П.V. Пусть в момент t+1 воспринят другой образ и П[t+1].i=П.V. В соответствии с (8.5) в момент t+1 получим Пt.k<П[t+1].k, и установившиеся между k и l связи окажутся асимметричными: R[t+1].kl>R[t+1].lk.
Пусть в моменты t, t+1, t+2, ..., t+n М-автомат воспринимает последовательность из n+1 неповторяющихся образов. При этом (в соответствии с (8.8 ) и (8.11)) в М-сети сформируется структура, показанная на рис.55,а, где толщина линий пропорциональна проходимости изображаемых ими связей. Если через некоторое время после момента t+n окажется возбужденной i-модель l так, что она будет выделена СУТ, то в результате пересчета будут возбуждены i-модели k и m, причем П.m>П.k, и i-модель m окажется выделенной СУТ. Далее процесс повторится и будет продолжаться до тех пор, пока СУТ не выделит все следующие за l i-модели последовательности в том порядке, в котором предъявлялись соответствующие образы ("воспроизведет" последовательность). Правильный порядок воспроизведения может быть нарушен, если некоторые i-модели последовательности получают возбуждение от других i-моделей сети (например, от i-моделей сферы оценок - если предъявлялись "эмоционально значимые" образы). Этот феномен лежит в основе формирования "редуцированных" последовательностей, включающих в себя лишь наиболее важные, "ключевые" образы и понятия.
Рис.55. Отображение временных последовательностей в структуре связей.
Описанный механизм обеспечивает также правильное воспроизведение "пересекающихся", т.е. имеющих общие элементы, последовательностей. Такая возможность обусловлена тем, что характеристика затухания (8.2) i-моделей в общем случае обеспечивает отличную от нуля возбужденность i-модели в течение n (n>1) тактов с момента ее первоначального возбуждения, так что при предъявлении некоторой последовательности первая из возбужденных i-моделей связывается не только со второй, но и с рядом последующих i-моделей, причем R.1,2 > R.1,3 > ...> R.1,n. Очевидно, n=f(а) и R.i,j = r(a,П.V), что в неявном виде задается характеристиками (8.8 ), (8.9) п (8.10), (8.11).
Поясним сказанное простым примером. Пусть в моменты t, t+1, t+2 М-автомату предъявляется последовательность образов (a, b, c), а в моменты т+1, т+2, т+3 (т>>t) - последовательность (d, b, е). После предъявления обеих последовательностей в М-сети сформируется структура, изображенная на рис.55,б, где, как и раньше, толщина линий пропорциональна проходимости соответствующих связей. Пусть в момент Т (Т>>т) получила некоторое возбуждение i-модель а. В результате пересчета возбудятся i-модели b и с, но, поскольку R.ab>R.ac, то П[Т+1].b>П[Т+1].c и СУТ выделит i-модель b. В момент Т+2 окажутся возбужденными i-модели c и e, но, поскольку c еще сохраняет возбуждение, полученное в предыдущем такте, т.е. "предвозбуждена", то П[Т+2].c>П[T+2].e. СУТ выделяет i-модель c, и последовательность (a, b, c) оказывается воспроизведенной правильно.
Подробный анализ процессов воспроизведения последовательностей М-автоматом является темой отдельного исследования. Операции (8.11) реализуются специальным алгоритмом B.as.
B.ud - АЛГОРИТМ УСКОРЕНИЯ ДЕЙСТВИЙ - задает М-автомату "установку" на выполнение действий, повышает его "двигательную активность". Из описания работы автомата, приведенного в #2 настоящей главы, можно заключить, что возможны такие режимы его функционирования (определяемые совокупностью воспринятых ситуаций, состоянием сферы оценок и т.п.), при которых в течение длительного времени не выполняются условия действия. В свободной интерпретации это означает, что автомат "слишком долго думает" перед выбором шага. Такие режимы представляют определенный интерес, так как дают материал для изучения и оценки рациональности "хода мышления" автомата. В связи с этим, однако, существенно возрастают затраты машинного времени, что затрудняет исследование собственно двигательного поведения. Следовательно, целесообразно ввести алгоритм, ускоряющий выбор действия в необходимых случаях.
Алгоритм выполняет следующие операции: 1) сравнивает ситуацию, существующую в блоке восприятия в момент t, с ситуацией, существовавшей в момент t-1; 2) определяет меру совпадения m.s обеих ситуаций так, что 0<=m.s<=9. При полном совпадении ситуаций m.s=9, при полном несовпадении - m.s=0; 3) увеличивает возбужденность i-модели "желание действовать" (П.jd) на величину D.ij:
Пt.jd = Пt.jd + D.jd = П.jd + m.s*П.d, (8.12)
где П.d - максимально возможная добавка (П.d=const); 4) запоминает ситуацию, существующую в блоке восприятия в момент t. Действие алгоритма сводится, таким образом, к следующему. Если в течение нескольких тактов М-автомат не совершает действий и, следовательно, воспринимаемая им ситуация не меняется, то возрастает величина возбуждения П.jd. Это приводит к увеличению возбуждения i-модели действий, что, в свою очередь, приближает момент выполнения условий действия. Аналогичный процесс происходит и в тех случаях, когда выполнение действия не ведет к изменению ситуации, что возможно в средах с регулярным расположением раздражителей.
В.sit - АЛГОРИТМ ФОРМИРОВАНИЯ i-МОДЕЛЕЙ СИТУАЦИЙ - обеспечивает установление адекватных связей между i-моделями раздражителей, составляющих воспринимаемую в момент t ситуацию, и одной из "резервных" i-моделей.
В момент (такт) восприятия ситуации описываемый алгоритм определяет свободную (не связанную с другими) i-модель первого уровня блока памяти ситуаций и приписывает ей определенную, задаваемую заранее возбужденность П.sit. Далее, при работе блока установления связей A.R между этой i-моделью п i-моделями раздражителей устанавливаются необходимые связи. В случае, если резерв свободных i-моделей исчерпан, алгоритм определяет среди i-моделей первого уровня блока памяти ситуаций такую i-модель, которая наиболее слабо связана с остальными, уничтожает все направленные к ней и от нее связи (устанавливая нулевое значение их проходимости) и приписывает ей возбужденность П.sit. Через каждые k (k>1 и заранее задано) тактов аналогичные операции выполняются для i-моделей второго уровня блока памяти ситуаций.
В.о - АЛГОРИТМ ЗАДЕРЖАННОГО ОБУЧЕНИЯ - обеспечивает установление адекватных связей между i-моделями ситуаций и действий. Пусть в момент t М-автомат находится в некоторой ситуации S.i и выполняет шаг, переводящий его в другую ситуацию. В этот момент в М-сети автомата имеется i-модель, соответствующая ситуации S.i. Обозначим номер этой i-модели nsit. Номер i-модели шага, выполненного в момент t, обозначим ngou. В момент t+1 описываемый алгоритм, используя запомненные значения nsit и ngou, увеличит возбужденность соответствующих i-моделей на некоторую постоянную заранее заданную величину. В результате по формулам (8.8 ) будет установлена связь R.ngou,nsit. При этом, если воспринятая в момент t+1 новая ситуация содержит фактор наказания (поощрения), то тормозной (усиливающий) компонент связи R.ngou,nsit будет преобладающим. Таким образом, в М-сети окажется зафиксированной информация о том, что "в ситуации типа nsit не следует (следует) выполнять шаг ngou".
В ряде случаев, однако, новая ситуация может не содержать факторов реакции, тогда ее "эмоциональная оценка" вырабатывается с задержкой в ходе пересчетов сети. Пусть в момент t выполнен шаг ngou, а следующий шаг выполняется в момент t+n, причем n>1. В этом случае в момент t+1 будет установлена связь R.ngou,nsit, проходимости которой отражают текущее состояние центров Пр и НПр. Последнее запоминается, и в течение последующих тактов производится сравнение значений параметра D[t+k] при k=2,3,...,n со значением D[t+1]. Если абсолютное значение разности D[t+k]-D[t+1] превосходит в некоторый момент t+k (1<k<n) заранее задаваемый порог, то, в зависимости от знака разности, изменяется значение тормозного пли усиливающего компонента связи R.ngou,nsit. После выполнения в момент t+n следующего шага описанные процессы повторяются.
В.vs - АЛГОРИТМ ОГРАНИЧЕНИЯ КОЛИЧЕСТВА СВЯЗЕЙ - введен с целью уменьшения машинного времени счета программы.
В связи с ограниченной емкостью ОЗУ существует ограничение и на количество связей между i-моделями сети, так что М-сеть не может содержать более чем s.m связей.
В то же время очевидно, что чем меньше проходимости r.ij и ~r.ij связи R.ij, тем меньшее влияние оказывает R.ij на функционирование М-сети. Поэтому представляется целесообразным введение числовой переменной gvs с тем, чтобы
при выполнении условий rt.ij<gvs и ~rt.ij<gvs описываемый алгоритм исключал связь Rt.ij из рассмотрения, т.е. выполнял операцию Rt.ij=0.
Алгоритм построен так, что количество связей М-сети в любой момент времени (st.m) не превышает максимально допустимого (s.m). Для этого в начале каждого такта величина gvs вычисляется следующим образом:
gvs[t] = gvs[t-1] + k.V/(s.m-s[t-i].m), (8.13)
где k.V - масштабный коэффициент.
Таким образом, при увеличении числа связей в М-сети в первую очередь будут исключаться из рассмотрения связи с наименьшей проходимостью.
В.н - АЛГОРИТМ РАНДОМИЗАЦИИ ВОЗБУЖДЕНИЙ - вводит случайный компонент в распределение возбуждений М-сети. Содержательно такой компонент отражает влияние на функционирование модели факторов, не учтенных при моделировании. На каждом такте работы М-автомата алгоритм формирует последовательность (длиной меньше или много меньше числа i-моделей сети) случайных чисел, с помощью которых вычисляется количество случайно возбуждаемых i-моделей, их номера (R.i) и величина добавочного возбуждения (RП). Далее для каждой из возбуждаемых i-моделей выполняется операция
Пt.Ri = Пr.Ri + RП. (8.14)
В алгоритме использован стандартный датчик случайных чисел e(0<e<1) с равномерным законом распределения.
Bz - АЛГОРИТМ ФОРМИРОВАНИЯ РЕАКЦИЙ СРЕДЫ В "ОСОБЫХ" СИТУАЦИЯХ - введен с целью создания условий, удобных для исследования некоторых процессов обучения М-автомата. Используется при работе автомата в простых средах. Особой является такая ситуация, в которой одно (произвольно выбираемое экспериментатором) действие из множества возможных действий автомата считается запрещенным (разрешенным). При выполнении в особой ситуации запрещенного (разрешенного) действия производится "наказание" ("поощрение") автомата путем добавочного возбуждения i-модели НПр (Пр). Имеется возможность одновременно с наказанием или поощрением изменить местоположение автомата в среде.
Информация, содержащая описание особых ситуаций, перечисление разрешенных и запрещенных в них действий, а также указания о виде и степени наказаний и поощрений, составляется экспериментатором и является исходной для описываемого алгоритма. При работе автомата алгоритм сравнивает воспринимаемые ситуации с описаниями особых ситуаций, выполняемые в особых ситуациях действия - с разрешенными и запрещенными, а также реализует по заданным правилам операции поощрения и наказания. Подчеркнем еще раз, что информация об особых ситуациях и их свойствах ни в каком виде в М-автомат заранее не вводится. Содержательно она описывает присущие среде свойства, связанные не с отдельными объектами, а с их определенными совокупностями.
ПРОГРАММНАЯ РЕАЛИЗАЦИЯ М-АВТОМАТА. М-автомат реализован в виде программы, содержащей пять основных подпрограмм.
ПОДПРОГРАММА 1 содержит команды ввода информации и ряд подготовительных операций.
ПОДПРОГРАММА 2 состоит из алгоритмов восприятия, вычисления функции цели и некоторых вспомогательных. Кроме того, сюда включены алгоритмы, представляющие план действий и реализующие работу систем, следящих за выполнением плана. Обобщенная блок-схема этой подпрограммы приведена на рис.56, где использованы условные обозначения алгоритмов, введенные ранее. Значения переменных: chgou - счетчик шагов; avch - счетчик шагов, выполненных после отказа от построенного плана; prav - максимально допустимое значение avch. Смысл остальных переменных. ясен из схемы.
Рис.56. Обобщенная блок-схема подпрограммы 2 (восприятие и взаимодействие с планом).
ПОДПРОГРАММА 3 включает в себя все основные операции над М-сетью и содержит алгоритмы пересчета возбуждений, установления и проторения связей и ряд вспомогательных. Ее обобщенная блок-схема приведена на рис.57.
Рис.57. Обобщенная блок-схема подпрограммы 3 (пересчет возбуждений, установление и проторение связей).
ПОДПРОГРАММА 4 содержит алгоритм A.СУТ, реализующий функции системы усиления-торможения. Обобщенная блок-схема подпрограммы приведена на рис.58. В схеме использованы переменные, обозначающие: l.i - количество i-моделей в i-м блоке М-сети; b.m - количество блоков М-сети.
Рис.58. Обобщенная блок-схема подпрограммы 4 (СУТ).
ПОДПРОГРАММА 5 содержит алгоритм выбора действия и эффекторные алгоритмы. Ее блок-схема приведена на рис.59. Между подпрограммами установлены отношения, показанные на блок-схеме рис.60.
Рис.59. Обобщенная блок-схема подпрограммы 5 (выбор и реализация действий).
Рис.60. Обобщенная блок-схема программы (1-5 - номера подпрограмм).
Подпрограммы были написаны на входном языке транслятора АЛГОЛ-БЭСМ. Рабочая программа содержит около 11000(8 ) команд ЦВМ БЭСМ-6.
Машинное время, необходимое для просчета одного такта работы модели, зависит в основном от количества связей между i-моделями сети и в меньшей степени - от количества i-моделей. Для основного варианта модели оно составляет 30-50сек. Количество i-моделей и связей М-сети автомата, а также размеры всех остальных массивов числовых данных, с которыми оперирует программа, ограничены (в сумме) объемом оперативной памяти машины БЭСМ-6.
Программа позволяет произвольно разбивать М-сеть на сферы или блоки. Поэтому с помощью программы может быть реализовано множество М-автоматов, отличающихся друг от друга количеством i-моделей в различных сферах (блоках). Для обозначения разных вариантов М-автомата введем специальную символику. Перечислим еще раз блоки М-сети автомата: блок приема информации (Р); блок понятийных обобщений (П); блок памяти ситуаций (С), блок эмоций (Э), блок желаний (Ж) и блок действий (Д). Пусть правый нижний символ при букве, соответствующей названию блока, обозначает количество i-моделей в блоке, а правый верхний - количество уровней его организации. Зафиксируем порядок написания букв: Р, П, С, Э, Ж, Д. Если автомат является вырожденным, т.е. не включает в себя алгоритм А.СУТ, после буквы Д будем ставить 0. Если в автомате реализована одноуровневая СУТ, вместо 0 будем ставить 1, а если двухуровневая,- 2. Таким образом, конкретный вариант М-автомата описывается выражением типа
Рb1.a1 Пb2.a2 Сb3.a3 Эb4.a4 Жb5.a5 Дb6.a6 X (8.15)
Например, выражение Р1.45 П4.160 С2.30 Э1.10 Ж2.18 Д3.32 2 описывает М-автомат, блок приема информации которого содержит 45 i-моделей раздражителей, блок понятийных обобщений - 160 i-моделей, организованных в четыре уровня, и т.д., с двухуровневой системой усиления-торможения.
Выражение типа (8.15) будем называть формулой М-автомата.
Перейдем теперь к описанию экспериментов, проведенных с моделью двигательного поведения.
М-автомат МОД реализован в виде комплекса программ для ЦВМ БЭСМ-6. В настоящем параграфе описываются наиболее важные участки программы, а также блок-схемы, необходимые для понимания ее структуры.
При реализации М-автомата на его структуру и алгоритмы наложен ряд ограничений. Некоторые из них связаны с выбором конкретного вида характеристик i-моделей и связей. Эти ограничения зафиксированы в виде совокупности условий и неравенств, приведенных ниже. Часть ограничений вводится путем включения в алгоритм функционирования М-сети ряда вспомогательных процедур, краткое описание которых также дано в настоящем параграфе. Существенное ограничение, далее, состоит в том, что мы будем считать пренебрежимо малыми значения остаточных составляющих усиливающей и тормозной компонент связей, т.е. всегда r.(0)ij ~ ~r.(0)ij ~ 0 (см. гл.4). Введение этого ограничения обусловлено тем обстоятельством, что объем затрат машинного времени при экспериментальном исследовании модели двигательного поведения не позволяет исследовать работу М-сети в течение столь больших промежутков времени, чтобы изменения этих составляющих можно было считать существенными. С тем же обстоятельством связан и отказ от реализации в программе характеристик гипертрофии и адаптации возбудимости i-моделей. Таким образом, в рамках настоящей работы мы не будем исследовать упомянутые механизмы долговременной памяти М-сети.
ХАРАКТЕРИСТИКИ ЭЛЕМЕНТОВ М-СЕТИ. Основные характеристики i-моделей и связей между ними реализованы следующим образом.
Рис.53. Связи между i-моделями.
ХАРАКТЕРИСТИКА ПЕРЕДАЧИ СВЯЗЕЙ принята линейной, т.е. для случая, показанного на рис.53,
E.i = СУММА[j=1..n]П.j*r.ij,
~E.i = СУММА[j=1..n]П.j*~r.ij, (8.1)
ХАРАКТЕРИСТИКА ЗАТУХАНИЯ i-моделей имеет вид
zПt.i = П[t-1].i*a.i, (8.2)
где а.i - коэффициент затухания i-й i-модели, 0<=а.i<1; zПi - возбужденность i-й i-модели при условии Еt.i=~Et.i=0.
ХАРАКТЕРИСТИКА ВОЗБУЖДЕНИЯ i-моделей принята логарифмической и для i-й i-модели
vПt.i* = Kt.i * ln(Et.i), (8.3)
где Kt.i - коэффициент пропорциональности; vПt.i - возбужденность i-й i-модели при условии Пt.i=0, ~Еt.i=0.
ХАРАКТЕРИСТИКА ТОРМОЖЕНИЯ i-моделей принята линейной, так что
Kt.i = K.нi - m*~Et.i, (8.4)
где K.нi - "начальное" значение K.i, K.рi=const; m - коэффициент пропорциональности.
Каждая i-модель характеризуется порогом возбуждения O.i.
При определении величин возбуждений i-моделей сети в момент t+1 величины vПt.i и zПt.i нелинейно суммируются, так что в общем виде
Пt.i = Р = (K.нi-m*~Et.i)ln(exp(П[t-1].i*a.i/K.нi)+Et.i-O.i). (8.5)
Основываясь на нейрофизиологической аналогии (существование "верхнего порога" возбуждения нейрона), примем, что величина возбуждения i-моделей ограничена сверху некоторым постоянным, задаваемым заранее значением П.max. С целью экономии затрат машинного времени будем считать пренебрежимо малыми те возбуждения, величина которых не превосходит некоторого постоянного задаваемого заранее значения П.min. Таким образом,
П[t+1]i=
П.max при Р>П.max,
Р при П.min<=Р<=П.max,
0 при Р<П.min
Процесс определения возбужденности всех i-моделей сети с помощью формулы (8.5) будем называть пересчетом сети, а соответствующий алгоритм - алгоритмом пересчета.
Как упоминалось выше, характеристика проторения связей (4.2) может иметь различный вид для связей проторенных и непроторенных (точнее, проторяемых впервые). В исходном состоянии М-сети между отдельными i-моделями существуют заранее заданные связи, имеющие некоторую проходимость. Будем полагать, что между всеми остальными i-моделями также имеются связи, начальная проходимость которых равна нулю. При выполнении определенных условий эти связи могут проторяться. Процесс их проторения естественно называть установлением связей, а соответствующий алгоритм - алгоритмом установления.
Алгоритм установления связей между i-й и j-й i-моделями работает в том случае, если выполняется условие установления, т.е. является истинным выражение
(Пt.i>=П.u)&(Пt.j>=П.u), (8.7)
где П.u - задаваемый заранее порог.
Введем обозначение: Dt=Пt.Пр-Пt.Нпр. Пусть в момент t для i-моделей i и j выполнено условие (8.7), а также r.ij=0 и ~r.ij=0. Алгоритм установления реализует функцию (4.2), заданную в виде
rt.ij = k.0(Пt.i+Пt.j) + k.1*Dt, (8.8а)
~rt.ij = ~k.0(Пt.i+Пt.j) - ~k.1*Dt, (8.8б)
где k.0, k.1, ~k.0, ~k.1 - масштабные коэффициенты.
Если значение rt.ij (~rt.ij) оказывается меньше нуля, то оно принимается равным нулю, т.е. всегда rt.ij>=0 и ~rt.ij>=0.
ХАРАКТЕРИСТИКА ЗАТУХАНИЯ СВЯЗИ задается следующими соотношениями:
zr[t+1].ij = b*rt.ij, 0<b<=1, (8.9а)
~zr[t+1].ij = ~b*~rt.ij, 0<b<=1, (8.9б)
Где zr[t+1].ij и ~zr[t+1].ij - "затухшие" значения компонент rt.ij и ~rt.ij.
Если в момент t некоторая связь Rt.ij!=0, то характеристика проторения этой связи задается в виде
r[t+1].ij = zrt.ij + k.2*rt.ij(Пt.i+Пt.j]Dt, (8.10а)
~r[t+1].ij = ~zrt.ij + ~k.2*~rt.ij(Пt.i+Пt.j]Dt, (8.10б)
где k.2, ~k.2 - коэффициенты пропорциональности.
АЛГОРИТМЫ ФУНКЦИОНИРОВАНИЯ М-АВТОМАТА. Для удобства дальнейшего изложения введем обозначения и дадим краткое описание основных подблоков алгоритма А.
А.с - АЛГОРИТМ ПЕРЕСЧЕТА, реализующий функции (8.5).
А.R - АЛГОРИТМ УСТАНОВЛЕНИЯ СВЯЗЕЙ, реализующий функции (8.8 ) при выполнении условия (8.7).
А.p - АЛГОРИТМ ПРОТОРЕНИЯ СВЯЗЕЙ, реализующий функции (8.10).
А.СУТ - АЛГОРИТМ, РЕАЛИЗУЮЩИЙ ФУНКЦИИ СИСТЕМЫ УСИЛЕНИЯ-ТОРМОЖЕНИЯ.
A.g - АЛГОРИТМ, ВЫЧИСЛЯЮЩИЙ ФУНКЦИЮ ЦЕЛИ. Пусть в момент t М-автомат находится в вершине g.i среды и задана "целевая" вершина g.ц. Входной информацией для A.g являются сведения о g.i и g.ц. В результате работы A.g дополнительное возбуждение получает i-модель того сложного действия, выполнение которого необходимо для передвижения автомата из g.i в g.ц. Таким образом, алгоритм A.g отображает в сферу действий автомата его положение относительно цели, реализуя "функцию цели" g(g.i, g.ц).
A.V - АЛГОРИТМ ВОСПРИЯТИЯ. Входной информацией для A.V являются сведения о среде Р и местоположении автомата в данный момент. В результате работы A.V оказываются возбужденными до величины П.V i-модели раздражителей, находящихся в окрестности автомата. Совокупность возбужденных i-моделей соотнесем воспринятой ситуации S.t. Таким образом, алгоритм восприятия осуществляет отображение в сферу восприятия М-автомата ситуации, в которой последний находится.
A.D - алгоритм выбора действия. На вход A.D подается информация о распределении возбуждений в сфере действий М-сети и зафиксированные правила выбора действия. Используя эти правила, A.D либо выбирает некоторую i-модель действия, либо не выбирает никакой i-модели. Таким образом, действия могут осуществляться автоматом не на каждом такте его работы.
А.e - множество "эффекторных" алгоритмов. Каждому действию d.i из D соответствует единственный "эффекторный" алгоритм А.ei из А.e. После выбора алгоритмом A.D i-модели некоторого действия начинает работать соответствующий этому действию алгоритм А.ei, который в зависимости от вида действия может или изменить положение автомата в среде, или изменить расположение объектов, или сделать и то и другое.
Обобщенная блок-схема алгоритма А представлена на рис.54, где двойные стрелки указывают направления обмена информацией между блоками системы.
Рис.54. Обобщенная блок-схема алгоритма функционирования М-автомата.
Уточним понятие такта работы М-автомата. Будем полагать, что один такт составляют все операции, выполняемые между двумя последовательными вхождениями в блок A.D. Из рис.54 видно, что в зависимости от результатов работы A.D в такт может не включаться выполнение алгоритмов А.е, A.V, A.g.
Кроме указанных на рис. 54, в программу введен ряд вспомогательных алгоритмов, выполняющих некоторые функции, выражение которых в языке М-сети оказывается неудобным с точки зрения машинной реализации. Опишем наиболее важные из этих функций.
АСИММЕТРИЯ СВЯЗЕЙ R.ij и R.ji вводится для того, чтобы обеспечить М-автомату возможность воспроизведения последовательностей. Пусть в момент t i-модели i и j возбуждены до Пt.i и Пt.j соответственно и Пt.j>Пt.j. Для операций установления (8.8 ) и проторения (8.10) связен принято: если Пt.i<Пt.j, то
rt.ij = rt.ij + а.s(Пt.j-Пt.i) (8.11a)
и
~rt.ij = ~rt.ij + а.s(Пt.j-Пt.i), (8.11б)
здесь a.s - коэффициент асимметрии.
Очевидно, что при установлении или проторении связи Rt.ji справедливо Пt.j>Пt.i, и операции (8.11) над Rt.jt не выполняются. Получаем, таким образом, Rt.ij>Rt.ji.
Пусть в момент t М-автоматом воспринят некоторый образ и соответствующая ему i-модель k возбуждена до определенного значения П.v: Пt.k=П.V. Пусть в момент t+1 воспринят другой образ и П[t+1].i=П.V. В соответствии с (8.5) в момент t+1 получим Пt.k<П[t+1].k, и установившиеся между k и l связи окажутся асимметричными: R[t+1].kl>R[t+1].lk.
Пусть в моменты t, t+1, t+2, ..., t+n М-автомат воспринимает последовательность из n+1 неповторяющихся образов. При этом (в соответствии с (8.8 ) и (8.11)) в М-сети сформируется структура, показанная на рис.55,а, где толщина линий пропорциональна проходимости изображаемых ими связей. Если через некоторое время после момента t+n окажется возбужденной i-модель l так, что она будет выделена СУТ, то в результате пересчета будут возбуждены i-модели k и m, причем П.m>П.k, и i-модель m окажется выделенной СУТ. Далее процесс повторится и будет продолжаться до тех пор, пока СУТ не выделит все следующие за l i-модели последовательности в том порядке, в котором предъявлялись соответствующие образы ("воспроизведет" последовательность). Правильный порядок воспроизведения может быть нарушен, если некоторые i-модели последовательности получают возбуждение от других i-моделей сети (например, от i-моделей сферы оценок - если предъявлялись "эмоционально значимые" образы). Этот феномен лежит в основе формирования "редуцированных" последовательностей, включающих в себя лишь наиболее важные, "ключевые" образы и понятия.
Рис.55. Отображение временных последовательностей в структуре связей.
Описанный механизм обеспечивает также правильное воспроизведение "пересекающихся", т.е. имеющих общие элементы, последовательностей. Такая возможность обусловлена тем, что характеристика затухания (8.2) i-моделей в общем случае обеспечивает отличную от нуля возбужденность i-модели в течение n (n>1) тактов с момента ее первоначального возбуждения, так что при предъявлении некоторой последовательности первая из возбужденных i-моделей связывается не только со второй, но и с рядом последующих i-моделей, причем R.1,2 > R.1,3 > ...> R.1,n. Очевидно, n=f(а) и R.i,j = r(a,П.V), что в неявном виде задается характеристиками (8.8 ), (8.9) п (8.10), (8.11).
Поясним сказанное простым примером. Пусть в моменты t, t+1, t+2 М-автомату предъявляется последовательность образов (a, b, c), а в моменты т+1, т+2, т+3 (т>>t) - последовательность (d, b, е). После предъявления обеих последовательностей в М-сети сформируется структура, изображенная на рис.55,б, где, как и раньше, толщина линий пропорциональна проходимости соответствующих связей. Пусть в момент Т (Т>>т) получила некоторое возбуждение i-модель а. В результате пересчета возбудятся i-модели b и с, но, поскольку R.ab>R.ac, то П[Т+1].b>П[Т+1].c и СУТ выделит i-модель b. В момент Т+2 окажутся возбужденными i-модели c и e, но, поскольку c еще сохраняет возбуждение, полученное в предыдущем такте, т.е. "предвозбуждена", то П[Т+2].c>П[T+2].e. СУТ выделяет i-модель c, и последовательность (a, b, c) оказывается воспроизведенной правильно.
Подробный анализ процессов воспроизведения последовательностей М-автоматом является темой отдельного исследования. Операции (8.11) реализуются специальным алгоритмом B.as.
B.ud - АЛГОРИТМ УСКОРЕНИЯ ДЕЙСТВИЙ - задает М-автомату "установку" на выполнение действий, повышает его "двигательную активность". Из описания работы автомата, приведенного в #2 настоящей главы, можно заключить, что возможны такие режимы его функционирования (определяемые совокупностью воспринятых ситуаций, состоянием сферы оценок и т.п.), при которых в течение длительного времени не выполняются условия действия. В свободной интерпретации это означает, что автомат "слишком долго думает" перед выбором шага. Такие режимы представляют определенный интерес, так как дают материал для изучения и оценки рациональности "хода мышления" автомата. В связи с этим, однако, существенно возрастают затраты машинного времени, что затрудняет исследование собственно двигательного поведения. Следовательно, целесообразно ввести алгоритм, ускоряющий выбор действия в необходимых случаях.
Алгоритм выполняет следующие операции: 1) сравнивает ситуацию, существующую в блоке восприятия в момент t, с ситуацией, существовавшей в момент t-1; 2) определяет меру совпадения m.s обеих ситуаций так, что 0<=m.s<=9. При полном совпадении ситуаций m.s=9, при полном несовпадении - m.s=0; 3) увеличивает возбужденность i-модели "желание действовать" (П.jd) на величину D.ij:
Пt.jd = Пt.jd + D.jd = П.jd + m.s*П.d, (8.12)
где П.d - максимально возможная добавка (П.d=const); 4) запоминает ситуацию, существующую в блоке восприятия в момент t. Действие алгоритма сводится, таким образом, к следующему. Если в течение нескольких тактов М-автомат не совершает действий и, следовательно, воспринимаемая им ситуация не меняется, то возрастает величина возбуждения П.jd. Это приводит к увеличению возбуждения i-модели действий, что, в свою очередь, приближает момент выполнения условий действия. Аналогичный процесс происходит и в тех случаях, когда выполнение действия не ведет к изменению ситуации, что возможно в средах с регулярным расположением раздражителей.
В.sit - АЛГОРИТМ ФОРМИРОВАНИЯ i-МОДЕЛЕЙ СИТУАЦИЙ - обеспечивает установление адекватных связей между i-моделями раздражителей, составляющих воспринимаемую в момент t ситуацию, и одной из "резервных" i-моделей.
В момент (такт) восприятия ситуации описываемый алгоритм определяет свободную (не связанную с другими) i-модель первого уровня блока памяти ситуаций и приписывает ей определенную, задаваемую заранее возбужденность П.sit. Далее, при работе блока установления связей A.R между этой i-моделью п i-моделями раздражителей устанавливаются необходимые связи. В случае, если резерв свободных i-моделей исчерпан, алгоритм определяет среди i-моделей первого уровня блока памяти ситуаций такую i-модель, которая наиболее слабо связана с остальными, уничтожает все направленные к ней и от нее связи (устанавливая нулевое значение их проходимости) и приписывает ей возбужденность П.sit. Через каждые k (k>1 и заранее задано) тактов аналогичные операции выполняются для i-моделей второго уровня блока памяти ситуаций.
В.о - АЛГОРИТМ ЗАДЕРЖАННОГО ОБУЧЕНИЯ - обеспечивает установление адекватных связей между i-моделями ситуаций и действий. Пусть в момент t М-автомат находится в некоторой ситуации S.i и выполняет шаг, переводящий его в другую ситуацию. В этот момент в М-сети автомата имеется i-модель, соответствующая ситуации S.i. Обозначим номер этой i-модели nsit. Номер i-модели шага, выполненного в момент t, обозначим ngou. В момент t+1 описываемый алгоритм, используя запомненные значения nsit и ngou, увеличит возбужденность соответствующих i-моделей на некоторую постоянную заранее заданную величину. В результате по формулам (8.8 ) будет установлена связь R.ngou,nsit. При этом, если воспринятая в момент t+1 новая ситуация содержит фактор наказания (поощрения), то тормозной (усиливающий) компонент связи R.ngou,nsit будет преобладающим. Таким образом, в М-сети окажется зафиксированной информация о том, что "в ситуации типа nsit не следует (следует) выполнять шаг ngou".
В ряде случаев, однако, новая ситуация может не содержать факторов реакции, тогда ее "эмоциональная оценка" вырабатывается с задержкой в ходе пересчетов сети. Пусть в момент t выполнен шаг ngou, а следующий шаг выполняется в момент t+n, причем n>1. В этом случае в момент t+1 будет установлена связь R.ngou,nsit, проходимости которой отражают текущее состояние центров Пр и НПр. Последнее запоминается, и в течение последующих тактов производится сравнение значений параметра D[t+k] при k=2,3,...,n со значением D[t+1]. Если абсолютное значение разности D[t+k]-D[t+1] превосходит в некоторый момент t+k (1<k<n) заранее задаваемый порог, то, в зависимости от знака разности, изменяется значение тормозного пли усиливающего компонента связи R.ngou,nsit. После выполнения в момент t+n следующего шага описанные процессы повторяются.
В.vs - АЛГОРИТМ ОГРАНИЧЕНИЯ КОЛИЧЕСТВА СВЯЗЕЙ - введен с целью уменьшения машинного времени счета программы.
В связи с ограниченной емкостью ОЗУ существует ограничение и на количество связей между i-моделями сети, так что М-сеть не может содержать более чем s.m связей.
В то же время очевидно, что чем меньше проходимости r.ij и ~r.ij связи R.ij, тем меньшее влияние оказывает R.ij на функционирование М-сети. Поэтому представляется целесообразным введение числовой переменной gvs с тем, чтобы
при выполнении условий rt.ij<gvs и ~rt.ij<gvs описываемый алгоритм исключал связь Rt.ij из рассмотрения, т.е. выполнял операцию Rt.ij=0.
Алгоритм построен так, что количество связей М-сети в любой момент времени (st.m) не превышает максимально допустимого (s.m). Для этого в начале каждого такта величина gvs вычисляется следующим образом:
gvs[t] = gvs[t-1] + k.V/(s.m-s[t-i].m), (8.13)
где k.V - масштабный коэффициент.
Таким образом, при увеличении числа связей в М-сети в первую очередь будут исключаться из рассмотрения связи с наименьшей проходимостью.
В.н - АЛГОРИТМ РАНДОМИЗАЦИИ ВОЗБУЖДЕНИЙ - вводит случайный компонент в распределение возбуждений М-сети. Содержательно такой компонент отражает влияние на функционирование модели факторов, не учтенных при моделировании. На каждом такте работы М-автомата алгоритм формирует последовательность (длиной меньше или много меньше числа i-моделей сети) случайных чисел, с помощью которых вычисляется количество случайно возбуждаемых i-моделей, их номера (R.i) и величина добавочного возбуждения (RП). Далее для каждой из возбуждаемых i-моделей выполняется операция
Пt.Ri = Пr.Ri + RП. (8.14)
В алгоритме использован стандартный датчик случайных чисел e(0<e<1) с равномерным законом распределения.
Bz - АЛГОРИТМ ФОРМИРОВАНИЯ РЕАКЦИЙ СРЕДЫ В "ОСОБЫХ" СИТУАЦИЯХ - введен с целью создания условий, удобных для исследования некоторых процессов обучения М-автомата. Используется при работе автомата в простых средах. Особой является такая ситуация, в которой одно (произвольно выбираемое экспериментатором) действие из множества возможных действий автомата считается запрещенным (разрешенным). При выполнении в особой ситуации запрещенного (разрешенного) действия производится "наказание" ("поощрение") автомата путем добавочного возбуждения i-модели НПр (Пр). Имеется возможность одновременно с наказанием или поощрением изменить местоположение автомата в среде.
Информация, содержащая описание особых ситуаций, перечисление разрешенных и запрещенных в них действий, а также указания о виде и степени наказаний и поощрений, составляется экспериментатором и является исходной для описываемого алгоритма. При работе автомата алгоритм сравнивает воспринимаемые ситуации с описаниями особых ситуаций, выполняемые в особых ситуациях действия - с разрешенными и запрещенными, а также реализует по заданным правилам операции поощрения и наказания. Подчеркнем еще раз, что информация об особых ситуациях и их свойствах ни в каком виде в М-автомат заранее не вводится. Содержательно она описывает присущие среде свойства, связанные не с отдельными объектами, а с их определенными совокупностями.
ПРОГРАММНАЯ РЕАЛИЗАЦИЯ М-АВТОМАТА. М-автомат реализован в виде программы, содержащей пять основных подпрограмм.
ПОДПРОГРАММА 1 содержит команды ввода информации и ряд подготовительных операций.
ПОДПРОГРАММА 2 состоит из алгоритмов восприятия, вычисления функции цели и некоторых вспомогательных. Кроме того, сюда включены алгоритмы, представляющие план действий и реализующие работу систем, следящих за выполнением плана. Обобщенная блок-схема этой подпрограммы приведена на рис.56, где использованы условные обозначения алгоритмов, введенные ранее. Значения переменных: chgou - счетчик шагов; avch - счетчик шагов, выполненных после отказа от построенного плана; prav - максимально допустимое значение avch. Смысл остальных переменных. ясен из схемы.
Рис.56. Обобщенная блок-схема подпрограммы 2 (восприятие и взаимодействие с планом).
ПОДПРОГРАММА 3 включает в себя все основные операции над М-сетью и содержит алгоритмы пересчета возбуждений, установления и проторения связей и ряд вспомогательных. Ее обобщенная блок-схема приведена на рис.57.
Рис.57. Обобщенная блок-схема подпрограммы 3 (пересчет возбуждений, установление и проторение связей).
ПОДПРОГРАММА 4 содержит алгоритм A.СУТ, реализующий функции системы усиления-торможения. Обобщенная блок-схема подпрограммы приведена на рис.58. В схеме использованы переменные, обозначающие: l.i - количество i-моделей в i-м блоке М-сети; b.m - количество блоков М-сети.
Рис.58. Обобщенная блок-схема подпрограммы 4 (СУТ).
ПОДПРОГРАММА 5 содержит алгоритм выбора действия и эффекторные алгоритмы. Ее блок-схема приведена на рис.59. Между подпрограммами установлены отношения, показанные на блок-схеме рис.60.
Рис.59. Обобщенная блок-схема подпрограммы 5 (выбор и реализация действий).
Рис.60. Обобщенная блок-схема программы (1-5 - номера подпрограмм).
Подпрограммы были написаны на входном языке транслятора АЛГОЛ-БЭСМ. Рабочая программа содержит около 11000(8 ) команд ЦВМ БЭСМ-6.
Машинное время, необходимое для просчета одного такта работы модели, зависит в основном от количества связей между i-моделями сети и в меньшей степени - от количества i-моделей. Для основного варианта модели оно составляет 30-50сек. Количество i-моделей и связей М-сети автомата, а также размеры всех остальных массивов числовых данных, с которыми оперирует программа, ограничены (в сумме) объемом оперативной памяти машины БЭСМ-6.
Программа позволяет произвольно разбивать М-сеть на сферы или блоки. Поэтому с помощью программы может быть реализовано множество М-автоматов, отличающихся друг от друга количеством i-моделей в различных сферах (блоках). Для обозначения разных вариантов М-автомата введем специальную символику. Перечислим еще раз блоки М-сети автомата: блок приема информации (Р); блок понятийных обобщений (П); блок памяти ситуаций (С), блок эмоций (Э), блок желаний (Ж) и блок действий (Д). Пусть правый нижний символ при букве, соответствующей названию блока, обозначает количество i-моделей в блоке, а правый верхний - количество уровней его организации. Зафиксируем порядок написания букв: Р, П, С, Э, Ж, Д. Если автомат является вырожденным, т.е. не включает в себя алгоритм А.СУТ, после буквы Д будем ставить 0. Если в автомате реализована одноуровневая СУТ, вместо 0 будем ставить 1, а если двухуровневая,- 2. Таким образом, конкретный вариант М-автомата описывается выражением типа
Рb1.a1 Пb2.a2 Сb3.a3 Эb4.a4 Жb5.a5 Дb6.a6 X (8.15)
Например, выражение Р1.45 П4.160 С2.30 Э1.10 Ж2.18 Д3.32 2 описывает М-автомат, блок приема информации которого содержит 45 i-моделей раздражителей, блок понятийных обобщений - 160 i-моделей, организованных в четыре уровня, и т.д., с двухуровневой системой усиления-торможения.
Выражение типа (8.15) будем называть формулой М-автомата.
Перейдем теперь к описанию экспериментов, проведенных с моделью двигательного поведения.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ГЛАВА 9. ИССЛЕДОВАНИЕ ЭЛЕМЕНТАРНЫХ ПРОЦЕССОВ ОБУЧЕНИЯ
Экспериментальное исследование модели проводилось в два этапа. Первый связан с изучением поведения модели в ряде простых ситуаций-тестов. Основная задача этого этапа состояла в исследовании элементарных процессов обучения. Элементарными (на уровне описания, введенном в предыдущей главе) будем называть процессы обучения, связанные с установлением в М-сети новых связей (функции (8.8 )) и изменением проходимостей имеющихся связей (функции (8.9), (8.10)). Содержание работ сводилось к подбору значений существенных переменных в выражениях, задающих систему функций (9.33). Набор значений этих переменных определяет рабочий режим модели. Специфичным для этого этапа было то, что тестовые эксперименты проводились с простыми автоматами. Их упрощали так, что в каждом из тестов на работу автомата оказывали влияние по возможности лишь те из переменных, значения которых подбирались в данном тесте. Дополнительной задачей первого этапа исследований являлась демонстрация некоторых, интересных в практическом плане, возможностей, реализуемых простыми автоматами предложенного типа. Второй этап исследования связан с рассмотрением поведения модели в сложных средах.
Остановимся более подробно на структуре работ первого этапа. Выбор значений параметров в выражениях, задающих систему (9.33), проводился здесь различными способами. Так, оказалось возможным заимствовать некоторые значения из результатов проведенных ранее работ по исследованию М-автомата РЭМ. Для ряда параметров были определены допустимые области их значений на основе анализа ограничений, вводимых естественным образом при рассмотрении свойств соответствующих процессов. Наконец, для определения допустимых значений некоторых параметров были проведены тестовые эксперименты. Адекватность выбранных значений проверялась также путем проведения тестов, большая часть которых имела демонстрационный характер.
#1. ВЫБОР ЗНАЧЕНИЙ ПАРАМЕТРОВ ПЕРЕСЧЕТА И УСТАНОВЛЕНИЯ СВЯЗЕЙ
В результате исследования М-автомата РЭМ установлены оптимальные значения ряда параметров М-сети и обслуживающих ее алгоритмов. Некоторые из этих значений мы будем использовать в дальнейшем (табл.7).
Таблица 7
Следует отметить, что выбор значений порогов возбуждения O.i для i-моделей должен осуществляться отдельно в каждом конкретном случае. Задание O.i определяет общую логику переработки информации сетью и является одним из способов ее предорганизации. Возможности этого способа, глубоко исследованные для сетей из простых формальных нейронов, для случая рассматриваемых нами М-сетей будут продемонстрированы на конкретном примере несколько ниже.
Для того чтобы приступить к выбору параметров установления связей, рассмотрим на примере выражения (8.8а) их содержательное значение. Как указывалось ранее, установление связи между i-моделями i и j возможно в случае, когда Пt.i>0, Пt.j>0 и выполнено условие (8.7). Имея в виду это условие, сумму Пt.i+Пt.j можно назвать "разрешающим" фактором установления, поскольку выполнение неравенства
(Пt.i+Пt.j) >= 2П.н (9.1)
указывает на то, что установление связи в момент t разрешено. Соответственно, параметр k.0 определяет "базовое" значение проходимости устанавливающейся связи, т.е. значение, зависящее только от "разрешающего" фактора и не скорректированное "эмоциональным" фактором происходящего акта обучения. Упомянутая коррекция задается значением параметра k.1. Очевидно, отношение k.1/k.0 определяет значимость "эмоционального" фактора в обучении. Так, при постоянных значениях возбужденностей i-моделей увеличение k.1 повышает "чувствительность" системы к поощрениям. Аналогичные рассуждения могут быть проведены относительно выражения (8.8б).
Пусть
k.0 = A*k.1,
~k.0 = B*~k.1. (9.2)
Выбирая различные значения A и B, будем задавать конструируемой системе различные "характерологические" свойства. С целью упрощения дальнейших расчетов примем
A = B = 1. (9.3)
Тогда с учетом (9.3) функция (8.8 ) может быть записана в виде
rt.ij = k.0(Пt.i+Пt.j+Dt), (9.4а)
rt.ij = k.0(Пt.i+Пt.j-Dt). (9.4б)
Потребуем, чтобы процесс установления удовлетворял следующему условию. Если в момент t возбужденности Пt.i=П.ср, Пt.j=П.ср и Dt=0 и если в момент t+1 возбужденность П[t+1].j=П.ср , то после пересчета по установившейся в момент t связи Rt.ij должно выполняться условие П[t+1].i ~ П.ср .
Интуитивным обоснованием этого условия являются такие соображения. В процессе установления в М-сети возникают связи, содержащие усиливающие и тормозные компоненты. Дальнейшее обучение сети связано с изменением этих компонентов в ходе их проторения и затухания. Поэтому вновь установившаяся связь R.ij должна допускать в будущем как увеличение, так и уменьшение своих компонентов. Иными словами, только что установившаяся связь должна быть "средней" в том смысле, что при среднем возбуждении i-модели j она должна обеспечивать близкое к среднему возбуждение i-модели i. Близкими к среднему будем считать значения П.i, лежащие в интервале 0.7*П.ср <= П.i <= 1.3*П.ср.
Определим теперь значения k.0 и ~k.0, обеспечивающие выполнение введенного условия. Используя данные табл.7, примем: k.н=40; m=0.2; O=0; а=0; П.ср=100. Подставляя эти значения в выражение (8.5) и имея в виду запись (9.4), получим выражения для верхней и нижней границ области допустимых значений параметров k.0 и k.0: для верхней границы
k.0=exp(130/16E4/~k.0)-9.9, (9.5а)
для нижней границы
k.0=exp(70/16E4/~k.0)-9.9. (9.5б)
Найденная область схематически изображена на рис.61,а.
Рис.61. К определению допустимых значений параметров установления.
Введем теперь в рассмотрение влияние "эмоционального" фактора обучения, которому в функции установления соответствует переменная D.t. Легко видеть, что при D.t>0 возбужденность П[t+1].i, равная, например, 70, может быть получена при меньшем значении k.0 и большем значении ~k.0, чем это имело бы место при D.t=0. Это соответствует сдвигу области допустимых значений параметров на рис.61,а вправо. Аналогично, при D.t<0 область сдвигается влево. На основании опытов с необучаемой моделью можно полагать, что значение D в ходе работы М-сети изменяется в диапазоне -50<=D<=50. Не составляет труда получить выражение типа (9.5) для границ области допустимых параметров в крайних точках этого диапазона. Схема расположения областей в этом случае представлена на рис.61,б, где подобласть с двойной штриховкой и определяет совокупность таких значений параметров, которые при любом D (внутри заданного интервала) обеспечивают установление средней (в указанном выше смысле) связи. Упомянутая подобласть и составляет теперь область допустимых значений параметров k.0 и ~k.0. Еще одно ограничение на эту область накладывается требованиями, предъявляемыми к величине проходимостей связей r.ij, ~r.ij (см. табл.7). Потребуем, чтобы при D=0 выполнялось неравенство 0.1<=r<=0.9. Тогда из (9.4) можно определить минимально и максимально допустимые значения k.0 и ~k.0 и соответственно ограничить область их значений (пунктир на рис.61,б). Окончательный вид области допустимых значений параметров k.0 и ~k.0 приведен на рис.62. В качестве рабочей точки для дальнейших экспериментов выбрана точка A, т.е. k.0=k.1=1.5E-3; ~k.0=~k.1=2.5E-3.
Рис.62. Область допустимых значений параметров установления связей (А - рабочие значения параметров).
Реализация функции установления связей в виде подблока A.R алгоритма A обеспечивает определенные возможности обучения М-автомата. Некоторые из них будут продемонстрированы в следующем параграфе.
#2. ДЕМОНСТРАЦИОННЫЕ ТЕСТЫ
Необходимо убедиться в том, что выбранные значения параметров установления могут обеспечить решение автоматом определенных задач. Поскольку установление связей является лишь одним из возможных механизмов обучения, рассмотрим лишь такие задачи, для решения которых живые организмы используют (предположительно) способность к установлению временных связей между раздражителями различного рода. Психология и зоопсихология могут предложить большое количество таких задач. Мы рассмотрим только некоторые.
КЛАССИЧЕСКОЕ ОБУСЛОВЛИВАНИЕ. В настоящее время известно большое количество моделей условного рефлекса. Наши интересы в этой области ограничены принятой ранее постановкой задачи: из всего множества процессов и явлений обусловливания мы можем рассматривать лишь те, которые непосредственно связаны с проявлением двигательного поведения в средах заданного типа. (Мы не претендуем на модельное описание физиологических и других процессов, изученных в лабораторных условиях). Сопоставление отдельных важных процессов и экспериментальных процедур обусловливания с процессами, реализуемыми в М-автомате, показывает, что по крайней мере некоторые из основных процессов обусловливания естественно интерпретируются в терминах, описывающих структуру и функционирование М-автоматов. Можно полагать, что язык М-сетей послужит хорошей основой для построения более полных моделей обусловливания. Работы в этом направлении могут составить самостоятельную область исследований.
Рассмотрим теперь конкретный М-автомат, способный формировать условные реакции, и его работу при решении задачи "идентификации восприятий".
Задача "идентификации восприятия" возникает в тех случаях, когда организм воспринимает некоторое раздражение, но не обладает информацией относительно его биологической важности (раздражитель "незнаком"). При этом оказывается невозможным и выбор реакции на раздражение. Определение "значения" такого раздражителя и составляет содержание задачи идентификации. Человек может ставить и решать эту задачу на сознательной уровне. Животных побуждает к ее решению ориентировочный рефлекс. Решение может достигаться как путем формирования новых понятий и представлений (у человека), так и путем прямого связывания образа нового раздражителя с образами других, известных ранее. В последнем случае новый раздражитель может приобретать сигнальное значение. Классический условный рефлекс представляет пример решения задачи идентификации путем связывания ранее индифферентного раздражителя с другим, имеющим безусловное значение. Здесь мы ограничимся рассмотрением весьма простого варианта задачи.
Пусть в простой среде имеются объекты из класса "пища" и пусть в соответствующих этим объектам ячейках среды задана отличная от нуля интенсивность параметра "запах". В среде находится М-автомат, способный к осуществлению действий-шагов. Предположим, что объект "пища" известен автомату в том смысле, что восприятие такого объекта вызывает реакцию приближения к нему. Это означает, что между i-моделями объекта и действий-шагов есть соответствующие связи. Предположим также, что автомат может воспринять "запах", но "не знает" значения этого параметра, т.е. i-модели запаха не имеют связей с другими i-моделями сети. Пусть в течение некоторого времени Т автомат перемещается в среде и воспринимает как объекты "пища", так и связанный с ними "запах". Будем полагать, что автомат решает задачу идентификации параметра "запах", если по прошествии времени Т этот параметр приобретает для него сигнальное значение, т.е. восприятие "запаха" вызывает выполнение автоматом реакции приближения (соответствующих шагов).
Был проведен эксперимент с М-автоматом, который описывался формулой Р1.18 Д1.9 1. В дополнение к установленным ранее значениям параметров было принято: О=1, a=0. Структура автомата приведена на рис.63. В исходном состоянии связи, изображенные на рисунке штриховыми линиями, отсутствовали. Здесь и в дальнейшем при изображении структуры автоматов используется следующий упрощающий прием. Существующие в рассматриваемой среде объекты и параметры могут быть восприняты автоматом в девяти различных (относительно него) положениях. Каждый объект и параметр среды в рецепторной сфере автомата будем представлять девятью i-моделями, каждая из которых соответствует объекту, воспринимаемому из определенной ячейки окрестности. Пусть автомат находится в ячейке с координатами (0,0). Зафиксируем порядок перечисления ячеек окрестности: (0,-1), (-1,-1), (-1,0), (-1,1), (0,1), (1,1), (1,0), (1,-1), (0,0). При графическом изображении структуры автомата i-модели объекта, воспринимаемого из различных ячеек окрестности, будем располагать по горизонтали или вертикали так, чтобы их следование слева направо или сверху вниз соответствовало порядку перечисления ячеек окрестности. Так, на рис.63 i-модель k соответствует объекту "пища", воспринимаемому из ячейки с координатами (-1,1).
Рис.63. М-сеть автомата.
Автомат, структура которого изображена на рис.63, помещался в ячейку А среды, изображенной на рис.64. Вспомогательной i-модели р задавалось некоторое постоянное возбуждение, что обеспечивало передвижение автомата в направлении, указанном стрелками, до ячейки В. На рисунке отмечены крестиками ячейки, в которых интенсивность параметра "запах" отличалась от нуля. Видно, что в ряде ячеек среды осуществлялось одновременное восприятие как "пищи", так и "запаха", условие установления (8.7) оказывалось выполненным и в соответствии с правилами (8.8 ) между i-моделями устанавливались связи, изображенные на рис.63 пунктиром. Если теперь в какой-либо ячейке окрестности автомата, например (-1,1), будет воспринят "запах", то возбуждение соответствующей i-модели l по установившейся связи вызовет возбуждение i-модели "пища" k, а последнее, в свою очередь, обеспечит выполнение шага, реализующего реакцию приближения к ячейке, содержащей "запах". Таким образом, задача идентификации параметра оказывается решенной.
Рис.64. Обучающая среда.
Адекватность реакций обученного М-автомата иллюстрируется его поведением в среде, изображенной на рис.65, где сплошные линии соединяют ячейки с одинаковой интенсивностью параметра "запах", указанной в разрывах линий. Стрелки обозначают шаги автомата, помещенного первоначально в ячейку А. Видно, что автомат быстро достигает области с максимальным значением параметра и далее выполняет в ней случайные блуждания. Вспомогательная i-модель р в этом эксперименте не возбуждалась.
Рис.65. Контрольный эксперимент. Поиск экстремального значения параметра.
ЗАДАЧА СЛУЧАЙНОГО ПОИСКА. Задача случайного поиска методом "проб и ошибок" возникает в ситуациях, где возможно некоторое множество априорно равноценных реакций, и состоит в нахождении реакций, наилучших в некотором заранее определенном смысле.
Экспериментальная ситуация строилась следующим образом. М-автомат помещался в ячейку А среды, изображенной на рис.66, где знаками () и /\ отмечены различные объекты из класса "пища". Окрестность А представляла собой "особую" (см. #3, гл.8 ) ситуацию, единственным разрешенным действием которой являлось выполнение шага, отмеченного на рисунке двойной стрелкой. После выполнения любого шага автомат возвращался в исходную ячейку. Объекты, имеющиеся в среде, были "знакомы" автомату - между их i-моделями и i-моделями действий-шагов задавались связи. Информация о том, какой шаг является разрешенным, в автомат не вводилась. Предполагалось, что после выполнения ряда пробных шагов автомат "обучится" и будет многократно выполнять только разрешенное действие.
Рис.66. Обучающая среда.
Эксперимент проводился с М-автоматом, структура которого изображена на рис.67. Автомат описывается формулой Р1.18 С1.4 Э1.2 Д1.9 1. В дополнение к установленным ранее значениям параметров было принято: О=1; a=0.5. В исходном состоянии связи, изображенные на рисунке пунктиром, отсутствовали. После первого восприятия ситуации "резервный" элемент a сферы ПС становился i-моделью этой ситуации (алгоритм B.sit). Далее автомат выполнял некоторый шаг. В случае, если шаг не был разрешенным, возбуждалась i-модель НПр (алгоритм B.z) и между i-моделями ситуации и выполненного шага устанавливалась связь (алгоритм B.o) с преобладающим значением тормозной компоненты (функция (8.8 )). При повторном восприятии ситуации возбуждалась ее i-модель и, благодаря установившейся связи, возбуждение i-модели неразрешенного шага тормозилось. СУТ, следовательно, выбирала другой шаг, и весь процесс повторялся. В случае, если выполнялся разрешенный шаг, между его i-моделью и i-моделью ситуации устанавливалась связь с преобладающим значением усиливающей компоненты. Это обеспечивало при повторных восприятиях ситуации дополнительное возбуждение i-модели разрешенного шага и, следовательно, постоянное его выполнение. Результаты эксперимента графически изображены на рис.68, где показано изменение во времени возбужденностей i-моделей автомата. Графики иллюстрируют приведенное выше качественное описание процесса обучения.
Рис.67. М-сеть автомата.
Рис.68 Внутренние реакции М-автомата в ходе обучения.
Следует остановиться на рассмотрении двух особенностей поведения автомата, обнаруженных в ходе эксперимента. Первая из них состоит в том, что последовательность пробных действий в ходе поиска, вообще говоря, не является случайной. Анализ работы автомата показывает, что вид этой последовательности определяется (при заданной системе связей в М-сети) структурой ситуации, в которой находится автомат. Это соответствует и интуитивному представлению о разумности поведения: в незнакомой ситуации человек или животное испытывает прежде всего то действие, которое почему-либо представляется "естественным", "напрашивается" и т.п. Смысл такого рода терминов может быть несколько уточнен при установлении аналогий между поведением живых организмов и автоматов описываемого типа.
Вторая особенность поведения М-автомата состоит в следующем. Из рис.68 видно, что графики возбуждения i-моделей Пр и НПр представляют собой гладкие кривые, в то время как возбуждение этих i-моделей увеличивалось алгоритмом B.z дискретно, в каждый момент времени на постоянную величину. На содержательном уровне это означает, что автомат "субъективно искажает" значения предъявляемых ему поощрений и наказаний или, точнее, формирует внутреннее представление поощрения и наказания, которое не всегда совпадает с реальным значением этих факторов. Анализ работы алгоритма показал, что степень и вид "субъективного искажения" поощрений и наказаний определяются значением коэффициента затухания a в функции пересчета (8.5). Рассмотрим это явление в общем виде. Пусть автомату в течение n тактов предъявляется фактор наказания. Это означает, что в каждый момент дискретного времени реализуется операция Пt.НПр=Пt.НПр+V, где V - величина наказания. Тогда возбужденность i-моделей НПр будет изменяться во времени (с учетом работы алгоритма А) следующим образом (табл.8 ):
Таблица 8
Пусть n достаточно велико. Обозначим Пn.НПр=V.эф . Тогда
V.эф = V(a**n + a**(n-1)" + ... + a).
Выражение в скобках правой части есть степенной ряд, следовательно,
V.эф = V*a/(1-a).
Таким образом, при непрерывном предъявлении автомату наказания V эффективная ("субъективная") величина наказания стремится к V.эф. Динамика изменения эффективной величины наказания при различных a иллюстрируется графиками на рис.69. С помощью выражения для V.эф можно описать также изменения "эмоционального" фактора обучения Dt при смене характера подкрепления (появление поощрения после наказания и наоборот). В качестве примера на рис.69 приведены кривые (штриховые линии) изменения величин П.Пр, П.НПр и D в случае, когда после ряда наказаний автомат начинает получать поощрения. Момент изменения характера подкреплений отмечен на оси времени стрелкой. Видно, что поощрение "воспринимается" автоматом не сразу: в первый момент D мало и лишь со временем достигает значения, соответствующего реальной величине поощрения. Длительность этого процесса определяется "предысторией" автомата: чем меньше наказаний получил автомат до момента смены характера подкреплений, тем большим оказывается начальное значение D (точки A, A', А'' на штрихпунктирной кривой). Описанные процессы соответствуют некоторым интуитивным представлениям о динамике эмоциональных состояний.
Рис.69. Изменения эффективной величины наказания.
ЗАДАЧА ПАРАЛЛЕЛЬНОГО ОБУЧЕНИЯ. Эта задача возникает в случаях, когда поиск правильных решений ведется для n (n>1) ситуаций и ситуации предъявляются неупорядоченно во времени. В этих условиях процесс обучения может быть затруднен или нарушен, поскольку на выбор реакции в любой из ситуаций могут влиять результаты проб, выполненных в остальных n-1 ситуациях. Эксперимент строился следующим образом. Автомат помещался в ячейку А среды, изображенной на рис.70. Среда содержала четыре "особых" ситуации - A, B, C и E (изображены на рисунке отдельно). После выполнения пробы в одной из этих ситуаций с помощью алгоритма B.z автомат перемещался в другую ситуацию. Перемещения осуществлялись по схеме A->C->Е->B->А. Разрешенные шаги в каждой из ситуаций указаны на рис.70 стрелками. При выполнении разрешенного шага возбуждалась i-модель Пр, неразрешенного - НПр. Основное обучение автомата проводилось на участке среды L, разделенном на одинаковые "классы" I и II. Начиная поиск в ячейке А, лежащей в области I класса, автомат перемещался во II класс после выполнения первой удачной пробы. Перемещение осуществлялось в соответствии с приведенной схемой. После выполнения удачной пробы во II классе автомат помещался последовательно в ситуации E, B, A, C зоны Т среды ("экзамен"). Если все действия выполнялись правильно, обучение считалось оконченным. Если же в какой-либо ситуации зоны Т выполнялось неразрешенное действие, автомат возвращался в подобную ситуацию I класса. Таким образом, чтобы выполнить разрешенные действия во всех ситуациях зоны Т, автомат должен решить задачу параллельного обучения в четырех ситуациях.
Рис.70. Обучающая среда.
Эксперименты проводились с автоматом, структура которого изображена на рис.67. Результаты эксперимента приведены на схеме рис.71, где одинарные стрелки соответствуют шагам, выполненным автоматом в последовательные моменты времени, а двойные - человеком (первые правильные решения для каждой ситуации обведены). Видно, что задача решена автоматом за 30 проб.
Рис.71. Поиск решения автоматом и человеком.
Представляет интерес сравнение поведения автомата с поведением людей при решении аналогичной задачи. Условия проведенного нами психологического эксперимента полностью моделировали условия эксперимента с автоматом. Испытуемым предъявлялись карты, соответствующие ситуациям A, B, C и E. Требовалось для каждой ситуации найти единственную допустимую реакцию, состоящую в "нажимании" одной из восьми условных кнопок, изображение которых находилось в поле зрения испытуемых. Результаты проб сообщались испытуемым словами "правильно" и "неправильно". Порядок предъявления карт-ситуаций соответствовал схеме перемещения автомата в среде рис.70. Эксперимент проводился с группой из 10 взрослых испытуемых. Задача была решена всеми испытуемыми. Среднее по группе количество проб составило 49.2, минимальное количество - 28, максимальное - 96. В качестве примера на рис.71 двойными стрелками изображены реакции испытуемого Т. Из эксперимента видно, что поведение автомата при решении задачи параллельного обучения входит в класс поведений людей-испытуемых при решении ими аналогичной задачи. Следует отметить, что в тех случаях, когда испытуемые затрачивали для решения задачи большое число проб, наблюдались либо нарушения инструкции (например, попытки обнаружить закономерную связь между номерами ситуаций и правильных реакций), либо феномен забывания уже найденных правильных реакций. Эффект затягивания обучения легко достигается в автомате как увеличением амплитуды помех (случайных возбуждений) так и введением операторов затухания связей.
"ПОРОГОВАЯ ЛОГИКА" В М-СЕТИ. Рассмотрение возможностей предпрограммирования М-автоматов путем задания параметра О (см. функцию (8.5)) целесообразно провести в данном разделе, поскольку оно связано в основном с проведением специального демонстрационного теста.
Придавая определенные значения параметрам М-сети (в частности, для всех i a.i=0, K.нi>=40, П.max=1, П.min=0, обучение связей отсутствует), можно привести ее к виду, аналогичному сетям из формальных нейронов. Показано, что при соответствующем подборе порогов и конфигурации связей сеть из формальных нейронов в состоянии реализовать любую систему логических высказываний. По аналогии можно предположить, что подобное утверждение приложимо и к М-сетям. Спецификой последних является то, что требования к их организации могут быть сформулированы на содержательном уровне, т.е. в конкретном языке решаемой задачи. Продемонстрируем это на примере.
Рис.72. Обучающая среда.
Пусть автомат расположен в ячейке А среды, изображенной на рис.72. Участок F среды содержит раздражители 1 и 2 группы "пища". Участок N не содержит никаких раздражителей. Пусть среда продолжена от места обрыва на рисунке сколь угодно далеко, причем участки F п N чередуются. Автомат передвигается из ячейки А, постоянно выполняя действие-шаг (->). Участок F может быть пройден им за 3 шага, участок N - за n шагов. Пусть автомат "ощущает" голод, т.е. существует одноименная i-модель, возбуждение которой после каждого шага увеличивается на постоянную величину d. Кроме действий-шагов автомат может выполнять действия "есть" и "нести". Предполагается, что "переживание" голода вызывает чувство "неприятно", т.е. возбуждается i-модель НПр. Необходимо построить автомат так, чтобы его поведение было оптимальным, т.е. сумма возбуждений НПр за время прохождения каждой пары участков F и N была минимальной. Из интуитивных соображений ясно, что автомат должен полностью использовать "ресурсы среды", т.е. "съедать" обе "пищи", находящиеся в каждом из участков F. Следовательно, "пища 1" должна быть "съедена" в той ячейке, где она расположена, а "пища 2" перенесена в участок N и "съедена" после выполнения t шагов от места расположения "пищи 1". Учитывая линейный характер зависимости возбужденности i-модели "голод" от числа шагов, запишем выражение для суммы возбуждений НПр (СУММА.НПр):
1/2*t**2*d - 1/2(n+2-t)**2*d = СУММА.HПр, (9.6)
или после преобразований
t**2 - (n+2)t = СУММА.НПр/d - (n+2)/2. (9.7)
Правая часть равенства минимальна при значении t, обращающем в нуль первую производную левой части, отсюда оптимальное значение t.opt числа шагов между последовательными выполнениями действия "есть" определяется как t.opt=(n+2)/2.
Таким образом, оптимальность любого варианта поведения автомата может быть оценена по значению критерия
г = |t-t.opt|. (9.8 )
При г=0 поведение оптимально.
Рис.73. М-сеть автомата.
Исследовался автомат, структура которого изображена на рис.73. Формула автомата: Р1.9 Э1.2 Ж1.2 Д1.11; р - вспомогательная, постоянно возбужденная i-модель. В сферу желаний введена i-модель "жадность", возбуждение которой является интегральной по времени оценкой "переживания"
голода. Проходимости всех связей: r.ij=1, ~r.ij=0. Обучение отсутствует. Параметры i-моделей приведены в табл.9. Автомат помещался в среду с n=23 и вел себя следующим образом. Первый участок F автомат прошел, не выполнив действий "есть" или "нести", поскольку i-модель "голод" была возбуждена слабо. Во втором участке F была "съедена" "пища 1". В третьем участке F также была "съедена" "пища 1" и перенесена в участок N "пища 2", однако значение г превысило 12, что указывало на неудачный выбор параметров. Оптимизация автомата проводилась путем подбора значения параметра d, что эквивалентно изменению порога i-моделей "есть" и "нести". Полученная экспериментальная зависимость приведена на рис.74. Настройку автомата можно провести также путем изменения порога i-модели "жадность". В последнем случае изменяется и длина начального периода обучения. Таким образом, задание порогов является удобным способом предварительной организации "внутренней логики" переработки информации М-автоматов.
Таблица 9
Рис.74. Влияние величины порогов на поведение М-автомата.
Экспериментальное исследование модели проводилось в два этапа. Первый связан с изучением поведения модели в ряде простых ситуаций-тестов. Основная задача этого этапа состояла в исследовании элементарных процессов обучения. Элементарными (на уровне описания, введенном в предыдущей главе) будем называть процессы обучения, связанные с установлением в М-сети новых связей (функции (8.8 )) и изменением проходимостей имеющихся связей (функции (8.9), (8.10)). Содержание работ сводилось к подбору значений существенных переменных в выражениях, задающих систему функций (9.33). Набор значений этих переменных определяет рабочий режим модели. Специфичным для этого этапа было то, что тестовые эксперименты проводились с простыми автоматами. Их упрощали так, что в каждом из тестов на работу автомата оказывали влияние по возможности лишь те из переменных, значения которых подбирались в данном тесте. Дополнительной задачей первого этапа исследований являлась демонстрация некоторых, интересных в практическом плане, возможностей, реализуемых простыми автоматами предложенного типа. Второй этап исследования связан с рассмотрением поведения модели в сложных средах.
Остановимся более подробно на структуре работ первого этапа. Выбор значений параметров в выражениях, задающих систему (9.33), проводился здесь различными способами. Так, оказалось возможным заимствовать некоторые значения из результатов проведенных ранее работ по исследованию М-автомата РЭМ. Для ряда параметров были определены допустимые области их значений на основе анализа ограничений, вводимых естественным образом при рассмотрении свойств соответствующих процессов. Наконец, для определения допустимых значений некоторых параметров были проведены тестовые эксперименты. Адекватность выбранных значений проверялась также путем проведения тестов, большая часть которых имела демонстрационный характер.
#1. ВЫБОР ЗНАЧЕНИЙ ПАРАМЕТРОВ ПЕРЕСЧЕТА И УСТАНОВЛЕНИЯ СВЯЗЕЙ
В результате исследования М-автомата РЭМ установлены оптимальные значения ряда параметров М-сети и обслуживающих ее алгоритмов. Некоторые из этих значений мы будем использовать в дальнейшем (табл.7).
Таблица 7
Следует отметить, что выбор значений порогов возбуждения O.i для i-моделей должен осуществляться отдельно в каждом конкретном случае. Задание O.i определяет общую логику переработки информации сетью и является одним из способов ее предорганизации. Возможности этого способа, глубоко исследованные для сетей из простых формальных нейронов, для случая рассматриваемых нами М-сетей будут продемонстрированы на конкретном примере несколько ниже.
Для того чтобы приступить к выбору параметров установления связей, рассмотрим на примере выражения (8.8а) их содержательное значение. Как указывалось ранее, установление связи между i-моделями i и j возможно в случае, когда Пt.i>0, Пt.j>0 и выполнено условие (8.7). Имея в виду это условие, сумму Пt.i+Пt.j можно назвать "разрешающим" фактором установления, поскольку выполнение неравенства
(Пt.i+Пt.j) >= 2П.н (9.1)
указывает на то, что установление связи в момент t разрешено. Соответственно, параметр k.0 определяет "базовое" значение проходимости устанавливающейся связи, т.е. значение, зависящее только от "разрешающего" фактора и не скорректированное "эмоциональным" фактором происходящего акта обучения. Упомянутая коррекция задается значением параметра k.1. Очевидно, отношение k.1/k.0 определяет значимость "эмоционального" фактора в обучении. Так, при постоянных значениях возбужденностей i-моделей увеличение k.1 повышает "чувствительность" системы к поощрениям. Аналогичные рассуждения могут быть проведены относительно выражения (8.8б).
Пусть
k.0 = A*k.1,
~k.0 = B*~k.1. (9.2)
Выбирая различные значения A и B, будем задавать конструируемой системе различные "характерологические" свойства. С целью упрощения дальнейших расчетов примем
A = B = 1. (9.3)
Тогда с учетом (9.3) функция (8.8 ) может быть записана в виде
rt.ij = k.0(Пt.i+Пt.j+Dt), (9.4а)
rt.ij = k.0(Пt.i+Пt.j-Dt). (9.4б)
Потребуем, чтобы процесс установления удовлетворял следующему условию. Если в момент t возбужденности Пt.i=П.ср, Пt.j=П.ср и Dt=0 и если в момент t+1 возбужденность П[t+1].j=П.ср , то после пересчета по установившейся в момент t связи Rt.ij должно выполняться условие П[t+1].i ~ П.ср .
Интуитивным обоснованием этого условия являются такие соображения. В процессе установления в М-сети возникают связи, содержащие усиливающие и тормозные компоненты. Дальнейшее обучение сети связано с изменением этих компонентов в ходе их проторения и затухания. Поэтому вновь установившаяся связь R.ij должна допускать в будущем как увеличение, так и уменьшение своих компонентов. Иными словами, только что установившаяся связь должна быть "средней" в том смысле, что при среднем возбуждении i-модели j она должна обеспечивать близкое к среднему возбуждение i-модели i. Близкими к среднему будем считать значения П.i, лежащие в интервале 0.7*П.ср <= П.i <= 1.3*П.ср.
Определим теперь значения k.0 и ~k.0, обеспечивающие выполнение введенного условия. Используя данные табл.7, примем: k.н=40; m=0.2; O=0; а=0; П.ср=100. Подставляя эти значения в выражение (8.5) и имея в виду запись (9.4), получим выражения для верхней и нижней границ области допустимых значений параметров k.0 и k.0: для верхней границы
k.0=exp(130/16E4/~k.0)-9.9, (9.5а)
для нижней границы
k.0=exp(70/16E4/~k.0)-9.9. (9.5б)
Найденная область схематически изображена на рис.61,а.
Рис.61. К определению допустимых значений параметров установления.
Введем теперь в рассмотрение влияние "эмоционального" фактора обучения, которому в функции установления соответствует переменная D.t. Легко видеть, что при D.t>0 возбужденность П[t+1].i, равная, например, 70, может быть получена при меньшем значении k.0 и большем значении ~k.0, чем это имело бы место при D.t=0. Это соответствует сдвигу области допустимых значений параметров на рис.61,а вправо. Аналогично, при D.t<0 область сдвигается влево. На основании опытов с необучаемой моделью можно полагать, что значение D в ходе работы М-сети изменяется в диапазоне -50<=D<=50. Не составляет труда получить выражение типа (9.5) для границ области допустимых параметров в крайних точках этого диапазона. Схема расположения областей в этом случае представлена на рис.61,б, где подобласть с двойной штриховкой и определяет совокупность таких значений параметров, которые при любом D (внутри заданного интервала) обеспечивают установление средней (в указанном выше смысле) связи. Упомянутая подобласть и составляет теперь область допустимых значений параметров k.0 и ~k.0. Еще одно ограничение на эту область накладывается требованиями, предъявляемыми к величине проходимостей связей r.ij, ~r.ij (см. табл.7). Потребуем, чтобы при D=0 выполнялось неравенство 0.1<=r<=0.9. Тогда из (9.4) можно определить минимально и максимально допустимые значения k.0 и ~k.0 и соответственно ограничить область их значений (пунктир на рис.61,б). Окончательный вид области допустимых значений параметров k.0 и ~k.0 приведен на рис.62. В качестве рабочей точки для дальнейших экспериментов выбрана точка A, т.е. k.0=k.1=1.5E-3; ~k.0=~k.1=2.5E-3.
Рис.62. Область допустимых значений параметров установления связей (А - рабочие значения параметров).
Реализация функции установления связей в виде подблока A.R алгоритма A обеспечивает определенные возможности обучения М-автомата. Некоторые из них будут продемонстрированы в следующем параграфе.
#2. ДЕМОНСТРАЦИОННЫЕ ТЕСТЫ
Необходимо убедиться в том, что выбранные значения параметров установления могут обеспечить решение автоматом определенных задач. Поскольку установление связей является лишь одним из возможных механизмов обучения, рассмотрим лишь такие задачи, для решения которых живые организмы используют (предположительно) способность к установлению временных связей между раздражителями различного рода. Психология и зоопсихология могут предложить большое количество таких задач. Мы рассмотрим только некоторые.
КЛАССИЧЕСКОЕ ОБУСЛОВЛИВАНИЕ. В настоящее время известно большое количество моделей условного рефлекса. Наши интересы в этой области ограничены принятой ранее постановкой задачи: из всего множества процессов и явлений обусловливания мы можем рассматривать лишь те, которые непосредственно связаны с проявлением двигательного поведения в средах заданного типа. (Мы не претендуем на модельное описание физиологических и других процессов, изученных в лабораторных условиях). Сопоставление отдельных важных процессов и экспериментальных процедур обусловливания с процессами, реализуемыми в М-автомате, показывает, что по крайней мере некоторые из основных процессов обусловливания естественно интерпретируются в терминах, описывающих структуру и функционирование М-автоматов. Можно полагать, что язык М-сетей послужит хорошей основой для построения более полных моделей обусловливания. Работы в этом направлении могут составить самостоятельную область исследований.
Рассмотрим теперь конкретный М-автомат, способный формировать условные реакции, и его работу при решении задачи "идентификации восприятий".
Задача "идентификации восприятия" возникает в тех случаях, когда организм воспринимает некоторое раздражение, но не обладает информацией относительно его биологической важности (раздражитель "незнаком"). При этом оказывается невозможным и выбор реакции на раздражение. Определение "значения" такого раздражителя и составляет содержание задачи идентификации. Человек может ставить и решать эту задачу на сознательной уровне. Животных побуждает к ее решению ориентировочный рефлекс. Решение может достигаться как путем формирования новых понятий и представлений (у человека), так и путем прямого связывания образа нового раздражителя с образами других, известных ранее. В последнем случае новый раздражитель может приобретать сигнальное значение. Классический условный рефлекс представляет пример решения задачи идентификации путем связывания ранее индифферентного раздражителя с другим, имеющим безусловное значение. Здесь мы ограничимся рассмотрением весьма простого варианта задачи.
Пусть в простой среде имеются объекты из класса "пища" и пусть в соответствующих этим объектам ячейках среды задана отличная от нуля интенсивность параметра "запах". В среде находится М-автомат, способный к осуществлению действий-шагов. Предположим, что объект "пища" известен автомату в том смысле, что восприятие такого объекта вызывает реакцию приближения к нему. Это означает, что между i-моделями объекта и действий-шагов есть соответствующие связи. Предположим также, что автомат может воспринять "запах", но "не знает" значения этого параметра, т.е. i-модели запаха не имеют связей с другими i-моделями сети. Пусть в течение некоторого времени Т автомат перемещается в среде и воспринимает как объекты "пища", так и связанный с ними "запах". Будем полагать, что автомат решает задачу идентификации параметра "запах", если по прошествии времени Т этот параметр приобретает для него сигнальное значение, т.е. восприятие "запаха" вызывает выполнение автоматом реакции приближения (соответствующих шагов).
Был проведен эксперимент с М-автоматом, который описывался формулой Р1.18 Д1.9 1. В дополнение к установленным ранее значениям параметров было принято: О=1, a=0. Структура автомата приведена на рис.63. В исходном состоянии связи, изображенные на рисунке штриховыми линиями, отсутствовали. Здесь и в дальнейшем при изображении структуры автоматов используется следующий упрощающий прием. Существующие в рассматриваемой среде объекты и параметры могут быть восприняты автоматом в девяти различных (относительно него) положениях. Каждый объект и параметр среды в рецепторной сфере автомата будем представлять девятью i-моделями, каждая из которых соответствует объекту, воспринимаемому из определенной ячейки окрестности. Пусть автомат находится в ячейке с координатами (0,0). Зафиксируем порядок перечисления ячеек окрестности: (0,-1), (-1,-1), (-1,0), (-1,1), (0,1), (1,1), (1,0), (1,-1), (0,0). При графическом изображении структуры автомата i-модели объекта, воспринимаемого из различных ячеек окрестности, будем располагать по горизонтали или вертикали так, чтобы их следование слева направо или сверху вниз соответствовало порядку перечисления ячеек окрестности. Так, на рис.63 i-модель k соответствует объекту "пища", воспринимаемому из ячейки с координатами (-1,1).
Рис.63. М-сеть автомата.
Автомат, структура которого изображена на рис.63, помещался в ячейку А среды, изображенной на рис.64. Вспомогательной i-модели р задавалось некоторое постоянное возбуждение, что обеспечивало передвижение автомата в направлении, указанном стрелками, до ячейки В. На рисунке отмечены крестиками ячейки, в которых интенсивность параметра "запах" отличалась от нуля. Видно, что в ряде ячеек среды осуществлялось одновременное восприятие как "пищи", так и "запаха", условие установления (8.7) оказывалось выполненным и в соответствии с правилами (8.8 ) между i-моделями устанавливались связи, изображенные на рис.63 пунктиром. Если теперь в какой-либо ячейке окрестности автомата, например (-1,1), будет воспринят "запах", то возбуждение соответствующей i-модели l по установившейся связи вызовет возбуждение i-модели "пища" k, а последнее, в свою очередь, обеспечит выполнение шага, реализующего реакцию приближения к ячейке, содержащей "запах". Таким образом, задача идентификации параметра оказывается решенной.
Рис.64. Обучающая среда.
Адекватность реакций обученного М-автомата иллюстрируется его поведением в среде, изображенной на рис.65, где сплошные линии соединяют ячейки с одинаковой интенсивностью параметра "запах", указанной в разрывах линий. Стрелки обозначают шаги автомата, помещенного первоначально в ячейку А. Видно, что автомат быстро достигает области с максимальным значением параметра и далее выполняет в ней случайные блуждания. Вспомогательная i-модель р в этом эксперименте не возбуждалась.
Рис.65. Контрольный эксперимент. Поиск экстремального значения параметра.
ЗАДАЧА СЛУЧАЙНОГО ПОИСКА. Задача случайного поиска методом "проб и ошибок" возникает в ситуациях, где возможно некоторое множество априорно равноценных реакций, и состоит в нахождении реакций, наилучших в некотором заранее определенном смысле.
Экспериментальная ситуация строилась следующим образом. М-автомат помещался в ячейку А среды, изображенной на рис.66, где знаками () и /\ отмечены различные объекты из класса "пища". Окрестность А представляла собой "особую" (см. #3, гл.8 ) ситуацию, единственным разрешенным действием которой являлось выполнение шага, отмеченного на рисунке двойной стрелкой. После выполнения любого шага автомат возвращался в исходную ячейку. Объекты, имеющиеся в среде, были "знакомы" автомату - между их i-моделями и i-моделями действий-шагов задавались связи. Информация о том, какой шаг является разрешенным, в автомат не вводилась. Предполагалось, что после выполнения ряда пробных шагов автомат "обучится" и будет многократно выполнять только разрешенное действие.
Рис.66. Обучающая среда.
Эксперимент проводился с М-автоматом, структура которого изображена на рис.67. Автомат описывается формулой Р1.18 С1.4 Э1.2 Д1.9 1. В дополнение к установленным ранее значениям параметров было принято: О=1; a=0.5. В исходном состоянии связи, изображенные на рисунке пунктиром, отсутствовали. После первого восприятия ситуации "резервный" элемент a сферы ПС становился i-моделью этой ситуации (алгоритм B.sit). Далее автомат выполнял некоторый шаг. В случае, если шаг не был разрешенным, возбуждалась i-модель НПр (алгоритм B.z) и между i-моделями ситуации и выполненного шага устанавливалась связь (алгоритм B.o) с преобладающим значением тормозной компоненты (функция (8.8 )). При повторном восприятии ситуации возбуждалась ее i-модель и, благодаря установившейся связи, возбуждение i-модели неразрешенного шага тормозилось. СУТ, следовательно, выбирала другой шаг, и весь процесс повторялся. В случае, если выполнялся разрешенный шаг, между его i-моделью и i-моделью ситуации устанавливалась связь с преобладающим значением усиливающей компоненты. Это обеспечивало при повторных восприятиях ситуации дополнительное возбуждение i-модели разрешенного шага и, следовательно, постоянное его выполнение. Результаты эксперимента графически изображены на рис.68, где показано изменение во времени возбужденностей i-моделей автомата. Графики иллюстрируют приведенное выше качественное описание процесса обучения.
Рис.67. М-сеть автомата.
Рис.68 Внутренние реакции М-автомата в ходе обучения.
Следует остановиться на рассмотрении двух особенностей поведения автомата, обнаруженных в ходе эксперимента. Первая из них состоит в том, что последовательность пробных действий в ходе поиска, вообще говоря, не является случайной. Анализ работы автомата показывает, что вид этой последовательности определяется (при заданной системе связей в М-сети) структурой ситуации, в которой находится автомат. Это соответствует и интуитивному представлению о разумности поведения: в незнакомой ситуации человек или животное испытывает прежде всего то действие, которое почему-либо представляется "естественным", "напрашивается" и т.п. Смысл такого рода терминов может быть несколько уточнен при установлении аналогий между поведением живых организмов и автоматов описываемого типа.
Вторая особенность поведения М-автомата состоит в следующем. Из рис.68 видно, что графики возбуждения i-моделей Пр и НПр представляют собой гладкие кривые, в то время как возбуждение этих i-моделей увеличивалось алгоритмом B.z дискретно, в каждый момент времени на постоянную величину. На содержательном уровне это означает, что автомат "субъективно искажает" значения предъявляемых ему поощрений и наказаний или, точнее, формирует внутреннее представление поощрения и наказания, которое не всегда совпадает с реальным значением этих факторов. Анализ работы алгоритма показал, что степень и вид "субъективного искажения" поощрений и наказаний определяются значением коэффициента затухания a в функции пересчета (8.5). Рассмотрим это явление в общем виде. Пусть автомату в течение n тактов предъявляется фактор наказания. Это означает, что в каждый момент дискретного времени реализуется операция Пt.НПр=Пt.НПр+V, где V - величина наказания. Тогда возбужденность i-моделей НПр будет изменяться во времени (с учетом работы алгоритма А) следующим образом (табл.8 ):
Таблица 8
Пусть n достаточно велико. Обозначим Пn.НПр=V.эф . Тогда
V.эф = V(a**n + a**(n-1)" + ... + a).
Выражение в скобках правой части есть степенной ряд, следовательно,
V.эф = V*a/(1-a).
Таким образом, при непрерывном предъявлении автомату наказания V эффективная ("субъективная") величина наказания стремится к V.эф. Динамика изменения эффективной величины наказания при различных a иллюстрируется графиками на рис.69. С помощью выражения для V.эф можно описать также изменения "эмоционального" фактора обучения Dt при смене характера подкрепления (появление поощрения после наказания и наоборот). В качестве примера на рис.69 приведены кривые (штриховые линии) изменения величин П.Пр, П.НПр и D в случае, когда после ряда наказаний автомат начинает получать поощрения. Момент изменения характера подкреплений отмечен на оси времени стрелкой. Видно, что поощрение "воспринимается" автоматом не сразу: в первый момент D мало и лишь со временем достигает значения, соответствующего реальной величине поощрения. Длительность этого процесса определяется "предысторией" автомата: чем меньше наказаний получил автомат до момента смены характера подкреплений, тем большим оказывается начальное значение D (точки A, A', А'' на штрихпунктирной кривой). Описанные процессы соответствуют некоторым интуитивным представлениям о динамике эмоциональных состояний.
Рис.69. Изменения эффективной величины наказания.
ЗАДАЧА ПАРАЛЛЕЛЬНОГО ОБУЧЕНИЯ. Эта задача возникает в случаях, когда поиск правильных решений ведется для n (n>1) ситуаций и ситуации предъявляются неупорядоченно во времени. В этих условиях процесс обучения может быть затруднен или нарушен, поскольку на выбор реакции в любой из ситуаций могут влиять результаты проб, выполненных в остальных n-1 ситуациях. Эксперимент строился следующим образом. Автомат помещался в ячейку А среды, изображенной на рис.70. Среда содержала четыре "особых" ситуации - A, B, C и E (изображены на рисунке отдельно). После выполнения пробы в одной из этих ситуаций с помощью алгоритма B.z автомат перемещался в другую ситуацию. Перемещения осуществлялись по схеме A->C->Е->B->А. Разрешенные шаги в каждой из ситуаций указаны на рис.70 стрелками. При выполнении разрешенного шага возбуждалась i-модель Пр, неразрешенного - НПр. Основное обучение автомата проводилось на участке среды L, разделенном на одинаковые "классы" I и II. Начиная поиск в ячейке А, лежащей в области I класса, автомат перемещался во II класс после выполнения первой удачной пробы. Перемещение осуществлялось в соответствии с приведенной схемой. После выполнения удачной пробы во II классе автомат помещался последовательно в ситуации E, B, A, C зоны Т среды ("экзамен"). Если все действия выполнялись правильно, обучение считалось оконченным. Если же в какой-либо ситуации зоны Т выполнялось неразрешенное действие, автомат возвращался в подобную ситуацию I класса. Таким образом, чтобы выполнить разрешенные действия во всех ситуациях зоны Т, автомат должен решить задачу параллельного обучения в четырех ситуациях.
Рис.70. Обучающая среда.
Эксперименты проводились с автоматом, структура которого изображена на рис.67. Результаты эксперимента приведены на схеме рис.71, где одинарные стрелки соответствуют шагам, выполненным автоматом в последовательные моменты времени, а двойные - человеком (первые правильные решения для каждой ситуации обведены). Видно, что задача решена автоматом за 30 проб.
Рис.71. Поиск решения автоматом и человеком.
Представляет интерес сравнение поведения автомата с поведением людей при решении аналогичной задачи. Условия проведенного нами психологического эксперимента полностью моделировали условия эксперимента с автоматом. Испытуемым предъявлялись карты, соответствующие ситуациям A, B, C и E. Требовалось для каждой ситуации найти единственную допустимую реакцию, состоящую в "нажимании" одной из восьми условных кнопок, изображение которых находилось в поле зрения испытуемых. Результаты проб сообщались испытуемым словами "правильно" и "неправильно". Порядок предъявления карт-ситуаций соответствовал схеме перемещения автомата в среде рис.70. Эксперимент проводился с группой из 10 взрослых испытуемых. Задача была решена всеми испытуемыми. Среднее по группе количество проб составило 49.2, минимальное количество - 28, максимальное - 96. В качестве примера на рис.71 двойными стрелками изображены реакции испытуемого Т. Из эксперимента видно, что поведение автомата при решении задачи параллельного обучения входит в класс поведений людей-испытуемых при решении ими аналогичной задачи. Следует отметить, что в тех случаях, когда испытуемые затрачивали для решения задачи большое число проб, наблюдались либо нарушения инструкции (например, попытки обнаружить закономерную связь между номерами ситуаций и правильных реакций), либо феномен забывания уже найденных правильных реакций. Эффект затягивания обучения легко достигается в автомате как увеличением амплитуды помех (случайных возбуждений) так и введением операторов затухания связей.
"ПОРОГОВАЯ ЛОГИКА" В М-СЕТИ. Рассмотрение возможностей предпрограммирования М-автоматов путем задания параметра О (см. функцию (8.5)) целесообразно провести в данном разделе, поскольку оно связано в основном с проведением специального демонстрационного теста.
Придавая определенные значения параметрам М-сети (в частности, для всех i a.i=0, K.нi>=40, П.max=1, П.min=0, обучение связей отсутствует), можно привести ее к виду, аналогичному сетям из формальных нейронов. Показано, что при соответствующем подборе порогов и конфигурации связей сеть из формальных нейронов в состоянии реализовать любую систему логических высказываний. По аналогии можно предположить, что подобное утверждение приложимо и к М-сетям. Спецификой последних является то, что требования к их организации могут быть сформулированы на содержательном уровне, т.е. в конкретном языке решаемой задачи. Продемонстрируем это на примере.
Рис.72. Обучающая среда.
Пусть автомат расположен в ячейке А среды, изображенной на рис.72. Участок F среды содержит раздражители 1 и 2 группы "пища". Участок N не содержит никаких раздражителей. Пусть среда продолжена от места обрыва на рисунке сколь угодно далеко, причем участки F п N чередуются. Автомат передвигается из ячейки А, постоянно выполняя действие-шаг (->). Участок F может быть пройден им за 3 шага, участок N - за n шагов. Пусть автомат "ощущает" голод, т.е. существует одноименная i-модель, возбуждение которой после каждого шага увеличивается на постоянную величину d. Кроме действий-шагов автомат может выполнять действия "есть" и "нести". Предполагается, что "переживание" голода вызывает чувство "неприятно", т.е. возбуждается i-модель НПр. Необходимо построить автомат так, чтобы его поведение было оптимальным, т.е. сумма возбуждений НПр за время прохождения каждой пары участков F и N была минимальной. Из интуитивных соображений ясно, что автомат должен полностью использовать "ресурсы среды", т.е. "съедать" обе "пищи", находящиеся в каждом из участков F. Следовательно, "пища 1" должна быть "съедена" в той ячейке, где она расположена, а "пища 2" перенесена в участок N и "съедена" после выполнения t шагов от места расположения "пищи 1". Учитывая линейный характер зависимости возбужденности i-модели "голод" от числа шагов, запишем выражение для суммы возбуждений НПр (СУММА.НПр):
1/2*t**2*d - 1/2(n+2-t)**2*d = СУММА.HПр, (9.6)
или после преобразований
t**2 - (n+2)t = СУММА.НПр/d - (n+2)/2. (9.7)
Правая часть равенства минимальна при значении t, обращающем в нуль первую производную левой части, отсюда оптимальное значение t.opt числа шагов между последовательными выполнениями действия "есть" определяется как t.opt=(n+2)/2.
Таким образом, оптимальность любого варианта поведения автомата может быть оценена по значению критерия
г = |t-t.opt|. (9.8 )
При г=0 поведение оптимально.
Рис.73. М-сеть автомата.
Исследовался автомат, структура которого изображена на рис.73. Формула автомата: Р1.9 Э1.2 Ж1.2 Д1.11; р - вспомогательная, постоянно возбужденная i-модель. В сферу желаний введена i-модель "жадность", возбуждение которой является интегральной по времени оценкой "переживания"
голода. Проходимости всех связей: r.ij=1, ~r.ij=0. Обучение отсутствует. Параметры i-моделей приведены в табл.9. Автомат помещался в среду с n=23 и вел себя следующим образом. Первый участок F автомат прошел, не выполнив действий "есть" или "нести", поскольку i-модель "голод" была возбуждена слабо. Во втором участке F была "съедена" "пища 1". В третьем участке F также была "съедена" "пища 1" и перенесена в участок N "пища 2", однако значение г превысило 12, что указывало на неудачный выбор параметров. Оптимизация автомата проводилась путем подбора значения параметра d, что эквивалентно изменению порога i-моделей "есть" и "нести". Полученная экспериментальная зависимость приведена на рис.74. Настройку автомата можно провести также путем изменения порога i-модели "жадность". В последнем случае изменяется и длина начального периода обучения. Таким образом, задание порогов является удобным способом предварительной организации "внутренней логики" переработки информации М-автоматов.
Таблица 9
Рис.74. Влияние величины порогов на поведение М-автомата.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#3. ВЫБОР ЗНАЧЕНИЙ ПАРАМЕТРОВ ПРОТОРЕНИЯ СВЯЗЕЙ. ЗАДАЧА ИЗБЕГАНИЯ НАКАЗАНИЙ
Определим область допустимых значений параметров k.2 и ~k.2 в выражении (8.10) при условии отсутствия затухания связей, т.е. если b = ~b = 1 и, следовательно,
zr[t+1].ij = rt.ij. (9.9)
Рассмотренный выше процесс установления связей обеспечивает обучение автомата в тех случаях, когда оказывается достаточным сравнительно небольшое (в пределах 0.7-1.3 начального значения) изменение возбужденности i-моделей. Характерным здесь является также обучение "с первого предъявления" - результат каждой пробы фиксируется связью и дальнейшей коррекции не подвергается. На практике, однако, обучение живых организмов "с первой пробы" встречается весьма редко. Более того, оно весьма редко является целесообразным, поскольку естественная среда, как правило, предъявляет организму случайные последовательности воздействий. Обучение должно, таким образом, обеспечивать выделение статистических закономерностей в среде. Для этого необходимо, чтобы за каждым отдельно взятым актом обучения следовало лишь малое изменение в связях (коэффициентах, параметрах) системы. В М-автоматах такой процесс обеспечивается функцией проторения.
При исследовании процессов обучения животных и человека часто используют эксперименты, связанные с обучением уклонению от боли или избеганию наказаний. Условия экспериментов такого рода обладают рядом важных для нас свойств. Прежде всего, такие эксперименты предполагают многократные предъявления обучающего воздействия, в ходе которых испытуемый улучшает свое поведение постепенно. Далее, однородность применяемых раздражителей и их характер (обычно используются биологически важные раздражители) облегчают испытуемому запоминание ситуаций, так что в экспериментах такого рода забыванием обычно пренебрегают. Имея в виду указанные свойства, выберем задачу обучения избеганию наказаний в качестве тестовой для настройки М-автомата.
Выбор параметров проторения проведем следующим образом. Построим вычислительную модель соответствующего эксперимента, используя в качестве "испытуемого" М-автомат с неопределенными параметрами k.2 и ~k.2. Далее, применяя данные относительно параметров процесса обучения, известные в психологии, а также учитывая вводимые естественным образом ограничения, определим такую область значений k.2 и ~k.2, в которой поведение автомата является удовлетворительным. В дальнейшем будем считать эту область областью допустимых значений параметров.
Методики экспериментов по обучению избеганию наказаний хорошо разработаны. Мы выбрали следующую их модификацию. Автомат помещался в среду (10*10 ячеек), которая случайным образом заполнялась раздражителями из группы "опасность". Всего в среде располагалось 66 раздражителей так, что вероятность попадания каждого из них в любую из ячеек среды составляла 0.66. В этой среде автомат выполнял случайные шаги. Автомат включал в себя девять i-моделей раздражителя "опасность", девять i-моделей действий-шагов и i-модели Пр и НПр (формула Р1.9 Э1.2 Д1.9 1). Связи в исходном состоянии не задавались. Перед каждым пересчетом i-моделям действий-шагов приписывались случайные значения E.i и ~E.i (см. 8.5) так, что математическое ожидание величины Пt.i, для всех i-моделей шагов П.ср=100. Таким образом, вероятность выполнения любого действия-шага в конце такта, т.е. после работы алгоритма A.СУТ. составляла 1/9. Если в процессе случайных блужданий автомат занимал ячейку, в которой находился раздражитель, то i-модели НПр приписывалось возбуждение (50усл.ед.), и между i-моделью шага, приведшего в занятую ячейку, и соответствующей i-моделью раздражителя устанавливалась связь с преимущественной тормозной компонентой. При повторениях описанной ситуации связь проторялась. После ряда проторений тормозные компоненты связей обеспечивали такие воздействия на i-модели шагов, что, несмотря на случайные возбуждения последних, М-автомат не выполнял шагов, переводящих его в занятые ячейки. Таким образом, автомат оказывался обученным избеганию объекта "опасность".
Для того чтобы получить числовые характеристики исследуемого процесса, наложим ограничения на время обучения автомата. Потребуем, чтобы обучение правильной реакции на один раздражитель, например "опасность справа", требовало 3-5 повторений ошибочного шага - это примерно соответствует количеству необходимых предъявлений (проб) для обучения высших животных. Установим, сколько всего случайных шагов должен делать автомат в среде, чтобы каждое из возможных действий было неправильно выбрано 3-5 раз. Обозначим это число шагов через N. Тогда нас не будут интересовать автоматы, обучающиеся более чем за N шагов,- они будут являться "неудачными" вариантами. Дальнейшее рассуждение проведем, исходя из требования, чтобы каждый из шагов был выбран 4/0.66=6 раз.
Представим задачу в теоретико-вероятностных терминах. Один такт работы автомата есть испытание. За одно испытание выбирается один из девяти возможных шагов. Коэффициенты затухания в выражениях (8.5) и (8.9) для данного автомата приняты равными нулю, следовательно, испытания можно считать независимыми. Выбор одного i-го действия есть событие A.i. Поскольку выбор каждого действия за одно испытание равновероятен, проведем рассуждение относительно одного какого-либо действия. Тогда событие А - выбор этого действия, событие ~А - выбор любого другого. Очевидно, вероятность наступления события А
р(А) = р = 1/9, (9.10)
а события ~А -
q(~A) = q = 1-p =8/9. (9.11)
Сформулируем задачу следующим образом. Требуется определить такое число испытаний n, чтобы с заданной вероятностью r произошло не менее m событий А, вероятность наступления каждого из которых в одном испытании равна p. Потребуем, чтобы r=0.9. Требование получить не менее 6 выборов одного и того же шага равносильно неравенству
6 <= m <= беск. (9.12)
Для решения задачи применим интегральную теорему Муавра-Лапласа. Используя известные методики, получим n=88.
Поскольку с увеличением n вероятность получения не менее 6 выборов одного шага может лишь возрасти, окончательно получим n>=88. Примем N=90.
При исследовании автомата будем в качестве показателя степени его обученности L рассматривать количество наказаний, полученных им за 30 последовательных шагов в среде. С целью получения статистически достоверного описания динамики обучения будем вычислять L как среднее по 20 различным случайным средам. При случайном блуждании автомата без обучения математическое ожидание значения L
М(L) = 30*0.66 ~ 20.
Будем считать обучение автомата удовлетворительным, если за время, не превышающее N=90 тактов, величина M(L) будет уменьшена не менее чем на порядок, т.е.
M.Финальное(L) <= 2.
Наложим ограничения на величины k.2 и ~k.2. Ограничение ~k.2 сверху можно получить, потребовав, чтобы за 6 повторений шага величина ~r осталась меньшей или равной 1 (см. табл.7). Поскольку значение коэффициента установления выбрано ранее и k.0=2.5E-3, то значение ~r после установления (по 8.8 ) составляет ~r.нач=0.625. Далее, в течение пяти проб эта связь проторяется, так что, подставляя численные значения, получаем
~r[t=6] = ~r.нач*(1+1E4*~k2)**5. (9.14)
Из условия r[t=6]<=1 находим
~k.2 <= 1E-5. (9.15)
Легко видеть, что существует задача, в определенном смысле обратная рассмотренной,- задача "обучения овладению"; в ней рассматривается поведение автомата в среде, содержащей раздражители группы "пища", так что в случае, если автомат переходит в ячейку, занятую этим раздражителем, осуществляется его поощрение, т.е. возбуждается i-модель Пр. Проведенные выше рассуждения с очевидными изменениями справедливы и для такой обратной задачи. Аналогичным способом получим ограничение сверху и для r.
Поскольку k.0 уже выбрано: k.0=1.5E-3, то r.нач=0.375. В ходе проторения получаем r[t=6]=r.нач(1+1E4*k.2) и из условия r[t=6]<=1 находим
k.2 <= 2.3E-5). (9.16)
В качестве иллюстрации на рис.75 приведены усредненные по 20 средам кривые обучения автомата при разных
значениях k.2 и ~k.2. Начальные участки кривых обучения хорошо описываются выражением L=n**a (a - коэффициент), так что в логарифмических масштабах кривая обучения изображается прямой. Характеристика обучения N - число шагов, сделанных автоматом до момента выполнения условия (9.13),- вычисляется как абсцисса точки пересечения прямых ln(L)=a*ln(n) и ln(L)=ln(2).
75. Кривые обучения М-автомата.
Перейдем к выбору области допустимых значений параметров k.2 и ~k.2. На рис.76 представлено фазовое пространство параметров. Цифры возле точек указывают значения характеристики обучения N при соответствующих значениях параметров. Видно, что условие N<=90 выполняется не для всех точек. Исключив из области значений, удовлетворяющих условиям (9.15) и (9.16), область, содержащую точки, для которых N>90, получим область допустимых значений параметров k.2 и ~k.2. На рис.76 эта область обведена жирной линией. В качестве рабочей выберем точку А, соответствующую значениям k.2=1.5E-5
и ~k.2=1.5E-5.
Рис.76. Область допустимых значений параметров проторения связей (А - рабочие значения параметров).
#4. ВЫБОР ЗНАЧЕНИЙ ПАРАМЕТРОВ ЗАТУХАНИЯ СВЯЗЕЙ. ЗАДАЧА ПОВТОРЕНИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Определим область допустимых значений параметров b и ~b в выражении (8.9).
В исследуемом варианте М-сеть реализует следующие виды удержания следов внешних воздействий (памяти): а) память возбуждений - задается коэффициентом затухания возбуждений a (см. 8.2); б) память связей - задается коэффициентами b и ~b в (8.9). Память возбуждений соответствует простейшей форме памяти, связанной со временем переходных процессов, и может быть реализована в неадаптивных системах. В таких системах при подаче на вход сигналов, следующих с интервалом, меньшим времени переходного процесса, реакции системы изменяются в связи с суперпозицией ответов на каждый сигнал. Процессы такого рода в М-сети уже исследованы. Память вида "б" соответствует памяти адаптивных систем, изменяющих свою структуру под действием входных сигналов на время, превышающее время переходных процессов, и, следовательно, способных к воспроизведению входных сигналов. Здесь мы имеем дело с более сложными формами памяти, соответствующими мнемоническим процессам в высших организмах.
Принято различать кратковременную оперативную и долговременную память человека. Оперативной памяти человека, характеризующейся ограниченным объемом и сравнительно небольшим временем удержания следа, поставим в соответствие память связей в М-сети. Ее параметры п исследуются в настоящем параграфе.
При изучении оперативной памяти часто используется эксперимент по воспроизведению последовательностей сигналов, предъявляемых испытуемому. (Сигналами в различных методиках служат одно- и двусложные слова, бессмысленные слоги и т.п.) В этой области получен важный результат, состоящий в установлении того факта, что люди-испытуемые, как правило, в состоянии безошибочно воспроизвести предъявленную им последовательность в том случае, если она содержит не более 7+/-2 сигналов. Этот результат проверен многими исследователями, что позволяет нам выбрать задачу воспроизведения последовательностей в качестве тестовой для настройки М-автомата. Параметры затухания связей выберем следующим образом. Построим вычислительную модель упомянутого эксперимента, используя в качестве "испытуемого" М-автомат с неопределенными параметрами b и ~b. Далее, определим такую область значений параметров, в которой поведение автомата является удовлетворительным. В дальнейшем будем считать эту область областью допустимых значений параметров.
Рис.77. Обучающая среда.
Известная методика проведения экспериментов по воспроизведению последовательностей модифицирована следующим образом, М-автомат помещался в среду (рис.77), содержащую "нейтральные" для автомата раздражители. В качестве исходных выбирались ячейки, отмеченные на рисунке символами A.1,...,A.10. Автомат выполнял 10 действий-шагов (<-). В описываемом эксперименте алгоритм A.д, был для удобства изменен так, что шаг (<-) выполнялся "через ячейку", так что, двигаясь из ячейки A.10, автомат последовательно занимал ячейки, отмеченные на рисунке точками. При этом последовательно воспринимались 10 различных ситуаций. Если движение начиналось из ячейки А.9 (А.8, ..., A.4), количество воспринятых за 10 шагов ситуаций составляло соответственно 9(8, ..., 4). После каждого шага алгоритм B.sit ставил в соответствие воспринятой ситуации единственную i-модель из сферы "памяти ситуаций" и эта i-модель получала дополнительное возбуждение. Таким образом,, при движении автомата последовательно возбуждались. 10 (9,..., 4) i-моделей ситуации. После выполнения 10 шагов в структуре автомата оказывалась сформированной цепочка, аналогичная представленной на рис.55,а. Затем специально введенный для данного эксперимента обслуживающий алгоритм предъявлял автомату ситуацию 1 (рис.77). При этом возбуждалась первая из сформированных i-моделей ситуаций и возбуждение от нее передавалось по цепочке, вызывая соответствующие переключения СУТ.пс. Выделение СУТ.пс любой i-модели ситуации рассматривалось как "воспроизведение" соответствующей ситуации. Поведение автомата считалось удовлетворительным, если ситуации воспроизводились в том же порядке, что и воспринимались. Исходная структура автомата представлена на рис.78 (формула Р1.9 С1.10 Д1.9 2); р - вспомогательная i-модель.
Рис.78. М-сеть автомата.
Ранее обсуждалась роль асимметрии связей в организации процесса повторения последовательностей. Коэффициент a.s в (8.11) целесообразно выбрать таким образом, чтобы обеспечиваемое им увеличение связи R.ij составляло (при средних значениях параметров) 0.1-0.2 начального значения. Примем для дальнейшего a.s=0.002.
Рис.79. Область допустимых значений параметров забывания связей (А - рабочие значения параметров).
Эксперименты проводились следующим образом. Автомат помещался в ячейку А.10, принималось b = ~b = 1 и проверялась правильность воспроизведения последовательности из 10 элементов. Затем проводились изменения b и ~b, и для каждой пары их значений проверялась правильность воспроизведения. Далее автомат помещался в ячейку A.9 (A.8, ..., A.4), и описанные операции повторялись. Полученные результаты приведены на рис.79. Штрихпунктиром обозначены верхние границы значений параметров, соответствующие ограничениям (8.9): b<=1; ~b<=1. Сплошными линиями обозначены полученные в эксперименте нижние границы областей, в которых выполняется правильное воспроизведение последовательностей. Цифры возле линий указывают длину последовательностей, правильное воспроизведение которых происходит в отграничиваемых областях. Так, на рисунке заштрихована область значений, в которой правильно воспроизводятся 10-элементные последовательности. Будем считать, что удовлетворительным поведением модели является повторение последовательностей длиной 7+/-2. Тогда область допустимых значений параметров ограничивается снизу границей области повторения 5-элементных, а сверху - 10-элемент-ных последовательностей. На рисунке эта область обведена жирной линией. В качестве рабочей примем точку А, соответствующую значениям
b = 0.99; ~b = 0.975. (9.17)
Следует отметить, что в случаях, когда последовательности воспроизводились неправильно, наблюдались ошибки двух типов. Так, для области повторения 5-элементных последовательностей в зоне, обозначенной на рисунке буквой В, характерными являлись ошибки типа "обрыв" - последовательность 1, 2, 3, 4, 5 воспроизводилась неполностью: 1, 2, 3. В зоне же С характерными являлись ошибки типа "персевераций" - последовательность воспроизводилась в виде: 1, 2, 3, 2, 3, 4, 3, 4, ... с последующим "обрывом". Аналогичные явления наблюдались для областей повторения 6-, 7- и 8-элементных последовательностей. Можно предположить, что различие типов ошибок обусловливает и форму границ указанных областей (характерный "клин" зоны С). Представляется интересным подробно проанализировать процессы передачи возбуждений в цепочках при ее воспроизведении, однако такой анализ достаточно сложен, никак не связан с задачей эмпирической настройки автомата и поэтому в данной работе не проводится.
В экспериментах по воспроизведению последовательностей людьми наблюдается обычно своеобразный "эффект начала": независимо от успешности воспроизведения последовательности в целом первые ее элементы испытуемый воспроизводит правильно. Аналогичный эффект наблюдается и в экспериментах с М-автоматом. Кроме того, при многократных повторениях последовательности позже всего "забывались" элементы, предъявленные автомату первыми.
При построении модели двигательного поведения найденные выше значения параметров b и ~b должны использоваться в тех ее блоках, где целесообразно обеспечить возможность "последовательного вспоминания" прошлого опыта. Прежде всего это относится к блоку ПС. В блоке же понятийных обобщений, например, представляется более важным "свободное ассоциирование". Это означает, что значения b и ~р должны выбираться здесь из других соображений. Как указывалось выше, коэффициенты затухания связей определяют объем оперативной памяти системы. Потребуем, чтобы оперативная память обеспечивала сохранение в М-сети информации лишь о достаточно часто повторяющихся событиях. Пусть Т.0 - среднее время повторения некоторых событий, а r.н - начальное значение проходимости связей (в момент установления). Тогда, если некоторое событие произошло в момент t и установилась связь rt=r.н и если в течение времени T>T.0 событие не повторилось, то проходимость r[t+T] не должна превышать некоторое малое значение r.min (связь должна быть "забыта"). Примем Т=2T.0 Переменная r.min имеет смысл числовой константы gvs, используемой алгоритмом B.VS. Пусть gvs=0.02. Имея в виду среду, с которой предстоит работать модели двигательного поведения, примем T.0=10. Запишем наше требование следующим образом:
r.н*b**2T.0 <= r.min. (9.18 )
Отсюда, подставляя числовые значения, получим
b<=0.86; ~b<=0.84. (9.19)
Таким образом, значения (9.17) обеспечивают запоминание последовательности событий, а значения (9.19) - запоминание событий, повторяющихся достаточно часто.
Определим область допустимых значений параметров k.2 и ~k.2 в выражении (8.10) при условии отсутствия затухания связей, т.е. если b = ~b = 1 и, следовательно,
zr[t+1].ij = rt.ij. (9.9)
Рассмотренный выше процесс установления связей обеспечивает обучение автомата в тех случаях, когда оказывается достаточным сравнительно небольшое (в пределах 0.7-1.3 начального значения) изменение возбужденности i-моделей. Характерным здесь является также обучение "с первого предъявления" - результат каждой пробы фиксируется связью и дальнейшей коррекции не подвергается. На практике, однако, обучение живых организмов "с первой пробы" встречается весьма редко. Более того, оно весьма редко является целесообразным, поскольку естественная среда, как правило, предъявляет организму случайные последовательности воздействий. Обучение должно, таким образом, обеспечивать выделение статистических закономерностей в среде. Для этого необходимо, чтобы за каждым отдельно взятым актом обучения следовало лишь малое изменение в связях (коэффициентах, параметрах) системы. В М-автоматах такой процесс обеспечивается функцией проторения.
При исследовании процессов обучения животных и человека часто используют эксперименты, связанные с обучением уклонению от боли или избеганию наказаний. Условия экспериментов такого рода обладают рядом важных для нас свойств. Прежде всего, такие эксперименты предполагают многократные предъявления обучающего воздействия, в ходе которых испытуемый улучшает свое поведение постепенно. Далее, однородность применяемых раздражителей и их характер (обычно используются биологически важные раздражители) облегчают испытуемому запоминание ситуаций, так что в экспериментах такого рода забыванием обычно пренебрегают. Имея в виду указанные свойства, выберем задачу обучения избеганию наказаний в качестве тестовой для настройки М-автомата.
Выбор параметров проторения проведем следующим образом. Построим вычислительную модель соответствующего эксперимента, используя в качестве "испытуемого" М-автомат с неопределенными параметрами k.2 и ~k.2. Далее, применяя данные относительно параметров процесса обучения, известные в психологии, а также учитывая вводимые естественным образом ограничения, определим такую область значений k.2 и ~k.2, в которой поведение автомата является удовлетворительным. В дальнейшем будем считать эту область областью допустимых значений параметров.
Методики экспериментов по обучению избеганию наказаний хорошо разработаны. Мы выбрали следующую их модификацию. Автомат помещался в среду (10*10 ячеек), которая случайным образом заполнялась раздражителями из группы "опасность". Всего в среде располагалось 66 раздражителей так, что вероятность попадания каждого из них в любую из ячеек среды составляла 0.66. В этой среде автомат выполнял случайные шаги. Автомат включал в себя девять i-моделей раздражителя "опасность", девять i-моделей действий-шагов и i-модели Пр и НПр (формула Р1.9 Э1.2 Д1.9 1). Связи в исходном состоянии не задавались. Перед каждым пересчетом i-моделям действий-шагов приписывались случайные значения E.i и ~E.i (см. 8.5) так, что математическое ожидание величины Пt.i, для всех i-моделей шагов П.ср=100. Таким образом, вероятность выполнения любого действия-шага в конце такта, т.е. после работы алгоритма A.СУТ. составляла 1/9. Если в процессе случайных блужданий автомат занимал ячейку, в которой находился раздражитель, то i-модели НПр приписывалось возбуждение (50усл.ед.), и между i-моделью шага, приведшего в занятую ячейку, и соответствующей i-моделью раздражителя устанавливалась связь с преимущественной тормозной компонентой. При повторениях описанной ситуации связь проторялась. После ряда проторений тормозные компоненты связей обеспечивали такие воздействия на i-модели шагов, что, несмотря на случайные возбуждения последних, М-автомат не выполнял шагов, переводящих его в занятые ячейки. Таким образом, автомат оказывался обученным избеганию объекта "опасность".
Для того чтобы получить числовые характеристики исследуемого процесса, наложим ограничения на время обучения автомата. Потребуем, чтобы обучение правильной реакции на один раздражитель, например "опасность справа", требовало 3-5 повторений ошибочного шага - это примерно соответствует количеству необходимых предъявлений (проб) для обучения высших животных. Установим, сколько всего случайных шагов должен делать автомат в среде, чтобы каждое из возможных действий было неправильно выбрано 3-5 раз. Обозначим это число шагов через N. Тогда нас не будут интересовать автоматы, обучающиеся более чем за N шагов,- они будут являться "неудачными" вариантами. Дальнейшее рассуждение проведем, исходя из требования, чтобы каждый из шагов был выбран 4/0.66=6 раз.
Представим задачу в теоретико-вероятностных терминах. Один такт работы автомата есть испытание. За одно испытание выбирается один из девяти возможных шагов. Коэффициенты затухания в выражениях (8.5) и (8.9) для данного автомата приняты равными нулю, следовательно, испытания можно считать независимыми. Выбор одного i-го действия есть событие A.i. Поскольку выбор каждого действия за одно испытание равновероятен, проведем рассуждение относительно одного какого-либо действия. Тогда событие А - выбор этого действия, событие ~А - выбор любого другого. Очевидно, вероятность наступления события А
р(А) = р = 1/9, (9.10)
а события ~А -
q(~A) = q = 1-p =8/9. (9.11)
Сформулируем задачу следующим образом. Требуется определить такое число испытаний n, чтобы с заданной вероятностью r произошло не менее m событий А, вероятность наступления каждого из которых в одном испытании равна p. Потребуем, чтобы r=0.9. Требование получить не менее 6 выборов одного и того же шага равносильно неравенству
6 <= m <= беск. (9.12)
Для решения задачи применим интегральную теорему Муавра-Лапласа. Используя известные методики, получим n=88.
Поскольку с увеличением n вероятность получения не менее 6 выборов одного шага может лишь возрасти, окончательно получим n>=88. Примем N=90.
При исследовании автомата будем в качестве показателя степени его обученности L рассматривать количество наказаний, полученных им за 30 последовательных шагов в среде. С целью получения статистически достоверного описания динамики обучения будем вычислять L как среднее по 20 различным случайным средам. При случайном блуждании автомата без обучения математическое ожидание значения L
М(L) = 30*0.66 ~ 20.
Будем считать обучение автомата удовлетворительным, если за время, не превышающее N=90 тактов, величина M(L) будет уменьшена не менее чем на порядок, т.е.
M.Финальное(L) <= 2.
Наложим ограничения на величины k.2 и ~k.2. Ограничение ~k.2 сверху можно получить, потребовав, чтобы за 6 повторений шага величина ~r осталась меньшей или равной 1 (см. табл.7). Поскольку значение коэффициента установления выбрано ранее и k.0=2.5E-3, то значение ~r после установления (по 8.8 ) составляет ~r.нач=0.625. Далее, в течение пяти проб эта связь проторяется, так что, подставляя численные значения, получаем
~r[t=6] = ~r.нач*(1+1E4*~k2)**5. (9.14)
Из условия r[t=6]<=1 находим
~k.2 <= 1E-5. (9.15)
Легко видеть, что существует задача, в определенном смысле обратная рассмотренной,- задача "обучения овладению"; в ней рассматривается поведение автомата в среде, содержащей раздражители группы "пища", так что в случае, если автомат переходит в ячейку, занятую этим раздражителем, осуществляется его поощрение, т.е. возбуждается i-модель Пр. Проведенные выше рассуждения с очевидными изменениями справедливы и для такой обратной задачи. Аналогичным способом получим ограничение сверху и для r.
Поскольку k.0 уже выбрано: k.0=1.5E-3, то r.нач=0.375. В ходе проторения получаем r[t=6]=r.нач(1+1E4*k.2) и из условия r[t=6]<=1 находим
k.2 <= 2.3E-5). (9.16)
В качестве иллюстрации на рис.75 приведены усредненные по 20 средам кривые обучения автомата при разных
значениях k.2 и ~k.2. Начальные участки кривых обучения хорошо описываются выражением L=n**a (a - коэффициент), так что в логарифмических масштабах кривая обучения изображается прямой. Характеристика обучения N - число шагов, сделанных автоматом до момента выполнения условия (9.13),- вычисляется как абсцисса точки пересечения прямых ln(L)=a*ln(n) и ln(L)=ln(2).
75. Кривые обучения М-автомата.
Перейдем к выбору области допустимых значений параметров k.2 и ~k.2. На рис.76 представлено фазовое пространство параметров. Цифры возле точек указывают значения характеристики обучения N при соответствующих значениях параметров. Видно, что условие N<=90 выполняется не для всех точек. Исключив из области значений, удовлетворяющих условиям (9.15) и (9.16), область, содержащую точки, для которых N>90, получим область допустимых значений параметров k.2 и ~k.2. На рис.76 эта область обведена жирной линией. В качестве рабочей выберем точку А, соответствующую значениям k.2=1.5E-5
и ~k.2=1.5E-5.
Рис.76. Область допустимых значений параметров проторения связей (А - рабочие значения параметров).
#4. ВЫБОР ЗНАЧЕНИЙ ПАРАМЕТРОВ ЗАТУХАНИЯ СВЯЗЕЙ. ЗАДАЧА ПОВТОРЕНИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Определим область допустимых значений параметров b и ~b в выражении (8.9).
В исследуемом варианте М-сеть реализует следующие виды удержания следов внешних воздействий (памяти): а) память возбуждений - задается коэффициентом затухания возбуждений a (см. 8.2); б) память связей - задается коэффициентами b и ~b в (8.9). Память возбуждений соответствует простейшей форме памяти, связанной со временем переходных процессов, и может быть реализована в неадаптивных системах. В таких системах при подаче на вход сигналов, следующих с интервалом, меньшим времени переходного процесса, реакции системы изменяются в связи с суперпозицией ответов на каждый сигнал. Процессы такого рода в М-сети уже исследованы. Память вида "б" соответствует памяти адаптивных систем, изменяющих свою структуру под действием входных сигналов на время, превышающее время переходных процессов, и, следовательно, способных к воспроизведению входных сигналов. Здесь мы имеем дело с более сложными формами памяти, соответствующими мнемоническим процессам в высших организмах.
Принято различать кратковременную оперативную и долговременную память человека. Оперативной памяти человека, характеризующейся ограниченным объемом и сравнительно небольшим временем удержания следа, поставим в соответствие память связей в М-сети. Ее параметры п исследуются в настоящем параграфе.
При изучении оперативной памяти часто используется эксперимент по воспроизведению последовательностей сигналов, предъявляемых испытуемому. (Сигналами в различных методиках служат одно- и двусложные слова, бессмысленные слоги и т.п.) В этой области получен важный результат, состоящий в установлении того факта, что люди-испытуемые, как правило, в состоянии безошибочно воспроизвести предъявленную им последовательность в том случае, если она содержит не более 7+/-2 сигналов. Этот результат проверен многими исследователями, что позволяет нам выбрать задачу воспроизведения последовательностей в качестве тестовой для настройки М-автомата. Параметры затухания связей выберем следующим образом. Построим вычислительную модель упомянутого эксперимента, используя в качестве "испытуемого" М-автомат с неопределенными параметрами b и ~b. Далее, определим такую область значений параметров, в которой поведение автомата является удовлетворительным. В дальнейшем будем считать эту область областью допустимых значений параметров.
Рис.77. Обучающая среда.
Известная методика проведения экспериментов по воспроизведению последовательностей модифицирована следующим образом, М-автомат помещался в среду (рис.77), содержащую "нейтральные" для автомата раздражители. В качестве исходных выбирались ячейки, отмеченные на рисунке символами A.1,...,A.10. Автомат выполнял 10 действий-шагов (<-). В описываемом эксперименте алгоритм A.д, был для удобства изменен так, что шаг (<-) выполнялся "через ячейку", так что, двигаясь из ячейки A.10, автомат последовательно занимал ячейки, отмеченные на рисунке точками. При этом последовательно воспринимались 10 различных ситуаций. Если движение начиналось из ячейки А.9 (А.8, ..., A.4), количество воспринятых за 10 шагов ситуаций составляло соответственно 9(8, ..., 4). После каждого шага алгоритм B.sit ставил в соответствие воспринятой ситуации единственную i-модель из сферы "памяти ситуаций" и эта i-модель получала дополнительное возбуждение. Таким образом,, при движении автомата последовательно возбуждались. 10 (9,..., 4) i-моделей ситуации. После выполнения 10 шагов в структуре автомата оказывалась сформированной цепочка, аналогичная представленной на рис.55,а. Затем специально введенный для данного эксперимента обслуживающий алгоритм предъявлял автомату ситуацию 1 (рис.77). При этом возбуждалась первая из сформированных i-моделей ситуаций и возбуждение от нее передавалось по цепочке, вызывая соответствующие переключения СУТ.пс. Выделение СУТ.пс любой i-модели ситуации рассматривалось как "воспроизведение" соответствующей ситуации. Поведение автомата считалось удовлетворительным, если ситуации воспроизводились в том же порядке, что и воспринимались. Исходная структура автомата представлена на рис.78 (формула Р1.9 С1.10 Д1.9 2); р - вспомогательная i-модель.
Рис.78. М-сеть автомата.
Ранее обсуждалась роль асимметрии связей в организации процесса повторения последовательностей. Коэффициент a.s в (8.11) целесообразно выбрать таким образом, чтобы обеспечиваемое им увеличение связи R.ij составляло (при средних значениях параметров) 0.1-0.2 начального значения. Примем для дальнейшего a.s=0.002.
Рис.79. Область допустимых значений параметров забывания связей (А - рабочие значения параметров).
Эксперименты проводились следующим образом. Автомат помещался в ячейку А.10, принималось b = ~b = 1 и проверялась правильность воспроизведения последовательности из 10 элементов. Затем проводились изменения b и ~b, и для каждой пары их значений проверялась правильность воспроизведения. Далее автомат помещался в ячейку A.9 (A.8, ..., A.4), и описанные операции повторялись. Полученные результаты приведены на рис.79. Штрихпунктиром обозначены верхние границы значений параметров, соответствующие ограничениям (8.9): b<=1; ~b<=1. Сплошными линиями обозначены полученные в эксперименте нижние границы областей, в которых выполняется правильное воспроизведение последовательностей. Цифры возле линий указывают длину последовательностей, правильное воспроизведение которых происходит в отграничиваемых областях. Так, на рисунке заштрихована область значений, в которой правильно воспроизводятся 10-элементные последовательности. Будем считать, что удовлетворительным поведением модели является повторение последовательностей длиной 7+/-2. Тогда область допустимых значений параметров ограничивается снизу границей области повторения 5-элементных, а сверху - 10-элемент-ных последовательностей. На рисунке эта область обведена жирной линией. В качестве рабочей примем точку А, соответствующую значениям
b = 0.99; ~b = 0.975. (9.17)
Следует отметить, что в случаях, когда последовательности воспроизводились неправильно, наблюдались ошибки двух типов. Так, для области повторения 5-элементных последовательностей в зоне, обозначенной на рисунке буквой В, характерными являлись ошибки типа "обрыв" - последовательность 1, 2, 3, 4, 5 воспроизводилась неполностью: 1, 2, 3. В зоне же С характерными являлись ошибки типа "персевераций" - последовательность воспроизводилась в виде: 1, 2, 3, 2, 3, 4, 3, 4, ... с последующим "обрывом". Аналогичные явления наблюдались для областей повторения 6-, 7- и 8-элементных последовательностей. Можно предположить, что различие типов ошибок обусловливает и форму границ указанных областей (характерный "клин" зоны С). Представляется интересным подробно проанализировать процессы передачи возбуждений в цепочках при ее воспроизведении, однако такой анализ достаточно сложен, никак не связан с задачей эмпирической настройки автомата и поэтому в данной работе не проводится.
В экспериментах по воспроизведению последовательностей людьми наблюдается обычно своеобразный "эффект начала": независимо от успешности воспроизведения последовательности в целом первые ее элементы испытуемый воспроизводит правильно. Аналогичный эффект наблюдается и в экспериментах с М-автоматом. Кроме того, при многократных повторениях последовательности позже всего "забывались" элементы, предъявленные автомату первыми.
При построении модели двигательного поведения найденные выше значения параметров b и ~b должны использоваться в тех ее блоках, где целесообразно обеспечить возможность "последовательного вспоминания" прошлого опыта. Прежде всего это относится к блоку ПС. В блоке же понятийных обобщений, например, представляется более важным "свободное ассоциирование". Это означает, что значения b и ~р должны выбираться здесь из других соображений. Как указывалось выше, коэффициенты затухания связей определяют объем оперативной памяти системы. Потребуем, чтобы оперативная память обеспечивала сохранение в М-сети информации лишь о достаточно часто повторяющихся событиях. Пусть Т.0 - среднее время повторения некоторых событий, а r.н - начальное значение проходимости связей (в момент установления). Тогда, если некоторое событие произошло в момент t и установилась связь rt=r.н и если в течение времени T>T.0 событие не повторилось, то проходимость r[t+T] не должна превышать некоторое малое значение r.min (связь должна быть "забыта"). Примем Т=2T.0 Переменная r.min имеет смысл числовой константы gvs, используемой алгоритмом B.VS. Пусть gvs=0.02. Имея в виду среду, с которой предстоит работать модели двигательного поведения, примем T.0=10. Запишем наше требование следующим образом:
r.н*b**2T.0 <= r.min. (9.18 )
Отсюда, подставляя числовые значения, получим
b<=0.86; ~b<=0.84. (9.19)
Таким образом, значения (9.17) обеспечивают запоминание последовательности событий, а значения (9.19) - запоминание событий, повторяющихся достаточно часто.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#5. ИССЛЕДОВАНИЕ ВЗАИМОДЕЙСТВИЯ ЭЛЕМЕНТАРНЫХ ПРОЦЕССОВ ОБУЧЕНИЯ. ЗАДАЧА ФОРМИРОВАНИЯ ПОНЯТИЙ
Выше были определены области допустимых значений всех основных параметров обучения. При этом мы стремились к тому, чтобы в каждом из тестов на работу М-автомата оказывали влияние лишь те параметры, значения которых в данном тесте подбирались. Так, в тестах, описанных в #3, 4, использовались только те значения параметров установления связей, которые были выбраны ранее, в #1. "Отключение" процессов проторения и затухания связей в этих тестах осуществлялось программно. Что касается остальных параметров, в большей или меньшей степени влияющих на поведение автоматов (значения порогов, коэффициентов и т.п.), то их значения принимались в соответствии с табл.7 и оставались постоянными для всех моделей, описанных в данном разделе.
Проверим пригодность подобранных в тестах значений параметров при их совместном применении. Проверку желательно произвести на примере такого теста, который никак не связан с задачами, использованными при определении значений параметров. Для этой цели выбрана задача одновременного формирования трех сложных понятий. Выбор именно этой задачи продиктован следующими соображениями. Процесс формирования понятий широко изучается в психологии. Имеются хорошо апробированные методики экспериментального исследования этого процесса, которые позволяют получить характеристики соответствующего поведения человека в числовой форме, т.е. в форме, удобной для сравнения с характеристиками поведения модели. Большое значение имеет также то обстоятельство, что ряд известных объяснений процесса формирования понятий естественно интерпретируется в терминах М-сетей. Кроме того, если нам удастся показать, что процессы в М-сети обеспечивают феномен формирования понятий, то полученные при этом данные могут быть использованы для предварительной организации и задания характеристик соответствующего блока модели двигательного поведения.
Построим проверку следующим образом. Применяя одну из известных методик, проведем психологический эксперимент по формированию понятий. Далее, построим вычислительную модель этого эксперимента, используя в качестве "испытуемого" М-автомат. При этом будем пользоваться только теми значениями параметров обучения, которые получены в предыдущих параграфах. Затем проведем сравнение поведения автомата с поведением людей-испытуемых. Если результаты сравнения окажутся удовлетворительными, будем считать удовлетворительными и найденные ранее значения параметров.
МЕТОДИКА ЭКСПЕРИМЕНТА. Использованная в эксперименте одна из известных методик модифицировалась для того, чтобы сделать ее удобной для дальнейшего представления в вычислительной модели; модификация заключалась в замене цифрами (в оригинальном варианте) геометрических фигур, цветовых знаков и т.п. Кроме того, эксперимент проводился в условиях дефицита времени.
Была подготовлена колода из 15 прямоугольных карт, на каждой из которых располагалась строка из шести цифр. Цифры помещались в строку в случайном порядке с одинаковыми для всех карт интервалами. Карты были разделены на три класса, по пять карт в каждом. В качестве названий классов использовались бессмысленные слова "пуно", "риду", "кема". Релевантным признаком каждого класса являлось наличие в строке двух определенных цифр. Колода тасовалась и карты последовательно предъявлялись испытуемому ("серия"). После ознакомления с картой за время, не превышающее 1сек, испытуемый должен был назвать класс, к которому принадлежит карта. Затем правильное название класса давал экспериментатор. После предъявления всех карт колода тасовалась и серия повторялась. Эксперимент оканчивался после первого правильного определения испытуемым принадлежности всех 15 карт. Фиксировалось количество правильных ответов Р в каждой серии. Кривая изменения Р в функции номера серии описывала ход процесса одновременного формирования трех сложных понятий.
Эксперимент проводился в два приема с 24 взрослыми испытуемыми обоего пола в возрасте 28-37 лет. В первой, предварительной, серии испытуемые осваивались с условиями эксперимента. Для проведения основной серии было отобрано 20 человек, не проявлявших в ходе эксперимента признаков эмоциональной напряженности или нежелания выполнять инструкцию. В проведении эксперимента принимали участие А.Н.Лук и И.А.Чепурнова.
Рис.80. Характерная кривая обучения человека-испытуемого.
РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА. Все испытуемые решили задачу успешно. Характерная кривая обучения схематически изображена на рис.80. Каждый эксперимент описывался двумя параметрами: временем обучения Т и коэффициентом ошибки м. Смысл параметра Т ясен из рис.80. Коэффициент м есть отношение числа ошибок, сделанных испытуемым в ходе обучения, к числу проб. По данным эксперимента м вычислялся следующим образом:
м = СУММА[i](15-P.i)/15T, i=1,2,...,T. (9.20)
Очевидно, 0<м<1. В качестве общего параметра кривой обучения использовался коэффициент K, характеризующий среднее число ошибок, приходящихся на одну карту:
К = м*Т. (9.21)
Чем быстрее и с меньшим числом ошибок проходит обучение, тем меньшим оказывается K. Значение К для разных испытуемых изменялось в пределах 1.5-12.5. На рис.81 представлена гистограмма распределения K. Видно, что по значению К все множество испытуемых естественно разделяется на три группы, характеристики которых приведены в табл.10.
Рис.81. Распределение K=м*T.
Таблица 10
Поскольку в дальнейшем предполагается сравнение результатов психологического эксперимента с модельным, введем правило отнесения кривых обучения к той или иной группе. Для этого изобразим показанные испытуемыми результаты в виде точек в пространстве параметров Т и м (рис.82). Внутри каждой группы существует корреляция между Т и м (коэффициенты корреляции приведены в табл.10). Это обстоятельство позволяет ввести меру принадлежности произвольной точки к той или иной группе как расстояние от точки до линии регрессии этой группы. Тогда границы между группами представляют собой биссектрисы углов между линиями регрессии. На рис.82 тонкими линиями показаны построенные стандартными методами линии регрессии Т и м для каждой из групп. Жирные липии обозначают принятые границы между группами.
Рис.82. Пространство решений.
Отметим следующее интересное обстоятельство. Во время кратких словесных отчетов, периодически проводимых в ходе эксперимента, испытуемые сообщали, например, следующее: "...всю серию обращал внимание только на кема...", или "...пуно уже знаю, искал только кема...". Последующий анализ протоколов показал, что в тех случаях, когда испытуемый "искал только кема", как правило, резко увеличивалось количество правильных узнаваний карт других классов, так что через одну-две серии предъявлений испытуемый неожиданно для себя "вдруг" выделял признак класса, на который будто бы не обращал внимания. Это наблюдение (сделанное А.Н.Луком) позволяет полагать, что ряд важных процессов обучения не осознается испытуемым. Последнее обстоятельство свидетельствует о том, что выбранная нами методика и техника проведения эксперимента блокирует способность испытуемых использовать при решении задачи специфические для такого рода деятельности интеллектуальные операции (различные стратегии поисков, мнемонические приемы и т.п.). Можно полагать, что здесь мы имеем дело с работой более простых механизмов, обеспечивающих способность к удержанию информации. Таким образом, именно эта способность должна быть представлена в модели формирования понятий, которую нам предстоит построить.
МОДЕЛЬ ФОРМИРОВАНИЯ ПОНЯТИЙ. В М-сетях удержание информации реализуется функциями установления и проторения связей между i-моделями внешних раздражителей. Для существующих в психологии и нейропсихологии объяснений процессов формирования понятий характерно представление о связях (условных, ассоциативных, нервных) между различными элементами исследуемой системы (отображениями стимулов, образами, очагами возбуждения). Речь идет о возникновении, закреплении и угасании этих связей. Используя литературные данные, приведем схематическое описание процессов, связанных с формированием понятий в М-автомате, моделирующем деятельность испытуемого при проведении описанного выше эксперимента.
В ходе эксперимента испытуемый оперирует образами цифр, их совокупностей и названиями классов. Соответственно, М-автомат должен содержать i-модели цифр от 0 до 9 и i-модели классов (рис.83). При предъявлении испытуемому одной карты он воспринимает шесть изображенных на ней цифр. В М-автомате это соответствует возбуждению шести определенных i-моделей. Далее, испытуемый слышит правильное название карты, даваемое экспериментатором. В М-автомате этому соответствует возбуждение i-модели класса. Описанные процессы составляют одно предъявление. После предъявления в автомате оказывается выполненным условие установления, и между возбужденными i-моделями устанавливаются связи. Наш эксперимент показал, что испытуемые не могут и не стремятся запоминать содержание определенных карт. Это позволяет пренебречь связями между i-моделями цифр, т.е. считать их проходимости достаточно малыми; можно также считать, что удержание информации осуществляется в основном за счет памяти связей и можно пренебречь влиянием временной памяти возбуждении. Таким образом, примем для всех i-моделей a.i=0.
Рис.83. М-сеть автомата.
Пусть автомату предъявлены подряд несколько карт одного класса. После каждого предъявления устанавливаются новые и проторяются имевшиеся ранее связи. В результате самыми проторенными окажутся связи, идущие от i-моделей наиболее часто встречающихся цифр, т.е. цифр, составляющих релевантный признак (см., например, рис. 83, где толщина линий, изображающих связи, пропорциональна их проходимости). При предъявлении карт другого класса наиболее проторенными окажутся связи между i-моделями релевантного признака этого класса и i-моделью его названия. Если теперь предъявить новую карту одного из этих классов, возбудив i-модели определенных цифр, и произвести пересчет возбуждений по имеющимся связям, то наибольшее возбуждение получит i-модель того класса, релевантные признаки которого имелись в карте. Это означает, что соответствующая i-модель будет выбрана СУТ, и мы сможем интерпретировать этот выбор как "правильное узнавание" автоматом предъявленной карты.
В описанном виде автомат имеет много общего с машинами условной вероятности, описанными Аттли и позднее Штайнбухом и др. Дальнейшее развитие нашей модели связано с учетом реакций испытуемого на совпадение или несовпадение предложенного им названия карты с правильным названием.
Выделяются следующие однотипные этапы поведения испытуемого: 1) рассматривает предъявленную карту и узнает ее; 2) после ответа экспериментатора проявляет эмоциональную реакцию, позитивную или негативную; 3) рассматривает предъявленную карту, уже зная ее правильное название. Последний этап соответствует как бы еще одному предъявлению карты и ее правильному узнаванию.
В соответствии с приведенными описаниями и была построена программа, моделирующая эксперимент. Входная информация представлялась в виде таблицы нз 15 строк, каждая из которых содержала шесть цифр и соответствовала одной карте в эксперименте. Была организована случайная выборка строк из таблицы и предъявление их автомату, структура которого соответствовала структуре на рис.83. В исходном состоянии связи не задавались и первые ответы автомат выбирал случайным образом. В программу вводилась также информация о принадлежности карт классам. При правильном ответе возбуждалась i-модель Пр, при неправильном - НПр.
Структура программы поясняется блок-схемой на рис.84. В блоке "установление" реализовывалась функция (8.8 ), "проторение" - функция (8.10), "пересчет" - функция (8.6). Значения параметров М-сети соответствовали величинам, определенным в #1-4. На обучение автомата отводилось не более 30 серий предъявлений. Чтобы исключить влияние на результаты обучения последовательности предъявления карт в серии, кривая обучения определялась путем статистической обработки 20 экспериментов. Таким образом, кривая обучения автомата характеризует динамику величины математического ожидания числа правильных ответов в серии. Программа была записана на входном языке транслятора АЛГОЛ-БЭСМ и исследовалась на ЦВМ БЭСМ-6. Объем программы составлял 2000(8 ) рабочих команд, время просчета модели - около 3мин.
Рис.84. Блок-схема программы формирования понятий.
ЭКСПЕРИМЕНТЫ С МОДЕЛЬЮ. На рис.85 представлена кривая обучения автомата и ее среднеквадратичные отклонения. Значения параметров обучения соответствовали координатам точки А на рис.62, 76 и 79. В дальнейшем будем называть эту совокупность значений основным вариантом. Для кривой, изображенной на рисунке, Т=7; м=0.347; K=2.43. Представляющая точка автомата в пространстве параметров Т и м. принадлежит первой, наиболее представительной группе, однако не совпадает ни с одной из точек, представляющих людей-испытуемых.
Рис.85. Усредненная кривая обучения М-автомата.
Наблюдаемый в психологическом эксперименте разброс результатов может быть объяснен индивидуальными различиями в характере нервных процессов испытуемых, а также отличиями их мотивации при решении задачи. В терминах М-автомата эти различия могут быть интерпретированы в различия параметров обучения, т.е. коэффициентов установления, проторения и затухания связей, а также интенсивности возбуждения i-моделей Пр и НПр при правильных и неправильных ответах. Чтобы показать правомерность этого утверждения, была предпринята попытка воспроизвести в модели кривые обучения испытуемых путем изменения указанных параметров.
Изменения проводились внутри определенных ранее областей допустимых значений. Полное исследование пространства параметров не являлось необходимым для решения поставленной задачи. Варьировались все основные параметры обучения и некоторые их совокупности. Характеристики ряда интересных в практическом отношении вариаций представлены в табл.11. На каждом шаге изменения параметров проводилось 20 экспериментов с автоматом, кривые обучения усреднялись и по усредненной кривой вычислялись коэффициенты T и м. Изменения Т и м соответствуют перемещению представляющей точки автомата в пространстве (рис.82). Каждая вариация, таким образом, может быть графически изображена в виде траектории представляющей точки в этом пространстве.
Таблица 11
Вариации 1-8 проводились с целью изучения характера влияния отдельных параметров на процесс обучения. Соответствующие траектории представлены на рис.86,а. Видно, что изменения отдельных параметров редко выводят представляющую точку за границы I группы. Обнаруживается также, что в области допустимых значений автомат некритичен к изменению каждого из параметров обучения усиливающих компонент связей - траектории вариаций 1, 3 и 5 суть точки.
Рис.86. Траектории представляющей точки М-автомата при изменении параметров.
На рис.86,б приведены траектории вариаций 4, 6, 9, 10, переводящих рабочую точку в области пространства, соответствующие I, II и III группам. Таким образом, изменяя параметры обучения, можно совмещать показатели обучения автомата с показателями обучения испытуемых различных групп. Иначе говоря, разработанный М-автомат может быть использован в качестве модели испытуемых различных групп. Параметры, превращающие автомат в такие модели, приведены в табл.12.
Таблица 12
Представляет также интерес сопоставление кривых обучения автомата с кривыми обучения отдельных испытуемых. Это сопоставление проведено по данным испытуемых и автоматов I группы. Сравнивались кривые обучения людей и неусредненные кривые обучения автоматов. Сравнение показало, что кривые имеют одинаковый характер и в ряде случаев могут быть хорошо совмещены. В качестве примера на рис.87 приведено шесть пар кривых обучений. В каждой паре одна кривая получена в эксперименте с человеком и одна - в эксперименте с автоматом (отмечены буквой М). Чтобы исключить субъективность в оценке совместимости кривых, был использован модифицированный критерий Тьюринга. Каждая пара кривых была предъявлена 10 лицам, знакомым с характером и результатами эксперимента (бывшим испытуемым), с просьбой указать "машинную" кривую. Всего, таким образом, наблюдалось 60 выборов. "Машинные" кривые были правильно названы в 24 случаях, что мало отличается от вероятного числа удачных выборов при случайном угадывании. Описанные выше результаты позволяют считать предложенную модель в целом адекватной экспериментальным данным.
Рис.87. Кривые обучения людей-испытуемых (И) и М-автоматов (М).
Дальнейший анализ результатов экспериментального исследования модели связан с рассмотрением структуры М-сети, возникающей в ходе обучения автомата. Ниже приведена матрица связей, направленных от i-моделей признаков 1, 2, ..., 10 к i-моделям классов "пуно" (П), "риду" (Р), "кема" (К). Пара чисел на пересечении i-й строки и j-го столбца соответствует численному значению компонент r.ij (в клетке вверху) и ~r.ij (внизу) связи R.ij. Числа представляют собой среднеарифметические значения проходимостей, полученные при обработке 15 матриц, каждая из которых соответствовала одной реализации процесса обучения основного варианта модели. Разброс значений для всех связей характеризуется величиной среднеквадратичного отклонения порядка 0.05-0.16.
Из структуры матрицы видно, что возбуждение i-го признака ведет к возбуждению i-моделей П, Р и К. При этом возбужденности последних в общем случае оказываются различными. Значимость i-ro признака для возбуждения i-модели класса можно охарактеризовать величиной
гx.i = r.xi/~r.xi (9.22)
...
Выше были определены области допустимых значений всех основных параметров обучения. При этом мы стремились к тому, чтобы в каждом из тестов на работу М-автомата оказывали влияние лишь те параметры, значения которых в данном тесте подбирались. Так, в тестах, описанных в #3, 4, использовались только те значения параметров установления связей, которые были выбраны ранее, в #1. "Отключение" процессов проторения и затухания связей в этих тестах осуществлялось программно. Что касается остальных параметров, в большей или меньшей степени влияющих на поведение автоматов (значения порогов, коэффициентов и т.п.), то их значения принимались в соответствии с табл.7 и оставались постоянными для всех моделей, описанных в данном разделе.
Проверим пригодность подобранных в тестах значений параметров при их совместном применении. Проверку желательно произвести на примере такого теста, который никак не связан с задачами, использованными при определении значений параметров. Для этой цели выбрана задача одновременного формирования трех сложных понятий. Выбор именно этой задачи продиктован следующими соображениями. Процесс формирования понятий широко изучается в психологии. Имеются хорошо апробированные методики экспериментального исследования этого процесса, которые позволяют получить характеристики соответствующего поведения человека в числовой форме, т.е. в форме, удобной для сравнения с характеристиками поведения модели. Большое значение имеет также то обстоятельство, что ряд известных объяснений процесса формирования понятий естественно интерпретируется в терминах М-сетей. Кроме того, если нам удастся показать, что процессы в М-сети обеспечивают феномен формирования понятий, то полученные при этом данные могут быть использованы для предварительной организации и задания характеристик соответствующего блока модели двигательного поведения.
Построим проверку следующим образом. Применяя одну из известных методик, проведем психологический эксперимент по формированию понятий. Далее, построим вычислительную модель этого эксперимента, используя в качестве "испытуемого" М-автомат. При этом будем пользоваться только теми значениями параметров обучения, которые получены в предыдущих параграфах. Затем проведем сравнение поведения автомата с поведением людей-испытуемых. Если результаты сравнения окажутся удовлетворительными, будем считать удовлетворительными и найденные ранее значения параметров.
МЕТОДИКА ЭКСПЕРИМЕНТА. Использованная в эксперименте одна из известных методик модифицировалась для того, чтобы сделать ее удобной для дальнейшего представления в вычислительной модели; модификация заключалась в замене цифрами (в оригинальном варианте) геометрических фигур, цветовых знаков и т.п. Кроме того, эксперимент проводился в условиях дефицита времени.
Была подготовлена колода из 15 прямоугольных карт, на каждой из которых располагалась строка из шести цифр. Цифры помещались в строку в случайном порядке с одинаковыми для всех карт интервалами. Карты были разделены на три класса, по пять карт в каждом. В качестве названий классов использовались бессмысленные слова "пуно", "риду", "кема". Релевантным признаком каждого класса являлось наличие в строке двух определенных цифр. Колода тасовалась и карты последовательно предъявлялись испытуемому ("серия"). После ознакомления с картой за время, не превышающее 1сек, испытуемый должен был назвать класс, к которому принадлежит карта. Затем правильное название класса давал экспериментатор. После предъявления всех карт колода тасовалась и серия повторялась. Эксперимент оканчивался после первого правильного определения испытуемым принадлежности всех 15 карт. Фиксировалось количество правильных ответов Р в каждой серии. Кривая изменения Р в функции номера серии описывала ход процесса одновременного формирования трех сложных понятий.
Эксперимент проводился в два приема с 24 взрослыми испытуемыми обоего пола в возрасте 28-37 лет. В первой, предварительной, серии испытуемые осваивались с условиями эксперимента. Для проведения основной серии было отобрано 20 человек, не проявлявших в ходе эксперимента признаков эмоциональной напряженности или нежелания выполнять инструкцию. В проведении эксперимента принимали участие А.Н.Лук и И.А.Чепурнова.
Рис.80. Характерная кривая обучения человека-испытуемого.
РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА. Все испытуемые решили задачу успешно. Характерная кривая обучения схематически изображена на рис.80. Каждый эксперимент описывался двумя параметрами: временем обучения Т и коэффициентом ошибки м. Смысл параметра Т ясен из рис.80. Коэффициент м есть отношение числа ошибок, сделанных испытуемым в ходе обучения, к числу проб. По данным эксперимента м вычислялся следующим образом:
м = СУММА[i](15-P.i)/15T, i=1,2,...,T. (9.20)
Очевидно, 0<м<1. В качестве общего параметра кривой обучения использовался коэффициент K, характеризующий среднее число ошибок, приходящихся на одну карту:
К = м*Т. (9.21)
Чем быстрее и с меньшим числом ошибок проходит обучение, тем меньшим оказывается K. Значение К для разных испытуемых изменялось в пределах 1.5-12.5. На рис.81 представлена гистограмма распределения K. Видно, что по значению К все множество испытуемых естественно разделяется на три группы, характеристики которых приведены в табл.10.
Рис.81. Распределение K=м*T.
Таблица 10
Поскольку в дальнейшем предполагается сравнение результатов психологического эксперимента с модельным, введем правило отнесения кривых обучения к той или иной группе. Для этого изобразим показанные испытуемыми результаты в виде точек в пространстве параметров Т и м (рис.82). Внутри каждой группы существует корреляция между Т и м (коэффициенты корреляции приведены в табл.10). Это обстоятельство позволяет ввести меру принадлежности произвольной точки к той или иной группе как расстояние от точки до линии регрессии этой группы. Тогда границы между группами представляют собой биссектрисы углов между линиями регрессии. На рис.82 тонкими линиями показаны построенные стандартными методами линии регрессии Т и м для каждой из групп. Жирные липии обозначают принятые границы между группами.
Рис.82. Пространство решений.
Отметим следующее интересное обстоятельство. Во время кратких словесных отчетов, периодически проводимых в ходе эксперимента, испытуемые сообщали, например, следующее: "...всю серию обращал внимание только на кема...", или "...пуно уже знаю, искал только кема...". Последующий анализ протоколов показал, что в тех случаях, когда испытуемый "искал только кема", как правило, резко увеличивалось количество правильных узнаваний карт других классов, так что через одну-две серии предъявлений испытуемый неожиданно для себя "вдруг" выделял признак класса, на который будто бы не обращал внимания. Это наблюдение (сделанное А.Н.Луком) позволяет полагать, что ряд важных процессов обучения не осознается испытуемым. Последнее обстоятельство свидетельствует о том, что выбранная нами методика и техника проведения эксперимента блокирует способность испытуемых использовать при решении задачи специфические для такого рода деятельности интеллектуальные операции (различные стратегии поисков, мнемонические приемы и т.п.). Можно полагать, что здесь мы имеем дело с работой более простых механизмов, обеспечивающих способность к удержанию информации. Таким образом, именно эта способность должна быть представлена в модели формирования понятий, которую нам предстоит построить.
МОДЕЛЬ ФОРМИРОВАНИЯ ПОНЯТИЙ. В М-сетях удержание информации реализуется функциями установления и проторения связей между i-моделями внешних раздражителей. Для существующих в психологии и нейропсихологии объяснений процессов формирования понятий характерно представление о связях (условных, ассоциативных, нервных) между различными элементами исследуемой системы (отображениями стимулов, образами, очагами возбуждения). Речь идет о возникновении, закреплении и угасании этих связей. Используя литературные данные, приведем схематическое описание процессов, связанных с формированием понятий в М-автомате, моделирующем деятельность испытуемого при проведении описанного выше эксперимента.
В ходе эксперимента испытуемый оперирует образами цифр, их совокупностей и названиями классов. Соответственно, М-автомат должен содержать i-модели цифр от 0 до 9 и i-модели классов (рис.83). При предъявлении испытуемому одной карты он воспринимает шесть изображенных на ней цифр. В М-автомате это соответствует возбуждению шести определенных i-моделей. Далее, испытуемый слышит правильное название карты, даваемое экспериментатором. В М-автомате этому соответствует возбуждение i-модели класса. Описанные процессы составляют одно предъявление. После предъявления в автомате оказывается выполненным условие установления, и между возбужденными i-моделями устанавливаются связи. Наш эксперимент показал, что испытуемые не могут и не стремятся запоминать содержание определенных карт. Это позволяет пренебречь связями между i-моделями цифр, т.е. считать их проходимости достаточно малыми; можно также считать, что удержание информации осуществляется в основном за счет памяти связей и можно пренебречь влиянием временной памяти возбуждении. Таким образом, примем для всех i-моделей a.i=0.
Рис.83. М-сеть автомата.
Пусть автомату предъявлены подряд несколько карт одного класса. После каждого предъявления устанавливаются новые и проторяются имевшиеся ранее связи. В результате самыми проторенными окажутся связи, идущие от i-моделей наиболее часто встречающихся цифр, т.е. цифр, составляющих релевантный признак (см., например, рис. 83, где толщина линий, изображающих связи, пропорциональна их проходимости). При предъявлении карт другого класса наиболее проторенными окажутся связи между i-моделями релевантного признака этого класса и i-моделью его названия. Если теперь предъявить новую карту одного из этих классов, возбудив i-модели определенных цифр, и произвести пересчет возбуждений по имеющимся связям, то наибольшее возбуждение получит i-модель того класса, релевантные признаки которого имелись в карте. Это означает, что соответствующая i-модель будет выбрана СУТ, и мы сможем интерпретировать этот выбор как "правильное узнавание" автоматом предъявленной карты.
В описанном виде автомат имеет много общего с машинами условной вероятности, описанными Аттли и позднее Штайнбухом и др. Дальнейшее развитие нашей модели связано с учетом реакций испытуемого на совпадение или несовпадение предложенного им названия карты с правильным названием.
Выделяются следующие однотипные этапы поведения испытуемого: 1) рассматривает предъявленную карту и узнает ее; 2) после ответа экспериментатора проявляет эмоциональную реакцию, позитивную или негативную; 3) рассматривает предъявленную карту, уже зная ее правильное название. Последний этап соответствует как бы еще одному предъявлению карты и ее правильному узнаванию.
В соответствии с приведенными описаниями и была построена программа, моделирующая эксперимент. Входная информация представлялась в виде таблицы нз 15 строк, каждая из которых содержала шесть цифр и соответствовала одной карте в эксперименте. Была организована случайная выборка строк из таблицы и предъявление их автомату, структура которого соответствовала структуре на рис.83. В исходном состоянии связи не задавались и первые ответы автомат выбирал случайным образом. В программу вводилась также информация о принадлежности карт классам. При правильном ответе возбуждалась i-модель Пр, при неправильном - НПр.
Структура программы поясняется блок-схемой на рис.84. В блоке "установление" реализовывалась функция (8.8 ), "проторение" - функция (8.10), "пересчет" - функция (8.6). Значения параметров М-сети соответствовали величинам, определенным в #1-4. На обучение автомата отводилось не более 30 серий предъявлений. Чтобы исключить влияние на результаты обучения последовательности предъявления карт в серии, кривая обучения определялась путем статистической обработки 20 экспериментов. Таким образом, кривая обучения автомата характеризует динамику величины математического ожидания числа правильных ответов в серии. Программа была записана на входном языке транслятора АЛГОЛ-БЭСМ и исследовалась на ЦВМ БЭСМ-6. Объем программы составлял 2000(8 ) рабочих команд, время просчета модели - около 3мин.
Рис.84. Блок-схема программы формирования понятий.
ЭКСПЕРИМЕНТЫ С МОДЕЛЬЮ. На рис.85 представлена кривая обучения автомата и ее среднеквадратичные отклонения. Значения параметров обучения соответствовали координатам точки А на рис.62, 76 и 79. В дальнейшем будем называть эту совокупность значений основным вариантом. Для кривой, изображенной на рисунке, Т=7; м=0.347; K=2.43. Представляющая точка автомата в пространстве параметров Т и м. принадлежит первой, наиболее представительной группе, однако не совпадает ни с одной из точек, представляющих людей-испытуемых.
Рис.85. Усредненная кривая обучения М-автомата.
Наблюдаемый в психологическом эксперименте разброс результатов может быть объяснен индивидуальными различиями в характере нервных процессов испытуемых, а также отличиями их мотивации при решении задачи. В терминах М-автомата эти различия могут быть интерпретированы в различия параметров обучения, т.е. коэффициентов установления, проторения и затухания связей, а также интенсивности возбуждения i-моделей Пр и НПр при правильных и неправильных ответах. Чтобы показать правомерность этого утверждения, была предпринята попытка воспроизвести в модели кривые обучения испытуемых путем изменения указанных параметров.
Изменения проводились внутри определенных ранее областей допустимых значений. Полное исследование пространства параметров не являлось необходимым для решения поставленной задачи. Варьировались все основные параметры обучения и некоторые их совокупности. Характеристики ряда интересных в практическом отношении вариаций представлены в табл.11. На каждом шаге изменения параметров проводилось 20 экспериментов с автоматом, кривые обучения усреднялись и по усредненной кривой вычислялись коэффициенты T и м. Изменения Т и м соответствуют перемещению представляющей точки автомата в пространстве (рис.82). Каждая вариация, таким образом, может быть графически изображена в виде траектории представляющей точки в этом пространстве.
Таблица 11
Вариации 1-8 проводились с целью изучения характера влияния отдельных параметров на процесс обучения. Соответствующие траектории представлены на рис.86,а. Видно, что изменения отдельных параметров редко выводят представляющую точку за границы I группы. Обнаруживается также, что в области допустимых значений автомат некритичен к изменению каждого из параметров обучения усиливающих компонент связей - траектории вариаций 1, 3 и 5 суть точки.
Рис.86. Траектории представляющей точки М-автомата при изменении параметров.
На рис.86,б приведены траектории вариаций 4, 6, 9, 10, переводящих рабочую точку в области пространства, соответствующие I, II и III группам. Таким образом, изменяя параметры обучения, можно совмещать показатели обучения автомата с показателями обучения испытуемых различных групп. Иначе говоря, разработанный М-автомат может быть использован в качестве модели испытуемых различных групп. Параметры, превращающие автомат в такие модели, приведены в табл.12.
Таблица 12
Представляет также интерес сопоставление кривых обучения автомата с кривыми обучения отдельных испытуемых. Это сопоставление проведено по данным испытуемых и автоматов I группы. Сравнивались кривые обучения людей и неусредненные кривые обучения автоматов. Сравнение показало, что кривые имеют одинаковый характер и в ряде случаев могут быть хорошо совмещены. В качестве примера на рис.87 приведено шесть пар кривых обучений. В каждой паре одна кривая получена в эксперименте с человеком и одна - в эксперименте с автоматом (отмечены буквой М). Чтобы исключить субъективность в оценке совместимости кривых, был использован модифицированный критерий Тьюринга. Каждая пара кривых была предъявлена 10 лицам, знакомым с характером и результатами эксперимента (бывшим испытуемым), с просьбой указать "машинную" кривую. Всего, таким образом, наблюдалось 60 выборов. "Машинные" кривые были правильно названы в 24 случаях, что мало отличается от вероятного числа удачных выборов при случайном угадывании. Описанные выше результаты позволяют считать предложенную модель в целом адекватной экспериментальным данным.
Рис.87. Кривые обучения людей-испытуемых (И) и М-автоматов (М).
Дальнейший анализ результатов экспериментального исследования модели связан с рассмотрением структуры М-сети, возникающей в ходе обучения автомата. Ниже приведена матрица связей, направленных от i-моделей признаков 1, 2, ..., 10 к i-моделям классов "пуно" (П), "риду" (Р), "кема" (К). Пара чисел на пересечении i-й строки и j-го столбца соответствует численному значению компонент r.ij (в клетке вверху) и ~r.ij (внизу) связи R.ij. Числа представляют собой среднеарифметические значения проходимостей, полученные при обработке 15 матриц, каждая из которых соответствовала одной реализации процесса обучения основного варианта модели. Разброс значений для всех связей характеризуется величиной среднеквадратичного отклонения порядка 0.05-0.16.
Из структуры матрицы видно, что возбуждение i-го признака ведет к возбуждению i-моделей П, Р и К. При этом возбужденности последних в общем случае оказываются различными. Значимость i-ro признака для возбуждения i-модели класса можно охарактеризовать величиной
гx.i = r.xi/~r.xi (9.22)
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
В табл.13 приведены значения г для i-моделей признаков 1-10. Видно, что максимально значимыми для каждого класса оказываются его релевантные признаки (в таблице подчеркнуты). Это свидетельствует о том, что правильное отнесение карты к одному из классов осуществляется за счет преимущественного значения усиливающих компонент связей, направленных от i-моделей релевантных признаков к i-моделям соответствующих классов. Из содержательного анализа процессов в автомате ясно, что наибольшее относительное возбуждение i-модели "правильного" класса при предъявлении некоторой карты может быть получено в случае, если значения тормозных компонент связей, направленных к i-моделям "неправильных" классов от i-моделей релевантных признаков, окажутся большими, чем значения усиливающих компонент этих связей. Следовательно, наиболее эффективной явится такая структура модели, для которой все, кроме подчеркнутых, значения г в 1, 2, 4, 5, 7 и 8-й строках табл.13 будут удовлетворять неравенству 0<=г<=1. Из приведенной таблицы видно, что для структуры, полученной в эксперименте, это неравенство удовлетворяется не всюду. В частности, "недостаточно обученными" остались связи R.Р7 и R.Р8. Возможные причины этого явления будут проанализированы ниже.
Таблица 13
Данные табл.13 позволяют оценить "степень обученности" групп связей, направленных от i-моделей признаков к i-моделям П, К, Р. В момент установления связи R.ji признак i приобретает некоторое начальное значение гj.0i. Поскольку все связи в момент установления равны, то, при принятых в основном варианте значениях параметров обучения, для всех i и j
гj.0i = г.0 = 0.6. (9.23)
Используя начальное г.0 и финальные (табл.13) значения г, введем для каждой связи меру обученности
с.ji = |гj.i-г.0|. (9.24)
Среднюю обученность групп связей, направленных к i-моделям П, Р, К, определим как
с.x = СУММА[i]с.xi / 10. (9.23)
При подсчете параметров (9.25) с целью выравнивания результатов не учитывались три признака, каждый из которых имел максимальное значение г. Для исследуемой структуры получено:
с.П=0.73; с.Р=1.05; с.К=1.11. (9.26)
Структура связей автомата формируется в основном под влиянием двух факторов: набора значений параметров обучения и структуры обучающего материала. Показанное выше совпадение поведений модели и испытуемых является косвенным свидетельством правильности выбора значений параметров обучения. Чтобы продемонстрировать это в явной форме, необходимо показать адекватность структуры обучающего материала отражающей ее структуре М-сети автомата. Сделаем это следующим образом. Имея данную структуру обучающего материала, т.е. определенное размещение признаков на картах, можно определить информативность I0.i каждого из признаков. Анализируя приведенную выше матрицу, можно определить информативность IМ.j каждой i-модели признака в М-сети. В случае, если информативности признаков и их i-моделей совпадают достаточно близко, будем считать, что М-сеть хорошо отображает обучающий материал. Определим необходимые понятия.
Информативность данного признака обратно пропорциональна числу карт n, в которых этот признак встречается. Информативность релевантных признаков естественно считать большей и обратно пропорциональной числу вхождений признака в карты, принадлежащие классам, для которых он не релевантен. Таким образом, информативность i-го признака определяется как
I0.i = 15/n + e*10/(n-5), (9.27)
где
e =
1 для признака, релевантного какому-либо классу;
0 для признака, не релевантного никакому классу.
Информативность i-модели некоторого признака относительно i-модели данного класса интуитивно оценивается по степени ее влияния, усиливающегося или тормозного, на i-модель этого класса. В соответствии с этим информативность IМ.ix i-й i-модели признака относительно класса x вычисляется как отношение большей компоненты связи R.xi к меньшей компоненте этой же связи:
IМ.ix = (r.xi/~r.xi)**д, (9.28 )
где
д =
1 при r.xi >= ~r.xi,
-1 при r.xi <= ~r.xi.
Полная информативность i-модели признака i в М-сети определяется в виде
IМ.i = IМ.iП + IМ.iР + IМ.iК (9.29)
Значения IМ.i нормировались путем умножения на коэффициент
K = СУММА[i]I0.i / СУММА[i]IМ.i. (9.30)
Результаты расчетов приведены в табл.14. Близость I0.i и IМ.i оценивалась по критерию хи2. Для полученных данных значение хи2, рассчитанное стандартным способом, составило 2.16, что с высокой степенью достоверности (p=0.98 ) позволяет считать информативности признаков и их i-моделей совпадающими. Таким образом, выбранные значения параметров обучения можно рассматривать как удовлетворительные.
Таблица 14
Представляет интерес определение устойчивости U решения задач моделью. Под устойчивостью понимается отношение количества правильно классифицированных карт к общему количеству предъявленных карт при неограниченном увеличении числа предъявлений. Определим нижнюю границу U. Пользуясь значениями IМ.ix, нетрудно подобрать для каждого из классов наиболее "трудные" карты, т.е. такие, которые содержат релевантные признаки данного класса и те из остальных признаков, сумма информативностей которых относительно других классов максимальна. Для класса П, например, такая карта будет содержать признаки 1, 2, 4, 6, 7, 10. Предъявим автомату эти (три) карты и оценим выполненные им в каждом случае решения параметром р, вычисляемым как отношение возбужденности i-модели "правильного" к максимальной возбужденности i-модели "неправильного" класса. Для классов П, Р, К этот параметр составил соответственно: р.П=0.64, р.Р=1.32 и р.К=1.32. Это означает, что для класса П ответ был дан неправильно и, следовательно, среди всех возможных карт класса П имеются такие, которые будут классифицированы неверно. Любые же карты классов Р и К будут распознаваться правильно. Таким образом, нижняя граница U лежит не ниже 0.66 или, грубо, U>=0.7.
Следует отметить, что между вычисленными выше числовыми характеристиками элементов анализируемой структуры и результатами психологического эксперимента имеются определенные соответствия. Так, из табл.15 видно, что максимальной информативностью обладает признак 1. Анализ протоколов эксперимента показывает, что именно этот признак анализировался испытуемым в первую очередь. Далее, как показано выше, минимальному обучению подвергалась группа связей, направленных к i-модели класса П (с.П=0.73), причем отношение
с.Р/с.П ~ с.К/с.П ~ 1.5 (9.31)
Можно предположить, что чем меньше с.x, тем быстрее заканчивается обучение и тем раньше испытуемые обучаются правильно распознавать класс x. Анализ протоколов показал, что среднее время Т.ср обучения испытуемых правильному распознаванию классов П, Р, К составляет соответственно: ТП.ср=10; ТК.ср=16.6; ТР.ср=16.6. При этом
ТР.ср/ТП.ср = ТК.ср/ТП.ср = 1.66, (9.32)
что хорошо совпадает с аналогичным отношением для модели. Интересно, что завершившееся наиболее легко обучение класса П оказалось для модели н самым неустойчивым (р.п=0.64).
Особо следует остановиться на следующем обстоятельстве. Эксперимент показал, что как только испытуемый выделяет релевантные признаки двух каких-либо классов, он начинает относить к третьему классу все карты, не содержащие известные ему признаки. Обучение заканчивается, таким образом, в момент определения признаков двух, а не трех классов. Этим, в частности, можно объяснить равенство параметров ТР.ср и ТК.ср Типичные для большинства испытуемых процессы обучения можно описать в этом случае следующим образом. Вначале выделяется класс П как содержащий наиболее информативные (в сумме) релевантные признаки. Как только эти признаки выделены, испытуемые анализируют классы Р и К, причем для обоих классов процесс развивается параллельно, независимо от того, осознан он или нет. В какой-то момент определяется один из классов и обучение заканчивается.
Предположим теперь, что процесс обучения в модели развивается по той же схеме. Вначале анализ всех трех классов идет параллельно: в модели не реализован механизм сознательного выбора объекта анализа. Анализ класса П заканчивается первым (по тем же причинам, что и у людей-испытуемых), и с этого момента соответствующая часть структуры изменяется мало (это обусловлено структурой алгоритмов обучения - см. рис.84). Поэтому с.П<с.К и с.П<с.Р. Происходит дальнейший параллельный анализ классов Р и К. В какой-то момент заканчивается анализ класса, например К, и следовало бы ожидать, что дальнейшая работа связана с продолжением анализа Р. Однако этому противоречит равенство с.Р ~ с.К, что заставляет предположить, что с окончанием анализа класса К заканчивается и обучение вообще. Об этом же свидетельствуют равенство р.P=р.К и отмеченная раньше "недостаточная обученность" связей в классе Р от его релевантных признаков (определенная по параметру г). Таким образом, возникает предположение о том, что М-сеть автомата в неявной форме реализует некоторое правило, сходное по своему влиянию на ход обучения с правилом, используемым испытуемыми. Это предположение, очевидно, не является достаточно обоснованным, однако позволяет объяснить ряд совпадений числовых характеристик модели.
В ходе экспериментов с программой был обнаружен и ряд ограничений, присущих модели. Это, в частности, касается воспроизведения автоматом кривых обучения испытуемых III группы. Для последних характерно большое время обучения (Т>20), значительную часть которого количество правильных ответов за серию колеблется в пределах 4-7. В случаях же Т>20 для М-автомата большую часть времени обучения количество правильных ответов за серию составляет 10-12. Это приводит к тому, что коэффициент м для автоматов III группы меньше, чем для людей-испытуемых. В тех случаях, когда подбором параметров удается увеличить м, часто обнаруживается эффект "растягивания" верхней части кривой (в ряде заключительных серий количество ответов близко к 15), который у людей-испытуемых наблюдался весьма редко. Эти ограничения указывают на определенную неполноту модели. Однако удовлетворительные результаты моделирования испытуемых I и II групп (17 человек из 20) позволяют использовать полученные результаты при дальнейшей работе.
Описанный эксперимент подтверждает правомерность предложенной интерпретации индивидуальных различий испытуемых как различий некоторых параметров обучения М-автомата. Поскольку в основу модели положены соображения относительно вида информационных процессов в коре, то можно полагать, что она является моделью испытуемого, а не конкретного эксперимента и, следовательно, должна давать удовлетворительные результаты в широком классе методик этого эксперимента. (Обычно математическая модель психологического эксперимента описывает только одну методику. Например, модель, разработанная для случая одновременного формирования двух понятий, не является моделью формирования трех, четырех и т.д. понятий). Проверим это предположение.
Не изменяя полученных выше характеристик М-автомата, используем его в качестве "испытуемого" при проведении эксперимента по формированию двух понятий. Рассмотрим также имеющиеся в литературе данные ("эталонные") аналогичного психологического эксперимента. Далее, применим к обеим группам данных одну из известных частных моделей формирования двух понятий. Если предсказания этой частной модели относительно эталонной группы данных хорошо совпадут с аналогичными предсказаниями относительно поведения М-автомата, мы будем иметь основания считать, что М-автомат является адекватной моделью формирования понятий при различных методиках эксперимента.
В качестве эталонных приняты данные, полученные Бауэром и Трабассо. Их эксперимент по формированию двух понятий проведен с 46 испытуемыми. Стимулами служили изображения геометрических фигур, представляющих собой вариации шести признаков. Задача считалась решенной при получении 10 правильных ответов подряд.
Для модельного эксперимента была использована описанная в настоящем параграфе программа. Изменения касались входной информации, которая соответствовала здесь 100 картам с шестью признаками (цифрами) на каждой. Карты разделялись на два класса по релевантному признаку, состоящему из трех цифр. Значения параметров обучения соответствовали основному варианту. Чтобы обеспечить статистическую достоверность результатов, эксперимент был проведен со 100 М-автоматами (т.е. со 100 "испытуемыми"), которые отличались друг от друга значениями b и ~b. Эти параметры менялись для различных автоматов в пределах 0.895-0.995. Эксперимент с каждым автоматом проводился до получения 10 правильных ответов подряд.
В качестве частной описывающей модели была принята модель, разработанная и проверенная Р.Аткинсоном и др. Предложенная модель весьма удовлетворительно предсказывает результаты Бауэра и Трабассо. Рассмотрим ее предсказания относительно результатов, полученных в эксперименте с М-автоматами.
Среднее по 100 автоматам количество ошибок за эксперимент составило 9.23. Это число используется в модели Аткинсона для предсказания характеристик экспериментального материала. С его помощью был рассчитан ряд таких характеристик. Те же характеристики были определены путем обработки эмпирического материала, полученного в эксперименте с автоматами. Приведем результаты их сравнения.
1. Вероятность ошибки в n-й пробе (q.n). Выражение для q.n характеризует процесс обучения группы испытуемых. На рис.88 приведена кривая обучения, предсказанная моделью Аткинсона (А), и экспериментальная кривая (М), полученная при исследовании 100 автоматов. Оценка согласованности кривых по критерию Пирсона дает значение хи2=4.1 при 10 степенях свободы, что позволяет считать наблюдаемые расхождения несущественными и отнести их за счет случайных причин.
Рис.88. Теоретическая (А) и экспериментальная (М) кривые обучения М-автомата двум понятиям.
2. Номер пробы, соответствующий последней ошибке (L). Модель Аткинсона предсказывает значение математического ожидания L, равное 18.5 при среднеквадратичном отклонении 18. В результате обработки экспериментальных данных найдено, что среднее значение L равнялось 20.4, а среднее квадратичное - 19.1. Таким образом, теоретически предсказанные числа удовлетворительно совпадают с наблюдаемыми в эксперименте.
3. Распределение числа правильных ответов, попадающих между соседними ошибочными ответами (Н). На рис.89 показаны теоретическое (А) и эмпирическое (М) распределения Н. Оценка степени согласованности распределений по критерию Колмогорова дает р(г)=1 (при л=0.25), что позволяет считать имеющиеся расхождения несущественными.
Рис.89. Теоретическое (А) и экспериментальное (М) распределение числа правильных ответов, попадающих между соседними ошибочными.
Из приведенных данных видно, что модель Аткинсона, хорошо описывающая поведение людей-испытуемых при формировании двух понятий (эталонные данные), хорошо описывает также и поведение в аналогичных условиях М-автомата. Показано также, что автомат вырабатывает адекватное поведение в различных экспериментах без специальной перенастройки. Построенная нами модель, таким образом, обладает определенной общностью и может рассматриваться как правомерное описание информационных процессов, реализуемых мозгом в ходе деятельности по формированию понятий описанного типа. Основным результатом изложенных в настоящем параграфе работ является заключение о том, что выбранные (в #1-3 настоящей главы) значения параметров обучения можно считать удовлетворительными.
Таблица 13
Данные табл.13 позволяют оценить "степень обученности" групп связей, направленных от i-моделей признаков к i-моделям П, К, Р. В момент установления связи R.ji признак i приобретает некоторое начальное значение гj.0i. Поскольку все связи в момент установления равны, то, при принятых в основном варианте значениях параметров обучения, для всех i и j
гj.0i = г.0 = 0.6. (9.23)
Используя начальное г.0 и финальные (табл.13) значения г, введем для каждой связи меру обученности
с.ji = |гj.i-г.0|. (9.24)
Среднюю обученность групп связей, направленных к i-моделям П, Р, К, определим как
с.x = СУММА[i]с.xi / 10. (9.23)
При подсчете параметров (9.25) с целью выравнивания результатов не учитывались три признака, каждый из которых имел максимальное значение г. Для исследуемой структуры получено:
с.П=0.73; с.Р=1.05; с.К=1.11. (9.26)
Структура связей автомата формируется в основном под влиянием двух факторов: набора значений параметров обучения и структуры обучающего материала. Показанное выше совпадение поведений модели и испытуемых является косвенным свидетельством правильности выбора значений параметров обучения. Чтобы продемонстрировать это в явной форме, необходимо показать адекватность структуры обучающего материала отражающей ее структуре М-сети автомата. Сделаем это следующим образом. Имея данную структуру обучающего материала, т.е. определенное размещение признаков на картах, можно определить информативность I0.i каждого из признаков. Анализируя приведенную выше матрицу, можно определить информативность IМ.j каждой i-модели признака в М-сети. В случае, если информативности признаков и их i-моделей совпадают достаточно близко, будем считать, что М-сеть хорошо отображает обучающий материал. Определим необходимые понятия.
Информативность данного признака обратно пропорциональна числу карт n, в которых этот признак встречается. Информативность релевантных признаков естественно считать большей и обратно пропорциональной числу вхождений признака в карты, принадлежащие классам, для которых он не релевантен. Таким образом, информативность i-го признака определяется как
I0.i = 15/n + e*10/(n-5), (9.27)
где
e =
1 для признака, релевантного какому-либо классу;
0 для признака, не релевантного никакому классу.
Информативность i-модели некоторого признака относительно i-модели данного класса интуитивно оценивается по степени ее влияния, усиливающегося или тормозного, на i-модель этого класса. В соответствии с этим информативность IМ.ix i-й i-модели признака относительно класса x вычисляется как отношение большей компоненты связи R.xi к меньшей компоненте этой же связи:
IМ.ix = (r.xi/~r.xi)**д, (9.28 )
где
д =
1 при r.xi >= ~r.xi,
-1 при r.xi <= ~r.xi.
Полная информативность i-модели признака i в М-сети определяется в виде
IМ.i = IМ.iП + IМ.iР + IМ.iК (9.29)
Значения IМ.i нормировались путем умножения на коэффициент
K = СУММА[i]I0.i / СУММА[i]IМ.i. (9.30)
Результаты расчетов приведены в табл.14. Близость I0.i и IМ.i оценивалась по критерию хи2. Для полученных данных значение хи2, рассчитанное стандартным способом, составило 2.16, что с высокой степенью достоверности (p=0.98 ) позволяет считать информативности признаков и их i-моделей совпадающими. Таким образом, выбранные значения параметров обучения можно рассматривать как удовлетворительные.
Таблица 14
Представляет интерес определение устойчивости U решения задач моделью. Под устойчивостью понимается отношение количества правильно классифицированных карт к общему количеству предъявленных карт при неограниченном увеличении числа предъявлений. Определим нижнюю границу U. Пользуясь значениями IМ.ix, нетрудно подобрать для каждого из классов наиболее "трудные" карты, т.е. такие, которые содержат релевантные признаки данного класса и те из остальных признаков, сумма информативностей которых относительно других классов максимальна. Для класса П, например, такая карта будет содержать признаки 1, 2, 4, 6, 7, 10. Предъявим автомату эти (три) карты и оценим выполненные им в каждом случае решения параметром р, вычисляемым как отношение возбужденности i-модели "правильного" к максимальной возбужденности i-модели "неправильного" класса. Для классов П, Р, К этот параметр составил соответственно: р.П=0.64, р.Р=1.32 и р.К=1.32. Это означает, что для класса П ответ был дан неправильно и, следовательно, среди всех возможных карт класса П имеются такие, которые будут классифицированы неверно. Любые же карты классов Р и К будут распознаваться правильно. Таким образом, нижняя граница U лежит не ниже 0.66 или, грубо, U>=0.7.
Следует отметить, что между вычисленными выше числовыми характеристиками элементов анализируемой структуры и результатами психологического эксперимента имеются определенные соответствия. Так, из табл.15 видно, что максимальной информативностью обладает признак 1. Анализ протоколов эксперимента показывает, что именно этот признак анализировался испытуемым в первую очередь. Далее, как показано выше, минимальному обучению подвергалась группа связей, направленных к i-модели класса П (с.П=0.73), причем отношение
с.Р/с.П ~ с.К/с.П ~ 1.5 (9.31)
Можно предположить, что чем меньше с.x, тем быстрее заканчивается обучение и тем раньше испытуемые обучаются правильно распознавать класс x. Анализ протоколов показал, что среднее время Т.ср обучения испытуемых правильному распознаванию классов П, Р, К составляет соответственно: ТП.ср=10; ТК.ср=16.6; ТР.ср=16.6. При этом
ТР.ср/ТП.ср = ТК.ср/ТП.ср = 1.66, (9.32)
что хорошо совпадает с аналогичным отношением для модели. Интересно, что завершившееся наиболее легко обучение класса П оказалось для модели н самым неустойчивым (р.п=0.64).
Особо следует остановиться на следующем обстоятельстве. Эксперимент показал, что как только испытуемый выделяет релевантные признаки двух каких-либо классов, он начинает относить к третьему классу все карты, не содержащие известные ему признаки. Обучение заканчивается, таким образом, в момент определения признаков двух, а не трех классов. Этим, в частности, можно объяснить равенство параметров ТР.ср и ТК.ср Типичные для большинства испытуемых процессы обучения можно описать в этом случае следующим образом. Вначале выделяется класс П как содержащий наиболее информативные (в сумме) релевантные признаки. Как только эти признаки выделены, испытуемые анализируют классы Р и К, причем для обоих классов процесс развивается параллельно, независимо от того, осознан он или нет. В какой-то момент определяется один из классов и обучение заканчивается.
Предположим теперь, что процесс обучения в модели развивается по той же схеме. Вначале анализ всех трех классов идет параллельно: в модели не реализован механизм сознательного выбора объекта анализа. Анализ класса П заканчивается первым (по тем же причинам, что и у людей-испытуемых), и с этого момента соответствующая часть структуры изменяется мало (это обусловлено структурой алгоритмов обучения - см. рис.84). Поэтому с.П<с.К и с.П<с.Р. Происходит дальнейший параллельный анализ классов Р и К. В какой-то момент заканчивается анализ класса, например К, и следовало бы ожидать, что дальнейшая работа связана с продолжением анализа Р. Однако этому противоречит равенство с.Р ~ с.К, что заставляет предположить, что с окончанием анализа класса К заканчивается и обучение вообще. Об этом же свидетельствуют равенство р.P=р.К и отмеченная раньше "недостаточная обученность" связей в классе Р от его релевантных признаков (определенная по параметру г). Таким образом, возникает предположение о том, что М-сеть автомата в неявной форме реализует некоторое правило, сходное по своему влиянию на ход обучения с правилом, используемым испытуемыми. Это предположение, очевидно, не является достаточно обоснованным, однако позволяет объяснить ряд совпадений числовых характеристик модели.
В ходе экспериментов с программой был обнаружен и ряд ограничений, присущих модели. Это, в частности, касается воспроизведения автоматом кривых обучения испытуемых III группы. Для последних характерно большое время обучения (Т>20), значительную часть которого количество правильных ответов за серию колеблется в пределах 4-7. В случаях же Т>20 для М-автомата большую часть времени обучения количество правильных ответов за серию составляет 10-12. Это приводит к тому, что коэффициент м для автоматов III группы меньше, чем для людей-испытуемых. В тех случаях, когда подбором параметров удается увеличить м, часто обнаруживается эффект "растягивания" верхней части кривой (в ряде заключительных серий количество ответов близко к 15), который у людей-испытуемых наблюдался весьма редко. Эти ограничения указывают на определенную неполноту модели. Однако удовлетворительные результаты моделирования испытуемых I и II групп (17 человек из 20) позволяют использовать полученные результаты при дальнейшей работе.
Описанный эксперимент подтверждает правомерность предложенной интерпретации индивидуальных различий испытуемых как различий некоторых параметров обучения М-автомата. Поскольку в основу модели положены соображения относительно вида информационных процессов в коре, то можно полагать, что она является моделью испытуемого, а не конкретного эксперимента и, следовательно, должна давать удовлетворительные результаты в широком классе методик этого эксперимента. (Обычно математическая модель психологического эксперимента описывает только одну методику. Например, модель, разработанная для случая одновременного формирования двух понятий, не является моделью формирования трех, четырех и т.д. понятий). Проверим это предположение.
Не изменяя полученных выше характеристик М-автомата, используем его в качестве "испытуемого" при проведении эксперимента по формированию двух понятий. Рассмотрим также имеющиеся в литературе данные ("эталонные") аналогичного психологического эксперимента. Далее, применим к обеим группам данных одну из известных частных моделей формирования двух понятий. Если предсказания этой частной модели относительно эталонной группы данных хорошо совпадут с аналогичными предсказаниями относительно поведения М-автомата, мы будем иметь основания считать, что М-автомат является адекватной моделью формирования понятий при различных методиках эксперимента.
В качестве эталонных приняты данные, полученные Бауэром и Трабассо. Их эксперимент по формированию двух понятий проведен с 46 испытуемыми. Стимулами служили изображения геометрических фигур, представляющих собой вариации шести признаков. Задача считалась решенной при получении 10 правильных ответов подряд.
Для модельного эксперимента была использована описанная в настоящем параграфе программа. Изменения касались входной информации, которая соответствовала здесь 100 картам с шестью признаками (цифрами) на каждой. Карты разделялись на два класса по релевантному признаку, состоящему из трех цифр. Значения параметров обучения соответствовали основному варианту. Чтобы обеспечить статистическую достоверность результатов, эксперимент был проведен со 100 М-автоматами (т.е. со 100 "испытуемыми"), которые отличались друг от друга значениями b и ~b. Эти параметры менялись для различных автоматов в пределах 0.895-0.995. Эксперимент с каждым автоматом проводился до получения 10 правильных ответов подряд.
В качестве частной описывающей модели была принята модель, разработанная и проверенная Р.Аткинсоном и др. Предложенная модель весьма удовлетворительно предсказывает результаты Бауэра и Трабассо. Рассмотрим ее предсказания относительно результатов, полученных в эксперименте с М-автоматами.
Среднее по 100 автоматам количество ошибок за эксперимент составило 9.23. Это число используется в модели Аткинсона для предсказания характеристик экспериментального материала. С его помощью был рассчитан ряд таких характеристик. Те же характеристики были определены путем обработки эмпирического материала, полученного в эксперименте с автоматами. Приведем результаты их сравнения.
1. Вероятность ошибки в n-й пробе (q.n). Выражение для q.n характеризует процесс обучения группы испытуемых. На рис.88 приведена кривая обучения, предсказанная моделью Аткинсона (А), и экспериментальная кривая (М), полученная при исследовании 100 автоматов. Оценка согласованности кривых по критерию Пирсона дает значение хи2=4.1 при 10 степенях свободы, что позволяет считать наблюдаемые расхождения несущественными и отнести их за счет случайных причин.
Рис.88. Теоретическая (А) и экспериментальная (М) кривые обучения М-автомата двум понятиям.
2. Номер пробы, соответствующий последней ошибке (L). Модель Аткинсона предсказывает значение математического ожидания L, равное 18.5 при среднеквадратичном отклонении 18. В результате обработки экспериментальных данных найдено, что среднее значение L равнялось 20.4, а среднее квадратичное - 19.1. Таким образом, теоретически предсказанные числа удовлетворительно совпадают с наблюдаемыми в эксперименте.
3. Распределение числа правильных ответов, попадающих между соседними ошибочными ответами (Н). На рис.89 показаны теоретическое (А) и эмпирическое (М) распределения Н. Оценка степени согласованности распределений по критерию Колмогорова дает р(г)=1 (при л=0.25), что позволяет считать имеющиеся расхождения несущественными.
Рис.89. Теоретическое (А) и экспериментальное (М) распределение числа правильных ответов, попадающих между соседними ошибочными.
Из приведенных данных видно, что модель Аткинсона, хорошо описывающая поведение людей-испытуемых при формировании двух понятий (эталонные данные), хорошо описывает также и поведение в аналогичных условиях М-автомата. Показано также, что автомат вырабатывает адекватное поведение в различных экспериментах без специальной перенастройки. Построенная нами модель, таким образом, обладает определенной общностью и может рассматриваться как правомерное описание информационных процессов, реализуемых мозгом в ходе деятельности по формированию понятий описанного типа. Основным результатом изложенных в настоящем параграфе работ является заключение о том, что выбранные (в #1-3 настоящей главы) значения параметров обучения можно считать удовлетворительными.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#6. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Целью описанных в этой главе исследований являлось решение следующих задач: а) выбор значений существенных параметров в выражениях, задающих систему (9.33); б) отладка основных алгоритмов модели; в) рассмотрение возможностей моделирования относительно простых психических функций с помощью предложенного аппарата; г) получение некоторых дополнительных данных для построения основного варианта модели. Рассмотрим с этих позиций результаты исследования описанных выше моделей.
МОДЕЛЬ ОБУЧЕНИЯ ИЗБЕГАНИЮ НАКАЗАНИЙ. Задача, решаемая этой моделью, широко применяется в качестве теста при исследовании свойств обучающихся автоматов. Ряд авторов указывают на важность этой задачи при решении некоторых проблем автоматического управления. Обычно она формируется как задача минимизации суммы штрафов, получаемых автоматом в случайных средах. Мы использовали геометрическую интерпретацию этой задачи (случайные блуждания автомата в среде, содержащей случайно расположенные раздражители), более удобную для наших целей. Основным результатом исследования модели обучения избеганию наказаний является определение области допустимых значений коэффициентов проторения связей М-сети.
Существенные результаты в исследовании задачи минимизации штрафов получены М.Л.Цетлиным и его последователями. Нетрудно видеть, что структура и алгоритмы предложенной модели плохо описываются на языке развитой ими теории автоматов с линейной тактикой. Особые трудности возникают при описании функций СУТ. Предложенный М-автомат не содержит каких-либо специальных алгоритмов, обеспечивающих решение задачи. Способность к обучению в случайных средах заложена в основных свойствах М-сети.
Исследование модели показало, что М-автомат способен устанавливать "условнорефлекторные" связи между i-моделями "раздражителей" и действий, а также позволило изучить конфигурацию и параметры этих связей. Это дает возможность включить указанные конфигурации в структуру основного варианта модели двигательного поведения на этапе ее предорганизации. Будем полагать, что основной вариант уже имеет некоторый "опыт" действий, зафиксированный вводимыми связями. По аналогии будем также задавать связи между i-моделями раздражителей и "активных" действий ("есть", "спать" и др.).
МОДЕЛЬ ПОВТОРЕНИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ. Представляет собой модель хорошо изученной психической функции. Основной целью ее построения и результатом исследования является определение области допустимых значений коэффициентов затухания связей М-сети.
Существенную роль в организации функций модели играет вспомогательный алгоритм асимметрии связей B.as. Этот алгоритм имеет весьма малый объем, поскольку выполняет лишь корректирующую функцию свойств М-сети, обусловленных ее основными операторами. Подбором некоторых коэффициентов (b, ~b) параметры поведения модели легко приводятся в соответствие с параметрами моделируемого процесса. При повторении последовательностей моделью наблюдается ряд особенностей, характерных и для людей-испытуемых (плохое воспроизведение последовательности "назад", эффект начала, персеверации и др.). Это дает основание считать свойства модели адекватными свойствам моделируемого объекта.
Исследование модели позволило определить значения параметров b, ~b, обеспечивающие феномен запоминания "истории" возбуждений в М-сети. Отработка модели проведена на сети, соответствующей блоку "памяти ситуаций" основного варианта модели. Полученные результаты могут, однако, применяться и в других блоках, где целесообразно обеспечить запоминание последовательностей. В частности, эти результаты будут использованы при предорганизации блока "решений".
МОДЕЛЬ ФОРМИРОВАНИЯ ПОНЯТИЙ. На примере задачи формирования простых понятий мы должны показать пригодность всех выбранных ранее параметров обучения при совместном их использовании. Положительное решение этой задачи и составляет основной результат исследования модели.
Задача моделирования процесса формирования понятий ставилась многими авторами и в разных вариантах. Интерес к ней обусловлен тем обстоятельством, что модель формирования понятий может быть использована при решении как некоторых психологических задач, так и ряда задач практического характера. Принятая нами постановка задачи имеет специфику, заключающуюся в том, что моделировались психические процессы, развивающиеся (предположительно) при решении задачи в строго определенной экспериментальной ситуации. Такая постановка, во-первых, упрощает задачу моделирования и, во-вторых, дает достаточный материал для решения основного вопроса - о совместимости найденных параметров обучения.
Результаты исследования позволяют сделать заключение об адекватности модели. При этом обнаруживаются следующие интересные моменты.
1. Модель одновременного формирования трех понятий выполнена в виде М-автомата, погруженного в специфическую среду конкретного эксперимента. Удовлетворительный режим функционирования автомата был получен за счет использования основных свойств М-сети. Все перенастройки модели проводились путем изменения значений параметров обучения. При этом удалось совместить характеристики обучения модели с аналогичными характеристиками людей-испытуемых.
2. Не потребовалась перенастройка автомата и в случае использования его в режиме работы по формированию двух понятий. Это обстоятельство позволяет полагать, что предложенный М-автомат может рассматриваться в качестве удовлетворительной модели испытуемого, занятого решением задач описанного класса. Этот вывод представляет определенный интерес, поскольку известные модели аналогичного типа строятся как модели экспериментальных результатов, полученных в рамках строго определенной методики. Такие модели теряют адекватность при изменении методики эксперимента. В частности, известные модели формирования трех понятий уже не могут использоваться для описания результатов эксперимента по одновременному формированию двух понятий.
В ходе экспериментального исследования модели изучены конфигурации связей, возникающих в М-автомате в процессе выработки понятий, и установлены параметры связей. Полученные результаты естественно распространяются на случай формирования многоуровневых структур, отображающих родо-видовые отношения понятий. Их можно, таким образом, использовать при задании предорганизации блока понятийных обобщений в основном варианте модели. Задавая связи, отражающие отношения включения на множестве i-моделей различных "понятий" этого блока, мы тем самым зададим автомату некоторую начальную систему "знаний" об объектах окружающего его мира. При функционировании модели эти "знания" будут подвергаться коррекции и пополняться за счет установления новых "ассоциативных" связей. Таким образом, в ходе работ, описанных в настоящей главе, были решены такие задачи: выбраны области допустимых значений параметров обучения; отлажены все основные блоки алгоритма А; получены сведения, необходимые при задании предорганизации М-сети основного варианта модели двигательного поведения. Кроме того, исследованы возможности М-сети при моделировании некоторых психических функций. При этом установлено следующее.
1. М-сеть является достаточно гибким средством моделирования, поскольку оказалось возможным, используя ее основные свойства и не вводя какие-либо специальные меры, построить ряд моделей некоторых психических функций, существенно отличающихся друг от друга по характеру и способам проявления. Отметим, что при построении различных моделей в разной степени использовались блоки алгоритма А. Предварительный анализ показывает, что использование А в полном объеме не меняет существенно результатов, полученных в каждой из моделей. Полностью этот вопрос, однако, не исследовался. Его решение, тем не менее, не влияет существенно на сделанный вывод, так как, используя любую часть алгоритма А или любое сочетание его частей, мы по-прежнему используем "языковые средства" рассматриваемого метода моделирования.
2. М-сеть является достаточно эффективным средством моделирования, поскольку позволяет использовать при построении действующих моделей не только количественные, но и качественные сведения об объектах; допускает представление информации в наглядной и легко обозримой форме; обеспечивает простоту корректирования моделей путем изменения лишь отдельных ее параметров (обучения, порогов и т.п.), без перестройки модели в целом.
До сих пор, однако, мы имели дело со сравнительно простыми моделями. Более интересный случай - использование М-сети при построении достаточно сложного автомата - будет рассмотрен в следующей главе на примере экспериментального исследования основного варианта модели двигательного поведения. Формальная постановка задачи моделирования двигательного поведения в общем виде приведена в другой работе. Здесь мы рассмотрим некоторые дополнительные сведения, необходимые для дальнейшего изложения. В другой работе описаны структура и способ задания абстрактной системы М, организующей поведение в некоторой среде Р. Среда может быть представлена в виде ненаправленного связного конечного графа G, каждая вершина g.i которого сопоставляется с определенной областью "жизненного пространства" системы М. Упомянутые области содержат наборы объектов, воспринимаемых системой и являющихся раздражителями для нее.
Система функционирует в дискретном времени. Вершину g.i графа G, в которой система М находится в момент t, будем называть собственной (в момент t) вершиной. Собственную вершину и множество соседних, соединенных с ней ребрами вершин будем называть окрестностью системы (в момент t). Система М может воспринять раздражители, имеющиеся в ее окрестности, и распознать их.
Будем выделять в системе М следующие подсистемы: MV, ответственную за восприятие информации об окрестности системы; МР, осуществляющую хранение и переработку воспринятой в MV информации; MD, формирующую последовательность действий как результат переработки информации в МР; ME, формирующую оценки функционирования системы М.
Задание М сводится к заданию следующей системы функций (9.33):
S.t = Ф.1(Р, g.i) - функция восприятия,
C.t = Ф.2(c.[t-1], S.t, e.t, g(g.i, g.ц)) - функция переработки,
d.t = Ф.3(c.t, e.i) - функция принятия решений,
e.t = Ф.4(e.[t-1], с.t, S.t) - функция оценки.
Здесь g.i - собственная (в момент t) вершина; S.t - воспринятая ситуация, т.е. состояние MV после восприятия раздражителей из окрестности g.i; c.t - состояние в момент t подсистемы МР, c.t из C = {c.1, c.2, ...}; e.t - текущее значение оценки, вырабатываемой подсистемой ME,- численная величина, лежащая в границах между (-А) - "максимально плохо" и (А) - "максимально хорошо" (А - const); g(g.i, g.ц) - функция цели, числовое значение которой определяется "близостью" текущего (g.i) положения системы в среде к заданному (g.ц); d.t - действие, выполняемое системой в момент t; d.t из D = Н*V, где H - множество "шагов", перемещающих М из g.i в одну из вершин окрестности; V - множество "воздействий" ("активных действий"), изменяющих расположение раздражителей в среде.
Введем показатель качества функционирования системы М. Пусть система функционирует Т моментов времени начиная с момента t=1, причем тем лучше, чем больше величина
e = СУММА[t=1..T]e.t. (9.34)
Очевидно, что значение е определяется видом функций (9.33), задающих систему. Существует множество возможных видов этих функций. Конкретный вид функций назовем вариантом задания системы М и будем рассматривать упорядоченное некоторым образом множество таких вариантов, т.е. вектор вариантов m. Пусть на входе системы имеется случайная последовательность ситуаций {S[t], t = 1, 2, ...}, a S - вектор случайных последовательностей. Таким образом, величина е есть функционал вектора вариантов m, зависящий также от вектора случайных последовательностей S. Выражение (9.34) можно записать следующим образом:
е = Q(S, m). (9.35)
В общей форме показатель качества функционирования системы М запишем в виде
I(m) = lim[T->беск.] 1/T СУММА[t=1..T]Q(S[t], m). (9.36)
Наилучший, оптимальный, вариант задания системы соответствует максимуму показателя качества I(m).Следовательно, процесс оптимизации системы состоит в нахождении такого варианта ее задания, при котором алгебраическая сумма оценок, выработанных блоком ME за фиксированный (достаточно большой) промежуток времени в данной среде, оказывается максимальной. Для того чтобы задача оптимизации имела смысл, необходимо наложить определенные ограничения на векторы m и S. Вид этих ограничений обусловлен выбором конкретного способа задания системы М с помощью М-автомата. Ряд таких ограничений обсуждался выше, в гл.5.
Поскольку настоящая работа имеет бионическую направленность, потребуем, чтобы модель удовлетворяла дополнительным требованиям.
Среда Р является аналогом определенного класса естественных сред. Будем рассматривать двигательное поведение испытуемого (человека или животного) в среде из этого класса. Пусть испытуемый пытается достичь некоторой точки в среде. В зависимости от типа нервной деятельности и прошлого опыта различные испытуемые построят различные поведения, образующие множество Ne={ne.1., ne.2, ...} , которое может быть исследовано экспериментально.
Сопоставим ход мышления человека-испытуемого с определенной последовательностью переходов из состояния в состояние системы М. Пусть каждой последовательности переходов может быть единственным образом поставлена в соответствие последовательность слов в естественном языке. Назовем такую последовательность слов "ходом мышления" системы М. Располагая сведениями о среде, поведении и "ходе мышления" системы М, человек-экспериментатор может судить о рациональности ее "хода мышления". Необходимо построить модель двигательного поведения так, чтобы, во-первых, поведение nМ системы М соответствовало некоторому "естественному" поведению ne.i из Ne и, во-вторых, "ход мышления" системы М был рационален.
Целью описанных в этой главе исследований являлось решение следующих задач: а) выбор значений существенных параметров в выражениях, задающих систему (9.33); б) отладка основных алгоритмов модели; в) рассмотрение возможностей моделирования относительно простых психических функций с помощью предложенного аппарата; г) получение некоторых дополнительных данных для построения основного варианта модели. Рассмотрим с этих позиций результаты исследования описанных выше моделей.
МОДЕЛЬ ОБУЧЕНИЯ ИЗБЕГАНИЮ НАКАЗАНИЙ. Задача, решаемая этой моделью, широко применяется в качестве теста при исследовании свойств обучающихся автоматов. Ряд авторов указывают на важность этой задачи при решении некоторых проблем автоматического управления. Обычно она формируется как задача минимизации суммы штрафов, получаемых автоматом в случайных средах. Мы использовали геометрическую интерпретацию этой задачи (случайные блуждания автомата в среде, содержащей случайно расположенные раздражители), более удобную для наших целей. Основным результатом исследования модели обучения избеганию наказаний является определение области допустимых значений коэффициентов проторения связей М-сети.
Существенные результаты в исследовании задачи минимизации штрафов получены М.Л.Цетлиным и его последователями. Нетрудно видеть, что структура и алгоритмы предложенной модели плохо описываются на языке развитой ими теории автоматов с линейной тактикой. Особые трудности возникают при описании функций СУТ. Предложенный М-автомат не содержит каких-либо специальных алгоритмов, обеспечивающих решение задачи. Способность к обучению в случайных средах заложена в основных свойствах М-сети.
Исследование модели показало, что М-автомат способен устанавливать "условнорефлекторные" связи между i-моделями "раздражителей" и действий, а также позволило изучить конфигурацию и параметры этих связей. Это дает возможность включить указанные конфигурации в структуру основного варианта модели двигательного поведения на этапе ее предорганизации. Будем полагать, что основной вариант уже имеет некоторый "опыт" действий, зафиксированный вводимыми связями. По аналогии будем также задавать связи между i-моделями раздражителей и "активных" действий ("есть", "спать" и др.).
МОДЕЛЬ ПОВТОРЕНИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ. Представляет собой модель хорошо изученной психической функции. Основной целью ее построения и результатом исследования является определение области допустимых значений коэффициентов затухания связей М-сети.
Существенную роль в организации функций модели играет вспомогательный алгоритм асимметрии связей B.as. Этот алгоритм имеет весьма малый объем, поскольку выполняет лишь корректирующую функцию свойств М-сети, обусловленных ее основными операторами. Подбором некоторых коэффициентов (b, ~b) параметры поведения модели легко приводятся в соответствие с параметрами моделируемого процесса. При повторении последовательностей моделью наблюдается ряд особенностей, характерных и для людей-испытуемых (плохое воспроизведение последовательности "назад", эффект начала, персеверации и др.). Это дает основание считать свойства модели адекватными свойствам моделируемого объекта.
Исследование модели позволило определить значения параметров b, ~b, обеспечивающие феномен запоминания "истории" возбуждений в М-сети. Отработка модели проведена на сети, соответствующей блоку "памяти ситуаций" основного варианта модели. Полученные результаты могут, однако, применяться и в других блоках, где целесообразно обеспечить запоминание последовательностей. В частности, эти результаты будут использованы при предорганизации блока "решений".
МОДЕЛЬ ФОРМИРОВАНИЯ ПОНЯТИЙ. На примере задачи формирования простых понятий мы должны показать пригодность всех выбранных ранее параметров обучения при совместном их использовании. Положительное решение этой задачи и составляет основной результат исследования модели.
Задача моделирования процесса формирования понятий ставилась многими авторами и в разных вариантах. Интерес к ней обусловлен тем обстоятельством, что модель формирования понятий может быть использована при решении как некоторых психологических задач, так и ряда задач практического характера. Принятая нами постановка задачи имеет специфику, заключающуюся в том, что моделировались психические процессы, развивающиеся (предположительно) при решении задачи в строго определенной экспериментальной ситуации. Такая постановка, во-первых, упрощает задачу моделирования и, во-вторых, дает достаточный материал для решения основного вопроса - о совместимости найденных параметров обучения.
Результаты исследования позволяют сделать заключение об адекватности модели. При этом обнаруживаются следующие интересные моменты.
1. Модель одновременного формирования трех понятий выполнена в виде М-автомата, погруженного в специфическую среду конкретного эксперимента. Удовлетворительный режим функционирования автомата был получен за счет использования основных свойств М-сети. Все перенастройки модели проводились путем изменения значений параметров обучения. При этом удалось совместить характеристики обучения модели с аналогичными характеристиками людей-испытуемых.
2. Не потребовалась перенастройка автомата и в случае использования его в режиме работы по формированию двух понятий. Это обстоятельство позволяет полагать, что предложенный М-автомат может рассматриваться в качестве удовлетворительной модели испытуемого, занятого решением задач описанного класса. Этот вывод представляет определенный интерес, поскольку известные модели аналогичного типа строятся как модели экспериментальных результатов, полученных в рамках строго определенной методики. Такие модели теряют адекватность при изменении методики эксперимента. В частности, известные модели формирования трех понятий уже не могут использоваться для описания результатов эксперимента по одновременному формированию двух понятий.
В ходе экспериментального исследования модели изучены конфигурации связей, возникающих в М-автомате в процессе выработки понятий, и установлены параметры связей. Полученные результаты естественно распространяются на случай формирования многоуровневых структур, отображающих родо-видовые отношения понятий. Их можно, таким образом, использовать при задании предорганизации блока понятийных обобщений в основном варианте модели. Задавая связи, отражающие отношения включения на множестве i-моделей различных "понятий" этого блока, мы тем самым зададим автомату некоторую начальную систему "знаний" об объектах окружающего его мира. При функционировании модели эти "знания" будут подвергаться коррекции и пополняться за счет установления новых "ассоциативных" связей. Таким образом, в ходе работ, описанных в настоящей главе, были решены такие задачи: выбраны области допустимых значений параметров обучения; отлажены все основные блоки алгоритма А; получены сведения, необходимые при задании предорганизации М-сети основного варианта модели двигательного поведения. Кроме того, исследованы возможности М-сети при моделировании некоторых психических функций. При этом установлено следующее.
1. М-сеть является достаточно гибким средством моделирования, поскольку оказалось возможным, используя ее основные свойства и не вводя какие-либо специальные меры, построить ряд моделей некоторых психических функций, существенно отличающихся друг от друга по характеру и способам проявления. Отметим, что при построении различных моделей в разной степени использовались блоки алгоритма А. Предварительный анализ показывает, что использование А в полном объеме не меняет существенно результатов, полученных в каждой из моделей. Полностью этот вопрос, однако, не исследовался. Его решение, тем не менее, не влияет существенно на сделанный вывод, так как, используя любую часть алгоритма А или любое сочетание его частей, мы по-прежнему используем "языковые средства" рассматриваемого метода моделирования.
2. М-сеть является достаточно эффективным средством моделирования, поскольку позволяет использовать при построении действующих моделей не только количественные, но и качественные сведения об объектах; допускает представление информации в наглядной и легко обозримой форме; обеспечивает простоту корректирования моделей путем изменения лишь отдельных ее параметров (обучения, порогов и т.п.), без перестройки модели в целом.
До сих пор, однако, мы имели дело со сравнительно простыми моделями. Более интересный случай - использование М-сети при построении достаточно сложного автомата - будет рассмотрен в следующей главе на примере экспериментального исследования основного варианта модели двигательного поведения. Формальная постановка задачи моделирования двигательного поведения в общем виде приведена в другой работе. Здесь мы рассмотрим некоторые дополнительные сведения, необходимые для дальнейшего изложения. В другой работе описаны структура и способ задания абстрактной системы М, организующей поведение в некоторой среде Р. Среда может быть представлена в виде ненаправленного связного конечного графа G, каждая вершина g.i которого сопоставляется с определенной областью "жизненного пространства" системы М. Упомянутые области содержат наборы объектов, воспринимаемых системой и являющихся раздражителями для нее.
Система функционирует в дискретном времени. Вершину g.i графа G, в которой система М находится в момент t, будем называть собственной (в момент t) вершиной. Собственную вершину и множество соседних, соединенных с ней ребрами вершин будем называть окрестностью системы (в момент t). Система М может воспринять раздражители, имеющиеся в ее окрестности, и распознать их.
Будем выделять в системе М следующие подсистемы: MV, ответственную за восприятие информации об окрестности системы; МР, осуществляющую хранение и переработку воспринятой в MV информации; MD, формирующую последовательность действий как результат переработки информации в МР; ME, формирующую оценки функционирования системы М.
Задание М сводится к заданию следующей системы функций (9.33):
S.t = Ф.1(Р, g.i) - функция восприятия,
C.t = Ф.2(c.[t-1], S.t, e.t, g(g.i, g.ц)) - функция переработки,
d.t = Ф.3(c.t, e.i) - функция принятия решений,
e.t = Ф.4(e.[t-1], с.t, S.t) - функция оценки.
Здесь g.i - собственная (в момент t) вершина; S.t - воспринятая ситуация, т.е. состояние MV после восприятия раздражителей из окрестности g.i; c.t - состояние в момент t подсистемы МР, c.t из C = {c.1, c.2, ...}; e.t - текущее значение оценки, вырабатываемой подсистемой ME,- численная величина, лежащая в границах между (-А) - "максимально плохо" и (А) - "максимально хорошо" (А - const); g(g.i, g.ц) - функция цели, числовое значение которой определяется "близостью" текущего (g.i) положения системы в среде к заданному (g.ц); d.t - действие, выполняемое системой в момент t; d.t из D = Н*V, где H - множество "шагов", перемещающих М из g.i в одну из вершин окрестности; V - множество "воздействий" ("активных действий"), изменяющих расположение раздражителей в среде.
Введем показатель качества функционирования системы М. Пусть система функционирует Т моментов времени начиная с момента t=1, причем тем лучше, чем больше величина
e = СУММА[t=1..T]e.t. (9.34)
Очевидно, что значение е определяется видом функций (9.33), задающих систему. Существует множество возможных видов этих функций. Конкретный вид функций назовем вариантом задания системы М и будем рассматривать упорядоченное некоторым образом множество таких вариантов, т.е. вектор вариантов m. Пусть на входе системы имеется случайная последовательность ситуаций {S[t], t = 1, 2, ...}, a S - вектор случайных последовательностей. Таким образом, величина е есть функционал вектора вариантов m, зависящий также от вектора случайных последовательностей S. Выражение (9.34) можно записать следующим образом:
е = Q(S, m). (9.35)
В общей форме показатель качества функционирования системы М запишем в виде
I(m) = lim[T->беск.] 1/T СУММА[t=1..T]Q(S[t], m). (9.36)
Наилучший, оптимальный, вариант задания системы соответствует максимуму показателя качества I(m).Следовательно, процесс оптимизации системы состоит в нахождении такого варианта ее задания, при котором алгебраическая сумма оценок, выработанных блоком ME за фиксированный (достаточно большой) промежуток времени в данной среде, оказывается максимальной. Для того чтобы задача оптимизации имела смысл, необходимо наложить определенные ограничения на векторы m и S. Вид этих ограничений обусловлен выбором конкретного способа задания системы М с помощью М-автомата. Ряд таких ограничений обсуждался выше, в гл.5.
Поскольку настоящая работа имеет бионическую направленность, потребуем, чтобы модель удовлетворяла дополнительным требованиям.
Среда Р является аналогом определенного класса естественных сред. Будем рассматривать двигательное поведение испытуемого (человека или животного) в среде из этого класса. Пусть испытуемый пытается достичь некоторой точки в среде. В зависимости от типа нервной деятельности и прошлого опыта различные испытуемые построят различные поведения, образующие множество Ne={ne.1., ne.2, ...} , которое может быть исследовано экспериментально.
Сопоставим ход мышления человека-испытуемого с определенной последовательностью переходов из состояния в состояние системы М. Пусть каждой последовательности переходов может быть единственным образом поставлена в соответствие последовательность слов в естественном языке. Назовем такую последовательность слов "ходом мышления" системы М. Располагая сведениями о среде, поведении и "ходе мышления" системы М, человек-экспериментатор может судить о рациональности ее "хода мышления". Необходимо построить модель двигательного поведения так, чтобы, во-первых, поведение nМ системы М соответствовало некоторому "естественному" поведению ne.i из Ne и, во-вторых, "ход мышления" системы М был рационален.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ГЛАВА 10. ЭКСПЕРИМЕНТЫ С МОДЕЛЬЮ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ
#1. ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ О МОДЕЛИ МОД
Работы по определению значений параметров обучения составили первый этап исследования модели. Второй его этап связан с экспериментальным изучением свойств модели, представленной в полном объеме. Изложению экспериментальных результатов следует предпослать более детальное описание структуры исследуемой модели и некоторых ее механизмов, не описанных ранее.
В организации поведения существенную роль играют процессы, связанные с построением предварительного плана действий. Моделирование двигательного поведения было бы неполным без разработки специальной модели процессов планирования. М-автомат МОД рассчитан на взаимодействие с такой моделью. Поскольку ее описание содержится в предыдущих разделах книги, ограничимся здесь упоминанием лишь о тех ее компонентах, которые непосредственно включены в структуру нашего автомата. Прежде всего, к ним относятся механизмы представления плана в М-сети и механизмы систем, следящих за выполнением плана.
Выходная информация модели планирования фиксируется в М-сети специфичной структурой, схематически изображенной на рис.90. Группа i-моделей ДII состоит из i-моделей "обобщенных" действий, характеризующих общее направление движения автомата за определенное время, например, "двигаться вперед" и т.п. Группа i-моделей Р состоит из i-моделей этапов плана. Р.i - i-модель i-ro этапа. Результат планирования представляется в виде совокупности связей, каждая из которых направлена от i-модели этапа плана к i-модели "обобщенного" действия и определяет таким образом содержание этапа. В ходе работы М-автомата, по мере выполнения им намеченного плана, оказывается возбужденной одна (и в каждый момент времени - только одна) i-модель этапа. По имеющейся связи возбуждение передается на соответствующую i-модель "обобщенного" действия и далее - на i-модели действий-шагов, которыми данное "обобщенное" действие может быть реализовано. Таким образом, i-модели шагов, удовлетворяющих плану, получают дополнительное возбуждение и вероятность их выполнения повышается. В исходном состоянии возбуждена i-модель Р.1. Одновременно со структурой рис.90 модель планирования формирует информацию о зонах расположения "ориентиров" каждого этапа, т.е. таких объектов среды, при достижении которых соответствующий этап считается выполненным, а также об ожидаемых возбуждениях i-моделей Пр и НПр при выполнении каждого из этапов и примерном числе шагов, необходимых для выполнения этапа. Эта информация используется при работе следящих систем "по результатам" и "по чувствам", контролирующих выполнение плана.
Рис.90. Задание плана в М-сети.
Следящая система "по результатам" обеспечивает выполнение следующих операций: 1) если в ходе перемещений автомата в среде оказывается воспринятым объект, отмеченный как ориентир i-ro этапа плана, то возбуждение i-модели Р.i, снижается до нуля и возбуждается i-модель Р.[i+1]. 2) если после выполнения автоматом определенного в модели планирования числа шагов ориентир не воспринят, то возбуждение i-модели выполняемого этапа плана снижается до нуля, получает дополнительное возбуждение i-модель НПр и автомат в течение некоторого времени выполняет шаги без учета плана ("поиск ориентира"). Если за это время ориентир обнаружен, выполняется операция 1, если нет - автомат формирует требование на построение нового плана (вызов модели планирования).
Следящая система "по чувствам" постоянно производит сравнение текущего значения величины Dt=Пt.НПр-Пt.Пр с "критическим" значением этой величины, определенным в модели планирования для каждого из этапов плана. Если текущее значение превышает критическое, автомат формирует требование на построение нового плана. Отметим, что новый план будет построен с учетом сложившегося состояния сферы эмоций автомата и может отличаться от предыдущего.
Алгоритмы, реализующие описанные операторы, включены в программу так, как показано на блок-схеме рис.56.
Рис.91. Схематическое представление структуры блока понятийных обобщений.
Дополним теперь приведенное ранее описание блока понятийных обобщений исследуемого М-автомата. При задании начальной структуры этого блока были использованы сведения о характере и числовых параметрах связей, полученные при исследовании модели формирования понятий (#5, гл.9). Данные этого исследования нетрудно обобщить на случаи формирования иерархических понятийных структур и понятий по различным признакам. На рис.91 приведено схематическое изображение принятой нами структуры "системы знаний" автомата. Кроме "системы знаний", блок понятийных обобщений содержит субблок "мотивации принятия решений", или просто блок "решений". (Это название удобно ввиду его краткости, однако неточно, поскольку i-моделями возможных решений автомата являются, вообще говоря, i-модели его действий, а мотивация принятия решений, т.е. выбора действий, задается в каждый момент времени структурой и состоянием всей М-сети автомата). Заданием определенной структуры блока решений в автомат введена "память" о его гипотетическом прошлом опыте. Схематически фрагмент этой структуры изображен на рис.92, где знаки -> и -( обозначают связи с преимущественно усиливающим и тормозным компонентами соответственно. Схема демонстрирует влияние на выбор решения состояния воспринимающей и эмоциональной сфер. Отметим, что "выбор" (т.е. возбуждение) той или иной i-модели решений не означает еще выполнения соответствующих действий, а лишь создает благоприятные условия для их выбора СУТ. Состояние остальной части М-сети может обусловить выполнение других действий. Аналогичные структуры построены для выбора решений "есть" и "нести", "спать" и "создать убежище". При работе автомата в блоке могут устанавливаться новые связи и меняться проходимости заданных - "опыт" может изменяться.
Рис.92. Фрагмент структуры блока принятия решений.
Числовые характеристики блоков М-сети автомата представлены в табл.15. Формула автомата: Р1.82 П.3.44 С2.200 Э1.16 Ж2.6 Д2.41 2. На рис.93 приведена уточненная блок-схема автомата. Обозначения на схеме соответствуют табл.15 (ПР - блок принятия решений). Отдельно показаны различные уровни блоков ПО и ПС. Линии на схеме и штриховка указывают, что между i-моделями соединенных блоков и внутри заштрихованных связи задаются на этапе предорганизации. Введена нумерация блоков, которая понадобится в дальнейшем. Места, где связи вводятся на уровне предорганизации, обозначены буквами а, б и т.д. Связи, помеченные буквой а, вводятся на основании данных, полученных в #5 гл.8, их схема приведена на рис.91. Связи, помеченные буквой б, вводятся на основании данных #3 гл.8. Схема связей, помеченных буквой в, проиллюстрирована на рис.92. Связи, помеченные буквой г, задают предорганизацию "эмоционального" канала переработки информации. Представление о структуре этого канала дает схема на рис.94. Связи, помеченные буквой д, задают автомату план действий, разный в различных экспериментах; связи д вводятся по типу рис.90.
Таблица 15
Рис.93. Уточненная блок-схема М-автомата МОД.
Рис.94. Фрагмент структуры М-сети. Двойными стрелками показаны связи от других i-моделей сети.
Из схемы рис.87 видно, что этап предорганизации занимает важное место в построении модели и что после выполнения этого этапа автомат оказывается способным организовать некоторое поведение. Между блоками Р и Д имеются два пересекающихся канала информации - "логический" (понятийный) и "эмоциональный". Таким образом, восприятие некоторой информации в блоке Р может вызвать выполнение действия. Информация о результатах этого действия воспринимается блоком Р в виде соответствующего изменения среды. Система оказывается замкнутой. Очевидно, характер поведения автомата определяется характером предорганизации. Поскольку предорганизация является существенным этапом работы, во многом предопределяющим ее конечный результат, необходимо провести проверку "качества" принятого варианта. Выполним эту проверку путем исследования поведения предорганизованного автомата в некоторой среде, причем исключим из алгоритма А все операции, связанные с обучением сети. В случае, если поведение автомата окажется удовлетворительным, будем считать удовлетворительным и принятый вариант предорганизации и не будем изменять его при всех дальнейших экспериментах. Такой (необучающийся) вариант М-автомата назовем опорным.
Прежде чем приступить к исследованию предорганизации модели, необходимо определить способы представления и обработки информации о ее функционировании.
#1. ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ О МОДЕЛИ МОД
Работы по определению значений параметров обучения составили первый этап исследования модели. Второй его этап связан с экспериментальным изучением свойств модели, представленной в полном объеме. Изложению экспериментальных результатов следует предпослать более детальное описание структуры исследуемой модели и некоторых ее механизмов, не описанных ранее.
В организации поведения существенную роль играют процессы, связанные с построением предварительного плана действий. Моделирование двигательного поведения было бы неполным без разработки специальной модели процессов планирования. М-автомат МОД рассчитан на взаимодействие с такой моделью. Поскольку ее описание содержится в предыдущих разделах книги, ограничимся здесь упоминанием лишь о тех ее компонентах, которые непосредственно включены в структуру нашего автомата. Прежде всего, к ним относятся механизмы представления плана в М-сети и механизмы систем, следящих за выполнением плана.
Выходная информация модели планирования фиксируется в М-сети специфичной структурой, схематически изображенной на рис.90. Группа i-моделей ДII состоит из i-моделей "обобщенных" действий, характеризующих общее направление движения автомата за определенное время, например, "двигаться вперед" и т.п. Группа i-моделей Р состоит из i-моделей этапов плана. Р.i - i-модель i-ro этапа. Результат планирования представляется в виде совокупности связей, каждая из которых направлена от i-модели этапа плана к i-модели "обобщенного" действия и определяет таким образом содержание этапа. В ходе работы М-автомата, по мере выполнения им намеченного плана, оказывается возбужденной одна (и в каждый момент времени - только одна) i-модель этапа. По имеющейся связи возбуждение передается на соответствующую i-модель "обобщенного" действия и далее - на i-модели действий-шагов, которыми данное "обобщенное" действие может быть реализовано. Таким образом, i-модели шагов, удовлетворяющих плану, получают дополнительное возбуждение и вероятность их выполнения повышается. В исходном состоянии возбуждена i-модель Р.1. Одновременно со структурой рис.90 модель планирования формирует информацию о зонах расположения "ориентиров" каждого этапа, т.е. таких объектов среды, при достижении которых соответствующий этап считается выполненным, а также об ожидаемых возбуждениях i-моделей Пр и НПр при выполнении каждого из этапов и примерном числе шагов, необходимых для выполнения этапа. Эта информация используется при работе следящих систем "по результатам" и "по чувствам", контролирующих выполнение плана.
Рис.90. Задание плана в М-сети.
Следящая система "по результатам" обеспечивает выполнение следующих операций: 1) если в ходе перемещений автомата в среде оказывается воспринятым объект, отмеченный как ориентир i-ro этапа плана, то возбуждение i-модели Р.i, снижается до нуля и возбуждается i-модель Р.[i+1]. 2) если после выполнения автоматом определенного в модели планирования числа шагов ориентир не воспринят, то возбуждение i-модели выполняемого этапа плана снижается до нуля, получает дополнительное возбуждение i-модель НПр и автомат в течение некоторого времени выполняет шаги без учета плана ("поиск ориентира"). Если за это время ориентир обнаружен, выполняется операция 1, если нет - автомат формирует требование на построение нового плана (вызов модели планирования).
Следящая система "по чувствам" постоянно производит сравнение текущего значения величины Dt=Пt.НПр-Пt.Пр с "критическим" значением этой величины, определенным в модели планирования для каждого из этапов плана. Если текущее значение превышает критическое, автомат формирует требование на построение нового плана. Отметим, что новый план будет построен с учетом сложившегося состояния сферы эмоций автомата и может отличаться от предыдущего.
Алгоритмы, реализующие описанные операторы, включены в программу так, как показано на блок-схеме рис.56.
Рис.91. Схематическое представление структуры блока понятийных обобщений.
Дополним теперь приведенное ранее описание блока понятийных обобщений исследуемого М-автомата. При задании начальной структуры этого блока были использованы сведения о характере и числовых параметрах связей, полученные при исследовании модели формирования понятий (#5, гл.9). Данные этого исследования нетрудно обобщить на случаи формирования иерархических понятийных структур и понятий по различным признакам. На рис.91 приведено схематическое изображение принятой нами структуры "системы знаний" автомата. Кроме "системы знаний", блок понятийных обобщений содержит субблок "мотивации принятия решений", или просто блок "решений". (Это название удобно ввиду его краткости, однако неточно, поскольку i-моделями возможных решений автомата являются, вообще говоря, i-модели его действий, а мотивация принятия решений, т.е. выбора действий, задается в каждый момент времени структурой и состоянием всей М-сети автомата). Заданием определенной структуры блока решений в автомат введена "память" о его гипотетическом прошлом опыте. Схематически фрагмент этой структуры изображен на рис.92, где знаки -> и -( обозначают связи с преимущественно усиливающим и тормозным компонентами соответственно. Схема демонстрирует влияние на выбор решения состояния воспринимающей и эмоциональной сфер. Отметим, что "выбор" (т.е. возбуждение) той или иной i-модели решений не означает еще выполнения соответствующих действий, а лишь создает благоприятные условия для их выбора СУТ. Состояние остальной части М-сети может обусловить выполнение других действий. Аналогичные структуры построены для выбора решений "есть" и "нести", "спать" и "создать убежище". При работе автомата в блоке могут устанавливаться новые связи и меняться проходимости заданных - "опыт" может изменяться.
Рис.92. Фрагмент структуры блока принятия решений.
Числовые характеристики блоков М-сети автомата представлены в табл.15. Формула автомата: Р1.82 П.3.44 С2.200 Э1.16 Ж2.6 Д2.41 2. На рис.93 приведена уточненная блок-схема автомата. Обозначения на схеме соответствуют табл.15 (ПР - блок принятия решений). Отдельно показаны различные уровни блоков ПО и ПС. Линии на схеме и штриховка указывают, что между i-моделями соединенных блоков и внутри заштрихованных связи задаются на этапе предорганизации. Введена нумерация блоков, которая понадобится в дальнейшем. Места, где связи вводятся на уровне предорганизации, обозначены буквами а, б и т.д. Связи, помеченные буквой а, вводятся на основании данных, полученных в #5 гл.8, их схема приведена на рис.91. Связи, помеченные буквой б, вводятся на основании данных #3 гл.8. Схема связей, помеченных буквой в, проиллюстрирована на рис.92. Связи, помеченные буквой г, задают предорганизацию "эмоционального" канала переработки информации. Представление о структуре этого канала дает схема на рис.94. Связи, помеченные буквой д, задают автомату план действий, разный в различных экспериментах; связи д вводятся по типу рис.90.
Таблица 15
Рис.93. Уточненная блок-схема М-автомата МОД.
Рис.94. Фрагмент структуры М-сети. Двойными стрелками показаны связи от других i-моделей сети.
Из схемы рис.87 видно, что этап предорганизации занимает важное место в построении модели и что после выполнения этого этапа автомат оказывается способным организовать некоторое поведение. Между блоками Р и Д имеются два пересекающихся канала информации - "логический" (понятийный) и "эмоциональный". Таким образом, восприятие некоторой информации в блоке Р может вызвать выполнение действия. Информация о результатах этого действия воспринимается блоком Р в виде соответствующего изменения среды. Система оказывается замкнутой. Очевидно, характер поведения автомата определяется характером предорганизации. Поскольку предорганизация является существенным этапом работы, во многом предопределяющим ее конечный результат, необходимо провести проверку "качества" принятого варианта. Выполним эту проверку путем исследования поведения предорганизованного автомата в некоторой среде, причем исключим из алгоритма А все операции, связанные с обучением сети. В случае, если поведение автомата окажется удовлетворительным, будем считать удовлетворительным и принятый вариант предорганизации и не будем изменять его при всех дальнейших экспериментах. Такой (необучающийся) вариант М-автомата назовем опорным.
Прежде чем приступить к исследованию предорганизации модели, необходимо определить способы представления и обработки информации о ее функционировании.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#2. СПОСОБЫ ПРЕДСТАВЛЕНИЯ И ОБРАБОТКИ РЕЗУЛЬТАТОВ
Пусть предорганизованный М-автомат находится в ситуации, представленной на рис.95 (напомним, что используются обозначения раздражителей, введенные в табл.6). Исключим из алгоритма А все операции, связанные с обучением сети. Для этого достаточно придать нулевые значения вводимым параметрам обучения. Тогда характер реакций автомата будет определяться особенностями его предорганизации. Будем различать внешние и внутренние реакции. В рассматриваемом случае внешней реакцией автомата является выполнение им некоторого действия d.i из множества возможных действий D. К выбору действия d.i приводит переработка информации, воспринятой автоматом. Внутренние реакции автомата состоят в изменении возбужденностей всех i-моделей сети. С этими изменениями связаны также переключения на различные сферы и i-модели системы усиления-торможения. Таким образом, внутренние реакции описывают ход процесса переработки информации, приводящего к выбору d.i. Рассмотрение внутренних реакций позволит, очевидно, более полно представить работу автомата. Начнем поэтому с анализа именно этих реакций.
Рис.95. Тестовая ситуация.
Будем рассматривать внутренние реакции автомата в течение некоторого времени с момента выполнения им операций осмотра ситуации. Чтобы исключить на это время выполнение внешних реакций, "затормозим" двигательную сферу сети путем, например, придания малых значений коэффициентам K.н всех i-моделей действия. Внутренние реакции автомата на восприятие ситуации рис.95 в течение 10 моментов дискретного времени представлены на рис.96-100.
Выше мы зафиксировали некоторую (вообще говоря, произвольную) содержательную интерпретацию рассматриваемой задачи. В рамках этой интерпретации проведена и предорганизация модели. Поэтому содержательное описание внутренних реакций автомата проведем, используя введенную ранее терминологию. При содержательном описании графики на рис. 96-100 отображают "ход мыслей" некоторого условного субъекта, обладающего фиксированным набором "понятий", "чувств", "желаний" и т.п. "Ход мыслей" субъекта вызван восприятием определенных раздражителей из окружающей среды. Результатом "мышления" является принятие решения о выполнении некоторого действия. Интерпретация реакций основана на том, что возбужденность каждой i-модели сопоставляется с напряженностью (выраженностью, субъективной важностью) "мыслей" субъекта о соответствующем объекте или состоянии. Наиболее важные "мысли" (наиболее возбужденные i-модели) "осознаются" субъектом (выбираются СУТ). Менее важные составляют "подсознание".
Ситуация, в которой находится автомат, содержит всего пять раздражителей, из которых три относятся к классу "зверь", четыре - "препятствие", два - "пища" и один - "убежище". Два раздражителя ("зверь А" и "зверь В") абсолютно неприятны, два имеют смешанный характер и один абсолютно приятен. Ситуация, таким образом, весьма неоднородна и может вызвать противоречивые "стремления" и "мысли".
Рис.96. Внутренние реакции МОД в тестовой ситуации. Блок понятийных обобщений.
На рис.96 представлены кривые возбуждения i-моделей блока понятийных обобщений. Вид этих кривых допускает следующую содержательную интерпретацию. В первый после осмотра момент возбуждены "мысли" о раздражителях, имеющихся в среде. Степень их возбужденности одинакова - выполняется фиксация ситуации. В следующий момент происходит "узнавание" раздражителей и возбуждаются i-модели понятий первого уровня (см. рис.91) - возникают "мысли": "зверь", "пища", "дерево", "убежище". Их степень возбужденности уже неодинакова - наиболее выраженной оказывается "мысль" о "звере", менее выраженной - о "пище" и т.д. Это обусловлено различным представлением соответствующих раздражителей в ситуации. В дальнейшем (начиная с t.3) здесь будет сказываться влияние эмоциональных оценок, вырабатываемых в блоке Э. Процесс "узнавания" раздражителей продолжается, и в момент t3 возбуждаются понятия высшего уровня - "препятствие" и "полезное". Начиная с этого момента "мысли" о "звере", "пище", "препятствии" и "полезном" остаются ведущими, причем работа СУТ.ПО и изменения эмоциональных состояний приводит к временному доминированию то одной, то другой нз них. Остальные же "мысли" играют меньшую роль, т.е. оказывают меньшее влияние на выбор действия. Начиная с момента t.2 формируются представления о количественной нагруженности среды раздражителями: возбуждаются i-модели "много зверей", "много пищи" и т.п. Видно, что степень их возбужденности адекватна ситуации. Хорошо выражена ритмика возбуждения всех i-моделей, что обеспечивается функционированием алгоритмов СУТ-2 и СУТ.ПО. Из рисунка видно, что основную роль в переработке информации играют понятия высших уровней.
Рис.97. Внутренние реакции МОД в тестовой ситуации. Блок эмоций.
На рис.97 представлены кривые возбуждения i-моделей блока эмоций. В момент t.1 эмоциональная оценка еще не выработана и i-модели блока не возбуждены. Наиболее возбужденными в следующий момент оказываются "страх" и "гнев". Их возбуждение обусловлено "безусловной реакцией" автомата на восприятие раздражителей класса "зверь". Этим "чувствам" соответствуют два основных вида реакций автомата на опасность - пассивно оборонительная ("страх" включает "программу побега") и активно оборонительная ("гнев" включает "программу нападения"). При этом "страх" вызывается прежде всего восприятием раздражителей "зверь А" и "зверь В", по условию наиболее опасных для модели, а "гнев" - восприятием съедобного "зверя С", на которого нужно "напасть", чтобы его можно было "съесть". В ходе переработки информации выработанные оценки меняются: "страх" постепенно исчезает (поскольку наличие в среде "убежища" вызывает "чувства" "уверенности" и "безопасности"), а "гнев" становится менее интенсивным, уходит в "подсознание", хотя и поддерживается на сравнительно высоком уровне, поскольку его возбуждение необходимо для овладения съедобным "зверем". Таким образом, действие "нападать" является одним из возможных решений автомата, поддерживаемым "пищевым рефлексом". Связь "гнева" с этим рефлексом позволяет ожидать, что "гнев" будет возбужден тем сильнее, чем больше будет напряжен "пищевой рефлекс". Напряженность последнего отображается в сети возбуждением i-модели "чувство голода". Таким образом, возбуждения "голода" и "гнева" должны коррелировать друг с другом. Такая (положительная) корреляция и наблюдается в эксперименте. Характерно, что i-модели "гнев" и "чувство голода" непосредственно друг с другом не связаны. Это дает основания полагать, что совокупность связей между i-моделями чувств удовлетворительно отражает работу механизмов пищевого рефлекса.
Изложенные рассуждения приведены в качестве примера, иллюстрирующего возможность и способы содержательной интерпретации числовых результатов просчета модели. Кривые рис.97-100 могут служить основанием для целого ряда такого рода рассуждений, которые мы приводить здесь не будем. Отметим лишь несколько интересных моментов. Как указывалось ранее, возбуждение i-модели "голод" дискретно увеличивается в каждый момент времени (от "тела") и в данном эксперименте в момент времени t.10 составило 40усл.ед. i-Модель "чувства голода" в блоке Э связана как с i-моделью "голод", так и с i-моделями других чувств. Представленные на рисунках возбуждения "чувства голода" соответствуют, таким образом, "субъективному" восприятию модели и возникают "рефлекторно" при восприятии раздражителей класса "пища". i-Модель чувства "близость цели" также возбуждается дискретно и пропорционально расстоянию от собственной ячейки до ближайшего ориентира. Она также "субъективно" переживается автоматом в зависимости от его состояния.
Рассмотрение графиков показывает, что при переработке информации автомат меняет характер оценки воспринятой ситуации. Действительно, примерно до момента t.5 ведущую роль играют возбуждения "негативно окрашенных" чувств, затем они существенно затухают и преимущество получают "положительные" чувства. Соответственно изменяются и возбуждения интегрирующих центров Пр и НПр. Переоценка осуществляется в период t.5-t.6 и является устойчивой, поскольку разность П.Пр-П.НПр монотонно возрастает во времени. Такая "установка" модели на первоочередное выделение негативных свойств ситуации отображает доминирующее влияние "оборонительного рефлекса", представленного, как и "пищевой рефлекс", совокупностью связей в М-сети. Как и следовало ожидать, неоднородность раздражителей воспринятой ситуации привела к одновременному возбуждению i-моделей противоположных по характеру чувств ("удовлетворение" и "неудовлетворение", "уверенность" и "неуверенность" и т.п.).
Рис.98. Внутренние реакции МОД в тестовой ситуации. Блок желаний.
Динамика возбуждения i-моделей желаний иллюстрируется графиками на рис.98. Основную роль играет здесь желание "действовать". При этом высокая активность "чувства гнева" и "уверенности" диктует характеристику действий - "быстро". Возбуждение желания "не действовать" также велико, что является следствием одновременного возбуждения противоположных чувств в блоке Э. Характерно, что момент "наибольшей неуверенности", обусловленный практическим совпадением возбужденностей противоположных желаний, совпадает с моментом переоценки ситуации в блоке Э.
Рис.99. Внутренние реакции МОД в тестовой ситуации. Блок решений.
С целью иллюстрации работы блока принятия решений на рис.99 приведены графики возбуждений i-моделей, реализующих программу оценки решений "есть" и "нести". Названия этих моделей приведены на рисунке, их организация аналогична структуре на рис.92. Блок оценивает в условных величинах (отображаемых возбужденностями) "нужность" и "трудность" выполнения действий "есть" и "нести". В нашем случае оценка относится к раздражителю "зверь С", поскольку понятие "зверь" возбуждено сильнее, чем понятие "дерево", и, кроме того, "зверь" является более предпочтительной "пищей" (см. табл.4). Конкретные значения оценок определяются структурой ситуации (съесть трудно, так как пищей является зверь, не очень нужно, так как есть и другая пища и голод не велик; нести трудно, так как имеются препятствия и т.п.). Преимущество получает решение "съесть", однако его возбуждение не очень велико. Возбуждение i-моделей решений увеличивает возбуждение соответствующих действий, что оказывает влияние на их выбор СУТ в дальнейшем.
В той же форме, что и на рис.97-99, может быть представлена динамика возбуждений i-моделей блоков Р и Д. В приведенных графиках содержится информация о работе СУТ первого уровня. В каждом блоке X и в каждый момент времени СУТ.Х выделяет наиболее возбужденную i-модель. Последовательность названий i-моделей, выделяемых СУТ в различные моменты времени, представляет собой запись "хода рассуждений" автомата. Более грубо "ход рассуждений" представляется СУТ-2. Последняя использует в своей работе информацию о динамике возбуждения не отдельных i-моделей, а определенных участков блоков М-сети. На рис.100 представлены графики среднего возбуждения различных блоков (рассчитанного для каждого момента времени как среднее арифметическое по возбужденным i-моделям блока). Из рисунка видно, что ведущую роль в процессе переработки информации играет блок понятийных обобщений. Несколько меньшая роль принадлежит блокам эмоций и желаний. Роль блока решений меняется во времени. В разные моменты СУТ-2 выделяет блоки ПО, Р и Э.
Рис.100. Динамика среднего возбуждения различных блоков.
Приведенные графики достаточно полно отображают процессы в М-сети, однако являются весьма громоздкими. Поэтому в дальнейшем результаты экспериментов с автоматом (реакции автомата) будем представлять в форме таблиц, содержащих названия t-моделей блоков, выделяемых СУТ в разные моменты времени. Такие СУТ-таблицы на содержательном уровне изображают "ход рассуждений" модели в эксперименте (табл.16). Верхняя часть таблицы используется для изображения ситуации, в которой находится автомат, его внешних реакций и для различных замечаний. В строке "СУТ-2" помещаются названия блоков, выделенных СУТ-2 в различные моменты времени. Первый столбец таблицы содержит наименования блоков М-сети. В строках "ДII", "Ш" и "НП" стрелки изображают соответственно действия второго уровня, действия-шаги и действия "нападать", i-модели которых выделяются системами усиления - торможения соответствующих блоков. Прочерк означает, что в данный момент i-модели соответствующего блока не возбуждаются.
Таблица 16
Рассмотрим СУТ-таблицу описанного эксперимента. Содержание строк СУТ-2, ПО, Э, Ж следует из графиков рис.97-100. Чтобы упростить процессы в М-сети, на работу автомата было наложено следующее ограничение: СУТ.Р может выделять любые i-модели блока Р, за исключением i-моделей раздражителей-объектов (о составе блока Р см. гл.8 ). Поэтому строка Р таблицы содержит только названия раздражителей-запахов. Содержание строки ПР обусловлено тем, что в ходе эксперимента одновременно работали все три программы блока принятия решений. Видно, что наиболее активными были программы, запускаемые понятиями "опасность" и "съедобное", так как именно их i-модели выбирались СУТпр. Строка ДП указывает направление движения, заданное автомату планом. На интересное обстоятельство указывает содержание строки "Ш". В момент t.2 автомат готов выполнить шаг, соответствующий плану. Однако в дальнейшем, после некоторого "обдумывания", он "меняет решение" и отдает преимущество шагу, ведущему к весьма сильному, абсолютно положительному раздражителю "убежище". Из таблицы видно, что в период t.1-t.3 (как показано выше, это период максимально негативной оценки ситуации) автомат готов "принять решение" о нападении на "зверя С". Последующая переоценка ситуации приводит к отказу от рассмотрения этого решения.
Описанный эксперимент проведен при заторможенном блоке Д сети. Поэтому за рассчитанный промежуток времени автомат не выполнял действий. Предположим, что сфера Д расторможена. Тогда, если СУТ-2 выделит блок "шаги" в момент t.2, автомат выполнит действие-шаг, соответствующее плану. Если это выделение произойдет позже, автомат переместится в "убежище". Если же СУТ-2 выделит блок "нападать" до момента t.3, будет выполнено нападение. Все эти варианты поведения легко реализовать путем задания соответствующих значений коэффициента K.н i-модели блока Д. Этим способом мы можем, следовательно, сделать автомат "импульсивным", "агрессивным" и т.п. Рассмотренная возможность является лишь одной из множества возможностей такого рода, связанных с изменением и подбором коэффициентов, задающих систему (9.33).
С помощью СУТ-таблиц нам предстоит описывать результаты весьма продолжительных экспериментов. Не вся информация в таблице является одинаково важной. Так, содержание строки Р нетрудно предвидеть, зная содержание ситуаций. Не всегда нужно знать также, какие процессы проходят в блоке Д, так как обязательно будет известен окончательный выбор решения - внешняя реакция автомата. С другой стороны, для оценки работы модели всегда представляют интерес процессы, развивающиеся в "логическом" и "эмоциональном" каналах переработки информации. Поэтому в ряде случаев мы будем пользоваться сокращенной формой СУТ-таблиц, включающей лишь строки СУТ-2, ПО, Э и Ж.
Из изложенного ясно, что результаты просчетов моделей, выполненных в виде М-автоматов, допускают содержательные интерпретации. Последние, однако, имеют лишь относительную ценность, поскольку в значительной мере опираются на интуитивные представления разработчика. Кроме того, содержательные интерпретации имеют смысл в случаях, когда изучаемые автоматы построены как модели психических функций или рассматриваются как таковые. При этом существует соответствие между содержательными уровнями постановки задачи и описания результатов. В тех случаях, когда задача моделирования ставится достаточно определенно, представляется необходимым ввести строгие числовые критерии оценки результата. Содержательные описания играют здесь вспомогательную роль. Воспользуемся постановкой задачи, приведенной в гл.9 для введения критериев оценки реакций исследуемой модели двигательного поведения.
В общей форме показатель качества функционирования абстрактной системы М записан в виде функционала (9.36). Учитывая это, введем критерий качества функционирования модели двигательного поведения. Показано, что функцию оценки в М-автомате реализует блок Э, содержащий i-модели интегрирующих центров Пр и НПр. Пусть М-автомат А в течение N моментов дискретного времени функционирует в некоторой среде S. В каждый момент времени блок Э будет вырабатывать некоторую оценку состояния автомата. Соответственно будут изменяться возбужденности i-моделей Пр и НПр. Критерий качества функционирования e введем как среднюю оценку за время функционирования А в среде:
e = 1/N СУММА[i](Пti.Пр-Пti.НПр), i=1, 2, ..., N. (10.1)
Укажем на двойственную роль оценки e. Один и тот же автомат в различных средах будет формировать различные значения е, которые можно в этом случае рассматривать как оценки сред, но оценки, даваемые определенным, именно данным автоматом (субъективные оценки). С другой стороны, в одной и той же среде различные варианты автоматов также будут формировать различные значения е, рассматриваемые в данном случае как показатели приспособленности автоматов к среде, показатели их адаптационных возможностей, оценки качества их функционирования. Но все это - относительно лишь данной конкретной среды. Ниже мы будем использовать оценку e в обоих смыслах, специально оговаривая это в соответствующих случаях.
Таблица 17
Постановка задачи требует оценки "хода рассуждений" или "хода мышления" модели. Из предыдущего изложения ясно, что речь идет об оценке внутренних реакций автомата. Понятие рациональности мышления не является строго определенным. Уточним наше требование следующим образом. Потребуем определенного соответствия между процессами, протекающими в "логическом" канале переработки информации, и содержанием ситуаций внешней среды, в которых находится автомат. Иначе говоря, мы требуем адекватности "логических представлений" автомата о среде самой этой среде. Такое требование представляется естественным, поскольку правильное узнавание объектов среды, т.е. возбуждение i-моделей соответствующих понятий, играет важную роль при выборе соответствующих данной ситуации действий. Будем оценивать упомянутое соответствие на уровне выборов СУТ.ПО. Зафиксируем таблицу соответствий ТЛ (табл.17). Строки этой таблицы соответствуют раздражителям, которые может "воспринять" автомат из среды, а столбцы - названиям i-моделей понятий, которые может выделить СУТ.ПО в блоке ПО. Единица на пересечении i-й строки и j-го столбца (ТЛ.ij=1) означает, что если в некоторый момент времени ситуация, в которой находится автомат, содержит раздражитель i и в тот же момент времени СУТ.ПО выделяет i-модель понятия j, то такая внутренняя реакция может считаться адекватной. Если TЛ.ij=0, то реакция неадекватна. Таким образом, имея СУТ-таблицу некоторого эксперимента, можно оценить адекватность работы СУТ блока понятийных обобщений в каждый момент времени и вычислить индекс адекватности I.а:
I.а = 1/N СУММА[i]д.ti, i = 1, 2, ..., N, (10.2)
где
д.ti =
1, если TЛ.ij = 1;
0, если TЛ.ij = 0.
Из интуитивных соображений мы не требуем непосредственного соответствия между внешней средой и процессами в "эмоциональном канале" переработки информации: далеко не всегда настроение человека соответствует тому, что он наблюдает в данный момент. Зато соответствие между эмоциональной и понятийной сферами мышления представляется нам более очевидным. По аналогии потребуем определенного соответствия между процессами, протекающими в "логическом" и "эмоциональном" каналах переработки информации М-автомата. Будем оценивать это соответствие на уровне работы СУТ.ПО и СУТ.Э. Зафиксируем таблицу соответствий ТЭ (табл.18 ). Строки этой таблицы соответствуют названиям i-моделей понятий, которые могут быть выбраны СУТ.ПО, столбцы - названиям i-моделей эмоций, выбираемых СУТ.Э. Если ТЭ.ij=1, то реакция автомата считается в данный момент адекватной, если же ТЭ.ij=0 - неадекватной. Анализируя СУТ-таблицу некоторого эксперимента, можно
оценить адекватность реакций в каждый момент и вычислить индекс адекватности I.Э:
I.Э = 1/N СУММА[i]e.ij, i = 1, 2, ..., N, (10.3)
где
e.ij =
1, если ТЭ.ij = 1;
0, если ТЭ.ij = 0.
Таблица 18
Отметим, что выражения (10.2) и (10.3) дают "слабые" оценки адекватности в том смысле, что они не учитывают возможности отсроченного возбуждения i-моделей ("вспоминания" состояний), которые зачастую представляются адекватными при содержательном описании. Очевидно, выполняются соотношения
0<=I.Л<=1, 0<=I.Э<=1. (10.4)
Рис.101. К определению коэффициента адекватности внутренних реакций М-автомата.
Рассмотрим фазовое пространство этих индексов (рис.101). Точка (1,1) в этом пространстве соответствует реакциям, оцениваемым как максимально адекватные или рациональные. Точка (0,0) представляет максимально нерациональные реакции. Введем границу L, построение которой ясно из рисунка, и будем считать рациональными все те реакции, представляющие точки которых расположены выше границы L. Ориентированное расстояние от представляющей точки В до L будем рассматривать как меру рациональности реакций, соответствующих точке В. Оценим рациональность реакций В коэффициентом б, вычисляемым как отношение меры рациональности В к максимально возможному значению этой меры. Из геометрических построений рис.101 следует, что для реакций, описываемых определенными значениями индексов I.Л и I.Э, коэффициент б вычисляется следующим образом:
б = I.Л + I.Э - 1. (10.5)
Рациональными считаются реакции, для которых 0<б<=1.
Из изложенного ясно, что параметр б не является исчерпывающим при описании адекватности внутренних реакций автомата в общем случае. Он введен на основе интуитивных рассуждений (задания таблиц ТЛ и ТЭ) и использует не всю имеющуюся информацию о работе модели. С другой стороны, он, хотя и грубо, соответствует некоторым содержательным представлениям о характере реакций и легко вычисляется. Поэтому, а также в связи с отсутствием других разработанных оценок такого рода мы будем использовать б в качестве одного из параметров, характеризующих работу автомата. При функционировании в среде автомат выполняет некоторую последовательность действий-шагов, переводящих его из исходной ячейки g.н в финальную g.ф. Последовательность таких шагов составляет траекторию движения автомата. Введем вспомогательный коэффициент г для оценки качества траектории. Будем считать траекторию тем лучше, чем она короче, т.е. чем из меньшего числа шагов она состоит. Пусть в каком-либо эксперименте автомат переместился из g.н в g.ф за K шагов. Минимально возможной длиной траектории будем считать такое количество шагов K.0, которое выполнил бы, переходя из g.н в g.ф тот же автомат при условии, что среда не содержит никаких раздражителей. В этом случае автомат двигался бы под влиянием только заданного плана и достиг цели за минимальное число шагов. Таким образом,
г = K.0/K (g.н, g.ф - const); (10.6)
чем ближе значение г к 1, тем лучше оцениваемая траектория. В качестве ячеек g.н и g.ф будем в различных случаях принимать различные ячейки конкретных сред, специально оговаривая это. Условные обозначения внешних реакций автомата приведены в табл.19. Сокращения, используемые в дальнейшем для обозначения названий i-моделей в СУТ-таблицах, приведены в табл.20.
Таблица 19
Таблица 20
Пусть предорганизованный М-автомат находится в ситуации, представленной на рис.95 (напомним, что используются обозначения раздражителей, введенные в табл.6). Исключим из алгоритма А все операции, связанные с обучением сети. Для этого достаточно придать нулевые значения вводимым параметрам обучения. Тогда характер реакций автомата будет определяться особенностями его предорганизации. Будем различать внешние и внутренние реакции. В рассматриваемом случае внешней реакцией автомата является выполнение им некоторого действия d.i из множества возможных действий D. К выбору действия d.i приводит переработка информации, воспринятой автоматом. Внутренние реакции автомата состоят в изменении возбужденностей всех i-моделей сети. С этими изменениями связаны также переключения на различные сферы и i-модели системы усиления-торможения. Таким образом, внутренние реакции описывают ход процесса переработки информации, приводящего к выбору d.i. Рассмотрение внутренних реакций позволит, очевидно, более полно представить работу автомата. Начнем поэтому с анализа именно этих реакций.
Рис.95. Тестовая ситуация.
Будем рассматривать внутренние реакции автомата в течение некоторого времени с момента выполнения им операций осмотра ситуации. Чтобы исключить на это время выполнение внешних реакций, "затормозим" двигательную сферу сети путем, например, придания малых значений коэффициентам K.н всех i-моделей действия. Внутренние реакции автомата на восприятие ситуации рис.95 в течение 10 моментов дискретного времени представлены на рис.96-100.
Выше мы зафиксировали некоторую (вообще говоря, произвольную) содержательную интерпретацию рассматриваемой задачи. В рамках этой интерпретации проведена и предорганизация модели. Поэтому содержательное описание внутренних реакций автомата проведем, используя введенную ранее терминологию. При содержательном описании графики на рис. 96-100 отображают "ход мыслей" некоторого условного субъекта, обладающего фиксированным набором "понятий", "чувств", "желаний" и т.п. "Ход мыслей" субъекта вызван восприятием определенных раздражителей из окружающей среды. Результатом "мышления" является принятие решения о выполнении некоторого действия. Интерпретация реакций основана на том, что возбужденность каждой i-модели сопоставляется с напряженностью (выраженностью, субъективной важностью) "мыслей" субъекта о соответствующем объекте или состоянии. Наиболее важные "мысли" (наиболее возбужденные i-модели) "осознаются" субъектом (выбираются СУТ). Менее важные составляют "подсознание".
Ситуация, в которой находится автомат, содержит всего пять раздражителей, из которых три относятся к классу "зверь", четыре - "препятствие", два - "пища" и один - "убежище". Два раздражителя ("зверь А" и "зверь В") абсолютно неприятны, два имеют смешанный характер и один абсолютно приятен. Ситуация, таким образом, весьма неоднородна и может вызвать противоречивые "стремления" и "мысли".
Рис.96. Внутренние реакции МОД в тестовой ситуации. Блок понятийных обобщений.
На рис.96 представлены кривые возбуждения i-моделей блока понятийных обобщений. Вид этих кривых допускает следующую содержательную интерпретацию. В первый после осмотра момент возбуждены "мысли" о раздражителях, имеющихся в среде. Степень их возбужденности одинакова - выполняется фиксация ситуации. В следующий момент происходит "узнавание" раздражителей и возбуждаются i-модели понятий первого уровня (см. рис.91) - возникают "мысли": "зверь", "пища", "дерево", "убежище". Их степень возбужденности уже неодинакова - наиболее выраженной оказывается "мысль" о "звере", менее выраженной - о "пище" и т.д. Это обусловлено различным представлением соответствующих раздражителей в ситуации. В дальнейшем (начиная с t.3) здесь будет сказываться влияние эмоциональных оценок, вырабатываемых в блоке Э. Процесс "узнавания" раздражителей продолжается, и в момент t3 возбуждаются понятия высшего уровня - "препятствие" и "полезное". Начиная с этого момента "мысли" о "звере", "пище", "препятствии" и "полезном" остаются ведущими, причем работа СУТ.ПО и изменения эмоциональных состояний приводит к временному доминированию то одной, то другой нз них. Остальные же "мысли" играют меньшую роль, т.е. оказывают меньшее влияние на выбор действия. Начиная с момента t.2 формируются представления о количественной нагруженности среды раздражителями: возбуждаются i-модели "много зверей", "много пищи" и т.п. Видно, что степень их возбужденности адекватна ситуации. Хорошо выражена ритмика возбуждения всех i-моделей, что обеспечивается функционированием алгоритмов СУТ-2 и СУТ.ПО. Из рисунка видно, что основную роль в переработке информации играют понятия высших уровней.
Рис.97. Внутренние реакции МОД в тестовой ситуации. Блок эмоций.
На рис.97 представлены кривые возбуждения i-моделей блока эмоций. В момент t.1 эмоциональная оценка еще не выработана и i-модели блока не возбуждены. Наиболее возбужденными в следующий момент оказываются "страх" и "гнев". Их возбуждение обусловлено "безусловной реакцией" автомата на восприятие раздражителей класса "зверь". Этим "чувствам" соответствуют два основных вида реакций автомата на опасность - пассивно оборонительная ("страх" включает "программу побега") и активно оборонительная ("гнев" включает "программу нападения"). При этом "страх" вызывается прежде всего восприятием раздражителей "зверь А" и "зверь В", по условию наиболее опасных для модели, а "гнев" - восприятием съедобного "зверя С", на которого нужно "напасть", чтобы его можно было "съесть". В ходе переработки информации выработанные оценки меняются: "страх" постепенно исчезает (поскольку наличие в среде "убежища" вызывает "чувства" "уверенности" и "безопасности"), а "гнев" становится менее интенсивным, уходит в "подсознание", хотя и поддерживается на сравнительно высоком уровне, поскольку его возбуждение необходимо для овладения съедобным "зверем". Таким образом, действие "нападать" является одним из возможных решений автомата, поддерживаемым "пищевым рефлексом". Связь "гнева" с этим рефлексом позволяет ожидать, что "гнев" будет возбужден тем сильнее, чем больше будет напряжен "пищевой рефлекс". Напряженность последнего отображается в сети возбуждением i-модели "чувство голода". Таким образом, возбуждения "голода" и "гнева" должны коррелировать друг с другом. Такая (положительная) корреляция и наблюдается в эксперименте. Характерно, что i-модели "гнев" и "чувство голода" непосредственно друг с другом не связаны. Это дает основания полагать, что совокупность связей между i-моделями чувств удовлетворительно отражает работу механизмов пищевого рефлекса.
Изложенные рассуждения приведены в качестве примера, иллюстрирующего возможность и способы содержательной интерпретации числовых результатов просчета модели. Кривые рис.97-100 могут служить основанием для целого ряда такого рода рассуждений, которые мы приводить здесь не будем. Отметим лишь несколько интересных моментов. Как указывалось ранее, возбуждение i-модели "голод" дискретно увеличивается в каждый момент времени (от "тела") и в данном эксперименте в момент времени t.10 составило 40усл.ед. i-Модель "чувства голода" в блоке Э связана как с i-моделью "голод", так и с i-моделями других чувств. Представленные на рисунках возбуждения "чувства голода" соответствуют, таким образом, "субъективному" восприятию модели и возникают "рефлекторно" при восприятии раздражителей класса "пища". i-Модель чувства "близость цели" также возбуждается дискретно и пропорционально расстоянию от собственной ячейки до ближайшего ориентира. Она также "субъективно" переживается автоматом в зависимости от его состояния.
Рассмотрение графиков показывает, что при переработке информации автомат меняет характер оценки воспринятой ситуации. Действительно, примерно до момента t.5 ведущую роль играют возбуждения "негативно окрашенных" чувств, затем они существенно затухают и преимущество получают "положительные" чувства. Соответственно изменяются и возбуждения интегрирующих центров Пр и НПр. Переоценка осуществляется в период t.5-t.6 и является устойчивой, поскольку разность П.Пр-П.НПр монотонно возрастает во времени. Такая "установка" модели на первоочередное выделение негативных свойств ситуации отображает доминирующее влияние "оборонительного рефлекса", представленного, как и "пищевой рефлекс", совокупностью связей в М-сети. Как и следовало ожидать, неоднородность раздражителей воспринятой ситуации привела к одновременному возбуждению i-моделей противоположных по характеру чувств ("удовлетворение" и "неудовлетворение", "уверенность" и "неуверенность" и т.п.).
Рис.98. Внутренние реакции МОД в тестовой ситуации. Блок желаний.
Динамика возбуждения i-моделей желаний иллюстрируется графиками на рис.98. Основную роль играет здесь желание "действовать". При этом высокая активность "чувства гнева" и "уверенности" диктует характеристику действий - "быстро". Возбуждение желания "не действовать" также велико, что является следствием одновременного возбуждения противоположных чувств в блоке Э. Характерно, что момент "наибольшей неуверенности", обусловленный практическим совпадением возбужденностей противоположных желаний, совпадает с моментом переоценки ситуации в блоке Э.
Рис.99. Внутренние реакции МОД в тестовой ситуации. Блок решений.
С целью иллюстрации работы блока принятия решений на рис.99 приведены графики возбуждений i-моделей, реализующих программу оценки решений "есть" и "нести". Названия этих моделей приведены на рисунке, их организация аналогична структуре на рис.92. Блок оценивает в условных величинах (отображаемых возбужденностями) "нужность" и "трудность" выполнения действий "есть" и "нести". В нашем случае оценка относится к раздражителю "зверь С", поскольку понятие "зверь" возбуждено сильнее, чем понятие "дерево", и, кроме того, "зверь" является более предпочтительной "пищей" (см. табл.4). Конкретные значения оценок определяются структурой ситуации (съесть трудно, так как пищей является зверь, не очень нужно, так как есть и другая пища и голод не велик; нести трудно, так как имеются препятствия и т.п.). Преимущество получает решение "съесть", однако его возбуждение не очень велико. Возбуждение i-моделей решений увеличивает возбуждение соответствующих действий, что оказывает влияние на их выбор СУТ в дальнейшем.
В той же форме, что и на рис.97-99, может быть представлена динамика возбуждений i-моделей блоков Р и Д. В приведенных графиках содержится информация о работе СУТ первого уровня. В каждом блоке X и в каждый момент времени СУТ.Х выделяет наиболее возбужденную i-модель. Последовательность названий i-моделей, выделяемых СУТ в различные моменты времени, представляет собой запись "хода рассуждений" автомата. Более грубо "ход рассуждений" представляется СУТ-2. Последняя использует в своей работе информацию о динамике возбуждения не отдельных i-моделей, а определенных участков блоков М-сети. На рис.100 представлены графики среднего возбуждения различных блоков (рассчитанного для каждого момента времени как среднее арифметическое по возбужденным i-моделям блока). Из рисунка видно, что ведущую роль в процессе переработки информации играет блок понятийных обобщений. Несколько меньшая роль принадлежит блокам эмоций и желаний. Роль блока решений меняется во времени. В разные моменты СУТ-2 выделяет блоки ПО, Р и Э.
Рис.100. Динамика среднего возбуждения различных блоков.
Приведенные графики достаточно полно отображают процессы в М-сети, однако являются весьма громоздкими. Поэтому в дальнейшем результаты экспериментов с автоматом (реакции автомата) будем представлять в форме таблиц, содержащих названия t-моделей блоков, выделяемых СУТ в разные моменты времени. Такие СУТ-таблицы на содержательном уровне изображают "ход рассуждений" модели в эксперименте (табл.16). Верхняя часть таблицы используется для изображения ситуации, в которой находится автомат, его внешних реакций и для различных замечаний. В строке "СУТ-2" помещаются названия блоков, выделенных СУТ-2 в различные моменты времени. Первый столбец таблицы содержит наименования блоков М-сети. В строках "ДII", "Ш" и "НП" стрелки изображают соответственно действия второго уровня, действия-шаги и действия "нападать", i-модели которых выделяются системами усиления - торможения соответствующих блоков. Прочерк означает, что в данный момент i-модели соответствующего блока не возбуждаются.
Таблица 16
Рассмотрим СУТ-таблицу описанного эксперимента. Содержание строк СУТ-2, ПО, Э, Ж следует из графиков рис.97-100. Чтобы упростить процессы в М-сети, на работу автомата было наложено следующее ограничение: СУТ.Р может выделять любые i-модели блока Р, за исключением i-моделей раздражителей-объектов (о составе блока Р см. гл.8 ). Поэтому строка Р таблицы содержит только названия раздражителей-запахов. Содержание строки ПР обусловлено тем, что в ходе эксперимента одновременно работали все три программы блока принятия решений. Видно, что наиболее активными были программы, запускаемые понятиями "опасность" и "съедобное", так как именно их i-модели выбирались СУТпр. Строка ДП указывает направление движения, заданное автомату планом. На интересное обстоятельство указывает содержание строки "Ш". В момент t.2 автомат готов выполнить шаг, соответствующий плану. Однако в дальнейшем, после некоторого "обдумывания", он "меняет решение" и отдает преимущество шагу, ведущему к весьма сильному, абсолютно положительному раздражителю "убежище". Из таблицы видно, что в период t.1-t.3 (как показано выше, это период максимально негативной оценки ситуации) автомат готов "принять решение" о нападении на "зверя С". Последующая переоценка ситуации приводит к отказу от рассмотрения этого решения.
Описанный эксперимент проведен при заторможенном блоке Д сети. Поэтому за рассчитанный промежуток времени автомат не выполнял действий. Предположим, что сфера Д расторможена. Тогда, если СУТ-2 выделит блок "шаги" в момент t.2, автомат выполнит действие-шаг, соответствующее плану. Если это выделение произойдет позже, автомат переместится в "убежище". Если же СУТ-2 выделит блок "нападать" до момента t.3, будет выполнено нападение. Все эти варианты поведения легко реализовать путем задания соответствующих значений коэффициента K.н i-модели блока Д. Этим способом мы можем, следовательно, сделать автомат "импульсивным", "агрессивным" и т.п. Рассмотренная возможность является лишь одной из множества возможностей такого рода, связанных с изменением и подбором коэффициентов, задающих систему (9.33).
С помощью СУТ-таблиц нам предстоит описывать результаты весьма продолжительных экспериментов. Не вся информация в таблице является одинаково важной. Так, содержание строки Р нетрудно предвидеть, зная содержание ситуаций. Не всегда нужно знать также, какие процессы проходят в блоке Д, так как обязательно будет известен окончательный выбор решения - внешняя реакция автомата. С другой стороны, для оценки работы модели всегда представляют интерес процессы, развивающиеся в "логическом" и "эмоциональном" каналах переработки информации. Поэтому в ряде случаев мы будем пользоваться сокращенной формой СУТ-таблиц, включающей лишь строки СУТ-2, ПО, Э и Ж.
Из изложенного ясно, что результаты просчетов моделей, выполненных в виде М-автоматов, допускают содержательные интерпретации. Последние, однако, имеют лишь относительную ценность, поскольку в значительной мере опираются на интуитивные представления разработчика. Кроме того, содержательные интерпретации имеют смысл в случаях, когда изучаемые автоматы построены как модели психических функций или рассматриваются как таковые. При этом существует соответствие между содержательными уровнями постановки задачи и описания результатов. В тех случаях, когда задача моделирования ставится достаточно определенно, представляется необходимым ввести строгие числовые критерии оценки результата. Содержательные описания играют здесь вспомогательную роль. Воспользуемся постановкой задачи, приведенной в гл.9 для введения критериев оценки реакций исследуемой модели двигательного поведения.
В общей форме показатель качества функционирования абстрактной системы М записан в виде функционала (9.36). Учитывая это, введем критерий качества функционирования модели двигательного поведения. Показано, что функцию оценки в М-автомате реализует блок Э, содержащий i-модели интегрирующих центров Пр и НПр. Пусть М-автомат А в течение N моментов дискретного времени функционирует в некоторой среде S. В каждый момент времени блок Э будет вырабатывать некоторую оценку состояния автомата. Соответственно будут изменяться возбужденности i-моделей Пр и НПр. Критерий качества функционирования e введем как среднюю оценку за время функционирования А в среде:
e = 1/N СУММА[i](Пti.Пр-Пti.НПр), i=1, 2, ..., N. (10.1)
Укажем на двойственную роль оценки e. Один и тот же автомат в различных средах будет формировать различные значения е, которые можно в этом случае рассматривать как оценки сред, но оценки, даваемые определенным, именно данным автоматом (субъективные оценки). С другой стороны, в одной и той же среде различные варианты автоматов также будут формировать различные значения е, рассматриваемые в данном случае как показатели приспособленности автоматов к среде, показатели их адаптационных возможностей, оценки качества их функционирования. Но все это - относительно лишь данной конкретной среды. Ниже мы будем использовать оценку e в обоих смыслах, специально оговаривая это в соответствующих случаях.
Таблица 17
Постановка задачи требует оценки "хода рассуждений" или "хода мышления" модели. Из предыдущего изложения ясно, что речь идет об оценке внутренних реакций автомата. Понятие рациональности мышления не является строго определенным. Уточним наше требование следующим образом. Потребуем определенного соответствия между процессами, протекающими в "логическом" канале переработки информации, и содержанием ситуаций внешней среды, в которых находится автомат. Иначе говоря, мы требуем адекватности "логических представлений" автомата о среде самой этой среде. Такое требование представляется естественным, поскольку правильное узнавание объектов среды, т.е. возбуждение i-моделей соответствующих понятий, играет важную роль при выборе соответствующих данной ситуации действий. Будем оценивать упомянутое соответствие на уровне выборов СУТ.ПО. Зафиксируем таблицу соответствий ТЛ (табл.17). Строки этой таблицы соответствуют раздражителям, которые может "воспринять" автомат из среды, а столбцы - названиям i-моделей понятий, которые может выделить СУТ.ПО в блоке ПО. Единица на пересечении i-й строки и j-го столбца (ТЛ.ij=1) означает, что если в некоторый момент времени ситуация, в которой находится автомат, содержит раздражитель i и в тот же момент времени СУТ.ПО выделяет i-модель понятия j, то такая внутренняя реакция может считаться адекватной. Если TЛ.ij=0, то реакция неадекватна. Таким образом, имея СУТ-таблицу некоторого эксперимента, можно оценить адекватность работы СУТ блока понятийных обобщений в каждый момент времени и вычислить индекс адекватности I.а:
I.а = 1/N СУММА[i]д.ti, i = 1, 2, ..., N, (10.2)
где
д.ti =
1, если TЛ.ij = 1;
0, если TЛ.ij = 0.
Из интуитивных соображений мы не требуем непосредственного соответствия между внешней средой и процессами в "эмоциональном канале" переработки информации: далеко не всегда настроение человека соответствует тому, что он наблюдает в данный момент. Зато соответствие между эмоциональной и понятийной сферами мышления представляется нам более очевидным. По аналогии потребуем определенного соответствия между процессами, протекающими в "логическом" и "эмоциональном" каналах переработки информации М-автомата. Будем оценивать это соответствие на уровне работы СУТ.ПО и СУТ.Э. Зафиксируем таблицу соответствий ТЭ (табл.18 ). Строки этой таблицы соответствуют названиям i-моделей понятий, которые могут быть выбраны СУТ.ПО, столбцы - названиям i-моделей эмоций, выбираемых СУТ.Э. Если ТЭ.ij=1, то реакция автомата считается в данный момент адекватной, если же ТЭ.ij=0 - неадекватной. Анализируя СУТ-таблицу некоторого эксперимента, можно
оценить адекватность реакций в каждый момент и вычислить индекс адекватности I.Э:
I.Э = 1/N СУММА[i]e.ij, i = 1, 2, ..., N, (10.3)
где
e.ij =
1, если ТЭ.ij = 1;
0, если ТЭ.ij = 0.
Таблица 18
Отметим, что выражения (10.2) и (10.3) дают "слабые" оценки адекватности в том смысле, что они не учитывают возможности отсроченного возбуждения i-моделей ("вспоминания" состояний), которые зачастую представляются адекватными при содержательном описании. Очевидно, выполняются соотношения
0<=I.Л<=1, 0<=I.Э<=1. (10.4)
Рис.101. К определению коэффициента адекватности внутренних реакций М-автомата.
Рассмотрим фазовое пространство этих индексов (рис.101). Точка (1,1) в этом пространстве соответствует реакциям, оцениваемым как максимально адекватные или рациональные. Точка (0,0) представляет максимально нерациональные реакции. Введем границу L, построение которой ясно из рисунка, и будем считать рациональными все те реакции, представляющие точки которых расположены выше границы L. Ориентированное расстояние от представляющей точки В до L будем рассматривать как меру рациональности реакций, соответствующих точке В. Оценим рациональность реакций В коэффициентом б, вычисляемым как отношение меры рациональности В к максимально возможному значению этой меры. Из геометрических построений рис.101 следует, что для реакций, описываемых определенными значениями индексов I.Л и I.Э, коэффициент б вычисляется следующим образом:
б = I.Л + I.Э - 1. (10.5)
Рациональными считаются реакции, для которых 0<б<=1.
Из изложенного ясно, что параметр б не является исчерпывающим при описании адекватности внутренних реакций автомата в общем случае. Он введен на основе интуитивных рассуждений (задания таблиц ТЛ и ТЭ) и использует не всю имеющуюся информацию о работе модели. С другой стороны, он, хотя и грубо, соответствует некоторым содержательным представлениям о характере реакций и легко вычисляется. Поэтому, а также в связи с отсутствием других разработанных оценок такого рода мы будем использовать б в качестве одного из параметров, характеризующих работу автомата. При функционировании в среде автомат выполняет некоторую последовательность действий-шагов, переводящих его из исходной ячейки g.н в финальную g.ф. Последовательность таких шагов составляет траекторию движения автомата. Введем вспомогательный коэффициент г для оценки качества траектории. Будем считать траекторию тем лучше, чем она короче, т.е. чем из меньшего числа шагов она состоит. Пусть в каком-либо эксперименте автомат переместился из g.н в g.ф за K шагов. Минимально возможной длиной траектории будем считать такое количество шагов K.0, которое выполнил бы, переходя из g.н в g.ф тот же автомат при условии, что среда не содержит никаких раздражителей. В этом случае автомат двигался бы под влиянием только заданного плана и достиг цели за минимальное число шагов. Таким образом,
г = K.0/K (g.н, g.ф - const); (10.6)
чем ближе значение г к 1, тем лучше оцениваемая траектория. В качестве ячеек g.н и g.ф будем в различных случаях принимать различные ячейки конкретных сред, специально оговаривая это. Условные обозначения внешних реакций автомата приведены в табл.19. Сокращения, используемые в дальнейшем для обозначения названий i-моделей в СУТ-таблицах, приведены в табл.20.
Таблица 19
Таблица 20
Последний раз редактировалось: Gudleifr (Вс Сен 17, 2023 2:37 pm), всего редактировалось 1 раз(а)
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#3. ИССЛЕДОВАНИЕ ПРЕДОРГАНИЗАЦИИ МОДЕЛИ
Вводя связи между различными i-моделями в ходе предорганизации М-сети, мы исходили в значительной степени из содержательных рассуждений. Задавая некоторую связь R.ij, мы фиксировали этим способом "элементарное" суждение о возможной взаимосвязи понятий i и j в понятийной системе моделируемого (условного) субъекта. Функционирование заданной таким образом структуры является своего рода автоматическим выведением следствий из множества сделанных "элементарных" суждений. Задача проверки качества принятого варианта предорганизации была поставлена в #1. Осуществим эту проверку, наблюдая за реакциями опорного варианта модели в ряде специально подобранных тестовых ситуаций.
Тестовые ситуации (рис.102) выбраны таким образом, что представляют основные типы ситуаций, встречающихся в дальнейших исследованиях. Так, ситуация Т1 содержит только отрицательные раздражители: всех представителей класса "зверь" и "несъедобное дерево В". Ситуация Т2 положительна, так как содержит "съедобные" объекты и "убежище". Ситуация Т3 отрицательна, но менее, чем Т1. Промежуточное положение занимает и Т4, содржащая как "съедобные", так и "опасные" объекты.
Рис.102. Тестовые ситуации
Реакции автомата в ситуации Т4 представлены на рис.95-99 (их содержательное описание см. в #2), в остальных ситуациях - СУТ-таблицами (табл.21). Содержательные интерпретации реакций здесь и в дальнейшем не приводятся. Значения оценочных коэффициентов для всех случаев тестовых ситуаций приведены в табл.22. Видно, что наиболее отрицательная оценка e выработана автоматом для ситуации Т1, наиболее положительная - для Т2. Оценки Т3 и Т4 занимают промежуточное положение. В целом это правильно отражает характер ситуаций. Близость оценок Т1 и Т3 указывает на то, что раздражитель "дерево В" оценивается автоматом примерно так же, как и раздражитель класса "зверь". Но это касается только общей, интегральной оценки: конкретные "чувства", вызываемые этими раздражителями, различны. Значения индексов адекватности реакций б во всех случаях принадлежат допустимой области. Видно, что "логический" канал обеспечивает адекватную переработку информации (I.л=1). Степень соответствия между "логикой" и "эмоциями" изменяется в зависимости от типа ситуации. Характерно, что значения I.э максимальны для отрицательно оцениваемых ситуаций. Это, однако, справедливо лишь для уровня "внимания": в "подсознательной" сфере формируются адекватные оценки, о чем косвенно свидетельствует удовлетворительное соотношение вырабатываемых значений e. В ситуации Т4, содержащей раздражители, имеющие противоположные значения для автомата, значение e близко к нейтральному (нулю). Здесь же, в условиях "сшибки мотивов", минимальным оказывается I.э. Указанные выше особенности соответствуют интуитивным представлениям об удовлетворительном поведении; с формальной стороны реакции оцениваются как адекватные.
Таблица 21
Таблица 22
Описанные тесты проводились с автоматом, блок действия которого был заторможен. При его растормаживании автомат выполнил в тестовых ситуациях шаги, указанные на рис.102 стрелками. Шаги выполнялись в моменты t.5-t.6. План, заданный автомату, требовал его передвижения в направлении, указанном стрелкой для ДII в СУТ-таблицах. Видно, что в ситуациях Т1 и Т3 автомат выполняет шаги, соответствующие плану и обеспечивающие обход препятствий. В ситуациях Т2 и Т4 он переходит в ячейки, содержащие "абсолютно положительный" раздражитель. Увеличивая возбуждение i-модели первого этапа плана (т.е. силу цели), удается заставить автомат выполнить нужный шаг и в этих ситуациях.
Для проверки взаимодействия всех механизмов модели (плана, выбора активных действий, эффекторных алгоритмов и др.) было рассмотрено поведение автомата в условной среде. Эта среда изображена на рис.103 и состоит из регулярно расположенных тестовых ситуаций Т1-Т4. Автомат стартовал из ячейки А. Ориентиры последовательных этапов плана отмечены римскими цифрами. Видно, что все этапы плана выполнены полностью. Выполнялись также все активные действия.
Рис.103 Внешние реакции необучающегося варианта М-автомата.
Характерны реакции автомата в области 1. Автомат "съедает пищу", переходит в "убежище", где "спит". Во время "сна" возрастает "голод" и, после выполнения следующего шага, автомат опять "ест". Аналогичные ситуации существуют в области 2. Здесь автомат также "ест" и затем переходит в "убежище". В этом случае, однако, он не "спит" (так как недавно выполнял это действие и "усталость" еще не накопилась); соответственно не накапливается и "голод" и, восприняв следующую "пищу", автомат "не съедает" ее, а "несет с собой". В течение дальнейших шести шагов "пища" остается не съеденной ("голод" не накопился). Затем автомат "видит зверя", возникает "страх" и автомат "бросает пищу", продолжает путь и через некоторое время "съедает" другой объект "пища".
Из рисунка видно также, что действие "создать убежище" автомат выполняет, как правило, в тех случаях, когда в течение некоторого времени воспринимает раздражитель класса "зверь". Это действие является, таким образом, своеобразной реакцией на восприятие "плохих" ситуаций и имеет компенсирующее значение, так как восприятие "убежища" вызывает возбуждение i-моделей "положительных чувств". Видно, кроме того, что действие "спать" выполняется всегда в тех ячейках, где имеется "убежище". Обе эти реакции в явном виде автомату не задавались.
На основании описанных экспериментов можно сделать вывод, что принятый вариант предорганизации обеспечивает адекватное поведение автомата и может быть признан удовлетворительным. Отметим, что получение этого результата потребовало проведения значительной работы по настройке модели, связанной с целым рядом коррекций исходного варианта предорганизации М-сети. Необучающийся М-автомат, предорганизацию которого мы исследовали, будем в дальнейшем считать "опорным" вариантом и обозначать символом А.0.
Среда, изображенная на рис.103, характеризуется малой плотностью раздражителей. В дальнейшем для уменьшения затрат машинного времени мы будем исследовать поведение автомата в средах меньшего размера, но с большей плотностью раздражителей. Первую из таких сред - S.1 (рис.104) - получим из варианта рис.103 путем некоторого его усложнения. Буквой F обозначен ориентир первого этапа плана - цель движения. Точкой старта автомата является ячейка А.
Рис.104. Внешние реакции А.0 в среде S.1.
Рассматривалось поведение автомата А.0 в среде S.1. Внешние реакции автомата представлены на рис.104, внутренние - СУТ-таблицей (табл.23). Начиная с момента t.60 траектория автомата зацикливается. Оказывается, таким образом, что автомат А.0 в среде S.1 план выполнить не в состоянии. Этот результат используется при дальнейшем рассмотрении. Ниже приводятся и оценочные коэффициенты реакций автомата.
Таблица 23
Итак, зафиксировав предорганизацию модели, можно приступать к исследованию процессов обучения в ней.
#4. ВАРИАНТЫ ОБУЧЕНИЯ
Процессы обучения в модели реализуются путем проторения и забывания связей в М-сети, установлением новых связей и формированием новых i-моделей. Последняя возможность обеспечивается функционированием алгоритма B.sit (возбуждающего новую, ранее не связанную с другими, "резервную" i-модель всякий раз, когда автомат воспринимает новую ситуацию). Различные режимы использования B.sit позволяют реализовать существенно отличающиеся друг от друга режимы обучения.
Предположим вначале, что B.sit вообще не работает. В этом случае все изменения в сети сводятся только к установлению, проторению и затуханию связей. Автомат, следовательно, способен к обучению. Процессы обучения в таком режиме - режиме изменения весов связей - рассматривались в некоторых работах. Ряд особенностей предложенной модели (применение СУТ и пр.) не позволяет непосредственно использовать полученные в этих работах результаты и делает целесообразным специальное изучение адаптационных возможностей М-автомата с изменяющимися весами связей в различных средах. Автомат, реализующий описанный вариант обучения, будем обозначать символом A.1.
Пусть теперь B.sit функционирует так, как описано в гл.8. Каждой новой ситуации ставится в соответствие специальная i-модель. Между такими i-моделями ситуаций устанавливаются связи, фиксирующие порядок восприятия ситуаций автоматом (B.as). Алгоритм задержанного обучения B.0 обеспечивает установление адекватных связей между i-моделью каждой из ситуаций и выполненными в них действиями. Автомат, таким образом, оказывается способным "узнавать" ситуации, "вспоминать" их и выбирать в них нужные действия. Кроме того, в таком автомате протекают все те процессы, которые имеют место в варианте A.1. Автомат, реализующий описанный режим обучения (режим "памяти ситуаций"), обозначим символом A.s.
Следующий режим обучения также связан с использованием В.sit. В ходе переработки информации автоматом A.1 структура его М-сети постоянно изменяется. Устанавливающиеся и меняющиеся связи создают в различные моменты времени новые конфигурации каналов передачи возбуждения между блоками сети и внутри них. Со временем эти конфигурации распадаются и на их месте возникают другие. Каждая такая конфигурация соответствует определенному состоянию автомата и фиксирует в себе некоторую информацию о его внутренних реакциях. В варианте A.1 эта "память состояний" является неустойчивой, временной. В М-сети, однако, существует возможность долговременного запоминания собственных состояний. Эта возможность связана с возникновением новых i-моделей. Проиллюстрируем ее на условном примере.
Пусть в некоторый момент t возбуждены определенные i-модели a.1, ..., a.n и между ними установлены связи с высокой проходимостью - создана некоторая их конфигурация р (рис.105,а). Пусть в этот же момент оказалась возбужденной "резервная" i-модель r. Между нею и i-моделями a.1, ..., a.n установятся связи (рис.105,б). Потребуем, чтобы эти
связи затухали медленно (b, ~b для них велики). Через некоторое время возбуждения i-моделей могут затухнуть и конфигурация р начнет распадаться из-за затухания части связей (рис.105,в). Если в этом состоянии вновь окажется возбужденной i-модель r (от других аналогичных i-моделей состояний или от возбудившихся в ходе работы сети некоторых из i-моделей a.1, ..., a.n), то возбуждение r передастся на все i-модели a.1, ..., a.n, связи между ними проторятся и конфигурация p окажется восстановленной (рис.105,г). Таким образом, формирование i-моделей конфигураций (состояний) обеспечивает их долговременное запоминание. Можно предположить, что формирование новых конфигураций обусловлено поступлением в сеть новой информации. Последнее связано с перемещением автомата из одной ситуации в другую. Оказывается, таким образом, что в качестве i-моделей состояний могут быть использованы "резервные" i-модели блока ПС. Такое их использование обеспечивается работой алгоритма B.sit при наложении следующих ограничений: установление связей между i-моделями ситуаций и действий будем считать запрещенным, а установление связей между i-моделями ситуаций и всеми остальными i-моделями сети - разрешенным. Автомат, реализующий такой режим обучения (режим "памяти состояний"), обозначим символом А.2.
Рис. 105. Запоминание состояний в М-сети.
Исследуем эффективность различных режимов обучения, помещая автоматы A.1, A.s и А.2 в среду S.1. О качестве обучения будем судить по значениям введенных выше оценочных коэффициентов. Внешние реакции автоматов изображены на рис.106. Фрагменты внутренних реакций представлены в табл.24-26. Видно, что все автоматы выполнили план. "Трудное место", через которое не смог пройти опорный вариант А.0, автоматы преодолели с разной степенью эффективности. Серию неудачных шагов автомата A.1 в области ячейки F можно пояснить восприятием большого количества отрицательных раздражителей ("паника"). Автомат А.2 в этой области "вел" себя лучше, поскольку случайно (выполняя шаг "быстро") попал на "пищу" и "съел" ее. A.1 также "нападал" на "пищу", но действия "есть" не выполнил, так как его "внимание" (СУТ-2) было привлечено в это время к состоянию сферы эмоций.
Рис. 106. Внешние реакции М-автоматов A.1, A.s, A.2 в среде S.1.
Таблица 24
Таблица 25
Таблица 26
Конкретные различия в вариантах обучения автоматов видны из рис.107, где представлены "разрешающие матрицы" вариантов. Строки и столбцы этих матриц соответствуют блокам М-сети. Использована нумерация блоков, приведенная на рис.93. Единица на пересечении i-й строки и j-го столбца означает, что обучение и установление связей, направленных от i-моделей блока i к i-моделям блока j разрешено. Отсутствие единицы означает запрет соответствующих операций. В экспериментах использовались значения параметров обучения, определенные ранее в тестах гл.9. (Для связей блока ПС в A.2 было принято b = ~b = 0.95). Значения оценочных коэффициентов, полученные в описанных экспериментах, приведены в табл.27. Отметим, что оценка e подсчитывалась по времени, которое автоматы находились на одном или сходных участках среды. При подсчете г в качестве ячейки g.н принималась ячейка А, а g.ф - ячейка F.
Рис.107. Разрешающие матрицы обучения М-автоматов.
Таблица 27
Из таблицы следует, что выработанная опорным вариантом A.0 оценка e существенно улучшена всеми обучающимися вариантами и более всего - автоматом A.2. Обратная картина наблюдается для оценки адекватности б. Здесь она минимальна для A.2 и максимальна для A.0. Обучающиеся варианты "чувствуют себя" в среде лучше, чем A.0, но "платят" за это уменьшением адекватности реакций. Однако все значения б находятся в допустимой области. Таким образом, можно сделать предварительный вывод: если для каких-либо целей необходим автомат, обеспечивающий, высокую оценку качества функционирования, а адекватность его внутренних реакций не важна, то следует выбрать автомат типа A.2. Если же, напротив, важна только адекватность внутренних реакций, наилучшим явится вариант A.0. Этот вывод, впрочем, применим только к среде S.1. Необходимо проверить, не изменится ли характер поведения автоматов в средах других типов. Для ответа на этот вопрос были проведены эксперименты в разных средах.
Данные табл.27 показывают, что оценки автомата А.s занимают промежуточное положение по отношению к оценкам A.1 и A.2 (e и б близки к A.1, г - к А.2). Это легко объясняется тем обстоятельством, что основные преимущества "памяти ситуаций" могут проявиться, когда среда содержит часто повторяющиеся ситуации или такова, что для организации удовлетворительного поведения необходимо помнить последовательности реакций и их результатов. Среда S.1 не обладает указанными свойствами. Очевидно, автомат A.s имеет смысл использовать только в средах (например, в регулярных), где такие свойства хорошо выражены. Поэтому в дальнейшем мы не будем исследовать А.s в "невыгодных" для него условиях.
#5. ЭКСПЕРИМЕНТЫ С М-АВТОМАТАМИ В РАЗЛИЧНЫХ СРЕДАХ
Из рис.104 видно, что среда S.1 содержит значительное количество раздражителей класса "зверь". Представляет интерес рассмотреть реакции автомата в более "приятной" для него среде. Такая среда S.2, содержащая большее количество раздражителей класса "пища", представлена на рис.108. Здесь А - исходная ячейка, F.1 F.2, F.3 - ориентиры первого, второго и третьего этапов плана. Прежде всего в ячейку А был помещен автомат А.0. Его внешние реакции представлены на рис.108, внутренние - в табл.28. Затем аналогичные исследования были проведены с обучающимися вариантами A.1 и А.2 (рис.109, табл.29 и 30). Оценочные коэффициенты приведены в табл.31. При подсчете г ячейке g.н соответствует ячейка А, ячейке g.ф - F.3. Из таблицы следует, что в случае "приятной" среды все обучающиеся варианты автомата оказываются хуже необучающегося. Более, того, имеющий в среде S.1 максимальную оценку e автомат A.2 в среде S.2 имеет минимальную оценку. Адекватность же его внутренних реакций в S.2 по сравнению с S.1 существенно повысилась. Предварительный вывод: исследуемые алгоритмы обучения не являются универсальными относительно свойств среды, их эффективность существенно зависит от этих свойств. Чтобы полнее рассмотреть характер предполагаемой зависимости, продолжим исследование автоматов в другой среде - S.3.
Рис.108. Внешние реакции A.0 в среде S.2.
Рис.109. Внешние реакции М-автоматов A.1 и A.2 в среде S.2.
Таблица 28
Таблица 29
Таблица 30
Таблица 31
Среда S.3, представленная на рис.110, содержит преимущественно раздражители класса "препятствие", не являющиеся для автомата ни "опасными", ни "съедобными". Выше было показано, что эти раздражители также оцениваются автоматом как "неприятные", вызывая, однако, другие по сравнению с "опасностью" внутренние реакции. Автоматы стартовали из ячейки А, ячейки F.1, F.2, F.3 - ориентиры последовательных этапов плана. На рис.110 показаны внешние реакции автомата А.0. Видно, что автомат выполнил только первый этап плана (напомним, что этап считается выполненным, если автомат занимает любую ячейку в окрестности ориентира). Его внутренние реакции представлены в табл.32. Поведение автоматов A.1 и A.2 показано на рис.111 и в табл.33 и 34. Оценочные коэффициенты приведены в табл.35. Значение e вычислялось для всех автоматов по совпадающим или близким участкам траектории. При вычислении г отождествлялись ячейки g.н и А, & также g.ф и F.2. Из таблицы видно, что в среде S.3 обучающиеся автоматы опять имеют преимущество и максимальная оценка е выработана А.2. Обсуждение полученных результатов удобно привести ниже.
Рис. 110. Внешние реакции A.0 в среде S3.
Таблица 32
Таблица 33
Таблица 34
Таблица 35
Рис.111. Внешние реакции М-автоматов A.1 и A2 в среде S.2
Мы видели, что зависимость оценочных коэффициентов от характера среды более четко проявляется для автомата А.2. Интересно поэтому рассмотреть режим обучения с "памятью состояний" более подробно.
Вводя связи между различными i-моделями в ходе предорганизации М-сети, мы исходили в значительной степени из содержательных рассуждений. Задавая некоторую связь R.ij, мы фиксировали этим способом "элементарное" суждение о возможной взаимосвязи понятий i и j в понятийной системе моделируемого (условного) субъекта. Функционирование заданной таким образом структуры является своего рода автоматическим выведением следствий из множества сделанных "элементарных" суждений. Задача проверки качества принятого варианта предорганизации была поставлена в #1. Осуществим эту проверку, наблюдая за реакциями опорного варианта модели в ряде специально подобранных тестовых ситуаций.
Тестовые ситуации (рис.102) выбраны таким образом, что представляют основные типы ситуаций, встречающихся в дальнейших исследованиях. Так, ситуация Т1 содержит только отрицательные раздражители: всех представителей класса "зверь" и "несъедобное дерево В". Ситуация Т2 положительна, так как содержит "съедобные" объекты и "убежище". Ситуация Т3 отрицательна, но менее, чем Т1. Промежуточное положение занимает и Т4, содржащая как "съедобные", так и "опасные" объекты.
Рис.102. Тестовые ситуации
Реакции автомата в ситуации Т4 представлены на рис.95-99 (их содержательное описание см. в #2), в остальных ситуациях - СУТ-таблицами (табл.21). Содержательные интерпретации реакций здесь и в дальнейшем не приводятся. Значения оценочных коэффициентов для всех случаев тестовых ситуаций приведены в табл.22. Видно, что наиболее отрицательная оценка e выработана автоматом для ситуации Т1, наиболее положительная - для Т2. Оценки Т3 и Т4 занимают промежуточное положение. В целом это правильно отражает характер ситуаций. Близость оценок Т1 и Т3 указывает на то, что раздражитель "дерево В" оценивается автоматом примерно так же, как и раздражитель класса "зверь". Но это касается только общей, интегральной оценки: конкретные "чувства", вызываемые этими раздражителями, различны. Значения индексов адекватности реакций б во всех случаях принадлежат допустимой области. Видно, что "логический" канал обеспечивает адекватную переработку информации (I.л=1). Степень соответствия между "логикой" и "эмоциями" изменяется в зависимости от типа ситуации. Характерно, что значения I.э максимальны для отрицательно оцениваемых ситуаций. Это, однако, справедливо лишь для уровня "внимания": в "подсознательной" сфере формируются адекватные оценки, о чем косвенно свидетельствует удовлетворительное соотношение вырабатываемых значений e. В ситуации Т4, содержащей раздражители, имеющие противоположные значения для автомата, значение e близко к нейтральному (нулю). Здесь же, в условиях "сшибки мотивов", минимальным оказывается I.э. Указанные выше особенности соответствуют интуитивным представлениям об удовлетворительном поведении; с формальной стороны реакции оцениваются как адекватные.
Таблица 21
Таблица 22
Описанные тесты проводились с автоматом, блок действия которого был заторможен. При его растормаживании автомат выполнил в тестовых ситуациях шаги, указанные на рис.102 стрелками. Шаги выполнялись в моменты t.5-t.6. План, заданный автомату, требовал его передвижения в направлении, указанном стрелкой для ДII в СУТ-таблицах. Видно, что в ситуациях Т1 и Т3 автомат выполняет шаги, соответствующие плану и обеспечивающие обход препятствий. В ситуациях Т2 и Т4 он переходит в ячейки, содержащие "абсолютно положительный" раздражитель. Увеличивая возбуждение i-модели первого этапа плана (т.е. силу цели), удается заставить автомат выполнить нужный шаг и в этих ситуациях.
Для проверки взаимодействия всех механизмов модели (плана, выбора активных действий, эффекторных алгоритмов и др.) было рассмотрено поведение автомата в условной среде. Эта среда изображена на рис.103 и состоит из регулярно расположенных тестовых ситуаций Т1-Т4. Автомат стартовал из ячейки А. Ориентиры последовательных этапов плана отмечены римскими цифрами. Видно, что все этапы плана выполнены полностью. Выполнялись также все активные действия.
Рис.103 Внешние реакции необучающегося варианта М-автомата.
Характерны реакции автомата в области 1. Автомат "съедает пищу", переходит в "убежище", где "спит". Во время "сна" возрастает "голод" и, после выполнения следующего шага, автомат опять "ест". Аналогичные ситуации существуют в области 2. Здесь автомат также "ест" и затем переходит в "убежище". В этом случае, однако, он не "спит" (так как недавно выполнял это действие и "усталость" еще не накопилась); соответственно не накапливается и "голод" и, восприняв следующую "пищу", автомат "не съедает" ее, а "несет с собой". В течение дальнейших шести шагов "пища" остается не съеденной ("голод" не накопился). Затем автомат "видит зверя", возникает "страх" и автомат "бросает пищу", продолжает путь и через некоторое время "съедает" другой объект "пища".
Из рисунка видно также, что действие "создать убежище" автомат выполняет, как правило, в тех случаях, когда в течение некоторого времени воспринимает раздражитель класса "зверь". Это действие является, таким образом, своеобразной реакцией на восприятие "плохих" ситуаций и имеет компенсирующее значение, так как восприятие "убежища" вызывает возбуждение i-моделей "положительных чувств". Видно, кроме того, что действие "спать" выполняется всегда в тех ячейках, где имеется "убежище". Обе эти реакции в явном виде автомату не задавались.
На основании описанных экспериментов можно сделать вывод, что принятый вариант предорганизации обеспечивает адекватное поведение автомата и может быть признан удовлетворительным. Отметим, что получение этого результата потребовало проведения значительной работы по настройке модели, связанной с целым рядом коррекций исходного варианта предорганизации М-сети. Необучающийся М-автомат, предорганизацию которого мы исследовали, будем в дальнейшем считать "опорным" вариантом и обозначать символом А.0.
Среда, изображенная на рис.103, характеризуется малой плотностью раздражителей. В дальнейшем для уменьшения затрат машинного времени мы будем исследовать поведение автомата в средах меньшего размера, но с большей плотностью раздражителей. Первую из таких сред - S.1 (рис.104) - получим из варианта рис.103 путем некоторого его усложнения. Буквой F обозначен ориентир первого этапа плана - цель движения. Точкой старта автомата является ячейка А.
Рис.104. Внешние реакции А.0 в среде S.1.
Рассматривалось поведение автомата А.0 в среде S.1. Внешние реакции автомата представлены на рис.104, внутренние - СУТ-таблицей (табл.23). Начиная с момента t.60 траектория автомата зацикливается. Оказывается, таким образом, что автомат А.0 в среде S.1 план выполнить не в состоянии. Этот результат используется при дальнейшем рассмотрении. Ниже приводятся и оценочные коэффициенты реакций автомата.
Таблица 23
Итак, зафиксировав предорганизацию модели, можно приступать к исследованию процессов обучения в ней.
#4. ВАРИАНТЫ ОБУЧЕНИЯ
Процессы обучения в модели реализуются путем проторения и забывания связей в М-сети, установлением новых связей и формированием новых i-моделей. Последняя возможность обеспечивается функционированием алгоритма B.sit (возбуждающего новую, ранее не связанную с другими, "резервную" i-модель всякий раз, когда автомат воспринимает новую ситуацию). Различные режимы использования B.sit позволяют реализовать существенно отличающиеся друг от друга режимы обучения.
Предположим вначале, что B.sit вообще не работает. В этом случае все изменения в сети сводятся только к установлению, проторению и затуханию связей. Автомат, следовательно, способен к обучению. Процессы обучения в таком режиме - режиме изменения весов связей - рассматривались в некоторых работах. Ряд особенностей предложенной модели (применение СУТ и пр.) не позволяет непосредственно использовать полученные в этих работах результаты и делает целесообразным специальное изучение адаптационных возможностей М-автомата с изменяющимися весами связей в различных средах. Автомат, реализующий описанный вариант обучения, будем обозначать символом A.1.
Пусть теперь B.sit функционирует так, как описано в гл.8. Каждой новой ситуации ставится в соответствие специальная i-модель. Между такими i-моделями ситуаций устанавливаются связи, фиксирующие порядок восприятия ситуаций автоматом (B.as). Алгоритм задержанного обучения B.0 обеспечивает установление адекватных связей между i-моделью каждой из ситуаций и выполненными в них действиями. Автомат, таким образом, оказывается способным "узнавать" ситуации, "вспоминать" их и выбирать в них нужные действия. Кроме того, в таком автомате протекают все те процессы, которые имеют место в варианте A.1. Автомат, реализующий описанный режим обучения (режим "памяти ситуаций"), обозначим символом A.s.
Следующий режим обучения также связан с использованием В.sit. В ходе переработки информации автоматом A.1 структура его М-сети постоянно изменяется. Устанавливающиеся и меняющиеся связи создают в различные моменты времени новые конфигурации каналов передачи возбуждения между блоками сети и внутри них. Со временем эти конфигурации распадаются и на их месте возникают другие. Каждая такая конфигурация соответствует определенному состоянию автомата и фиксирует в себе некоторую информацию о его внутренних реакциях. В варианте A.1 эта "память состояний" является неустойчивой, временной. В М-сети, однако, существует возможность долговременного запоминания собственных состояний. Эта возможность связана с возникновением новых i-моделей. Проиллюстрируем ее на условном примере.
Пусть в некоторый момент t возбуждены определенные i-модели a.1, ..., a.n и между ними установлены связи с высокой проходимостью - создана некоторая их конфигурация р (рис.105,а). Пусть в этот же момент оказалась возбужденной "резервная" i-модель r. Между нею и i-моделями a.1, ..., a.n установятся связи (рис.105,б). Потребуем, чтобы эти
связи затухали медленно (b, ~b для них велики). Через некоторое время возбуждения i-моделей могут затухнуть и конфигурация р начнет распадаться из-за затухания части связей (рис.105,в). Если в этом состоянии вновь окажется возбужденной i-модель r (от других аналогичных i-моделей состояний или от возбудившихся в ходе работы сети некоторых из i-моделей a.1, ..., a.n), то возбуждение r передастся на все i-модели a.1, ..., a.n, связи между ними проторятся и конфигурация p окажется восстановленной (рис.105,г). Таким образом, формирование i-моделей конфигураций (состояний) обеспечивает их долговременное запоминание. Можно предположить, что формирование новых конфигураций обусловлено поступлением в сеть новой информации. Последнее связано с перемещением автомата из одной ситуации в другую. Оказывается, таким образом, что в качестве i-моделей состояний могут быть использованы "резервные" i-модели блока ПС. Такое их использование обеспечивается работой алгоритма B.sit при наложении следующих ограничений: установление связей между i-моделями ситуаций и действий будем считать запрещенным, а установление связей между i-моделями ситуаций и всеми остальными i-моделями сети - разрешенным. Автомат, реализующий такой режим обучения (режим "памяти состояний"), обозначим символом А.2.
Рис. 105. Запоминание состояний в М-сети.
Исследуем эффективность различных режимов обучения, помещая автоматы A.1, A.s и А.2 в среду S.1. О качестве обучения будем судить по значениям введенных выше оценочных коэффициентов. Внешние реакции автоматов изображены на рис.106. Фрагменты внутренних реакций представлены в табл.24-26. Видно, что все автоматы выполнили план. "Трудное место", через которое не смог пройти опорный вариант А.0, автоматы преодолели с разной степенью эффективности. Серию неудачных шагов автомата A.1 в области ячейки F можно пояснить восприятием большого количества отрицательных раздражителей ("паника"). Автомат А.2 в этой области "вел" себя лучше, поскольку случайно (выполняя шаг "быстро") попал на "пищу" и "съел" ее. A.1 также "нападал" на "пищу", но действия "есть" не выполнил, так как его "внимание" (СУТ-2) было привлечено в это время к состоянию сферы эмоций.
Рис. 106. Внешние реакции М-автоматов A.1, A.s, A.2 в среде S.1.
Таблица 24
Таблица 25
Таблица 26
Конкретные различия в вариантах обучения автоматов видны из рис.107, где представлены "разрешающие матрицы" вариантов. Строки и столбцы этих матриц соответствуют блокам М-сети. Использована нумерация блоков, приведенная на рис.93. Единица на пересечении i-й строки и j-го столбца означает, что обучение и установление связей, направленных от i-моделей блока i к i-моделям блока j разрешено. Отсутствие единицы означает запрет соответствующих операций. В экспериментах использовались значения параметров обучения, определенные ранее в тестах гл.9. (Для связей блока ПС в A.2 было принято b = ~b = 0.95). Значения оценочных коэффициентов, полученные в описанных экспериментах, приведены в табл.27. Отметим, что оценка e подсчитывалась по времени, которое автоматы находились на одном или сходных участках среды. При подсчете г в качестве ячейки g.н принималась ячейка А, а g.ф - ячейка F.
Рис.107. Разрешающие матрицы обучения М-автоматов.
Таблица 27
Из таблицы следует, что выработанная опорным вариантом A.0 оценка e существенно улучшена всеми обучающимися вариантами и более всего - автоматом A.2. Обратная картина наблюдается для оценки адекватности б. Здесь она минимальна для A.2 и максимальна для A.0. Обучающиеся варианты "чувствуют себя" в среде лучше, чем A.0, но "платят" за это уменьшением адекватности реакций. Однако все значения б находятся в допустимой области. Таким образом, можно сделать предварительный вывод: если для каких-либо целей необходим автомат, обеспечивающий, высокую оценку качества функционирования, а адекватность его внутренних реакций не важна, то следует выбрать автомат типа A.2. Если же, напротив, важна только адекватность внутренних реакций, наилучшим явится вариант A.0. Этот вывод, впрочем, применим только к среде S.1. Необходимо проверить, не изменится ли характер поведения автоматов в средах других типов. Для ответа на этот вопрос были проведены эксперименты в разных средах.
Данные табл.27 показывают, что оценки автомата А.s занимают промежуточное положение по отношению к оценкам A.1 и A.2 (e и б близки к A.1, г - к А.2). Это легко объясняется тем обстоятельством, что основные преимущества "памяти ситуаций" могут проявиться, когда среда содержит часто повторяющиеся ситуации или такова, что для организации удовлетворительного поведения необходимо помнить последовательности реакций и их результатов. Среда S.1 не обладает указанными свойствами. Очевидно, автомат A.s имеет смысл использовать только в средах (например, в регулярных), где такие свойства хорошо выражены. Поэтому в дальнейшем мы не будем исследовать А.s в "невыгодных" для него условиях.
#5. ЭКСПЕРИМЕНТЫ С М-АВТОМАТАМИ В РАЗЛИЧНЫХ СРЕДАХ
Из рис.104 видно, что среда S.1 содержит значительное количество раздражителей класса "зверь". Представляет интерес рассмотреть реакции автомата в более "приятной" для него среде. Такая среда S.2, содержащая большее количество раздражителей класса "пища", представлена на рис.108. Здесь А - исходная ячейка, F.1 F.2, F.3 - ориентиры первого, второго и третьего этапов плана. Прежде всего в ячейку А был помещен автомат А.0. Его внешние реакции представлены на рис.108, внутренние - в табл.28. Затем аналогичные исследования были проведены с обучающимися вариантами A.1 и А.2 (рис.109, табл.29 и 30). Оценочные коэффициенты приведены в табл.31. При подсчете г ячейке g.н соответствует ячейка А, ячейке g.ф - F.3. Из таблицы следует, что в случае "приятной" среды все обучающиеся варианты автомата оказываются хуже необучающегося. Более, того, имеющий в среде S.1 максимальную оценку e автомат A.2 в среде S.2 имеет минимальную оценку. Адекватность же его внутренних реакций в S.2 по сравнению с S.1 существенно повысилась. Предварительный вывод: исследуемые алгоритмы обучения не являются универсальными относительно свойств среды, их эффективность существенно зависит от этих свойств. Чтобы полнее рассмотреть характер предполагаемой зависимости, продолжим исследование автоматов в другой среде - S.3.
Рис.108. Внешние реакции A.0 в среде S.2.
Рис.109. Внешние реакции М-автоматов A.1 и A.2 в среде S.2.
Таблица 28
Таблица 29
Таблица 30
Таблица 31
Среда S.3, представленная на рис.110, содержит преимущественно раздражители класса "препятствие", не являющиеся для автомата ни "опасными", ни "съедобными". Выше было показано, что эти раздражители также оцениваются автоматом как "неприятные", вызывая, однако, другие по сравнению с "опасностью" внутренние реакции. Автоматы стартовали из ячейки А, ячейки F.1, F.2, F.3 - ориентиры последовательных этапов плана. На рис.110 показаны внешние реакции автомата А.0. Видно, что автомат выполнил только первый этап плана (напомним, что этап считается выполненным, если автомат занимает любую ячейку в окрестности ориентира). Его внутренние реакции представлены в табл.32. Поведение автоматов A.1 и A.2 показано на рис.111 и в табл.33 и 34. Оценочные коэффициенты приведены в табл.35. Значение e вычислялось для всех автоматов по совпадающим или близким участкам траектории. При вычислении г отождествлялись ячейки g.н и А, & также g.ф и F.2. Из таблицы видно, что в среде S.3 обучающиеся автоматы опять имеют преимущество и максимальная оценка е выработана А.2. Обсуждение полученных результатов удобно привести ниже.
Рис. 110. Внешние реакции A.0 в среде S3.
Таблица 32
Таблица 33
Таблица 34
Таблица 35
Рис.111. Внешние реакции М-автоматов A.1 и A2 в среде S.2
Мы видели, что зависимость оценочных коэффициентов от характера среды более четко проявляется для автомата А.2. Интересно поэтому рассмотреть режим обучения с "памятью состояний" более подробно.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#6. ВЛИЯНИЕ ПАМЯТИ М-АВТОМАТА НА АДЕКВАТНОСТЬ ЕГО ВНУТРЕННИХ РЕАКЦИЙ
Из данных предыдущего параграфа следует, что в поведении автомата А.2, реализующего режим обучения с "памятью состояний", наблюдается следующая закономерность: чем "хуже" среда, в которой он действует, тем относительно выше оценка качества его функционирования и тем ниже оценка адекватности его внутренних реакций. Представляет интерес попытка улучшить значения б, не ухудшая существенно e.
Очевидно, в процессе формирования оценок немаловажную роль играют особенности памяти автомата. В нашем случае память реализуется совокупностью связей М-сети. Наиболее общей характеристикой сети является количество имеющихся в ней связей и их конфигурация. Разрешающая матрица обучения (см. рис.107) для А.2 допускает установление весьма большого количества разнообразных связей. Можно предположить, что среди них существуют как связи, мало влияющие на поведение автомата, так и связи, приводящие к нежелательным процессам в сети. Поэтому может оказаться целесообразным уменьшить объем памяти автомата.
В настоящее время не существует строгих методов анализа оптимальности разрешающих матриц, и при их изменении приходится опираться на интуитивные рассуждения. Последние сводятся в нашем случае опять к представлениям о "логическом" и "эмоциональном" каналах переработки информации. Ограничим разрешающую матрицу таким образом, чтобы связи устанавливались в центральных блоках этих каналов - ПО, ПС и Э,- а также между ними. Локализуя таким образом процессы обучения, мы уменьшаем общее количество связей, устанавливающихся в сети в ходе обучения, уменьшаем влияние на характер поведения второстепенных совпадений и увеличиваем удельный вес предорганизации в формировании поведения. Все это должно привести к улучшению характеристик последнего. Измененная соответствующим образом разрешающая матрица обучения представлена на рис.112,а. Ее иллюстрирует блок-схема на рис.112,б, на которой соединительные линии указывают области, где установление разрешено. Связи предорганизации на рисунке не показаны. Автомат, реализующий эту разрешающую матрицу, обозначим символом А.3.
Рис.112. Измененная матрица обучения (а) и блок-схема автомата (б).
Адекватность поведения автомата во многом определяется "подвижностью" процессов обучения, т.е. способностью автомата быстро изменять оценки при изменении среды. В нашем случае такие способности автомата определяются соотношением активностей процессов проторения и забывания связей, которые, в свою очередь, зависят от значения коэффициентов k.2, ~k.2 и b, ~b в выражениях (8.9) и (8.10). Изменять это соотношение можно, очевидно, путем изменения одной какой-либо пары коэффициентов.
Будем исследовать характер изменения реакций автомата, варьируя значения (b и ~b. Для этого поместим автомат A.3 в тестовую ситуацию, изображенную на рис.113. В ходе эксперимента автомат перемещается из ячейки А в ячейку В. На первой половине пути автомат воспринимает только "отрицательные" раздражители, на второй - "положительные". Адекватными значениями D (D=П.Пр-П.НПр) будут, следовательно, отрицательное значение на первом участке и положительное - на втором. Поскольку автомат вначале воспринимает отрицательные раздражители, можно ожидать, что выработанное им за это время значение А (отрицательное) будет сохранять свой знак и в течение некоторого времени д после перехода в область положительных раздражителей (рис.114). Время переходного периода д является в этих условиях характеристикой памяти. Варьируя b и ~b, будем подбирать такие их значения, при которых д минимально и, следовательно, значения e максимальны.
При всех экспериментах сохраняется равенство b = ~b, значения остальных параметров обучения соответствуют основному варианту.
Рис.113. Тестовая ситуация.
Рис.114. Ожидаемые реакции М-автомата в тестовой ситуации.
Результаты эксперимента приведены на рис.115. Видно, что оптимальные значения коэффициентов принадлежат области 0.6 .. 0.7. Однако по условию (9.19) нижняя граница их значений составляет примерно 0.8. Поэтому примем для автомата A.3, реализующего режим обучения с "памятью состояний" по сокращенной разрешающей матрице, значения коэффициентов забывания связей b = ~b = 0.8.
Рис.115. Зависимость оценки качества функционирования М-автомата от подвижности обучения.
Из графика на рис.115 следует, что как слишком большая, так и слишком малая подвижность обучения не является оптимальной. На рис.116 приведены в качестве примера кривые изменения некоторых реакций автомата в ходе эксперимента. Видно, что предположения рис.114 оправдываются.
Рис. 116. Реакции М-автомата в тестовой ситуации.
Кривые V на рисунке изображают изменения времени нахождения автомата в каждой из ситуаций (в единицах дискретного времени). Таким образом, V - это время "обдумывания" автоматом шага или время "принятия решения". Видно, что V резко возрастает при изменении характера воспринимаемых ситуаций. Одновременно возрастает и П.НПр (автомат "встревожен" изменением среды, к которой успел уже "привыкнуть"). Реакции такого рода в явном виде автомату не задавались.
Исследуем реакции автомата A.3 в описанных ранее средах. Эксперименты проводились по тем же правилам, что и для автоматов А.0, A.1 и А.2.. Внешние реакции A.3 в разных средах приведены на рис.117, внутренние - в табл.36-38. В табл.39 представлены оценки реакций автомата. Ясно, что оценки адекватности удалось существенно улучшить, не ухудшив оценки e.
Рис.117. Внешние реакции A.3 в средах S.1 (а), S.2 (б), S.3 (в).
Таблица 36
Таблица 37
Таблица 38
Таблица 39
#7. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Чтобы упростить в дальнейшем использование оценочных коэффициентов, преобразуем оценку e в более удобную форму. Пусть оценка качества функционирования выражается
некоторым коэффициентом а. Потребуем, чтобы а, как и все остальные коэффициенты, изменялся в пределах 0..1 и наихудшей оценке соответствовало бы его значение 0, а наилучшей - 1. Примем в качестве вероятной оценки верхней границы е среднюю величину возбуждения (см. табл.7) i-модели Пр: П.Ср=100. Аналогично оценим и нижнюю границу. Таким образом, изменение значения е будет происходить в границах -100..+100. Отобразим этот диапазон на отрезок -1..+1. Тогда
а = 0.5(1+0.01*е). (10.7)
Значения а>0.5 соответствуют оценкам e с положительным знаком, а<0.5 - с отрицательным.
Все оценочные коэффициенты, полученные в ходе экспериментов, сведены в табл.40. На рис.118 показаны отдельно характеристики адекватности реакций. Видно, что все представляющие точки расположены внутри допустимой области. Точки, соответствующие каждому из автоматов, расположены компактными группами, внутри которых наблюдаются разбросы, обусловленные различиями сред.
Таблица 40
Рис.118. Оценки адекватности реакций М-автоматов А.1, A.s, A.2, A.3 в средах S.1, S.2, S.3.
Из табл.40 видно, что различные оценки изменяются по-разному в зависимости от характера среды. Было бы полезно представить эту зависимость в наглядной форме. Для этого необходимо ввести в рассмотрение некоторый числовой параметр s, характеризующий среду. Потребуем, чтобы s был отрицательным в случае "плохих" для автоматов сред и положительным - для "хороших", а также чтобы |s| имел тем большее числовое значение, чем полнее выражен тип среды.
Выше мы упоминали уже о двойственном характере оценки качества функционирования автомата в среде (e). В случае, если автомат с неизменяющейся структурой находится в разных средах, то вырабатываемый им коэффициент e зависит только от типа среды и может рассматриваться как ее оценка. Из всех рассмотренных нами автоматов только опорный вариант A.0 не менял своей структуры в различных экспериментах. Естественно поэтому рассматривать вырабатываемую им в разных средах оценку e (будем обозначать ее e.0) в качестве оценки этих сред. Таким образом, опорный вариант А.0 может служить своеобразным "измерителем" сред. Поскольку его реакции определяются заданной предорганизацией, то, используя вырабатываемую им оценку среды во в качестве параметра s, будем оценивать среды "с точки зрения" заданных нами основных свойств автомата.
Для того чтобы выполнить требования, предъявленные выше к значению и знаку s, отобразим диапазон изменений e.0 (-100..+100) на отрезок -1..+ 1. Тогда, с учетом (10.7),
s = e.0/100 = 2а-1. (10.8 )
На рис.119 приведено графическое изображение зависимости оценочных коэффициентов от s. Видно, что на всем исследованном диапазоне сред всегда имеется хотя бы один обучающийся автомат, функционирующий лучше опорного необучающегося варианта не менее чем по двум оценкам. Для разных сред наилучшими являются разные автоматы.
Рис.119. Изменения оценок в зависимости от характера среды.
Так, на участках 1 и 4 наибольшую оценку а дает автомат A.3, на участке 2 - A.2, на участке 3 - А.1. Наиболее близкие
значения а (0.5-0.55) автоматы вырабатывают в "нейтральных" средах (s ~ 0). Наиболее адекватные реакции (рис.119,б) вырабатывают автоматы A.0 и A.3. При этом в самых "плохих" средах "разумнее" ведет себя необучающийся вариант. Он же обеспечивает наилучшие траектории в "очень хороших" средах (участок 3 на рис.119,в). В "очень плохих" средах (участок 1) лучшими являются траектории A.1, хотя его оценки а и б здесь невелики. В средах, близких к нейтральным, быстро достигает цели A.3 (участок 3 на рис.119,в).
Итак, нами исследовано поведение четырех различных вариантов М-автомата в средах трех типов. Число вариантов можно легко увеличить за счет различных сочетаний значений параметров обучения. Поведение каждого из таких вариантов можно рассматривать в более представительном .множестве сред, конструируемых путем изменения плотности воспринимаемых автоматами раздражителей. Методика исследования во всех этих случаях ничем не будет отличаться от описанной выше. Проведенные исследования могут служить примером, иллюстрирующим способы изучения сложных самообучающихся М-автоматов. Опираясь на этот пример, рассмотрим ряд задач, решение которых оказывается возможным на основе полученных при использовании этой методики результатов.
Предварительно сделаем следующее замечание. Вообще говоря, могут существовать отличающиеся друг от друга среды, обладающие тем свойством, что оценки s, вырабатываемые для этих сред опорным вариантом, близки друг к ДРУГУ, а оценки, вырабатываемые для этих же сред любым из обучающихся вариантов, различны. Это означает, что зависимости, изображенные на рис.119, в общем случае имеют вероятностный характер. Статистические характеристики этих зависимостей могут быть получены путем исследования поведения различных вариантов модели на достаточно представительном множестве сред. Работы в этом направлении не связаны с принципиальными затруднениями, однако требуют больших затрат времени и имеют смысл в тех случаях, когда вероятностные свойства рассматриваемых зависимостей оказываются важными при решении конкретных задач. В рамках проведенного исследования нами изучались принципиальные возможности использования автоматов описанного типа. Поэтому представляется целесообразным провести дальнейшее изложение исходя из допущения о том, что среднеквадратичные отклонения рассматриваемых зависимостей достаточно малы по сравнению с расстояниями между кривыми, описывающими свойства различных вариантов обучающихся автоматов. Отказ от этого допущения не изменяет общей структуры излагаемых ниже рассуждений, а лишь требует использования при их проведении специального формального аппарата.
Пусть A.0, A.1, ..., A.n - множество различных автоматов, реакции каждого из которых исследованы во множестве сред S.1, S.2, ..., S.m, принадлежащих некоторому диапазону сред. Автомат A.0 соответствует опорному варианту. Пусть результаты исследования представлены в виде кривых, аналогичных кривым на рис.119. Иначе говоря, определены функции
a.i = a.i(s),
б.i = б.i(s), (10.9)
г.i = г.i(s), i = 0, 1, ..., n,
где индекс i указывает на то, что функция описывает реакции автомата A.i.
В зависимости от цели моделирования различным оценкам может приписываться разный вес. Так, можно потребовать от автомата как можно большей адекватности реакций, не придавая особого значения оценке качества функционирования и совсем пренебрегая видом траектории. Требования такого рода могут быть учтены заданием функции цели, ставящей в соответствие любому сочетанию значений а, б, г некоторое значение обобщенного критерия u. В общем виде, следовательно,
u = u(а, б, г). (10.10)
Ясно, что по заданным функциям (10.9) и конкретному виду целевой функции для любого автомата A.i (i=0,1,...,n) может быть построена зависимость обобщенного критерия качества u от оценки среды, т.е.
u.i = f.i(s), i=0,1,...,n. (10.11)
В качестве примера рассмотрим функцию цели, заданную в виде
u = A*а + B*б + C*г, (10.12)
где А, В, С - весовые коэффициенты оценок. Пусть А = В = С = 1. В этом случае для исследованных выше автоматов зависимости (10.11) принимают вид, графически изображенный на рис.119,г. Используем функции (10.11) для решения следующих задач оптимизации.
ЗАДАЧА ВЫБОРА ОПТИМАЛЬНОГО ВАРИАНТА ОБУЧЕНИЯ ДЛЯ ФИКСИРОВАННОЙ СРЕДЫ. Пусть имеется некоторая среда S.с; исследуя поведение в ней автомата A.0, получим его оценку S.с и, следовательно, числовые значения u.1, u,2, ..., u.n (поскольку функции (10.11) считаются заданными). Оптимальным вариантом А* явится такой автомат, для которого значение обобщенного критерия
u* = max|u.i|. (10.13)
Так, на рис.119,г для среды S.A имеет место А* = А.1, для среды S.B A* = A.3.
ЗАДАЧА ВЫБОРА ОПТИМАЛЬНОГО "В СРЕДНЕМ" ВАРИАНТА. Пусть автомат функционирует в средах S.1, S.2, ..., S.j, ..., для которых оценка S изменяется в диапазоне (k..l). Вычислим для каждой из функций (10.11) значение u.i:
а) в случае, если функции (10.11) выражены аналитически в виде непрерывных функций,
u.i = 1/(l-k) ИНТЕГРАЛ[k..l]f.i(S)ds, i=0,1,...,n; (10.14)
б) в случае, если функции (10.11) заданы дискретно,
u.i = 1/m СУММА[j=1..m]f.i(S.j), i=0,1,...,n, (10.15)
где j соответствует индексу среды.
Оптимальным вариантом будет автомат, для которого u*=max|u.i|. Для случая, изображенного на рис.119,г, A*=A.3.
ЗАДАЧА ЛОКАЛЬНОЙ ОПТИМИЗАЦИИ ОБУЧЕНИЯ. Рассмотрим общий случай неоднородной среды, оценка различных областей которой меняется в определенном диапазоне. Ясно, что выбранный предыдущим способом оптимальный "в среднем" вариант в некоторых из областей такой среды не будет являться наилучшим.
Автоматы A.1, A.2, ..., A.n отличаются друг от друга различными значениями параметров обучения или, в общем случае, различными совокупностями исходных данных для программы, реализующей М-автомат. Пусть автоматам A.1, A.2, ..., A.n соответствуют совокупности исходных данных a.1, a.2, ..., a.n. Для каждого из участков среды, внутри которого оценка примерно постоянна, предпочтительной оказывается группа исходных данных a.i*, такая, что при ее использовании на данном участке A.i=A*.
Рис.120. Движение в неоднородной среде.
Допустим, некоторый автомат передвигается в неоднородной среде так, как показано на рис.120,а, где отграничены области с разной оценкой s. Пусть за время Т автомат пересек r областей. В каждой из них обобщенный критерий u принимает конкретное значение. Эффективность работы автомата за время Т охарактеризуем значением q:
q = 1/r СУММА[p=1..r]u.p. (10.16)
Максимальное значение q будет получено в том случае, если в каждой из областей критерий u будет принимать максимально возможное значение, для чего необходимо использовать в каждой из них совокупность исходных данных a.i*. Локальная оптимизация обучения может быть построена, таким образом, как процедура максимизации q, осуществляемая путем переключения режимов обучения автомата при перемещении его в различные области среды.
Рассмотрим алгоритм оптимизации Q, который выполняет следующие операции. В начальный момент времени осуществляется случайный выбор совокупности исходных данных a.i из множества a.1, a.2, ..., a.n и автомат A.i - помещается в среду, где функционирует в течение некоторого времени Z |Z<T|, называемого временем зондирования. По истечении времени Z осуществляется (в соответствии с функцией цели) расчет значения критерия u. Пусть u=u'.
Примем, что функции {s.i=ф.i(u)} (i=1,2,...,n) являются обратными относительно функций (10.11) и алгоритм Q может обращаться как к тем, так и к другим.
По значению u' с учетом функций, обратных функциям (10.11), вычисляется оценка s среды, в которой функционирует A.i. Допустим, s=s'. Используя s' и (10.11), получаем решение задачи выбора оптимального варианта обучения для фиксированной среды. При этом применяется критерий max|u.i| в соответствии с зависимостями (10.12). Пусть оказалось, что A*=A.j. Автомат A.j продолжает функционировать в течение времени Z, после чего повторяется расчет u, нахождение s' и т.д. Структура алгоритма Q приведена на рис.121.
Рис.121. Структура алгоритма локальной оптимизации.
В случае, если в неоднородной среде области с различными оценками s выражены нечетко, при выборе А* по s' и (10.11) может оказаться целесообразным критерий (10.13).
Обратимся к рис.120. В ходе движения автомат пересекает различные области среды. Время его нахождения в каждой из них t.н определяется размерами области и видом траектории движения. В общем случае, т.е. для множества возможных траекторий в данной фиксированной среде, t.н можно рассматривать как случайную величину, имеющую некоторое распределение. Вид этого распределения зависит от топологических характеристик среды. Будем рассматривать в качестве характеристики данной среды значения математического ожидания M(t.н). На рис. 120,б показан случай "перекрытия" этих периодов. Время зондирования Z.1 частично совпадает со временем нахождения автомата в области 1 и частично - в области 2. Выработанные при этом величины u' и соответственно s' не будут отражать правильно свойств области 2. Поэтому во все время Z.2 в области 2 будет функционировать неоптимальный вариант обучения и положение будет исправлено только в момент t.0. Ясно, что вероятность погрешностей такого рода будет уменьшена при выполнении условия
M(t.н) = n*Z, n = 1, 2, ... (10.17)
В целом оказывается, что значение q' параметра (10.16), которое может обеспечить алгоритм Q в данной среде, зависит от соотношения между значениями M(t.н) и Z. Поскольку, однако, M(t.н) есть характеристика данной среды, практически оказывается, что
q' = F(Z). (10.18 )
Выражение (10.18 ) указывает, что работа алгоритма локальной оптимизации может быть оптимизирована подбором времени зондирования. Эта оптимизация, связанная с поиском в одномерном пространстве, выполняется с помощью известных методов.
Основным результатом работ, изложенных в настоящей главе, является следующее. Показано, что описанная ранее и реализованная в виде М-автомата модель двигательного поведения действительно оказалась способной решать соответствующие задачи. При этом содержательные интерпретации реакций модели, а также их количественные оценки позволяют сделать заключение об адекватности модели имеющимся качественным описаниям характерных реакций человека при решении аналогичных задач. Выводы другого рода связаны с оценкой языка М-сетей как инструмента моделирования. Продемонстрированы возможности представления в этом языке различного рода качественных и плохо формализованных данных (рефлексов, чувств и т.п.). Показана гибкость языка, т.е. возможность изменять поведение модели путем частных изменений ее структуры (параметров обучения, предорганизации исходных данных и т.п.), без изменения модели в целом. Модель естественно формализуется средствами существующих алгоритмических языков. Показано, кроме того, что исследованные в работе алгоритмы обучения эффективно улучшают поведение модели по сравнению с необучающимся вариантом. Предложены экспериментальные процедуры оптимизации обучения при изменении характера решаемых моделью задач.
Из данных предыдущего параграфа следует, что в поведении автомата А.2, реализующего режим обучения с "памятью состояний", наблюдается следующая закономерность: чем "хуже" среда, в которой он действует, тем относительно выше оценка качества его функционирования и тем ниже оценка адекватности его внутренних реакций. Представляет интерес попытка улучшить значения б, не ухудшая существенно e.
Очевидно, в процессе формирования оценок немаловажную роль играют особенности памяти автомата. В нашем случае память реализуется совокупностью связей М-сети. Наиболее общей характеристикой сети является количество имеющихся в ней связей и их конфигурация. Разрешающая матрица обучения (см. рис.107) для А.2 допускает установление весьма большого количества разнообразных связей. Можно предположить, что среди них существуют как связи, мало влияющие на поведение автомата, так и связи, приводящие к нежелательным процессам в сети. Поэтому может оказаться целесообразным уменьшить объем памяти автомата.
В настоящее время не существует строгих методов анализа оптимальности разрешающих матриц, и при их изменении приходится опираться на интуитивные рассуждения. Последние сводятся в нашем случае опять к представлениям о "логическом" и "эмоциональном" каналах переработки информации. Ограничим разрешающую матрицу таким образом, чтобы связи устанавливались в центральных блоках этих каналов - ПО, ПС и Э,- а также между ними. Локализуя таким образом процессы обучения, мы уменьшаем общее количество связей, устанавливающихся в сети в ходе обучения, уменьшаем влияние на характер поведения второстепенных совпадений и увеличиваем удельный вес предорганизации в формировании поведения. Все это должно привести к улучшению характеристик последнего. Измененная соответствующим образом разрешающая матрица обучения представлена на рис.112,а. Ее иллюстрирует блок-схема на рис.112,б, на которой соединительные линии указывают области, где установление разрешено. Связи предорганизации на рисунке не показаны. Автомат, реализующий эту разрешающую матрицу, обозначим символом А.3.
Рис.112. Измененная матрица обучения (а) и блок-схема автомата (б).
Адекватность поведения автомата во многом определяется "подвижностью" процессов обучения, т.е. способностью автомата быстро изменять оценки при изменении среды. В нашем случае такие способности автомата определяются соотношением активностей процессов проторения и забывания связей, которые, в свою очередь, зависят от значения коэффициентов k.2, ~k.2 и b, ~b в выражениях (8.9) и (8.10). Изменять это соотношение можно, очевидно, путем изменения одной какой-либо пары коэффициентов.
Будем исследовать характер изменения реакций автомата, варьируя значения (b и ~b. Для этого поместим автомат A.3 в тестовую ситуацию, изображенную на рис.113. В ходе эксперимента автомат перемещается из ячейки А в ячейку В. На первой половине пути автомат воспринимает только "отрицательные" раздражители, на второй - "положительные". Адекватными значениями D (D=П.Пр-П.НПр) будут, следовательно, отрицательное значение на первом участке и положительное - на втором. Поскольку автомат вначале воспринимает отрицательные раздражители, можно ожидать, что выработанное им за это время значение А (отрицательное) будет сохранять свой знак и в течение некоторого времени д после перехода в область положительных раздражителей (рис.114). Время переходного периода д является в этих условиях характеристикой памяти. Варьируя b и ~b, будем подбирать такие их значения, при которых д минимально и, следовательно, значения e максимальны.
При всех экспериментах сохраняется равенство b = ~b, значения остальных параметров обучения соответствуют основному варианту.
Рис.113. Тестовая ситуация.
Рис.114. Ожидаемые реакции М-автомата в тестовой ситуации.
Результаты эксперимента приведены на рис.115. Видно, что оптимальные значения коэффициентов принадлежат области 0.6 .. 0.7. Однако по условию (9.19) нижняя граница их значений составляет примерно 0.8. Поэтому примем для автомата A.3, реализующего режим обучения с "памятью состояний" по сокращенной разрешающей матрице, значения коэффициентов забывания связей b = ~b = 0.8.
Рис.115. Зависимость оценки качества функционирования М-автомата от подвижности обучения.
Из графика на рис.115 следует, что как слишком большая, так и слишком малая подвижность обучения не является оптимальной. На рис.116 приведены в качестве примера кривые изменения некоторых реакций автомата в ходе эксперимента. Видно, что предположения рис.114 оправдываются.
Рис. 116. Реакции М-автомата в тестовой ситуации.
Кривые V на рисунке изображают изменения времени нахождения автомата в каждой из ситуаций (в единицах дискретного времени). Таким образом, V - это время "обдумывания" автоматом шага или время "принятия решения". Видно, что V резко возрастает при изменении характера воспринимаемых ситуаций. Одновременно возрастает и П.НПр (автомат "встревожен" изменением среды, к которой успел уже "привыкнуть"). Реакции такого рода в явном виде автомату не задавались.
Исследуем реакции автомата A.3 в описанных ранее средах. Эксперименты проводились по тем же правилам, что и для автоматов А.0, A.1 и А.2.. Внешние реакции A.3 в разных средах приведены на рис.117, внутренние - в табл.36-38. В табл.39 представлены оценки реакций автомата. Ясно, что оценки адекватности удалось существенно улучшить, не ухудшив оценки e.
Рис.117. Внешние реакции A.3 в средах S.1 (а), S.2 (б), S.3 (в).
Таблица 36
Таблица 37
Таблица 38
Таблица 39
#7. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Чтобы упростить в дальнейшем использование оценочных коэффициентов, преобразуем оценку e в более удобную форму. Пусть оценка качества функционирования выражается
некоторым коэффициентом а. Потребуем, чтобы а, как и все остальные коэффициенты, изменялся в пределах 0..1 и наихудшей оценке соответствовало бы его значение 0, а наилучшей - 1. Примем в качестве вероятной оценки верхней границы е среднюю величину возбуждения (см. табл.7) i-модели Пр: П.Ср=100. Аналогично оценим и нижнюю границу. Таким образом, изменение значения е будет происходить в границах -100..+100. Отобразим этот диапазон на отрезок -1..+1. Тогда
а = 0.5(1+0.01*е). (10.7)
Значения а>0.5 соответствуют оценкам e с положительным знаком, а<0.5 - с отрицательным.
Все оценочные коэффициенты, полученные в ходе экспериментов, сведены в табл.40. На рис.118 показаны отдельно характеристики адекватности реакций. Видно, что все представляющие точки расположены внутри допустимой области. Точки, соответствующие каждому из автоматов, расположены компактными группами, внутри которых наблюдаются разбросы, обусловленные различиями сред.
Таблица 40
Рис.118. Оценки адекватности реакций М-автоматов А.1, A.s, A.2, A.3 в средах S.1, S.2, S.3.
Из табл.40 видно, что различные оценки изменяются по-разному в зависимости от характера среды. Было бы полезно представить эту зависимость в наглядной форме. Для этого необходимо ввести в рассмотрение некоторый числовой параметр s, характеризующий среду. Потребуем, чтобы s был отрицательным в случае "плохих" для автоматов сред и положительным - для "хороших", а также чтобы |s| имел тем большее числовое значение, чем полнее выражен тип среды.
Выше мы упоминали уже о двойственном характере оценки качества функционирования автомата в среде (e). В случае, если автомат с неизменяющейся структурой находится в разных средах, то вырабатываемый им коэффициент e зависит только от типа среды и может рассматриваться как ее оценка. Из всех рассмотренных нами автоматов только опорный вариант A.0 не менял своей структуры в различных экспериментах. Естественно поэтому рассматривать вырабатываемую им в разных средах оценку e (будем обозначать ее e.0) в качестве оценки этих сред. Таким образом, опорный вариант А.0 может служить своеобразным "измерителем" сред. Поскольку его реакции определяются заданной предорганизацией, то, используя вырабатываемую им оценку среды во в качестве параметра s, будем оценивать среды "с точки зрения" заданных нами основных свойств автомата.
Для того чтобы выполнить требования, предъявленные выше к значению и знаку s, отобразим диапазон изменений e.0 (-100..+100) на отрезок -1..+ 1. Тогда, с учетом (10.7),
s = e.0/100 = 2а-1. (10.8 )
На рис.119 приведено графическое изображение зависимости оценочных коэффициентов от s. Видно, что на всем исследованном диапазоне сред всегда имеется хотя бы один обучающийся автомат, функционирующий лучше опорного необучающегося варианта не менее чем по двум оценкам. Для разных сред наилучшими являются разные автоматы.
Рис.119. Изменения оценок в зависимости от характера среды.
Так, на участках 1 и 4 наибольшую оценку а дает автомат A.3, на участке 2 - A.2, на участке 3 - А.1. Наиболее близкие
значения а (0.5-0.55) автоматы вырабатывают в "нейтральных" средах (s ~ 0). Наиболее адекватные реакции (рис.119,б) вырабатывают автоматы A.0 и A.3. При этом в самых "плохих" средах "разумнее" ведет себя необучающийся вариант. Он же обеспечивает наилучшие траектории в "очень хороших" средах (участок 3 на рис.119,в). В "очень плохих" средах (участок 1) лучшими являются траектории A.1, хотя его оценки а и б здесь невелики. В средах, близких к нейтральным, быстро достигает цели A.3 (участок 3 на рис.119,в).
Итак, нами исследовано поведение четырех различных вариантов М-автомата в средах трех типов. Число вариантов можно легко увеличить за счет различных сочетаний значений параметров обучения. Поведение каждого из таких вариантов можно рассматривать в более представительном .множестве сред, конструируемых путем изменения плотности воспринимаемых автоматами раздражителей. Методика исследования во всех этих случаях ничем не будет отличаться от описанной выше. Проведенные исследования могут служить примером, иллюстрирующим способы изучения сложных самообучающихся М-автоматов. Опираясь на этот пример, рассмотрим ряд задач, решение которых оказывается возможным на основе полученных при использовании этой методики результатов.
Предварительно сделаем следующее замечание. Вообще говоря, могут существовать отличающиеся друг от друга среды, обладающие тем свойством, что оценки s, вырабатываемые для этих сред опорным вариантом, близки друг к ДРУГУ, а оценки, вырабатываемые для этих же сред любым из обучающихся вариантов, различны. Это означает, что зависимости, изображенные на рис.119, в общем случае имеют вероятностный характер. Статистические характеристики этих зависимостей могут быть получены путем исследования поведения различных вариантов модели на достаточно представительном множестве сред. Работы в этом направлении не связаны с принципиальными затруднениями, однако требуют больших затрат времени и имеют смысл в тех случаях, когда вероятностные свойства рассматриваемых зависимостей оказываются важными при решении конкретных задач. В рамках проведенного исследования нами изучались принципиальные возможности использования автоматов описанного типа. Поэтому представляется целесообразным провести дальнейшее изложение исходя из допущения о том, что среднеквадратичные отклонения рассматриваемых зависимостей достаточно малы по сравнению с расстояниями между кривыми, описывающими свойства различных вариантов обучающихся автоматов. Отказ от этого допущения не изменяет общей структуры излагаемых ниже рассуждений, а лишь требует использования при их проведении специального формального аппарата.
Пусть A.0, A.1, ..., A.n - множество различных автоматов, реакции каждого из которых исследованы во множестве сред S.1, S.2, ..., S.m, принадлежащих некоторому диапазону сред. Автомат A.0 соответствует опорному варианту. Пусть результаты исследования представлены в виде кривых, аналогичных кривым на рис.119. Иначе говоря, определены функции
a.i = a.i(s),
б.i = б.i(s), (10.9)
г.i = г.i(s), i = 0, 1, ..., n,
где индекс i указывает на то, что функция описывает реакции автомата A.i.
В зависимости от цели моделирования различным оценкам может приписываться разный вес. Так, можно потребовать от автомата как можно большей адекватности реакций, не придавая особого значения оценке качества функционирования и совсем пренебрегая видом траектории. Требования такого рода могут быть учтены заданием функции цели, ставящей в соответствие любому сочетанию значений а, б, г некоторое значение обобщенного критерия u. В общем виде, следовательно,
u = u(а, б, г). (10.10)
Ясно, что по заданным функциям (10.9) и конкретному виду целевой функции для любого автомата A.i (i=0,1,...,n) может быть построена зависимость обобщенного критерия качества u от оценки среды, т.е.
u.i = f.i(s), i=0,1,...,n. (10.11)
В качестве примера рассмотрим функцию цели, заданную в виде
u = A*а + B*б + C*г, (10.12)
где А, В, С - весовые коэффициенты оценок. Пусть А = В = С = 1. В этом случае для исследованных выше автоматов зависимости (10.11) принимают вид, графически изображенный на рис.119,г. Используем функции (10.11) для решения следующих задач оптимизации.
ЗАДАЧА ВЫБОРА ОПТИМАЛЬНОГО ВАРИАНТА ОБУЧЕНИЯ ДЛЯ ФИКСИРОВАННОЙ СРЕДЫ. Пусть имеется некоторая среда S.с; исследуя поведение в ней автомата A.0, получим его оценку S.с и, следовательно, числовые значения u.1, u,2, ..., u.n (поскольку функции (10.11) считаются заданными). Оптимальным вариантом А* явится такой автомат, для которого значение обобщенного критерия
u* = max|u.i|. (10.13)
Так, на рис.119,г для среды S.A имеет место А* = А.1, для среды S.B A* = A.3.
ЗАДАЧА ВЫБОРА ОПТИМАЛЬНОГО "В СРЕДНЕМ" ВАРИАНТА. Пусть автомат функционирует в средах S.1, S.2, ..., S.j, ..., для которых оценка S изменяется в диапазоне (k..l). Вычислим для каждой из функций (10.11) значение u.i:
а) в случае, если функции (10.11) выражены аналитически в виде непрерывных функций,
u.i = 1/(l-k) ИНТЕГРАЛ[k..l]f.i(S)ds, i=0,1,...,n; (10.14)
б) в случае, если функции (10.11) заданы дискретно,
u.i = 1/m СУММА[j=1..m]f.i(S.j), i=0,1,...,n, (10.15)
где j соответствует индексу среды.
Оптимальным вариантом будет автомат, для которого u*=max|u.i|. Для случая, изображенного на рис.119,г, A*=A.3.
ЗАДАЧА ЛОКАЛЬНОЙ ОПТИМИЗАЦИИ ОБУЧЕНИЯ. Рассмотрим общий случай неоднородной среды, оценка различных областей которой меняется в определенном диапазоне. Ясно, что выбранный предыдущим способом оптимальный "в среднем" вариант в некоторых из областей такой среды не будет являться наилучшим.
Автоматы A.1, A.2, ..., A.n отличаются друг от друга различными значениями параметров обучения или, в общем случае, различными совокупностями исходных данных для программы, реализующей М-автомат. Пусть автоматам A.1, A.2, ..., A.n соответствуют совокупности исходных данных a.1, a.2, ..., a.n. Для каждого из участков среды, внутри которого оценка примерно постоянна, предпочтительной оказывается группа исходных данных a.i*, такая, что при ее использовании на данном участке A.i=A*.
Рис.120. Движение в неоднородной среде.
Допустим, некоторый автомат передвигается в неоднородной среде так, как показано на рис.120,а, где отграничены области с разной оценкой s. Пусть за время Т автомат пересек r областей. В каждой из них обобщенный критерий u принимает конкретное значение. Эффективность работы автомата за время Т охарактеризуем значением q:
q = 1/r СУММА[p=1..r]u.p. (10.16)
Максимальное значение q будет получено в том случае, если в каждой из областей критерий u будет принимать максимально возможное значение, для чего необходимо использовать в каждой из них совокупность исходных данных a.i*. Локальная оптимизация обучения может быть построена, таким образом, как процедура максимизации q, осуществляемая путем переключения режимов обучения автомата при перемещении его в различные области среды.
Рассмотрим алгоритм оптимизации Q, который выполняет следующие операции. В начальный момент времени осуществляется случайный выбор совокупности исходных данных a.i из множества a.1, a.2, ..., a.n и автомат A.i - помещается в среду, где функционирует в течение некоторого времени Z |Z<T|, называемого временем зондирования. По истечении времени Z осуществляется (в соответствии с функцией цели) расчет значения критерия u. Пусть u=u'.
Примем, что функции {s.i=ф.i(u)} (i=1,2,...,n) являются обратными относительно функций (10.11) и алгоритм Q может обращаться как к тем, так и к другим.
По значению u' с учетом функций, обратных функциям (10.11), вычисляется оценка s среды, в которой функционирует A.i. Допустим, s=s'. Используя s' и (10.11), получаем решение задачи выбора оптимального варианта обучения для фиксированной среды. При этом применяется критерий max|u.i| в соответствии с зависимостями (10.12). Пусть оказалось, что A*=A.j. Автомат A.j продолжает функционировать в течение времени Z, после чего повторяется расчет u, нахождение s' и т.д. Структура алгоритма Q приведена на рис.121.
Рис.121. Структура алгоритма локальной оптимизации.
В случае, если в неоднородной среде области с различными оценками s выражены нечетко, при выборе А* по s' и (10.11) может оказаться целесообразным критерий (10.13).
Обратимся к рис.120. В ходе движения автомат пересекает различные области среды. Время его нахождения в каждой из них t.н определяется размерами области и видом траектории движения. В общем случае, т.е. для множества возможных траекторий в данной фиксированной среде, t.н можно рассматривать как случайную величину, имеющую некоторое распределение. Вид этого распределения зависит от топологических характеристик среды. Будем рассматривать в качестве характеристики данной среды значения математического ожидания M(t.н). На рис. 120,б показан случай "перекрытия" этих периодов. Время зондирования Z.1 частично совпадает со временем нахождения автомата в области 1 и частично - в области 2. Выработанные при этом величины u' и соответственно s' не будут отражать правильно свойств области 2. Поэтому во все время Z.2 в области 2 будет функционировать неоптимальный вариант обучения и положение будет исправлено только в момент t.0. Ясно, что вероятность погрешностей такого рода будет уменьшена при выполнении условия
M(t.н) = n*Z, n = 1, 2, ... (10.17)
В целом оказывается, что значение q' параметра (10.16), которое может обеспечить алгоритм Q в данной среде, зависит от соотношения между значениями M(t.н) и Z. Поскольку, однако, M(t.н) есть характеристика данной среды, практически оказывается, что
q' = F(Z). (10.18 )
Выражение (10.18 ) указывает, что работа алгоритма локальной оптимизации может быть оптимизирована подбором времени зондирования. Эта оптимизация, связанная с поиском в одномерном пространстве, выполняется с помощью известных методов.
Основным результатом работ, изложенных в настоящей главе, является следующее. Показано, что описанная ранее и реализованная в виде М-автомата модель двигательного поведения действительно оказалась способной решать соответствующие задачи. При этом содержательные интерпретации реакций модели, а также их количественные оценки позволяют сделать заключение об адекватности модели имеющимся качественным описаниям характерных реакций человека при решении аналогичных задач. Выводы другого рода связаны с оценкой языка М-сетей как инструмента моделирования. Продемонстрированы возможности представления в этом языке различного рода качественных и плохо формализованных данных (рефлексов, чувств и т.п.). Показана гибкость языка, т.е. возможность изменять поведение модели путем частных изменений ее структуры (параметров обучения, предорганизации исходных данных и т.п.), без изменения модели в целом. Модель естественно формализуется средствами существующих алгоритмических языков. Показано, кроме того, что исследованные в работе алгоритмы обучения эффективно улучшают поведение модели по сравнению с необучающимся вариантом. Предложены экспериментальные процедуры оптимизации обучения при изменении характера решаемых моделью задач.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ЗАКЛЮЧЕНИЕ
При обсуждении различных вопросов, связанных с построением систем ИР, неоднократно упоминалось о том, что в целом проблема имеет прикладной характер. Направленность на практическое использование получаемых результатов характерна не только для конечной цели систем ИР, способных к решению сложных интеллектуальных задач, но и для промежуточных этапов исследования.
Одним из таких промежуточных этапов можно считать разработку М-автоматов РЭМ и МОД, в которых реализован ряд важных положений исходной гипотезы. Полученные результаты при решении практических задач могут использоваться в двух различных направлениях.
Первое из них связано с применением аппарата и приемов моделирования, развитых при построении модели двигательного поведения. К настоящему времени в этом направлении сделан ряд конкретных разработок, показавших перспективность предложенного метода моделирования.
Второе направление связано с непосредственным использованием разработанных автоматов при решении задач управления. РЭМ и МОД являются относительно простыми М-автоматами "первого поколения", рассчитанными на решение задач ограниченного класса. Поэтому и характер их практического использования определяется теми возможностями, которые предоставляет выбранный при разработке этих автоматов сюжет моделирования. Иначе говоря, применение разработанных автоматов необходимо связано с задачами двигательного поведения. Проиллюстрируем одну из возможностей такого рода.
В настоящее время все большую актуальность приобретают задачи автоматизации управления передвижением различных технических устройств в естественной среде. Речь идет об управлении такими объектами, как космические устройства, устройства для сбора информации, различные транспортные и обслуживающие средства и т.п. В ряде случаев участие в управлении человека-оператора нежелательно или невозможно и возникает проблема автоматизации его функций.
Рассмотренная выше задача моделирования двигательного поведения естественно интерпретируется в задачу управления движением. Для определенности будем иметь в виду задачу управления специализированными устройствами - "информационными роботами".
Прежде всего, каждое устройство такого рода должно обладать системой датчиков, отражающих состояние окружающей среды. Информация о среде фиксируется значениями некоторых физических параметров на выходе датчиков (напряжением, частотой и т.п.). Сопоставим значения таких параметров различным уровням возбужденности i-моделей, соответствующих измеряемым характеристикам среды (это оказывается возможным в подавляющем большинстве случаев). Таким образом, ситуация внешней среды, воспринимаемая устройством в каждый момент времени, может быть отображена совокупностью возбуждений "рецепторных" i-моделей управляющего М-автомата.
Далее, управляемое устройство должно быть способно выполнить в среде некоторые активные действия и, следовательно, должно иметь ряд эффекторных приспособлений. Выполнение устройством элементарного действия (движения по прямой, поворота, взятия пробы и т.д.) обеспечивается включением определенного эффектора или последовательностью таких включений, осуществляемых по жесткой программе. Каждой из этих операций может быть поставлена в соответствие i-модель из сферы "действий" М-автомата. Выбор одной из этих i-моделей системой усиления - торможения может интерпретироваться как принятие решения системой и перекодироваться в команду включения соответствующего эффектора.
Связи, которые можно заранее установить между "рецепторными" i-моделями и i-моделями "действий", составят систему "безусловных рефлексов" устройства. Задавая начальную структуру управляющего М-автомата, можно предопределить исходную логику его поведения в среде. В дальнейшем эта логика может изменяться в зависимости от "опыта" автомата.
Сфера "эмоций" М-автомата позволяет задать мотивацию поведения путем введения таких i-моделей, как "страх" перед опасными объектами, "любопытство", "осторожность", "голод" - показатель степени обеспеченности энергетическими ресурсами, "усталость" - показатель степени исправности или надежности функциональных систем и т.п.
Управляющий М-автомат может организовать целенаправленное поведение, если есть возможность заранее задать цель передвижений управляемого устройства или поисковое поведение на основе некоторых указаний общего характера, например: исследовать как можно больший район, пренебрегая деталями; детально исследовать заданный район; собрать информацию об объектах с заданными характеристиками; проводить исследования, считая, что выполнение задания важнее сохранения целостности, и т.п. Существует возможность повышения эффективности работы М-автомата путем введения в него имеющейся информации о характере исследуемой среды в виде, например, огрубленной карты. Если такой информации нет, то могут быть использованы программы "восприятия", ориентированные на совместную работу с М-сетью.
Проведенные работы составляют необходимый и достаточно важный этап исследования исходной гипотезы о составе и структуре программ переработки информации человеком. В разработанных М-автоматах нашла отражение только часть основных программ, реализация которых в полном объеме должна (согласно гипотезе) привести к построению системы, способной к разумному поведению при решении разнообразных задач. Рассмотрим кратко, какие именно возможности получит М-автомат в рамках разрабатываемого сюжета при введении новых, более сложных программ и каким образом введение этих программ может быть осуществлено.
Конечным результатом работ в интересующей нас области ИР должно явиться построение автомата в виде реального физического устройства, способного к сложному целесообразному поведению в естественной среде. Взаимодействие с естественной средой невозможно без реализации программы восприятия и первичной обработки внешней информации. Сюда входит настройка рецепторов на восприятие определенной информации, распознавание образов, временное хранение и предварительная обработка полученной информации. Весь этот процесс должен оканчиваться возбуждением определенных i-моделей в сфере восприятия М-сети автомата. Очевидно, что состояние М-сети в целом будет оказывать существенное влияние на код этих процессов. Например, для настройки анализаторов на восприятие определенной информации необходимо знать, какая именно информация наиболее важна для автомата в данный момент. Определение же степени ее важности зависит от предыдущих состояний и задачи автомата. Так, на некотором этапе работы для автомата может оказаться важной только зрительная информация или только слуховая. При поиске конкретного объекта наиболее важными должны быть именно его существенные признаки и соответственно должны быть настроены все анализаторы автомата. Важность той или иной информации в М-сети определяет СУТ. Возможно, для обеспечения адекватной настройки анализаторов необходимо будет несколько специализировать алгоритмы СУТ, работающей на уровне сферы восприятия, и ввести дополнительные механизмы и алгоритмы изменения состояний i-моделей в самой сфере восприятия. Что касается организации анализаторных механизмов, то в этом направлении некоторые работы уже проведены. Кроме того, здесь могут быть использованы результаты многочисленных работ по распознаванию образов, проводимых другими исследователями.
Перспективы развития и усложнения М-автоматов во многом связаны с решением задачи организации вербального поведения, или иначе,- воспроизведением программ речи. Здесь особое внимание уделяется нами проблеме понимания и синтеза осмысленной, а не только грамматически правильной речи. В программе речи слова выступают как символы образов, их пространственных, временных, качественных отношений и абстракций различного уровня. Смысл воспринятой речевой информации выделяется благодаря связям между i-моделями слов и i-моделями образов и эмоций. В общих чертах этот процесс можно описать следующим образом:
i-Модели воспринятых слов прямо или опосредованно вызывают возбуждение соответствующих i-моделей образов и эмоций. Это возбуждение распространяется в М-сети, в результате чего вырабатывается общая эмоциональная оценка и возбуждаются новые i-модели образов и слов, обобщающие воспринятую информацию. В частном случае эти слова могут быть редукцией воспринятой фразы. В процессе понимания большую роль играет соотношение полученной информации с уже имеющимися знаниями. Организация таких процессов М-сетью в ряде случаев является весьма трудной задачей. Поэтому автомат, реализующий программы речи, удобно, по-видимому, представлять в виде неполного М-автомата и, следовательно, заранее ориентироваться на использование совместно с М-сетью алгоритмов различного рода.
Принципы организации и возможные пути воспроизведения программ речи в широком объеме рассмотрены нами пока только теоретически. Однако в настоящее время уже выполнены и некоторые экспериментальные исследования по организации речевого поведения с помощью М-сети. Работа проведена В.Д.Фоменко. В построенной им модели механизмов речи представлены такие аспекты устной речи, как восприятие, осмысление и речевая экспрессия. Преимущественное внимание уделялось содержательной стороне процессов переработки вербальной информации. Модель реализована в виде необучающегося полного М-автомата и содержит следующие блоки: слуховых восприятий, сенсорный речевой, проприоцептивный речевой, понятийный, эмоций, мотивационный, двигательный речевой, артикуляторный и СУТ. Блоки модели соотнесены определенным мозговым образованиям. При задании организации М-сети использовались данные нейроморфологии, нейрофизиологии и клинической неврологии.
Проведенные В.Д.Фоменко исследования показали принципиальную возможность реализации речевого поведения полными М-автоматами. В то же время эти исследования позволили выявить и существенную трудность воспроизведения речевых функций при помощи М-сети, связанную со значительными размерами последней.
При современном состоянии техники, используемой для создания М-автоматов, более перспективной, очевидно, будет замена ряда участков М-сети функциональным описанием их деятельности, т.е. построение неполных М-автоматов. Это позволит существенно расширить словарный запас автомата и объединить в одном устройстве структуры, ответственные за выполнение речевых функций, с сетью, организующей, например, двигательное поведение. Раздельное исследование, а затем объединение различных программ переработки информации представляется нам эффективным путем дальнейшего развития работ по ИР.
Наиболее сложной и, с нашей точки зрения, ключевой для решения многих задач ИР является представление программы сознания. Воспроизведение этой программы в ИР обеспечит пространственную и временную ориентации автомата, а также "понимание" им причинно-следственных отношений в окружающем автомат внешнем мире. В программе сознания можно выделить несколько уровней: внимание - выделение наиболее важной в данный момент информации; определение пространственных и временных взаимоотношений объектов; возможность предсказания их поведения; представления о собственном "Я" и "не Я"; воля - способность концентрировать и направлять внимание; воображение - способность различать реальное и нереальное.
Способ реализации одного из элементов сознания - внимания показан нами на примере описанных выше М-автоматов. Следующим шагом на пути усложнения М-автоматов может быть формирование представлений о собственном "Я" и "не Я". В настоящее время намечен подход к решению этой задачи. Он связан с построением алгоритмов, формирующих в обучающейся М-сети такую подсеть, которая отражает в своих i-моделях и связях наиболее часто повторяющиеся состояния автомата. Кроме того, в "Я" должны быть включены алгоритмы или структуры, фиксирующие результаты взаимодействия автомата с различными внешними объектами.
Таким образом, "Я" автомата соответствует его "представлению" о себе самом, или, иначе, является моделью себя. Формирование модели "Я" должно происходить, по всей вероятности, параллельно с формированием моделей "не Я". Последние можно понимать как модифицированные модели "Я". Ведущую роль в формировании моделей "не Я", по нашему мнению, играет механизм сопереживания, т.е. отождествления себя с другим объектом. Действия этого объекта используются для коррекции модели "Я", а после определенного опыта взаимодействия или наблюдений "Я" модифицируется и выделяется самостоятельная модель "не Я", отражающая представление автомата о данном объекте. Параллельно с формированием новой модели "не Я" происходит и коррекция, дополнение модели "Я".
Модели "Я" и "не Я" могут использоваться автоматом для планирования собственных действий и экстраполяции действий других объектов, способных к активному поведению. Таким образом, на этом этапе автомат будет способен к эффективному поведению в динамических средах. Прогнозирование своих и чужих действий тесно связано с еще одним элементом сознания - воображением, поскольку автомат должен уметь отличать воображаемую, нереальную, ситуацию и свои или чужие (предполагаемые) действия в пей от ситуации реальной, требующей конкретных действий.
Представление в автомате воображаемых ситуаций может быть достигнуто путем формирования специфичной "разовой" внутренней модели - фрагмента общей внутренней модели среды. Необходимо именно формирование фрагмента, а не выделение его на общей внутренней модели, поскольку должна существовать возможность различных преобразований воображаемой ситуации. Различение реальной ситуации от воображаемой может быть достигнуто благодаря торможению или какому-нибудь иному изменению функции СУТ на сфере восприятия. Возможно, в автомате окажется целесообразным притормаживать деятельность рецепторов при "просмотре" воображаемых ситуаций, как это происходит у человека. Однако специальные сигналы, однозначно определяющие режим восприятия автомата, должны быть предусмотрены во всех случаях.
Реализация моделей "Я" и "не Я" позволит автомату "продумывать" каждое действие и проверять на внутренней модели возможные его последствия. Сознательное планирование собственных действий связано с решением проблем пространственно-временной ориентировки и "воли". Вообще, все элементы сознания тесно взаимосвязаны и, по всей вероятности, должны исследоваться комплексно. Естественно, в зависимости от назначения автомата те или иные аспекты сознания могут быть воспроизведены более или менее подробно, однако полное исключение каких-либо элементов должно существенно сказываться на "уровне разумности" поведения.
Заканчивая обсуждение, отметим, что перспективы дальнейшего развития работ в области практического использования М-автоматов и усложнения реализуемых ими функций связаны, по-видимому, с разработкой методов и техники построения М-автоматов в виде физических устройств. Принцип создания таких устройств определяется тем, что М-сеть конструируется из большого числа однотипных элементов. Предварительные работы по построению физических аналогов М-сетей показали принципиальную возможность создания систем весьма большого объема.
Необходимость представления М-автоматов в виде физических устройств обусловлена, прежде всего, спецификой ряда практически важных задач, в которых применение М-автоматов оказывается целесообразным. Здесь имеется в виду в основном создание автономных информационных роботов, способных организовывать разумное поведение в сложных условиях естественной среды.
Проблема разработки физического аналога М-сетей представляет интерес также и в связи с тем, что ряд особенностей такого устройства - распределенная память, параллельная переработка информации, совмещение операций запоминания, переработки и выборки информации - позволяют рассматривать его как один из вариантов реализации вычислительных сред, с развитием которых связываются перспективы построения вычислительных машин пятого поколения.
При обсуждении различных вопросов, связанных с построением систем ИР, неоднократно упоминалось о том, что в целом проблема имеет прикладной характер. Направленность на практическое использование получаемых результатов характерна не только для конечной цели систем ИР, способных к решению сложных интеллектуальных задач, но и для промежуточных этапов исследования.
Одним из таких промежуточных этапов можно считать разработку М-автоматов РЭМ и МОД, в которых реализован ряд важных положений исходной гипотезы. Полученные результаты при решении практических задач могут использоваться в двух различных направлениях.
Первое из них связано с применением аппарата и приемов моделирования, развитых при построении модели двигательного поведения. К настоящему времени в этом направлении сделан ряд конкретных разработок, показавших перспективность предложенного метода моделирования.
Второе направление связано с непосредственным использованием разработанных автоматов при решении задач управления. РЭМ и МОД являются относительно простыми М-автоматами "первого поколения", рассчитанными на решение задач ограниченного класса. Поэтому и характер их практического использования определяется теми возможностями, которые предоставляет выбранный при разработке этих автоматов сюжет моделирования. Иначе говоря, применение разработанных автоматов необходимо связано с задачами двигательного поведения. Проиллюстрируем одну из возможностей такого рода.
В настоящее время все большую актуальность приобретают задачи автоматизации управления передвижением различных технических устройств в естественной среде. Речь идет об управлении такими объектами, как космические устройства, устройства для сбора информации, различные транспортные и обслуживающие средства и т.п. В ряде случаев участие в управлении человека-оператора нежелательно или невозможно и возникает проблема автоматизации его функций.
Рассмотренная выше задача моделирования двигательного поведения естественно интерпретируется в задачу управления движением. Для определенности будем иметь в виду задачу управления специализированными устройствами - "информационными роботами".
Прежде всего, каждое устройство такого рода должно обладать системой датчиков, отражающих состояние окружающей среды. Информация о среде фиксируется значениями некоторых физических параметров на выходе датчиков (напряжением, частотой и т.п.). Сопоставим значения таких параметров различным уровням возбужденности i-моделей, соответствующих измеряемым характеристикам среды (это оказывается возможным в подавляющем большинстве случаев). Таким образом, ситуация внешней среды, воспринимаемая устройством в каждый момент времени, может быть отображена совокупностью возбуждений "рецепторных" i-моделей управляющего М-автомата.
Далее, управляемое устройство должно быть способно выполнить в среде некоторые активные действия и, следовательно, должно иметь ряд эффекторных приспособлений. Выполнение устройством элементарного действия (движения по прямой, поворота, взятия пробы и т.д.) обеспечивается включением определенного эффектора или последовательностью таких включений, осуществляемых по жесткой программе. Каждой из этих операций может быть поставлена в соответствие i-модель из сферы "действий" М-автомата. Выбор одной из этих i-моделей системой усиления - торможения может интерпретироваться как принятие решения системой и перекодироваться в команду включения соответствующего эффектора.
Связи, которые можно заранее установить между "рецепторными" i-моделями и i-моделями "действий", составят систему "безусловных рефлексов" устройства. Задавая начальную структуру управляющего М-автомата, можно предопределить исходную логику его поведения в среде. В дальнейшем эта логика может изменяться в зависимости от "опыта" автомата.
Сфера "эмоций" М-автомата позволяет задать мотивацию поведения путем введения таких i-моделей, как "страх" перед опасными объектами, "любопытство", "осторожность", "голод" - показатель степени обеспеченности энергетическими ресурсами, "усталость" - показатель степени исправности или надежности функциональных систем и т.п.
Управляющий М-автомат может организовать целенаправленное поведение, если есть возможность заранее задать цель передвижений управляемого устройства или поисковое поведение на основе некоторых указаний общего характера, например: исследовать как можно больший район, пренебрегая деталями; детально исследовать заданный район; собрать информацию об объектах с заданными характеристиками; проводить исследования, считая, что выполнение задания важнее сохранения целостности, и т.п. Существует возможность повышения эффективности работы М-автомата путем введения в него имеющейся информации о характере исследуемой среды в виде, например, огрубленной карты. Если такой информации нет, то могут быть использованы программы "восприятия", ориентированные на совместную работу с М-сетью.
Проведенные работы составляют необходимый и достаточно важный этап исследования исходной гипотезы о составе и структуре программ переработки информации человеком. В разработанных М-автоматах нашла отражение только часть основных программ, реализация которых в полном объеме должна (согласно гипотезе) привести к построению системы, способной к разумному поведению при решении разнообразных задач. Рассмотрим кратко, какие именно возможности получит М-автомат в рамках разрабатываемого сюжета при введении новых, более сложных программ и каким образом введение этих программ может быть осуществлено.
Конечным результатом работ в интересующей нас области ИР должно явиться построение автомата в виде реального физического устройства, способного к сложному целесообразному поведению в естественной среде. Взаимодействие с естественной средой невозможно без реализации программы восприятия и первичной обработки внешней информации. Сюда входит настройка рецепторов на восприятие определенной информации, распознавание образов, временное хранение и предварительная обработка полученной информации. Весь этот процесс должен оканчиваться возбуждением определенных i-моделей в сфере восприятия М-сети автомата. Очевидно, что состояние М-сети в целом будет оказывать существенное влияние на код этих процессов. Например, для настройки анализаторов на восприятие определенной информации необходимо знать, какая именно информация наиболее важна для автомата в данный момент. Определение же степени ее важности зависит от предыдущих состояний и задачи автомата. Так, на некотором этапе работы для автомата может оказаться важной только зрительная информация или только слуховая. При поиске конкретного объекта наиболее важными должны быть именно его существенные признаки и соответственно должны быть настроены все анализаторы автомата. Важность той или иной информации в М-сети определяет СУТ. Возможно, для обеспечения адекватной настройки анализаторов необходимо будет несколько специализировать алгоритмы СУТ, работающей на уровне сферы восприятия, и ввести дополнительные механизмы и алгоритмы изменения состояний i-моделей в самой сфере восприятия. Что касается организации анализаторных механизмов, то в этом направлении некоторые работы уже проведены. Кроме того, здесь могут быть использованы результаты многочисленных работ по распознаванию образов, проводимых другими исследователями.
Перспективы развития и усложнения М-автоматов во многом связаны с решением задачи организации вербального поведения, или иначе,- воспроизведением программ речи. Здесь особое внимание уделяется нами проблеме понимания и синтеза осмысленной, а не только грамматически правильной речи. В программе речи слова выступают как символы образов, их пространственных, временных, качественных отношений и абстракций различного уровня. Смысл воспринятой речевой информации выделяется благодаря связям между i-моделями слов и i-моделями образов и эмоций. В общих чертах этот процесс можно описать следующим образом:
i-Модели воспринятых слов прямо или опосредованно вызывают возбуждение соответствующих i-моделей образов и эмоций. Это возбуждение распространяется в М-сети, в результате чего вырабатывается общая эмоциональная оценка и возбуждаются новые i-модели образов и слов, обобщающие воспринятую информацию. В частном случае эти слова могут быть редукцией воспринятой фразы. В процессе понимания большую роль играет соотношение полученной информации с уже имеющимися знаниями. Организация таких процессов М-сетью в ряде случаев является весьма трудной задачей. Поэтому автомат, реализующий программы речи, удобно, по-видимому, представлять в виде неполного М-автомата и, следовательно, заранее ориентироваться на использование совместно с М-сетью алгоритмов различного рода.
Принципы организации и возможные пути воспроизведения программ речи в широком объеме рассмотрены нами пока только теоретически. Однако в настоящее время уже выполнены и некоторые экспериментальные исследования по организации речевого поведения с помощью М-сети. Работа проведена В.Д.Фоменко. В построенной им модели механизмов речи представлены такие аспекты устной речи, как восприятие, осмысление и речевая экспрессия. Преимущественное внимание уделялось содержательной стороне процессов переработки вербальной информации. Модель реализована в виде необучающегося полного М-автомата и содержит следующие блоки: слуховых восприятий, сенсорный речевой, проприоцептивный речевой, понятийный, эмоций, мотивационный, двигательный речевой, артикуляторный и СУТ. Блоки модели соотнесены определенным мозговым образованиям. При задании организации М-сети использовались данные нейроморфологии, нейрофизиологии и клинической неврологии.
Проведенные В.Д.Фоменко исследования показали принципиальную возможность реализации речевого поведения полными М-автоматами. В то же время эти исследования позволили выявить и существенную трудность воспроизведения речевых функций при помощи М-сети, связанную со значительными размерами последней.
При современном состоянии техники, используемой для создания М-автоматов, более перспективной, очевидно, будет замена ряда участков М-сети функциональным описанием их деятельности, т.е. построение неполных М-автоматов. Это позволит существенно расширить словарный запас автомата и объединить в одном устройстве структуры, ответственные за выполнение речевых функций, с сетью, организующей, например, двигательное поведение. Раздельное исследование, а затем объединение различных программ переработки информации представляется нам эффективным путем дальнейшего развития работ по ИР.
Наиболее сложной и, с нашей точки зрения, ключевой для решения многих задач ИР является представление программы сознания. Воспроизведение этой программы в ИР обеспечит пространственную и временную ориентации автомата, а также "понимание" им причинно-следственных отношений в окружающем автомат внешнем мире. В программе сознания можно выделить несколько уровней: внимание - выделение наиболее важной в данный момент информации; определение пространственных и временных взаимоотношений объектов; возможность предсказания их поведения; представления о собственном "Я" и "не Я"; воля - способность концентрировать и направлять внимание; воображение - способность различать реальное и нереальное.
Способ реализации одного из элементов сознания - внимания показан нами на примере описанных выше М-автоматов. Следующим шагом на пути усложнения М-автоматов может быть формирование представлений о собственном "Я" и "не Я". В настоящее время намечен подход к решению этой задачи. Он связан с построением алгоритмов, формирующих в обучающейся М-сети такую подсеть, которая отражает в своих i-моделях и связях наиболее часто повторяющиеся состояния автомата. Кроме того, в "Я" должны быть включены алгоритмы или структуры, фиксирующие результаты взаимодействия автомата с различными внешними объектами.
Таким образом, "Я" автомата соответствует его "представлению" о себе самом, или, иначе, является моделью себя. Формирование модели "Я" должно происходить, по всей вероятности, параллельно с формированием моделей "не Я". Последние можно понимать как модифицированные модели "Я". Ведущую роль в формировании моделей "не Я", по нашему мнению, играет механизм сопереживания, т.е. отождествления себя с другим объектом. Действия этого объекта используются для коррекции модели "Я", а после определенного опыта взаимодействия или наблюдений "Я" модифицируется и выделяется самостоятельная модель "не Я", отражающая представление автомата о данном объекте. Параллельно с формированием новой модели "не Я" происходит и коррекция, дополнение модели "Я".
Модели "Я" и "не Я" могут использоваться автоматом для планирования собственных действий и экстраполяции действий других объектов, способных к активному поведению. Таким образом, на этом этапе автомат будет способен к эффективному поведению в динамических средах. Прогнозирование своих и чужих действий тесно связано с еще одним элементом сознания - воображением, поскольку автомат должен уметь отличать воображаемую, нереальную, ситуацию и свои или чужие (предполагаемые) действия в пей от ситуации реальной, требующей конкретных действий.
Представление в автомате воображаемых ситуаций может быть достигнуто путем формирования специфичной "разовой" внутренней модели - фрагмента общей внутренней модели среды. Необходимо именно формирование фрагмента, а не выделение его на общей внутренней модели, поскольку должна существовать возможность различных преобразований воображаемой ситуации. Различение реальной ситуации от воображаемой может быть достигнуто благодаря торможению или какому-нибудь иному изменению функции СУТ на сфере восприятия. Возможно, в автомате окажется целесообразным притормаживать деятельность рецепторов при "просмотре" воображаемых ситуаций, как это происходит у человека. Однако специальные сигналы, однозначно определяющие режим восприятия автомата, должны быть предусмотрены во всех случаях.
Реализация моделей "Я" и "не Я" позволит автомату "продумывать" каждое действие и проверять на внутренней модели возможные его последствия. Сознательное планирование собственных действий связано с решением проблем пространственно-временной ориентировки и "воли". Вообще, все элементы сознания тесно взаимосвязаны и, по всей вероятности, должны исследоваться комплексно. Естественно, в зависимости от назначения автомата те или иные аспекты сознания могут быть воспроизведены более или менее подробно, однако полное исключение каких-либо элементов должно существенно сказываться на "уровне разумности" поведения.
Заканчивая обсуждение, отметим, что перспективы дальнейшего развития работ в области практического использования М-автоматов и усложнения реализуемых ими функций связаны, по-видимому, с разработкой методов и техники построения М-автоматов в виде физических устройств. Принцип создания таких устройств определяется тем, что М-сеть конструируется из большого числа однотипных элементов. Предварительные работы по построению физических аналогов М-сетей показали принципиальную возможность создания систем весьма большого объема.
Необходимость представления М-автоматов в виде физических устройств обусловлена, прежде всего, спецификой ряда практически важных задач, в которых применение М-автоматов оказывается целесообразным. Здесь имеется в виду в основном создание автономных информационных роботов, способных организовывать разумное поведение в сложных условиях естественной среды.
Проблема разработки физического аналога М-сетей представляет интерес также и в связи с тем, что ряд особенностей такого устройства - распределенная память, параллельная переработка информации, совмещение операций запоминания, переработки и выборки информации - позволяют рассматривать его как один из вариантов реализации вычислительных сред, с развитием которых связываются перспективы построения вычислительных машин пятого поколения.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Н.М.АМОСОВ
АЛГОРИТМЫ РАЗУМА
1979
ВВЕДЕНИЕ
Механизмы разума интересуют ученых разных специальностей. Для психологов и физиологов - это теория их науки, для кибернетиков - пути создания искусственного интеллекта (ИИ). В предлагаемой вниманию читателя книге я попытаюсь дать изложение представлений о этой проблеме - как результат развития работ, ведущихся в отделе биокибернетики Института кибернетики АН УССР начиная с 1962г. Новые идеи значительно отличаются от ранее опубликованных.
Слово "алгоритм" не случайно введено в название книги: мне представляется, что есть возможность "разложить по полочкам" самые сложные проявления интеллекта - и даже с перспективой на его развитие выше уровня человеческого разума. Видимо, я не смогу убедить скептиков - для этого нужно воспроизвести алгоритмы интеллекта в программах. К сожалению, на этом пути стоят большие трудности. Может быть, излагаемые идеи как-то помогут энтузиастам проблемы? Предупреждаю, что предмет исключительно сложен для понимания, поскольку лежит на стыке физиологии, психологии, техники и даже философии. Для упрощения я буду широко пользоваться схемами.
Интеллект определяется как совокупность средств и способов управления сложными системами путем оперирования с их моделями, направляемого критериями оптимальности управления. Современная наука и техника дают возможность воспроизводить модели и действия с ними техническими средствами и таким образом отделить разум от мозга, с которым его обычно связывают. Отличие приведенного определения от множества других состоит в том, что оно подчеркивает это последнее обстоятельство.
Таким образом, говоря об интеллекте, мы будем иметь в виду эту совокупность средств и способов управления, независимо от того, реализована ли она в биологических системах или при помощи искусственно созданных, технических средств. Такое употребление термина "интеллект" не является общепринятым. Оно, однако, тесно связано с основной идеей этой книги. В тех отдельных случаях, когда речь пойдет только о естественном интеллекте человека, это будет специально оговариваться. Что же касается термина "искусственный интеллект" (ИИ), то он, как это и принято, будет использоваться для обозначения различного рода технических реализаций, моделей интеллекта.
Остановимся на основных понятиях, с тем чтобы постепенно войти в круг обсуждаемых вопросов. Прежде всего нужно выделить два противоположных подхода к моделированию интеллекта. Условно их можно назвать сетевым и алгоритмическим. Соответственно будем различать и два типа моделей - сетевой (СИ) и алгоритмический (АИ) интеллекты.
Самая простая схема сетевого интеллекта показана на рис.1. Объект управления (Об) представляет собой некую сложную трехмерную структуру. Она воспринимается датчиком - рецепторами Рц (например, глазами) и передается сигналами в "мозг", где превращается в первичную модель ПМ. В первом приближении ПМ представлена плоской двухмерной структурой, составленной из возбужденных, активированных элементов некоторой сети - условного "рецепторного поля". Объект распознается путем наложения ПМ на множество фигур из неактивных элементов, объединенных "проторенными" связями. Эти неактивные модели-фигуры представляют собой модели уже известных объектов и составляют постоянную память ПП. В соответствии с принципом действия СИ элементы, составляющие постоянную и временную (или активную) память ВП,- одни и те же; они отличаются только уровнем активности. Наложением первичной модели на сеть выбирается и активируется одна распознанная модель - фигуры РМ, и от нее включается управляющее воздействие на объект. Это воздействие представлено моделью действия МД, управляющей эффекторами Э. Распознанная модель объекта связана с несколькими моделями действий; выбор одной, нужной, определяется критерием Кр. Активированная от РМ и Кр модель действий передает активность на эффекторы, в которых управляющие сигналы превращаются в механическую энергию управляющего воздействия. Таким образом, в сетевом интеллекте "действия с моделями" представлены изменением активности элементов сетей, в которых заложены модели.
Рис.1. Схема сетевого интеллекта (СИ): Об - объект управления; Рц - рецепторы; Э - эффекторы; ВП - кратковременная память; ПМ - первичная модель; ПП - постоянная память; РМ - распознанная модель; Кр - критерии; МД - модель действия.
На рис.2 показана схема алгоритмического интеллекта. Начало его функционирования такое же, как в СИ,- в результате работы рецепторов Рц формируется первичная структурная модель ПМ.1 в виде такой же плоской двумерной структуры. Однако она тут же считывается преобразователем П.1 превращаясь в линейную, одномерную модель из набора цифр - ПM.2. Все последующие действия осуществляются с этой моделью. Распознавание ПМ.2 состоит в последовательном сравнении ее с записанными тем же кодом моделями-эталонами из длительной памяти ДП, где находится распознанная модель РМ. По этой модели выбирается модель действия МД. Процесс этот осуществляется путем перебора моделей в длительной памяти под управлением критерия Кр. Модель действия передается на преобразователь П.2 , где цифровой код превращается в управляющие сигналы эффекторов Э и через управляющие действия - на объект Об.
Рис.2. Схема алгоритмического интеллекта (АИ): Об - объект управления; Рц - рецепторы; ПМ1 - первичная структурная модель; П - преобразователь; ПМ2 - первичная цифровая модель; РМ - распознанная модель; Кр - критерии; ДП - длительная память; МД - цифровая модель действия; П2 - преобразователь; Э - эффекторы.
Основное различие между СИ и АИ состоит в структуре памяти и вытекающих отсюда разных действиях с моделями. Однако в обоих типах интеллекта сохраняется принцип управления моделями со стороны критериев управления через их активацию.
Создание СИ и АИ предполагает использование разных методологических подходов к моделированию одного и того же объекта - разума человека. Каждый из подходов имеет свои сильные и слабые стороны. Поэтому при построении реальных систем ИИ может оказаться целесообразным представление некоторых функций разума в виде сетевых моделей, а некоторых - в виде алгоритмических. Общий принцип здесь таков: чем ниже уровень моделируемой функции в общей иерархии функций разума, тем вероятнее, что при ее воспроизведении в ИИ наиболее эффективным окажется сетевой метод.
Дело в том, что реализация многих функций нижнего уровня (как, например, нахождение распознанной модели по первичной модели - см. рис.2) связана с осуществлением больших переборов в длительной памяти. Такие переборы особенно эффективно осуществляются в сетевых моделях, реализующих параллельные процессы переработки информации. В то же время сетевые модели имеют другие недостатки, ограничивающие область их применения. На сравнительном анализе достоинств и недостатков сетевых и алгоритмических моделей я еще буду неоднократно останавливаться.
Вопросам создания и исследования свойств СИ посвящен ряд работ, выполненных под руководством автора. Получены конкретные результаты, краткий обзор которых содержится в первом разделе книги. Все дальнейшее изложение я посвящу описанию принципов построения АИ, не делая больше специальных оговорок, что при практической его реализации ряд функций может быть представлен при помощи сетевых структур.
АЛГОРИТМЫ РАЗУМА
1979
ВВЕДЕНИЕ
Механизмы разума интересуют ученых разных специальностей. Для психологов и физиологов - это теория их науки, для кибернетиков - пути создания искусственного интеллекта (ИИ). В предлагаемой вниманию читателя книге я попытаюсь дать изложение представлений о этой проблеме - как результат развития работ, ведущихся в отделе биокибернетики Института кибернетики АН УССР начиная с 1962г. Новые идеи значительно отличаются от ранее опубликованных.
Слово "алгоритм" не случайно введено в название книги: мне представляется, что есть возможность "разложить по полочкам" самые сложные проявления интеллекта - и даже с перспективой на его развитие выше уровня человеческого разума. Видимо, я не смогу убедить скептиков - для этого нужно воспроизвести алгоритмы интеллекта в программах. К сожалению, на этом пути стоят большие трудности. Может быть, излагаемые идеи как-то помогут энтузиастам проблемы? Предупреждаю, что предмет исключительно сложен для понимания, поскольку лежит на стыке физиологии, психологии, техники и даже философии. Для упрощения я буду широко пользоваться схемами.
Интеллект определяется как совокупность средств и способов управления сложными системами путем оперирования с их моделями, направляемого критериями оптимальности управления. Современная наука и техника дают возможность воспроизводить модели и действия с ними техническими средствами и таким образом отделить разум от мозга, с которым его обычно связывают. Отличие приведенного определения от множества других состоит в том, что оно подчеркивает это последнее обстоятельство.
Таким образом, говоря об интеллекте, мы будем иметь в виду эту совокупность средств и способов управления, независимо от того, реализована ли она в биологических системах или при помощи искусственно созданных, технических средств. Такое употребление термина "интеллект" не является общепринятым. Оно, однако, тесно связано с основной идеей этой книги. В тех отдельных случаях, когда речь пойдет только о естественном интеллекте человека, это будет специально оговариваться. Что же касается термина "искусственный интеллект" (ИИ), то он, как это и принято, будет использоваться для обозначения различного рода технических реализаций, моделей интеллекта.
Остановимся на основных понятиях, с тем чтобы постепенно войти в круг обсуждаемых вопросов. Прежде всего нужно выделить два противоположных подхода к моделированию интеллекта. Условно их можно назвать сетевым и алгоритмическим. Соответственно будем различать и два типа моделей - сетевой (СИ) и алгоритмический (АИ) интеллекты.
Самая простая схема сетевого интеллекта показана на рис.1. Объект управления (Об) представляет собой некую сложную трехмерную структуру. Она воспринимается датчиком - рецепторами Рц (например, глазами) и передается сигналами в "мозг", где превращается в первичную модель ПМ. В первом приближении ПМ представлена плоской двухмерной структурой, составленной из возбужденных, активированных элементов некоторой сети - условного "рецепторного поля". Объект распознается путем наложения ПМ на множество фигур из неактивных элементов, объединенных "проторенными" связями. Эти неактивные модели-фигуры представляют собой модели уже известных объектов и составляют постоянную память ПП. В соответствии с принципом действия СИ элементы, составляющие постоянную и временную (или активную) память ВП,- одни и те же; они отличаются только уровнем активности. Наложением первичной модели на сеть выбирается и активируется одна распознанная модель - фигуры РМ, и от нее включается управляющее воздействие на объект. Это воздействие представлено моделью действия МД, управляющей эффекторами Э. Распознанная модель объекта связана с несколькими моделями действий; выбор одной, нужной, определяется критерием Кр. Активированная от РМ и Кр модель действий передает активность на эффекторы, в которых управляющие сигналы превращаются в механическую энергию управляющего воздействия. Таким образом, в сетевом интеллекте "действия с моделями" представлены изменением активности элементов сетей, в которых заложены модели.
Рис.1. Схема сетевого интеллекта (СИ): Об - объект управления; Рц - рецепторы; Э - эффекторы; ВП - кратковременная память; ПМ - первичная модель; ПП - постоянная память; РМ - распознанная модель; Кр - критерии; МД - модель действия.
На рис.2 показана схема алгоритмического интеллекта. Начало его функционирования такое же, как в СИ,- в результате работы рецепторов Рц формируется первичная структурная модель ПМ.1 в виде такой же плоской двумерной структуры. Однако она тут же считывается преобразователем П.1 превращаясь в линейную, одномерную модель из набора цифр - ПM.2. Все последующие действия осуществляются с этой моделью. Распознавание ПМ.2 состоит в последовательном сравнении ее с записанными тем же кодом моделями-эталонами из длительной памяти ДП, где находится распознанная модель РМ. По этой модели выбирается модель действия МД. Процесс этот осуществляется путем перебора моделей в длительной памяти под управлением критерия Кр. Модель действия передается на преобразователь П.2 , где цифровой код превращается в управляющие сигналы эффекторов Э и через управляющие действия - на объект Об.
Рис.2. Схема алгоритмического интеллекта (АИ): Об - объект управления; Рц - рецепторы; ПМ1 - первичная структурная модель; П - преобразователь; ПМ2 - первичная цифровая модель; РМ - распознанная модель; Кр - критерии; ДП - длительная память; МД - цифровая модель действия; П2 - преобразователь; Э - эффекторы.
Основное различие между СИ и АИ состоит в структуре памяти и вытекающих отсюда разных действиях с моделями. Однако в обоих типах интеллекта сохраняется принцип управления моделями со стороны критериев управления через их активацию.
Создание СИ и АИ предполагает использование разных методологических подходов к моделированию одного и того же объекта - разума человека. Каждый из подходов имеет свои сильные и слабые стороны. Поэтому при построении реальных систем ИИ может оказаться целесообразным представление некоторых функций разума в виде сетевых моделей, а некоторых - в виде алгоритмических. Общий принцип здесь таков: чем ниже уровень моделируемой функции в общей иерархии функций разума, тем вероятнее, что при ее воспроизведении в ИИ наиболее эффективным окажется сетевой метод.
Дело в том, что реализация многих функций нижнего уровня (как, например, нахождение распознанной модели по первичной модели - см. рис.2) связана с осуществлением больших переборов в длительной памяти. Такие переборы особенно эффективно осуществляются в сетевых моделях, реализующих параллельные процессы переработки информации. В то же время сетевые модели имеют другие недостатки, ограничивающие область их применения. На сравнительном анализе достоинств и недостатков сетевых и алгоритмических моделей я еще буду неоднократно останавливаться.
Вопросам создания и исследования свойств СИ посвящен ряд работ, выполненных под руководством автора. Получены конкретные результаты, краткий обзор которых содержится в первом разделе книги. Все дальнейшее изложение я посвящу описанию принципов построения АИ, не делая больше специальных оговорок, что при практической его реализации ряд функций может быть представлен при помощи сетевых структур.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ СЕГОДНЯ
ОСНОВНЫЕ ЭТАПЫ И НАПРАВЛЕНИЯ ИССЛЕДОВАНИЙ
Не буду даже пытаться охватить всю проблему искусственного интеллекта. Книга задумана как изложение собственной гипотезы об общих механизмах или алгоритмах интеллекта, которым равно подчиняются разум животных, человека, коллективный разум общества и которые, как мне кажется, обязательны для любой его модели.
Искусственный интеллект стал особой областью знания. Существуют специальные комитеты, координирующие исследования по этой проблематике, издается несколько журналов, созываются международные конференции. С одной стороны, предмет этих исследований примыкает к теоретической кибернетике, с другой - к технике автоматов и роботов, есть и психофизиологический аспект проблемы. Одно скажу сразу: искусственный интеллект не создан. Векселя, которые выдала кибернетика в начале своего развития, претендуя на решение почти всех интеллектуальных задач, остались неоплаченными. Более того - наметился явный пессимизм во взглядах на саму возможность воспроизвести разум человека. Сошлюсь на книги Дрейфуса. Тем не менее большинство ученых-кибернетиков смотрит в будущее с надеждой, хотя теории интеллекта пока нет и все предлагаемые модели представляют собой воспроизведение частных механизмов мышления. Для того чтобы дать представление о состоянии дела, приведу очень краткую сводку работ последнего времени.
С самого начала основные надежды кибернетики были связаны с моделированием работы мозга. Было ясно, что здесь можно идти двумя путями - моделировать нейронные сети и воспроизводить алгоритмы мышления.
Лучшие результаты по моделированию нейронных сетей были получены в работах школы У.Мак-Каллоха. Выяснилось, однако, что сети из формальных нейронов не способны воспроизводить сложные функции мозга. Неэффективными оказались также попытки использовать такие сети для управления роботами. Большой интерес вызвали работы Ф.Розенблата, который сформулировал ряд принципов нейродинамики мозга и использовал их для построения персептронов - устройств для распознавания образов. Однако строгий анализ, осуществленный М.Минским и С.Пейпертом, показал ограниченность существующих здесь возможностей. Таким образом, к началу 70-х гг. общий кризис нейронного подхода стал очевидным.
Одновременно проводились исследования по алгоритмическому моделированию мышления. Оcновные достижения в этой области связаны с именами А.Ньюэла и Г.Саймона. Их работы по созданию GPS (общего решателя проблем) привели к формированию отдельного направления - эвристического программирования, влияние которого на исследования по ИИ прослеживается до сих пор. Однако в целом это направление исчерпало свои возможности уже к началу текущего десятилетия. При этом выяснилось, что оно не позволяет приблизиться к сколько-нибудь общей теории мышления, хотя и может обеспечить решение отдельных прикладных задач.
Кризис обоих направлений привлек внимание к работам, начатым еще в 50-е гг. и связанным с использованием формальных методов для решения сложных, "интеллектуальных" задач (доказательство теорем, игры и т.п.). К этому времени здесь был получен ряд интересных результатов. Среди них следует отметить разработку А.Сэмюэлем программы для игры в шашки, которая до сих пор является одной из лучших игровых программ. Работы этого направления и составили основу нового раздела кибернетики, который занимается проблемой искусственного интеллекта.
В начале 70-х гг. на исследования по ИИ оказывали большое влияние результаты, полученные в области математической логики Дж.Робинсоном. Развитый им метод резольвенций позволил строить мощные процедуры доказательства теорем. Это было использовано для построения нового класса программ, решающих сложные задачи. Наибольшую известность среди них получила разработанная в Стенфордском исследовательском институте программа STRIPS, решающая задачи планирования действий робота. Методы математической логики составили также основу теории поиска решений, главные положения которой обобщены в работах Н.Нильсона. Однако использование этих методов для широкого круга задач показало их низкую эффективность, обусловленную в основном большим объемом и громоздкостью соответствующих программ для ЦВМ. Так что к 1975г. наметилось разочарование и в этом подходе.
Попытки преодолеть трудности, сопутствующие разработке больших программ, привели к появлению новых методов автоматизации программирования и созданию специальных проблемно-ориентированных языков. Большие достижения здесь связаны с работами К.Хьюитта по построению языка PLANNER, который послужил основой для целого ряда дальнейших разработок в этом направлении.
Использование новых языков программирования обеспечило прогресс в сравнительно новой для ИИ области - имитации речевого поведения человека. Первые значительные успехи здесь были получены Т.Виноградом, разработавшим систему диалогового управления роботом с помощью естественного языка. Начиная с 1973-1975гг. проблемы естественной речи привлекают все большее число исследователей. Разрабатываются проблемы понимания, представления знаний, грамматического анализа и др. Проблема понимания активно исследуется также и в другой области ИИ - распознавания зрительных образов. Широко известны работы М.Минского, развивающего теперь новую теоретическую концепцию восприятия, связанную с представлениями о "системах фреймов".
В целом в последние годы опять намечается тенденция к использованию в программах ИИ знаний о поведении и мышлении человека, хотя сама задача моделирования человека прямо не ставится.
Меня больше всего интересует как раз эта задача - моделирование человека. Естественно было бы обратиться к нейрофизиологии и психологии. Именно эти науки должны описать физиологические механизмы психических явлений и дать рекомендации по их моделированию. Возможно, работающим здесь ученым кажется, что они знают, как мыслят животные и человек, но я не мог уяснить этого из их книг. Не нашел я и возможности переложить их словесные формулировки на цифровые модели. Впрочем, и другие кибернетики тоже не смогли перевести физиологию мозга в модели.
Разумеется, никто не будет отрицать, что именно нейрофизиологам принадлежат основополагающие открытия, благодаря которым стали возможными попытки строить модели. Перечислю несколько основных.
Первое - учение И.М.Сеченова о возбуждении и торможении. Разный уровень активности нейрона - от полного "молчания" до максимального возбуждения - это важнейший механизм взаимодействия моделей. Открытие И.П.Павловым условных рефлексов и условных связей дало объяснение обучаемости и самоорганизации. Учение А.А.Ухтомского о доминанте позволяет предположить механизм превалирования главной модели над всеми остальными. Если к этому добавить работы о ретикулярной формации, то, вместе взятые, они подсказали идею центрального регулирования активности коры - систему усиления-торможения (СУТ) и механизм сознания и подсознания. 3.Фрейд достаточно обосновал большое значение подсознания в психической жизни человека. Опыты X.Дельгадо и Н.П.Бехтеревой со вживленными электродами показали, как центры чувств управляют поведением, являясь источниками активности для моделей коры. Наконец, исследования Н.П.Бехтеревой и др. обнаружили так называемый "код слов", то есть наличие самих моделей слов речи, которые, видимо, запечатлены в нескольких или даже многих ансамблях нейронов. Следует также упомянуть П.К.Анохина, предложившего общие принципы управления физиологическими процессами.
Простое перечисление основных идей нейрофизиологии показывает, что наша гипотеза об алгоритме интеллекта является лишь одним из возможных вариантов их компоновки в единое целое. Это сделано для того, чтобы попытаться применить метод эвристического моделирования для изучения мышления и поведения. Если нейрофизиология идет к психике "снизу" путем анализа, от механизмов нейронов и их ансамблей, то кибернетическое моделирование идет "сверху", путем синтеза. Мне представляется, что второй подход имеет право на научность. Не уверен, что модели уже сейчас предложат физиологии новые идеи для экспериментов, но для создания искусственного интеллекта они дадут достаточно материала. К сожалению, попытки заинтересовать моделями физиологов и психологов пока терпят неудачу. Они кажутся им слишком примитивными в сравнении с огромной сложностью мозга. Что ж, против этого пока нечего возразить. Нужны более доказательные модели, способные продемонстрировать как можно больше феноменов поведения человека. Именно к этой цели и направлены работы отдела биокибернетики Института кибернетики АН УССР. Приведу их краткую историю.
НЕКОТОРЫЕ РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ СЕТЕВОГО ИНТЕЛЛЕКТА
В 1963-1964гг. мною был сформулирован первый вариант гипотезы о механизмах мышления в обобщенном виде. В 1965г. эта гипотеза была опубликована в книге "Моделирование мышления и психики". Два года спустя книгу переиздали в США. Последующее развитие идей нашло отражение в монографии "Искусственный разум", напечатанной в 1969г.
Модели, реализованные на ЦВМ. В 1963г. мы начали серию работ по созданию моделей интеллекта, построенных на принципе семантических сетей с СУТ. Такие сети были названы термином "М-сети", а модели, построенные на них,- "М-автоматами". В последующие годы создавались новые варианты моделей, однако все они основывались на использовании сетевого интеллекта с СУТ. Принцип его действия уже был описан: М-сеть представляет собой систему элементарных моделей (i-модели), каждой придано определенное значение, например модель - объект среды, модель действия, чувства, отношения и др. Модели имеют статические и динамические характеристики, в которых отражена величина уровня активности и зависимости от времени и "входных" раздражителей - то есть от величины некоей энергии, поступающей по связям с других моделей или от рецепторов. У первых моделей связи задавались жестко, у последующих проходимость связей менялась в зависимости от использования - тренировки. Это же относится к характеристикам возбуждения i-моделей. Исследование модели состоит в пересчете на ЦВМ уровня активности всех элементарных моделей за условный такт времени. СУТ выбирает одну, самую активную модель и еще дополнительно ее усиливает согласно своим характеристикам, а ВСЕ остальные тормозит. "Входами" М-автомата являются внешние объекты, "выходами" - его действия, направленные на среду. Все это типично для СИ.
Первая модель - РЭМ отображала условный сюжет путешествия некоего "искусственного субъекта" в среде, которая содержала полезные и опасные для него объекты. Мотивы поведения субъекта определялись ощущениями усталости, голода и стремлением к самосохранению. Субъект изучал среду, выбирал цель движения, строил план достижения этой цели и затем реализовал его, выполняя действия-шаги, сравнивая результаты, получаемые в ходе движения, с запланированными, дополняя и корректируя план в зависимости от складывающихся ситуаций.
М-сеть РЭМа содержала 90 i-моделей, около 400 связей и была способна воспринимать три типа объектов (входных параметров). Среда могла содержать до 400 объектов, произвольно расположенных на плоскости. РЭМ выполнял восемь действий и был построен как неполный М-автомат, иными словами, кроме М-сети с заданной на ней СУТ, он содержал функционирующие сопряженно с М-сетью алгоритмические структуры. Большинство из них осуществляло функции планирования. РЭМ был реализован в виде комплекса программ для ЦВМ М-220. Программы содержали свыше 3000 рабочих команд. Время просчета одного такта функционирования М-сети (единицы автоматного времени) - 1.5мин. В течение каждого такта производился расчет величин возбуждений и параметров характеристик всех i-моделей, а также параметров всех связей М-сети (эта процедура названа пересчетом). Последовательность операций, производимых за один такт, такова: восприятие информации из внешней среды, пересчет, выбор СУТ наиболее возбужденной i-модели, принятие на основании полученной информации решения о взаимодействии со средой, выполнение этого решения. Эксперименты с РЭМом включали просчеты его состояний и регистрацию решений на протяжении 10-20 тактов.
Результаты исследования РЭМа показали перспективность использования М-сетей как при построении моделей процессов мышления, так и при разработке систем типа "искусственный разум", способных к самостоятельному эффективному функционированию в сложных условиях. Выяснилась также целесообразность дальнейшего проведения работ по изучению возможностей аппарата при построении более мощных моделей, а также исследования весьма важного в практическом и теоретическом отношениях вопроса об адаптивных возможностях М-автоматов.
Затем была построена и исследована новая модель - МОД. При его создании сохранялись как общая схема постановки задачи, так и принципиальная структура выбранного ранее условного сюжета моделирования. МОД также был разработан в виде неполного М-автомата. При этом его алгоритмическая часть отображала процессы планирования, связанные с предварительной организацией движения, а структурная - процессы принятия решений в ходе непосредственного взаимодействия со средой. Обе части целесообразно рассматривать как независимые модели мыслительных процессов, между которыми может быть организовано постоянное взаимодействие. Эти модели названы соответственно МОД-1 и МОД-2.
МОД-1 вырабатывал план деятельности М-автомата в среде в виде совокупности подцелей движения, основной цели и ожидаемых (предвидимых) состояний автомата в ходе движения. Алгоритмы восприятия внешней информации в МОД-1 моделировали процессы зрительного восприятия человека, построения возможных вариантов плана, их оценки, синтеза окончательного варианта, его разбиения на отдельные этапы, выбора объектов-ориентиров для каждого из этапов, моделировали процессы принятия решения человеком в условиях отсутствия полной информации о среде.
МОД-1 являлся неполным М-автоматом, основной объем его функций реализовался алгоритмическими структурами. М-сеть здесь содержала 62 i-модели, около 1000 связей и использовалась в основном для представления мотивационной сферы модели. МОД-1 был реализован в виде комплекса программ для ЦВМ М-220. Программы включали до 15000 команд, их просчет занимал 20-30мин. машинного времени. Среда модели могла содержать до 625 объектов (это максимальное число). Каждый из объектов задавался упорядоченным набором из 8-10 признаков (входных воздействий). Выходом модели являлся оптимальный план передвижений в среде. В среднем такой план мог состоять из 30 элементов (целей, подцелей и ожидаемых отклонений внутренних состояний).
М-автомат МОД-2 вырабатывал конкретные реализации планов, построенных МОД-1. Его основная особенность связана с реализацией на М-сети программ самообучения. Последнее осуществлялось путем изменения веса первоначально заданных связей, установления новых связей и порождения новых узлов М-сети. Протекание процессов изменения структуры сети определялось особенностями среды, в которой действовал автомат, соотнесенными с поставленными перед ним задачами. Задачи могли формулироваться, например, в следующем виде: действовать так, чтобы обеспечить максимальное значение оценки "собственного комфорта", максимальное соответствие внешних и внутренних реакций автомата реакциям моделируемого объекта или быстрейшее достижение цели. Возможны были и комбинированные задачи.
Автомат может рассматриваться как модель деятельности человека по принятию решений в задачах движения в лабиринте. Кроме того, МОД-2 может быть использован в качестве устройства, управляющего передвижением технических систем, предназначенных для сбора информации, транспортировки и т.п. В зависимости от цели использования автомата изменяется и критерий оценки эффективности его функционирования.
МОД-2 - полный М-автомат. Его М-сеть может содержать до 400 i-моделей и до 2000 связей. На М-сети задана двухуровневая СУТ. МОД-2 был реализован в виде программы для ЦВМ БЭСМ-6. Программа содержала около 6000 команд. Время просчета одного такта 30-50 сек. Экспериментально были исследованы реакции автомата на протяжении до 300 тактов. На входы автомата подавалась информация о плане движения и об объектах среды, каждый из которых относится к одному из шести возможных типов. Всего среда могла содержать до 400 расположенных произвольным образом объектов. Предварительная информация о некоторых характеристиках среды и структуре оценочных функций задавалась в процессе начальной организации М-сети автомата. Количество выполняемых МОД-2 действий (выходных параметров или решений) - 22. Из них 17 - различного рода действия - шаги, перемещающие автомат в среде, а 5 - "активные" действия, изменяющие состояние среды или автомата ("есть", "спать", "нести объект", "бросить объект", "создать убежище"). Поведение автомата состояло в формировании последовательностей решений о выполнении тех или иных действий и соответственно их фактическим выполнением. Были разработаны оценки поведения и предложены процедуры оптимизации автомата. Оптимизация выполнялась варьированием значений шести параметров обучения.
В ходе исследования МОД-2 был решен ряд вспомогательных задач-тестов. Представляет самостоятельный интерес результат одной из таких задач, связанной с моделированием процессов формирования понятий человеком. Здесь показана приводимость М-автомата к формам, моделирующим как индивидуальное, так и обобщенное групповое поведение. Были продемонстрированы методы такого приведения.
Модель механизмов речи. Одновременно с разработкой МОДа проводилось исследование, цель которого состояла в том, чтобы изучить возможности М-сетей в области нейрофизиологии и нейропсихологии, а также оценить практическую и познавательную важность таких моделей. Был разработан и исследован М-автомат, моделирующий механизмы речи. В модели представлены такие аспекты устной речи, как восприятие, осмысливание, словесное выражение. Преимущественное внимание уделялось содержательной стороне процессов переработки словесной информации. Модель предназначена для воспроизведения относительно простых речевых функций - ответов на вопросы ограниченного типа, повторения, называния. Она содержит следующие блоки: слуховых восприятий, сенсорный речевой, проприоцептивный речевой, понятийный, эмоций, мотивационный, двигательный речевой, артикуляторный и блок СУТ. Блоки модели соотнесены с определенными мозговыми образованиями. При задании организации М-сети использовались данные нейроморфологии, нейрофизиологии и клинической неврологии.
Модель представлена в виде необучающегося полного М-автомата. Его М-сеть содержит более 1000 i-моделей и 8000 связей между ними. М-автомат реализован в виде программы для ЦВМ БЭСМ-6, содержащей около 500 команд. Время просчета одного такта - 2 сек. В экспериментах наблюдалось поведение модели на протяжении до 100 тактов. На вход модели подавались буквы русского алфавита, объединенные в слова и фразы, а также специальные объекты, соответствующие образам предметов. На выходе модели, в зависимости от режима ее работы, наблюдались последовательности букв русского алфавита, которые были либо ответами на входные вопросы, либо повторением входных слов, либо названиями предметов. То обстоятельство, что при создании модели широко использовались данные нейрофизиологии, позволило в экспериментах имитировать ряд поражений мозга органического и функционального характера, приводящих к нарушениям функций речи. В частности, получены модельные отображения синдромов сенсорной, моторной, проводниковой и транскортикальной афазий.
Описанные М-автоматы составляют основной фонд "больших" моделей, разработанных и исследованных в процессе изучения возможностей и практических методов использования М-сетей.
Нами были выполнены и некоторые модельные разработки, в которых аппарат М-сетей использовался эпизодически или в модифицированном виде. Анализ результатов, полученных в разработках такого рода, может представлять серьезный интерес при оценке возможностей и свойств обсуждаемого нами аппарата.
Весь опыт моделирования поведения "разумного субъекта" в некоей среде - "лабиринте" - с использованием М-сети и расчетами на ЦВМ подытожен в монографии. В качестве примера на рис.3 приведены результаты одного из экспериментов по исследованию поведения такого "субъекта".
Рис.3. Схема движений и действий МОДа по карте.
Семь-восемь лет мы занимались созданием сетевых моделей на ЦВМ, пока не убедились, что возможности таких моделей ограничены. Объем расчетов оказался слишком большим даже для компьютера: за один такт нужно пересчитать циркуляцию "энергии" по всем связям и изменения в их проходимости, подсчитать активность всех элементарных моделей, пересчитать изменение их тренированности для следующего такта. Если же предусмотреть и возможность образования новых связей и новых моделей, иными словами, воспроизвести принцип самоорганизации, то количество счетной работы будет расти подобно снежному кому. Затраты машинного времени увеличиваются приблизительно пропорционально кубу числа моделей в сети. Но дело не только в расчетах - так же трудно оказалось отладить громоздкие программы. Так или иначе, выйти за предел 1000 моделей и 8000 связей нам не удалось. Формально мы воспроизвели в МОД самые простые программы психики, такие, как сознание и подсознание, оптимизация действий по многим критериям - чувствам с предвидением и планированием. Была продемонстрирована разная обобщенность или иерархия моделей, обучение, забывание и даже различия характера. Но в целом этот "субъект", путешествующий среди врагов и препятствий в поисках пищи, соответствовал лишь довольно примитивному животному.
АНАЛОГОВЫЕ МОДЕЛИ. РОБОТЫ. Тем не менее существует много задач, для которых вполне достаточен и такой ограниченный интеллект. В частности - для роботов, предназначенных для специализированной деятельности. Важнейшим требованием для них должна быть автономность, независимость от ЦВМ, что привело к реализации сетевого интеллекта на физических элементах. Идея сама по себе проста: представить каждую элементарную модель в виде усилителя, на вход которого поступает потенциал от других моделей, а на выходе формируется усиленный потенциал, который тоже передается по связям и гасится пропорционально их сопротивлению. Из таких элементов-усилителей можно создать любую сеть, если каждому придать определенное значение - семантику. Одни элементы - модели предметов, другие - чувств и т.д., как в сетевых моделях РЭМ и МОД. Разные характеристики усилителей и разные сопротивления связей позволяют создать структуры любого назначения. Модель интеллекта на физических элементах в наибольшей мере приближается к имитации мозга. К сожалению, есть разница: несоизмеримо мало число элементов и связей. Однако сложность такого интеллекта целиком определяется технологией. Можно создать довольно большие сети, во всяком случае достаточные для робота.
В 1972г. были начаты работы по созданию модели ИИ в виде сети из физических элементов. Цель их - построить систему управления в виде М-сети с системой усиления-торможения (СУТ) и разместить ее на тележке.
Прежде чем приступить к разработке макета, были проверены возможности сети из физических элементов с СУТ. Первая сеть содержала 26 узлов и около 300 связей и управляла перемещением писчика по условной среде, изображенной на карте. Результаты экспериментальных исследований этой системы оказались обнадеживающими. Тогда приступили к созданию транспортного робота - ТАИРа.
Конструктивно разрабатываемый макет робота представляет собой трехколесное шасси, на котором смонтированы комплект рецепторов (органов чувств), блок управления, энергосистема и прочие устройства. Размер шасси 1600*1100*600 мм. Все три колеса являются ведущими и имеют автономный привод от электродвигателей мощностью по 30Вт. Переднее колесо поворотное. Питание электродвигателей осуществляется от аккумуляторных батарей. Скорость движения по ровной поверхности составляет 10-12м/мин.
Датчики-рецепторы можно разбить на несколько групп.
1. Датчики, определяющие положение робота в пространстве:
а) навигационная система с компасом и двумя радиомаяками;
б) датчики углов наклона тележки в двух плоскостях.
2. Датчики информации об окружающей среде:
а) дистантные. Активный оптический дальномер с радиусом действия до 10м. Система оптических датчиков близости с диапазоном расстояний до 30см;
б) контактные датчики - система микровыключателей, установленных на гибком чехле, в который заключена тележка.
3. Датчики состояний робота:
а) термодатчики на электродвигателях;
б) датчики крутящего момента на приводах к колесам;
в) датчики напряжения на аккумуляторных батареях;
г) вибродатчик.
4. Датчик времени.
Основу системы управления представляет физически реализованная М-сеть. Специфическая СУТ в М-сети задает положительную обратную связь по возбуждениям узлов и обеспечивает тем самым доминирование в каждый момент времени одного или нескольких узлов над всеми другими. Ввод и вывод информации в М-сети соответствуют возбуждению определенных ее узлов (входных и выходных).
В настоящее время система управления роботом предполагает осуществление целенаправленного движения с обеспечением собственной безопасности (объезд препятствий, избегание опасных мест, поддержание внутренних параметров в заданных пределах) и минимизацию временных и энергетических затрат. Вся сеть, состоящая из 100 узлов, разбита на шесть сфер.
Сферы оценок и распознавания ситуаций являются входными. Аналогично сенсорным системам мозга человека здесь осуществляется анализ воспринятой датчиками информации, на основе которого выполняется интегральная оценка среды, условий задачи и собственных состояний.
Выбор характера поведения в текущей ситуации производится в сфере решений. При этом может быть принято решение, определяющее направление движения, осуществление какого-то сложного маневра или даже выполнение некоторого элементарного действия.
Организация самого двигательного поведения осуществляется тремя сферами, являющимися выходными для сети,- сферами маневров высшего уровня, маневров нижнего уровня и элементарных действий. Здесь формируется последовательность команд, поступающих к эффекторной системе - системе управления поворотным и тяговыми электродвигателями.
Все узлы сети (i-модели) представляют собой усилители постоянного тока со специальными характеристиками. Узлы каждой из выделенных сфер имеют свои определенные характеристики. Точно так же в каждой сфере действует своя СУТ. Связи между узлами выполнены из резистивных элементов в устройстве матричного типа. Для ввода информации от датчиков в сетевое устройство управления используется 60 каналов.
Рис. 4. Внешний вид ТАИРа.
Внешний вид ТАИРа представлен на рис.4. В настоящее время мы продолжаем работы по созданию новых систем управления роботами. Эти системы пока не претендуют на достижение высокого уровня интеллекта. Правда, для ограниченных целей нейроноподоб-ная семантическая сеть на физических элементах с СУТ хорошо себя зарекомендовала и привлекла внимание исследователей и конструкторов, которые думают об автономных роботах. Планы отдела биокибернетики по совершенствованию автоматов предполагают реализовать обучение, создать ансамблевую организацию из элементов, позволяющую резко увеличить количество моделей при том же числе элементов, улучшить зрительное восприятие среды и даже дойти до человеческой речи. Я не уверен, что эти планы воплотятся в металл достаточно скоро, не потому, что идеи не состоятельны, а исключительно вследствие трудностей их технической реализации. Почти пятнадцать лет попыток моделирования разума человека привели меня лишь к ответу на вопрос "Что такое интеллект?", но существенно не приблизили к созданию его модели. Нейроноподобная семантическая сеть с переменной активностью элементов связей и с СУТ кажется наилучшим аналогом коры мозга, но размеры ее жестко ограничены сложностью воспроизведения, элементарные поведенческие реакции, полученные на описанных моделях, весьма далеки от человеческих и ничего не могут доказать. В самом деле, разве несколько сот элементов нашей сети могут заменить 10 миллиардов нейронов мозга? Если к этому прибавить, что каждая нервная клетка представляет собой функциональную систему из многих тысяч макромолекул, что она имеет несколько сот "входов" и может участвовать в работе различных клеточных ансамблей, давая почти астрономическое число моделей, то разве можно все это воспроизвести? К этому нужно добавить самоорганизацию в виде избирательной тренировки "входов" - синапсов, обеспечивающих память, и тренировку "выхода", резко повышающую активность нейрона. Нервная система - не просто сеть из одинаковых элементов. В ней имеется начальная структура связей и клеток с разной активностью, обеспечивающих врожденные рефлексы, чувства, программу доминирования. Тренируемость клеток и связей позволяет развивать и адаптировать врожденные реакции и наслаивать на них иерархию функциональных актов различных уровней обобщения и содержания. Все это, вместе взятое, дает человеческий разум - изумительное произведение природы, которое, раз возникнув, открыло в мозге новые возможности.
После такой характеристики сложности и возможностей мозга задача его воспроизведения в модели кажется безнадежной. Трудно представить себе искусственную сеть из десятка миллиардов элементарных усилителей, каждый из которых может иметь сотни входов, обладает способностью к тренировке - то есть изменению характеристик. Трудно, но не безнадежно. В отличие от длительной естественной эволюции прогресс науки и техники стремителен и все более ускоряется. Поэтому в перспективе возможна и аналоговая сеть, сравнимая по мощности с мозгом. Важно правильно поставить задачу - в данном случае сказать, какими должны быть элементы и как их соединять друг с другом. Пожалуй, еще важнее представить алгоритм интеллекта в достаточно обобщенном виде, позволяющем реализовать его различными средствами.
Велики технологические трудности на пути до аналогового интеллекта. Поэтому так заманчивы универсальные цифровые машины, которые уже теперь достигли большой мощности. Совершенствуется их внешняя память и растет объем оперативной памяти. Быстродействие исчисляется миллионами операций в секунду. Разделение времени и создание параллельных программ позволяют повысить эффективность компьютеров. Создается впечатление, что возможности ЦВМ еще не достаточно использованы для реализации алгоритма интеллекта. То обстоятельство, что до сих пор наши попытки создания СИ не увенчались успехом, еще не означает, что исследования закончены. Нужно сохранить обобщенный алгоритм, но отказаться от сети с тем, чтобы уменьшить объем расчетов. Однако при этом следует лишь в минимальной мере поступиться принципами. Мы решили предпринять такую попытку - создать алгоритмическую модель интеллекта. Соображения к ее проекту будут представлены в заключительной части книги. А пока перейдем к изложению идей, положенных в основу этой модели.
ОСНОВНЫЕ ЭТАПЫ И НАПРАВЛЕНИЯ ИССЛЕДОВАНИЙ
Не буду даже пытаться охватить всю проблему искусственного интеллекта. Книга задумана как изложение собственной гипотезы об общих механизмах или алгоритмах интеллекта, которым равно подчиняются разум животных, человека, коллективный разум общества и которые, как мне кажется, обязательны для любой его модели.
Искусственный интеллект стал особой областью знания. Существуют специальные комитеты, координирующие исследования по этой проблематике, издается несколько журналов, созываются международные конференции. С одной стороны, предмет этих исследований примыкает к теоретической кибернетике, с другой - к технике автоматов и роботов, есть и психофизиологический аспект проблемы. Одно скажу сразу: искусственный интеллект не создан. Векселя, которые выдала кибернетика в начале своего развития, претендуя на решение почти всех интеллектуальных задач, остались неоплаченными. Более того - наметился явный пессимизм во взглядах на саму возможность воспроизвести разум человека. Сошлюсь на книги Дрейфуса. Тем не менее большинство ученых-кибернетиков смотрит в будущее с надеждой, хотя теории интеллекта пока нет и все предлагаемые модели представляют собой воспроизведение частных механизмов мышления. Для того чтобы дать представление о состоянии дела, приведу очень краткую сводку работ последнего времени.
С самого начала основные надежды кибернетики были связаны с моделированием работы мозга. Было ясно, что здесь можно идти двумя путями - моделировать нейронные сети и воспроизводить алгоритмы мышления.
Лучшие результаты по моделированию нейронных сетей были получены в работах школы У.Мак-Каллоха. Выяснилось, однако, что сети из формальных нейронов не способны воспроизводить сложные функции мозга. Неэффективными оказались также попытки использовать такие сети для управления роботами. Большой интерес вызвали работы Ф.Розенблата, который сформулировал ряд принципов нейродинамики мозга и использовал их для построения персептронов - устройств для распознавания образов. Однако строгий анализ, осуществленный М.Минским и С.Пейпертом, показал ограниченность существующих здесь возможностей. Таким образом, к началу 70-х гг. общий кризис нейронного подхода стал очевидным.
Одновременно проводились исследования по алгоритмическому моделированию мышления. Оcновные достижения в этой области связаны с именами А.Ньюэла и Г.Саймона. Их работы по созданию GPS (общего решателя проблем) привели к формированию отдельного направления - эвристического программирования, влияние которого на исследования по ИИ прослеживается до сих пор. Однако в целом это направление исчерпало свои возможности уже к началу текущего десятилетия. При этом выяснилось, что оно не позволяет приблизиться к сколько-нибудь общей теории мышления, хотя и может обеспечить решение отдельных прикладных задач.
Кризис обоих направлений привлек внимание к работам, начатым еще в 50-е гг. и связанным с использованием формальных методов для решения сложных, "интеллектуальных" задач (доказательство теорем, игры и т.п.). К этому времени здесь был получен ряд интересных результатов. Среди них следует отметить разработку А.Сэмюэлем программы для игры в шашки, которая до сих пор является одной из лучших игровых программ. Работы этого направления и составили основу нового раздела кибернетики, который занимается проблемой искусственного интеллекта.
В начале 70-х гг. на исследования по ИИ оказывали большое влияние результаты, полученные в области математической логики Дж.Робинсоном. Развитый им метод резольвенций позволил строить мощные процедуры доказательства теорем. Это было использовано для построения нового класса программ, решающих сложные задачи. Наибольшую известность среди них получила разработанная в Стенфордском исследовательском институте программа STRIPS, решающая задачи планирования действий робота. Методы математической логики составили также основу теории поиска решений, главные положения которой обобщены в работах Н.Нильсона. Однако использование этих методов для широкого круга задач показало их низкую эффективность, обусловленную в основном большим объемом и громоздкостью соответствующих программ для ЦВМ. Так что к 1975г. наметилось разочарование и в этом подходе.
Попытки преодолеть трудности, сопутствующие разработке больших программ, привели к появлению новых методов автоматизации программирования и созданию специальных проблемно-ориентированных языков. Большие достижения здесь связаны с работами К.Хьюитта по построению языка PLANNER, который послужил основой для целого ряда дальнейших разработок в этом направлении.
Использование новых языков программирования обеспечило прогресс в сравнительно новой для ИИ области - имитации речевого поведения человека. Первые значительные успехи здесь были получены Т.Виноградом, разработавшим систему диалогового управления роботом с помощью естественного языка. Начиная с 1973-1975гг. проблемы естественной речи привлекают все большее число исследователей. Разрабатываются проблемы понимания, представления знаний, грамматического анализа и др. Проблема понимания активно исследуется также и в другой области ИИ - распознавания зрительных образов. Широко известны работы М.Минского, развивающего теперь новую теоретическую концепцию восприятия, связанную с представлениями о "системах фреймов".
В целом в последние годы опять намечается тенденция к использованию в программах ИИ знаний о поведении и мышлении человека, хотя сама задача моделирования человека прямо не ставится.
Меня больше всего интересует как раз эта задача - моделирование человека. Естественно было бы обратиться к нейрофизиологии и психологии. Именно эти науки должны описать физиологические механизмы психических явлений и дать рекомендации по их моделированию. Возможно, работающим здесь ученым кажется, что они знают, как мыслят животные и человек, но я не мог уяснить этого из их книг. Не нашел я и возможности переложить их словесные формулировки на цифровые модели. Впрочем, и другие кибернетики тоже не смогли перевести физиологию мозга в модели.
Разумеется, никто не будет отрицать, что именно нейрофизиологам принадлежат основополагающие открытия, благодаря которым стали возможными попытки строить модели. Перечислю несколько основных.
Первое - учение И.М.Сеченова о возбуждении и торможении. Разный уровень активности нейрона - от полного "молчания" до максимального возбуждения - это важнейший механизм взаимодействия моделей. Открытие И.П.Павловым условных рефлексов и условных связей дало объяснение обучаемости и самоорганизации. Учение А.А.Ухтомского о доминанте позволяет предположить механизм превалирования главной модели над всеми остальными. Если к этому добавить работы о ретикулярной формации, то, вместе взятые, они подсказали идею центрального регулирования активности коры - систему усиления-торможения (СУТ) и механизм сознания и подсознания. 3.Фрейд достаточно обосновал большое значение подсознания в психической жизни человека. Опыты X.Дельгадо и Н.П.Бехтеревой со вживленными электродами показали, как центры чувств управляют поведением, являясь источниками активности для моделей коры. Наконец, исследования Н.П.Бехтеревой и др. обнаружили так называемый "код слов", то есть наличие самих моделей слов речи, которые, видимо, запечатлены в нескольких или даже многих ансамблях нейронов. Следует также упомянуть П.К.Анохина, предложившего общие принципы управления физиологическими процессами.
Простое перечисление основных идей нейрофизиологии показывает, что наша гипотеза об алгоритме интеллекта является лишь одним из возможных вариантов их компоновки в единое целое. Это сделано для того, чтобы попытаться применить метод эвристического моделирования для изучения мышления и поведения. Если нейрофизиология идет к психике "снизу" путем анализа, от механизмов нейронов и их ансамблей, то кибернетическое моделирование идет "сверху", путем синтеза. Мне представляется, что второй подход имеет право на научность. Не уверен, что модели уже сейчас предложат физиологии новые идеи для экспериментов, но для создания искусственного интеллекта они дадут достаточно материала. К сожалению, попытки заинтересовать моделями физиологов и психологов пока терпят неудачу. Они кажутся им слишком примитивными в сравнении с огромной сложностью мозга. Что ж, против этого пока нечего возразить. Нужны более доказательные модели, способные продемонстрировать как можно больше феноменов поведения человека. Именно к этой цели и направлены работы отдела биокибернетики Института кибернетики АН УССР. Приведу их краткую историю.
НЕКОТОРЫЕ РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ СЕТЕВОГО ИНТЕЛЛЕКТА
В 1963-1964гг. мною был сформулирован первый вариант гипотезы о механизмах мышления в обобщенном виде. В 1965г. эта гипотеза была опубликована в книге "Моделирование мышления и психики". Два года спустя книгу переиздали в США. Последующее развитие идей нашло отражение в монографии "Искусственный разум", напечатанной в 1969г.
Модели, реализованные на ЦВМ. В 1963г. мы начали серию работ по созданию моделей интеллекта, построенных на принципе семантических сетей с СУТ. Такие сети были названы термином "М-сети", а модели, построенные на них,- "М-автоматами". В последующие годы создавались новые варианты моделей, однако все они основывались на использовании сетевого интеллекта с СУТ. Принцип его действия уже был описан: М-сеть представляет собой систему элементарных моделей (i-модели), каждой придано определенное значение, например модель - объект среды, модель действия, чувства, отношения и др. Модели имеют статические и динамические характеристики, в которых отражена величина уровня активности и зависимости от времени и "входных" раздражителей - то есть от величины некоей энергии, поступающей по связям с других моделей или от рецепторов. У первых моделей связи задавались жестко, у последующих проходимость связей менялась в зависимости от использования - тренировки. Это же относится к характеристикам возбуждения i-моделей. Исследование модели состоит в пересчете на ЦВМ уровня активности всех элементарных моделей за условный такт времени. СУТ выбирает одну, самую активную модель и еще дополнительно ее усиливает согласно своим характеристикам, а ВСЕ остальные тормозит. "Входами" М-автомата являются внешние объекты, "выходами" - его действия, направленные на среду. Все это типично для СИ.
Первая модель - РЭМ отображала условный сюжет путешествия некоего "искусственного субъекта" в среде, которая содержала полезные и опасные для него объекты. Мотивы поведения субъекта определялись ощущениями усталости, голода и стремлением к самосохранению. Субъект изучал среду, выбирал цель движения, строил план достижения этой цели и затем реализовал его, выполняя действия-шаги, сравнивая результаты, получаемые в ходе движения, с запланированными, дополняя и корректируя план в зависимости от складывающихся ситуаций.
М-сеть РЭМа содержала 90 i-моделей, около 400 связей и была способна воспринимать три типа объектов (входных параметров). Среда могла содержать до 400 объектов, произвольно расположенных на плоскости. РЭМ выполнял восемь действий и был построен как неполный М-автомат, иными словами, кроме М-сети с заданной на ней СУТ, он содержал функционирующие сопряженно с М-сетью алгоритмические структуры. Большинство из них осуществляло функции планирования. РЭМ был реализован в виде комплекса программ для ЦВМ М-220. Программы содержали свыше 3000 рабочих команд. Время просчета одного такта функционирования М-сети (единицы автоматного времени) - 1.5мин. В течение каждого такта производился расчет величин возбуждений и параметров характеристик всех i-моделей, а также параметров всех связей М-сети (эта процедура названа пересчетом). Последовательность операций, производимых за один такт, такова: восприятие информации из внешней среды, пересчет, выбор СУТ наиболее возбужденной i-модели, принятие на основании полученной информации решения о взаимодействии со средой, выполнение этого решения. Эксперименты с РЭМом включали просчеты его состояний и регистрацию решений на протяжении 10-20 тактов.
Результаты исследования РЭМа показали перспективность использования М-сетей как при построении моделей процессов мышления, так и при разработке систем типа "искусственный разум", способных к самостоятельному эффективному функционированию в сложных условиях. Выяснилась также целесообразность дальнейшего проведения работ по изучению возможностей аппарата при построении более мощных моделей, а также исследования весьма важного в практическом и теоретическом отношениях вопроса об адаптивных возможностях М-автоматов.
Затем была построена и исследована новая модель - МОД. При его создании сохранялись как общая схема постановки задачи, так и принципиальная структура выбранного ранее условного сюжета моделирования. МОД также был разработан в виде неполного М-автомата. При этом его алгоритмическая часть отображала процессы планирования, связанные с предварительной организацией движения, а структурная - процессы принятия решений в ходе непосредственного взаимодействия со средой. Обе части целесообразно рассматривать как независимые модели мыслительных процессов, между которыми может быть организовано постоянное взаимодействие. Эти модели названы соответственно МОД-1 и МОД-2.
МОД-1 вырабатывал план деятельности М-автомата в среде в виде совокупности подцелей движения, основной цели и ожидаемых (предвидимых) состояний автомата в ходе движения. Алгоритмы восприятия внешней информации в МОД-1 моделировали процессы зрительного восприятия человека, построения возможных вариантов плана, их оценки, синтеза окончательного варианта, его разбиения на отдельные этапы, выбора объектов-ориентиров для каждого из этапов, моделировали процессы принятия решения человеком в условиях отсутствия полной информации о среде.
МОД-1 являлся неполным М-автоматом, основной объем его функций реализовался алгоритмическими структурами. М-сеть здесь содержала 62 i-модели, около 1000 связей и использовалась в основном для представления мотивационной сферы модели. МОД-1 был реализован в виде комплекса программ для ЦВМ М-220. Программы включали до 15000 команд, их просчет занимал 20-30мин. машинного времени. Среда модели могла содержать до 625 объектов (это максимальное число). Каждый из объектов задавался упорядоченным набором из 8-10 признаков (входных воздействий). Выходом модели являлся оптимальный план передвижений в среде. В среднем такой план мог состоять из 30 элементов (целей, подцелей и ожидаемых отклонений внутренних состояний).
М-автомат МОД-2 вырабатывал конкретные реализации планов, построенных МОД-1. Его основная особенность связана с реализацией на М-сети программ самообучения. Последнее осуществлялось путем изменения веса первоначально заданных связей, установления новых связей и порождения новых узлов М-сети. Протекание процессов изменения структуры сети определялось особенностями среды, в которой действовал автомат, соотнесенными с поставленными перед ним задачами. Задачи могли формулироваться, например, в следующем виде: действовать так, чтобы обеспечить максимальное значение оценки "собственного комфорта", максимальное соответствие внешних и внутренних реакций автомата реакциям моделируемого объекта или быстрейшее достижение цели. Возможны были и комбинированные задачи.
Автомат может рассматриваться как модель деятельности человека по принятию решений в задачах движения в лабиринте. Кроме того, МОД-2 может быть использован в качестве устройства, управляющего передвижением технических систем, предназначенных для сбора информации, транспортировки и т.п. В зависимости от цели использования автомата изменяется и критерий оценки эффективности его функционирования.
МОД-2 - полный М-автомат. Его М-сеть может содержать до 400 i-моделей и до 2000 связей. На М-сети задана двухуровневая СУТ. МОД-2 был реализован в виде программы для ЦВМ БЭСМ-6. Программа содержала около 6000 команд. Время просчета одного такта 30-50 сек. Экспериментально были исследованы реакции автомата на протяжении до 300 тактов. На входы автомата подавалась информация о плане движения и об объектах среды, каждый из которых относится к одному из шести возможных типов. Всего среда могла содержать до 400 расположенных произвольным образом объектов. Предварительная информация о некоторых характеристиках среды и структуре оценочных функций задавалась в процессе начальной организации М-сети автомата. Количество выполняемых МОД-2 действий (выходных параметров или решений) - 22. Из них 17 - различного рода действия - шаги, перемещающие автомат в среде, а 5 - "активные" действия, изменяющие состояние среды или автомата ("есть", "спать", "нести объект", "бросить объект", "создать убежище"). Поведение автомата состояло в формировании последовательностей решений о выполнении тех или иных действий и соответственно их фактическим выполнением. Были разработаны оценки поведения и предложены процедуры оптимизации автомата. Оптимизация выполнялась варьированием значений шести параметров обучения.
В ходе исследования МОД-2 был решен ряд вспомогательных задач-тестов. Представляет самостоятельный интерес результат одной из таких задач, связанной с моделированием процессов формирования понятий человеком. Здесь показана приводимость М-автомата к формам, моделирующим как индивидуальное, так и обобщенное групповое поведение. Были продемонстрированы методы такого приведения.
Модель механизмов речи. Одновременно с разработкой МОДа проводилось исследование, цель которого состояла в том, чтобы изучить возможности М-сетей в области нейрофизиологии и нейропсихологии, а также оценить практическую и познавательную важность таких моделей. Был разработан и исследован М-автомат, моделирующий механизмы речи. В модели представлены такие аспекты устной речи, как восприятие, осмысливание, словесное выражение. Преимущественное внимание уделялось содержательной стороне процессов переработки словесной информации. Модель предназначена для воспроизведения относительно простых речевых функций - ответов на вопросы ограниченного типа, повторения, называния. Она содержит следующие блоки: слуховых восприятий, сенсорный речевой, проприоцептивный речевой, понятийный, эмоций, мотивационный, двигательный речевой, артикуляторный и блок СУТ. Блоки модели соотнесены с определенными мозговыми образованиями. При задании организации М-сети использовались данные нейроморфологии, нейрофизиологии и клинической неврологии.
Модель представлена в виде необучающегося полного М-автомата. Его М-сеть содержит более 1000 i-моделей и 8000 связей между ними. М-автомат реализован в виде программы для ЦВМ БЭСМ-6, содержащей около 500 команд. Время просчета одного такта - 2 сек. В экспериментах наблюдалось поведение модели на протяжении до 100 тактов. На вход модели подавались буквы русского алфавита, объединенные в слова и фразы, а также специальные объекты, соответствующие образам предметов. На выходе модели, в зависимости от режима ее работы, наблюдались последовательности букв русского алфавита, которые были либо ответами на входные вопросы, либо повторением входных слов, либо названиями предметов. То обстоятельство, что при создании модели широко использовались данные нейрофизиологии, позволило в экспериментах имитировать ряд поражений мозга органического и функционального характера, приводящих к нарушениям функций речи. В частности, получены модельные отображения синдромов сенсорной, моторной, проводниковой и транскортикальной афазий.
Описанные М-автоматы составляют основной фонд "больших" моделей, разработанных и исследованных в процессе изучения возможностей и практических методов использования М-сетей.
Нами были выполнены и некоторые модельные разработки, в которых аппарат М-сетей использовался эпизодически или в модифицированном виде. Анализ результатов, полученных в разработках такого рода, может представлять серьезный интерес при оценке возможностей и свойств обсуждаемого нами аппарата.
Весь опыт моделирования поведения "разумного субъекта" в некоей среде - "лабиринте" - с использованием М-сети и расчетами на ЦВМ подытожен в монографии. В качестве примера на рис.3 приведены результаты одного из экспериментов по исследованию поведения такого "субъекта".
Рис.3. Схема движений и действий МОДа по карте.
Семь-восемь лет мы занимались созданием сетевых моделей на ЦВМ, пока не убедились, что возможности таких моделей ограничены. Объем расчетов оказался слишком большим даже для компьютера: за один такт нужно пересчитать циркуляцию "энергии" по всем связям и изменения в их проходимости, подсчитать активность всех элементарных моделей, пересчитать изменение их тренированности для следующего такта. Если же предусмотреть и возможность образования новых связей и новых моделей, иными словами, воспроизвести принцип самоорганизации, то количество счетной работы будет расти подобно снежному кому. Затраты машинного времени увеличиваются приблизительно пропорционально кубу числа моделей в сети. Но дело не только в расчетах - так же трудно оказалось отладить громоздкие программы. Так или иначе, выйти за предел 1000 моделей и 8000 связей нам не удалось. Формально мы воспроизвели в МОД самые простые программы психики, такие, как сознание и подсознание, оптимизация действий по многим критериям - чувствам с предвидением и планированием. Была продемонстрирована разная обобщенность или иерархия моделей, обучение, забывание и даже различия характера. Но в целом этот "субъект", путешествующий среди врагов и препятствий в поисках пищи, соответствовал лишь довольно примитивному животному.
АНАЛОГОВЫЕ МОДЕЛИ. РОБОТЫ. Тем не менее существует много задач, для которых вполне достаточен и такой ограниченный интеллект. В частности - для роботов, предназначенных для специализированной деятельности. Важнейшим требованием для них должна быть автономность, независимость от ЦВМ, что привело к реализации сетевого интеллекта на физических элементах. Идея сама по себе проста: представить каждую элементарную модель в виде усилителя, на вход которого поступает потенциал от других моделей, а на выходе формируется усиленный потенциал, который тоже передается по связям и гасится пропорционально их сопротивлению. Из таких элементов-усилителей можно создать любую сеть, если каждому придать определенное значение - семантику. Одни элементы - модели предметов, другие - чувств и т.д., как в сетевых моделях РЭМ и МОД. Разные характеристики усилителей и разные сопротивления связей позволяют создать структуры любого назначения. Модель интеллекта на физических элементах в наибольшей мере приближается к имитации мозга. К сожалению, есть разница: несоизмеримо мало число элементов и связей. Однако сложность такого интеллекта целиком определяется технологией. Можно создать довольно большие сети, во всяком случае достаточные для робота.
В 1972г. были начаты работы по созданию модели ИИ в виде сети из физических элементов. Цель их - построить систему управления в виде М-сети с системой усиления-торможения (СУТ) и разместить ее на тележке.
Прежде чем приступить к разработке макета, были проверены возможности сети из физических элементов с СУТ. Первая сеть содержала 26 узлов и около 300 связей и управляла перемещением писчика по условной среде, изображенной на карте. Результаты экспериментальных исследований этой системы оказались обнадеживающими. Тогда приступили к созданию транспортного робота - ТАИРа.
Конструктивно разрабатываемый макет робота представляет собой трехколесное шасси, на котором смонтированы комплект рецепторов (органов чувств), блок управления, энергосистема и прочие устройства. Размер шасси 1600*1100*600 мм. Все три колеса являются ведущими и имеют автономный привод от электродвигателей мощностью по 30Вт. Переднее колесо поворотное. Питание электродвигателей осуществляется от аккумуляторных батарей. Скорость движения по ровной поверхности составляет 10-12м/мин.
Датчики-рецепторы можно разбить на несколько групп.
1. Датчики, определяющие положение робота в пространстве:
а) навигационная система с компасом и двумя радиомаяками;
б) датчики углов наклона тележки в двух плоскостях.
2. Датчики информации об окружающей среде:
а) дистантные. Активный оптический дальномер с радиусом действия до 10м. Система оптических датчиков близости с диапазоном расстояний до 30см;
б) контактные датчики - система микровыключателей, установленных на гибком чехле, в который заключена тележка.
3. Датчики состояний робота:
а) термодатчики на электродвигателях;
б) датчики крутящего момента на приводах к колесам;
в) датчики напряжения на аккумуляторных батареях;
г) вибродатчик.
4. Датчик времени.
Основу системы управления представляет физически реализованная М-сеть. Специфическая СУТ в М-сети задает положительную обратную связь по возбуждениям узлов и обеспечивает тем самым доминирование в каждый момент времени одного или нескольких узлов над всеми другими. Ввод и вывод информации в М-сети соответствуют возбуждению определенных ее узлов (входных и выходных).
В настоящее время система управления роботом предполагает осуществление целенаправленного движения с обеспечением собственной безопасности (объезд препятствий, избегание опасных мест, поддержание внутренних параметров в заданных пределах) и минимизацию временных и энергетических затрат. Вся сеть, состоящая из 100 узлов, разбита на шесть сфер.
Сферы оценок и распознавания ситуаций являются входными. Аналогично сенсорным системам мозга человека здесь осуществляется анализ воспринятой датчиками информации, на основе которого выполняется интегральная оценка среды, условий задачи и собственных состояний.
Выбор характера поведения в текущей ситуации производится в сфере решений. При этом может быть принято решение, определяющее направление движения, осуществление какого-то сложного маневра или даже выполнение некоторого элементарного действия.
Организация самого двигательного поведения осуществляется тремя сферами, являющимися выходными для сети,- сферами маневров высшего уровня, маневров нижнего уровня и элементарных действий. Здесь формируется последовательность команд, поступающих к эффекторной системе - системе управления поворотным и тяговыми электродвигателями.
Все узлы сети (i-модели) представляют собой усилители постоянного тока со специальными характеристиками. Узлы каждой из выделенных сфер имеют свои определенные характеристики. Точно так же в каждой сфере действует своя СУТ. Связи между узлами выполнены из резистивных элементов в устройстве матричного типа. Для ввода информации от датчиков в сетевое устройство управления используется 60 каналов.
Рис. 4. Внешний вид ТАИРа.
Внешний вид ТАИРа представлен на рис.4. В настоящее время мы продолжаем работы по созданию новых систем управления роботами. Эти системы пока не претендуют на достижение высокого уровня интеллекта. Правда, для ограниченных целей нейроноподоб-ная семантическая сеть на физических элементах с СУТ хорошо себя зарекомендовала и привлекла внимание исследователей и конструкторов, которые думают об автономных роботах. Планы отдела биокибернетики по совершенствованию автоматов предполагают реализовать обучение, создать ансамблевую организацию из элементов, позволяющую резко увеличить количество моделей при том же числе элементов, улучшить зрительное восприятие среды и даже дойти до человеческой речи. Я не уверен, что эти планы воплотятся в металл достаточно скоро, не потому, что идеи не состоятельны, а исключительно вследствие трудностей их технической реализации. Почти пятнадцать лет попыток моделирования разума человека привели меня лишь к ответу на вопрос "Что такое интеллект?", но существенно не приблизили к созданию его модели. Нейроноподобная семантическая сеть с переменной активностью элементов связей и с СУТ кажется наилучшим аналогом коры мозга, но размеры ее жестко ограничены сложностью воспроизведения, элементарные поведенческие реакции, полученные на описанных моделях, весьма далеки от человеческих и ничего не могут доказать. В самом деле, разве несколько сот элементов нашей сети могут заменить 10 миллиардов нейронов мозга? Если к этому прибавить, что каждая нервная клетка представляет собой функциональную систему из многих тысяч макромолекул, что она имеет несколько сот "входов" и может участвовать в работе различных клеточных ансамблей, давая почти астрономическое число моделей, то разве можно все это воспроизвести? К этому нужно добавить самоорганизацию в виде избирательной тренировки "входов" - синапсов, обеспечивающих память, и тренировку "выхода", резко повышающую активность нейрона. Нервная система - не просто сеть из одинаковых элементов. В ней имеется начальная структура связей и клеток с разной активностью, обеспечивающих врожденные рефлексы, чувства, программу доминирования. Тренируемость клеток и связей позволяет развивать и адаптировать врожденные реакции и наслаивать на них иерархию функциональных актов различных уровней обобщения и содержания. Все это, вместе взятое, дает человеческий разум - изумительное произведение природы, которое, раз возникнув, открыло в мозге новые возможности.
После такой характеристики сложности и возможностей мозга задача его воспроизведения в модели кажется безнадежной. Трудно представить себе искусственную сеть из десятка миллиардов элементарных усилителей, каждый из которых может иметь сотни входов, обладает способностью к тренировке - то есть изменению характеристик. Трудно, но не безнадежно. В отличие от длительной естественной эволюции прогресс науки и техники стремителен и все более ускоряется. Поэтому в перспективе возможна и аналоговая сеть, сравнимая по мощности с мозгом. Важно правильно поставить задачу - в данном случае сказать, какими должны быть элементы и как их соединять друг с другом. Пожалуй, еще важнее представить алгоритм интеллекта в достаточно обобщенном виде, позволяющем реализовать его различными средствами.
Велики технологические трудности на пути до аналогового интеллекта. Поэтому так заманчивы универсальные цифровые машины, которые уже теперь достигли большой мощности. Совершенствуется их внешняя память и растет объем оперативной памяти. Быстродействие исчисляется миллионами операций в секунду. Разделение времени и создание параллельных программ позволяют повысить эффективность компьютеров. Создается впечатление, что возможности ЦВМ еще не достаточно использованы для реализации алгоритма интеллекта. То обстоятельство, что до сих пор наши попытки создания СИ не увенчались успехом, еще не означает, что исследования закончены. Нужно сохранить обобщенный алгоритм, но отказаться от сети с тем, чтобы уменьшить объем расчетов. Однако при этом следует лишь в минимальной мере поступиться принципами. Мы решили предпринять такую попытку - создать алгоритмическую модель интеллекта. Соображения к ее проекту будут представлены в заключительной части книги. А пока перейдем к изложению идей, положенных в основу этой модели.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
СИСТЕМЫ И МОДЕЛИ
Современный этап развития науки ознаменован достижением принципиальной важности: вычислительные машины дали возможность овладеть сложностью. Все значение этого достижения как раз и состоит в том, что появилась надежда на создание количественных моделей, приближающихся по сложности к биологическим системам. Возможно, что при разработке таких моделей недостаточно внимания уделяется значению пространственных структур объектов, хотя наблюдения природы указывают на их исключительную роль (вспомним двойную спираль молекулы ДНК).
Весь физический мир можно свести к пространственным структурам, состоящим из атомов и молекул, а также к действующим между ними силам, связывающим материальные частицы в комплексы, которые условно можно назвать "телами". Общеизвестно, что все объекты в мире взаимосвязаны, однако степень прочности этих связей весьма различна: от жестких связей внутри твердых тел до гравитационных и электромагнитных сил, лишь ограничивающих пространственную свободу частиц. Пространство, энергия и время - вот самые общие координаты частиц и тел. Еще недавно казалось, что энергетические и материальные взаимоотношения между частицами и телами достаточно объясняют мир. Но вот появилось понятие информации и понятие сигнала как носителя информации, и это поколебало представления об исключительно энергетическом и материальном характере балансов отношений между объектами. Сигнал, несущий ничтожное количество энергии, может вызвать огромные вещественные и энергетические пертурбации в сложной системе, на которую он направлен (пример - атомная война).
Рис.5. Схемы простых систем - закрытой и открытой. Между элементами происходит обмен энергией Эн и веществом В.
Сложность структурных и энергетических отношений стала самостоятельным и значимым понятием, без учета которого уже невозможно объяснить мир. Понятие системы тоже более или менее определилось: это пространственная структура из неких элементов, объединенных внутренними "силами" настолько прочно, что она выступает как единое целое, противопоставленное всем другим объектам. Системы зависят друг от друга в обмене энергией и веществом, но в меньшей степени, чем элементы внутри них (рис.5). Хотелось бы дать количественное понятие системы, но очень нелегко установить, когда простое сочетание взаимодействующих элементов уже становится системой. Степень "зрелости" системы условно можно определить по степени зависимости ее элементов друг от друга: сколько времени они могут "самостоятельно прожить", не распадаясь на более простые частицы, если их отделить от системы. В связи с этим понятие элемента системы тоже не просто - в конце концов все объекты разложимы до элементарных частиц. Мне кажется, что элементом системы нужно считать некое более простое образование, уже обладающее чертами данной системы. Если взять живые биологические объекты, то можно перечислить иерархические ступени их сложности: элементарные частицы, атомы, молекулы, макромолекулы (ДНК, белки), клетки, органы, организмы, сообщества, биоценозы... Каждый уровень сам по себе достаточно сложен по структуре, чтобы претендовать на звание "сложности", но все-таки, какие из них допустимо считать сложными, какие отнести к простым, какие признать лишь элементами сложных? Без условности здесь не обойтись.
Рис.6. Схема сложной системы: Рц - рецептор; Эн - энергия; В - вещество.
СЛОЖНЫЕ СИСТЕМЫ
Будем считать сложными такие системы, в которых между элементами циркулируют не только частицы вещества и энергии, но и сигналы (рис.6). В структуре сложных систем можно условно выделить рабочие подсистемы, ведающие преобразованиями вещества и энергии, и управляющие, которые воздействуют на рабочие с помощью сигналов. Хотя сигнал тоже имеет физическую, то есть вещественную и энергетическую, природу, но дело не в ней, а в характере сигнала, то есть его временной структуре и, особенно, месте приложения к управляемому объекту - в данном случае к рабочей подсистеме. При таких условиях - обязательность наличия управляющих сигналов и рабочих подсистем - грань сложных систем проходит на уровне одноклеточных существ: их управляющим органом является генетический аппарат ДНК, рабочими подсистемами - органеллы клетки (оболочка, митохондрии, лизосомы и др.). Роль сигналов выполняют информационные РНК. Макромолекулы - белки и нуклеиновые кислоты - достаточно сложны по структуре, но не удовлетворяют требованиям, предъявляемым к сложной системе. На более высоких уровнях иерархии систем эти условия соблюдены. Например, в организме органами управления являются нервная и эндокринная системы, сигналами - молекулы гормонов и медиаторов (передатчики нервных импульсов). Сообщество животных не всегда становится сложной системой. Только у высших млекопитающих и птиц есть внутренняя организация в стае и система управляющих сигналов, и только у человека эта система приобретает достаточную "зрелость". В обществе легко обнаружить структуры, аналогичные рабочим и управляющим подсистемам, в нем циркулируют многочисленные и разнообразные сигналы. Иерархия сложных систем представлена на рис.7.
Рис.7. Иерархия сложных систем.
Элементом сложной системы каждого уровня являются системы предыдущего уровня, в которых уже заложены некоторые качества высшей системы. Для организма - это клетки, для общества - люди. Элементом клетки являются макромолекулы. Они способны воспроизводить себя лишь при наличии ферментов, действующих извне. Именно поэтому макромолекулу нельзя считать сложной системой. Скачок от молекулы до клетки очень велик - этим определяются трудности объяснения возникновения жизни на Земле. На других, высших уровнях такие качественные скачки менее выражены. Клетки многоклеточных, будучи отделены от тела, способны еще некоторое время жить, так же как и отбившиеся от стаи животные. А уровень "зрелости" такой системы, как человеческое общество, возрастает буквально на наших глазах. Еще пять-десять поколений тому назад, когда преобладало натуральное хозяйство, большинство людей было способно существовать в условиях весьма ограниченных связей с обществом. Теперь же брошенный в лесу человек может погибнуть через несколько дней.
Самое общее качество сложных систем "типа живых" - способность к поддержанию своей целостности и к противодействию разрушающим влияниям окружающей среды. Однако оно не беспредельно, поэтому необходимо другое качество, более сложное в своем структурном выражении,- способность к воспроизведению самих себя. Еще более сложным качеством является способность к усложнению в процессе воспроизведения. В живой природе это выражается изменчивостью. В человеческом обществе усложнение структуры и функции наблюдается постоянно и является следствием феномена творчества и труда, отсутствующих в стае животных.
Принцип структурности предполагает, что для реализации всех этих качеств должны быть соответствующие структуры. Нужна структура для постоянного возобновления своих разрушающихся частей и для утилизации с этой целью энергии среды, нужны структуры для размножения и структурное выражение программы их "удвоения" и, наконец, необходимы некоторые структурные возможности для наращивания новых структур, то есть для усложнения. Более того, должны быть структуры, отражающие внешний мир, поскольку на него замыкается реализация программ, которые являются выражением названных "способностей". Программа творчества тоже требует структурного выражения.
МОДЕЛИ
Существует хороший термин для обозначения структуры, отражающей другую структуру. Этот термин - модель; у каждого из нас есть его интуитивное понимание. Модель отражает объект не полностью, а с упрощениями и искажениями - в зависимости от того, для какой цели она предназначена и какие есть возможности для ее построения.
Органы управления сложных систем "типа живых" содержат в себе модели и программы (иными словами, тоже структуры), управляющие рабочими подсистемами в соответствии с этими моделями. Программа - это "считывание" модели сигналами, которые регулируют потоки энергии и вещества между элементами системы.
Как объяснить, что сравнительно простая структура - модель в ДНК зародышевой клетки человека - может отразить всю сложность самого человека с его разнообразием клеток и всеми человеческими качествами? Для того чтобы из яйцеклетки вырос человек, нужно извне получить массу сложных веществ ("кирпичиков"), а модель должна только предусмотреть, как сложить из них "здание". Само "складывание" состоит в значительной мере в повторении одинаковых операций. В ДНК заложены структуры всех белков организма и порядок, в каком следует "считывать" их при построении органов. Заложены и обратные связи, отмечающие выполнение этапов формирования организма. Следовательно, принцип управления по модели не исключает возможности построения более сложной, чем сама модель, системы, поскольку в модели должен быть предусмотрен лишь порядок включения структур, получаемых извне.
Мы привыкли к статическим моделям: игрушка, чертеж, текст - все это чистая структура. Основу моделей в органах управления сложных систем тоже составляют структуры: ДНК, сети нейронов в центральной нервной системе. Несомненна избыточность этих структур - например в каждой клетке имеется полный набор генов, достаточный для построения целого организма. Для реализации управления нужна программа "считывания" структур сигналами, а для этого - активация определенных частей модели. Таким образом, важна не только структура, но и активность, энергия различных элементов модели. Понятие активности тоже можно свести к изменению структур, только на уровне более низком, например в молекулах, атомах, составляющих структуру. Сам сигнал представляет собой такую "активированную порцию структуры". Пример - информационная РНК или активность синапса на теле нервной клетки, когда на него подается импульс с другого нейрона.
Структура нам представляется чем-то стабильным, хотя в действительности это относится лишь к грубым материальным конструкциям из многих молекул и атомов. В живых системах структуры ДНК очень прочны, чего нельзя сказать о структурах нервной системы. Конечно, нейроны не передвигаются, отростки их у взрослого растут медленно, но тонкие структуры синапсов - мест соединения нейронов, обеспечивающих прохождение энергии с одного нейрона на другой,- довольно нестабильны во времени. То же касается и "рабочих" элементов нейрона, обеспечивающих его активность - процесс возбуждения.
Рис.8. Динамические характеристики элементов модели (нейронов): "вход" - время раздражения извне, "выход" - величина активности на выходе элемента. Характеристики отмечают длительность активности после прекращения действия "входа".
Активность элементов модели, так же как и сигналы,- это ее функции. Модель, в которой элементы взаимодействуют друг с другом и с внешней средой через сигналы, можно назвать действующей, в противоположность статичной, лишенной функции и возможности самостоятельно взаимодействовать с внешним миром. Структуры живых клеток подчиняются закону тренировки и детренировки: при функционировании их "мощность" возрастает, при покое - уменьшается. Эти процессы развиваются неравномерно. Уровень и длительность активности живого структурного элемента не только заложены в его генах, но и являются результатом тренировки в процессе предшествовавшей деятельности. Изменение структуры модели в результате получения сигналов извне составляет память. Временная активность комплекса структурных элементов модели - это временная или активная память. Организация новых структур в соединениях элементов модели - ее длительная или пассивная память. На рис.8 показаны временные (динамические) характеристики различных типов элементов, а на рис.9 - статические характеристики их тренированности.
Рис.9. Статические характеристики элементов модели (нейронов): "вход" - величина раздражителя; "выход" - уровень активности. Показаны три характеристики - в зависимости от степени тренированности элемента.
Итак, сочетание постоянных и изменчивых структур, состоящих из элементов с разными динамическими характеристиками активности,- вот черты моделей систем "типа живых".
Современный этап развития науки ознаменован достижением принципиальной важности: вычислительные машины дали возможность овладеть сложностью. Все значение этого достижения как раз и состоит в том, что появилась надежда на создание количественных моделей, приближающихся по сложности к биологическим системам. Возможно, что при разработке таких моделей недостаточно внимания уделяется значению пространственных структур объектов, хотя наблюдения природы указывают на их исключительную роль (вспомним двойную спираль молекулы ДНК).
Весь физический мир можно свести к пространственным структурам, состоящим из атомов и молекул, а также к действующим между ними силам, связывающим материальные частицы в комплексы, которые условно можно назвать "телами". Общеизвестно, что все объекты в мире взаимосвязаны, однако степень прочности этих связей весьма различна: от жестких связей внутри твердых тел до гравитационных и электромагнитных сил, лишь ограничивающих пространственную свободу частиц. Пространство, энергия и время - вот самые общие координаты частиц и тел. Еще недавно казалось, что энергетические и материальные взаимоотношения между частицами и телами достаточно объясняют мир. Но вот появилось понятие информации и понятие сигнала как носителя информации, и это поколебало представления об исключительно энергетическом и материальном характере балансов отношений между объектами. Сигнал, несущий ничтожное количество энергии, может вызвать огромные вещественные и энергетические пертурбации в сложной системе, на которую он направлен (пример - атомная война).
Рис.5. Схемы простых систем - закрытой и открытой. Между элементами происходит обмен энергией Эн и веществом В.
Сложность структурных и энергетических отношений стала самостоятельным и значимым понятием, без учета которого уже невозможно объяснить мир. Понятие системы тоже более или менее определилось: это пространственная структура из неких элементов, объединенных внутренними "силами" настолько прочно, что она выступает как единое целое, противопоставленное всем другим объектам. Системы зависят друг от друга в обмене энергией и веществом, но в меньшей степени, чем элементы внутри них (рис.5). Хотелось бы дать количественное понятие системы, но очень нелегко установить, когда простое сочетание взаимодействующих элементов уже становится системой. Степень "зрелости" системы условно можно определить по степени зависимости ее элементов друг от друга: сколько времени они могут "самостоятельно прожить", не распадаясь на более простые частицы, если их отделить от системы. В связи с этим понятие элемента системы тоже не просто - в конце концов все объекты разложимы до элементарных частиц. Мне кажется, что элементом системы нужно считать некое более простое образование, уже обладающее чертами данной системы. Если взять живые биологические объекты, то можно перечислить иерархические ступени их сложности: элементарные частицы, атомы, молекулы, макромолекулы (ДНК, белки), клетки, органы, организмы, сообщества, биоценозы... Каждый уровень сам по себе достаточно сложен по структуре, чтобы претендовать на звание "сложности", но все-таки, какие из них допустимо считать сложными, какие отнести к простым, какие признать лишь элементами сложных? Без условности здесь не обойтись.
Рис.6. Схема сложной системы: Рц - рецептор; Эн - энергия; В - вещество.
СЛОЖНЫЕ СИСТЕМЫ
Будем считать сложными такие системы, в которых между элементами циркулируют не только частицы вещества и энергии, но и сигналы (рис.6). В структуре сложных систем можно условно выделить рабочие подсистемы, ведающие преобразованиями вещества и энергии, и управляющие, которые воздействуют на рабочие с помощью сигналов. Хотя сигнал тоже имеет физическую, то есть вещественную и энергетическую, природу, но дело не в ней, а в характере сигнала, то есть его временной структуре и, особенно, месте приложения к управляемому объекту - в данном случае к рабочей подсистеме. При таких условиях - обязательность наличия управляющих сигналов и рабочих подсистем - грань сложных систем проходит на уровне одноклеточных существ: их управляющим органом является генетический аппарат ДНК, рабочими подсистемами - органеллы клетки (оболочка, митохондрии, лизосомы и др.). Роль сигналов выполняют информационные РНК. Макромолекулы - белки и нуклеиновые кислоты - достаточно сложны по структуре, но не удовлетворяют требованиям, предъявляемым к сложной системе. На более высоких уровнях иерархии систем эти условия соблюдены. Например, в организме органами управления являются нервная и эндокринная системы, сигналами - молекулы гормонов и медиаторов (передатчики нервных импульсов). Сообщество животных не всегда становится сложной системой. Только у высших млекопитающих и птиц есть внутренняя организация в стае и система управляющих сигналов, и только у человека эта система приобретает достаточную "зрелость". В обществе легко обнаружить структуры, аналогичные рабочим и управляющим подсистемам, в нем циркулируют многочисленные и разнообразные сигналы. Иерархия сложных систем представлена на рис.7.
Рис.7. Иерархия сложных систем.
Элементом сложной системы каждого уровня являются системы предыдущего уровня, в которых уже заложены некоторые качества высшей системы. Для организма - это клетки, для общества - люди. Элементом клетки являются макромолекулы. Они способны воспроизводить себя лишь при наличии ферментов, действующих извне. Именно поэтому макромолекулу нельзя считать сложной системой. Скачок от молекулы до клетки очень велик - этим определяются трудности объяснения возникновения жизни на Земле. На других, высших уровнях такие качественные скачки менее выражены. Клетки многоклеточных, будучи отделены от тела, способны еще некоторое время жить, так же как и отбившиеся от стаи животные. А уровень "зрелости" такой системы, как человеческое общество, возрастает буквально на наших глазах. Еще пять-десять поколений тому назад, когда преобладало натуральное хозяйство, большинство людей было способно существовать в условиях весьма ограниченных связей с обществом. Теперь же брошенный в лесу человек может погибнуть через несколько дней.
Самое общее качество сложных систем "типа живых" - способность к поддержанию своей целостности и к противодействию разрушающим влияниям окружающей среды. Однако оно не беспредельно, поэтому необходимо другое качество, более сложное в своем структурном выражении,- способность к воспроизведению самих себя. Еще более сложным качеством является способность к усложнению в процессе воспроизведения. В живой природе это выражается изменчивостью. В человеческом обществе усложнение структуры и функции наблюдается постоянно и является следствием феномена творчества и труда, отсутствующих в стае животных.
Принцип структурности предполагает, что для реализации всех этих качеств должны быть соответствующие структуры. Нужна структура для постоянного возобновления своих разрушающихся частей и для утилизации с этой целью энергии среды, нужны структуры для размножения и структурное выражение программы их "удвоения" и, наконец, необходимы некоторые структурные возможности для наращивания новых структур, то есть для усложнения. Более того, должны быть структуры, отражающие внешний мир, поскольку на него замыкается реализация программ, которые являются выражением названных "способностей". Программа творчества тоже требует структурного выражения.
МОДЕЛИ
Существует хороший термин для обозначения структуры, отражающей другую структуру. Этот термин - модель; у каждого из нас есть его интуитивное понимание. Модель отражает объект не полностью, а с упрощениями и искажениями - в зависимости от того, для какой цели она предназначена и какие есть возможности для ее построения.
Органы управления сложных систем "типа живых" содержат в себе модели и программы (иными словами, тоже структуры), управляющие рабочими подсистемами в соответствии с этими моделями. Программа - это "считывание" модели сигналами, которые регулируют потоки энергии и вещества между элементами системы.
Как объяснить, что сравнительно простая структура - модель в ДНК зародышевой клетки человека - может отразить всю сложность самого человека с его разнообразием клеток и всеми человеческими качествами? Для того чтобы из яйцеклетки вырос человек, нужно извне получить массу сложных веществ ("кирпичиков"), а модель должна только предусмотреть, как сложить из них "здание". Само "складывание" состоит в значительной мере в повторении одинаковых операций. В ДНК заложены структуры всех белков организма и порядок, в каком следует "считывать" их при построении органов. Заложены и обратные связи, отмечающие выполнение этапов формирования организма. Следовательно, принцип управления по модели не исключает возможности построения более сложной, чем сама модель, системы, поскольку в модели должен быть предусмотрен лишь порядок включения структур, получаемых извне.
Мы привыкли к статическим моделям: игрушка, чертеж, текст - все это чистая структура. Основу моделей в органах управления сложных систем тоже составляют структуры: ДНК, сети нейронов в центральной нервной системе. Несомненна избыточность этих структур - например в каждой клетке имеется полный набор генов, достаточный для построения целого организма. Для реализации управления нужна программа "считывания" структур сигналами, а для этого - активация определенных частей модели. Таким образом, важна не только структура, но и активность, энергия различных элементов модели. Понятие активности тоже можно свести к изменению структур, только на уровне более низком, например в молекулах, атомах, составляющих структуру. Сам сигнал представляет собой такую "активированную порцию структуры". Пример - информационная РНК или активность синапса на теле нервной клетки, когда на него подается импульс с другого нейрона.
Структура нам представляется чем-то стабильным, хотя в действительности это относится лишь к грубым материальным конструкциям из многих молекул и атомов. В живых системах структуры ДНК очень прочны, чего нельзя сказать о структурах нервной системы. Конечно, нейроны не передвигаются, отростки их у взрослого растут медленно, но тонкие структуры синапсов - мест соединения нейронов, обеспечивающих прохождение энергии с одного нейрона на другой,- довольно нестабильны во времени. То же касается и "рабочих" элементов нейрона, обеспечивающих его активность - процесс возбуждения.
Рис.8. Динамические характеристики элементов модели (нейронов): "вход" - время раздражения извне, "выход" - величина активности на выходе элемента. Характеристики отмечают длительность активности после прекращения действия "входа".
Активность элементов модели, так же как и сигналы,- это ее функции. Модель, в которой элементы взаимодействуют друг с другом и с внешней средой через сигналы, можно назвать действующей, в противоположность статичной, лишенной функции и возможности самостоятельно взаимодействовать с внешним миром. Структуры живых клеток подчиняются закону тренировки и детренировки: при функционировании их "мощность" возрастает, при покое - уменьшается. Эти процессы развиваются неравномерно. Уровень и длительность активности живого структурного элемента не только заложены в его генах, но и являются результатом тренировки в процессе предшествовавшей деятельности. Изменение структуры модели в результате получения сигналов извне составляет память. Временная активность комплекса структурных элементов модели - это временная или активная память. Организация новых структур в соединениях элементов модели - ее длительная или пассивная память. На рис.8 показаны временные (динамические) характеристики различных типов элементов, а на рис.9 - статические характеристики их тренированности.
Рис.9. Статические характеристики элементов модели (нейронов): "вход" - величина раздражителя; "выход" - уровень активности. Показаны три характеристики - в зависимости от степени тренированности элемента.
Итак, сочетание постоянных и изменчивых структур, состоящих из элементов с разными динамическими характеристиками активности,- вот черты моделей систем "типа живых".
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ВОСПРИЯТИЕ И ПАМЯТЬ
ВОСПРИЯТИЕ И УПРАВЛЕНИЕ
Управляющие органы сложных систем можно представить как их интеллект, "тело" - как рабочие подсистемы. Сигналы представляются комплексами подвижных структур, как, например, РНК в клетках или импульсы в нервных проводниках.
В связи с этим можно говорить о "коде" моделей и сигналов.
Под словом "код" понимается определенный набор структурных элементов, из которых строятся статические модели. Письменная речь - это код букв. Есть код рисунков, код математических формул. Структура клеток и организмов записана генетическим кодом - набором генов, составленных из нуклеотидов и объединенных в ДНК. Структурный код нервной системы - это нервные клетки различного типа.
Функция моделей выражается сигналами, и к ним тоже применяется понятие кода. Примеры - код нервных импульсов, код информационных РНК, код сигнальных флагов и масса других.
Управление любым объектом предусматривает цепь из трех звеньев: рецептор - датчик, воспринимающий энергию объекта и превращающий ее в сигналы, сами органы управления (моделирующая установка, мозг, разум, интеллект) и эффектор - орган воздействия, превращающий управляющие сигналы, исходящие от интеллекта, в некоторый вид энергии, достаточно мощный, чтобы изменить деятельность объекта. Рецепторы специфичны: рецептор одного вида воспринимает только один вид энергии; но разные рецепторы одной системы превращают их в знаки одного кода, характерного для данного управляющего органа, интеллекта, разума. Например, рецепторы глаза, уха, кожи - все кодируют свои сигналы нервными импульсами. То же касается и эффекторов: они превращают сигналы универсального для системы кода в специфическую энергию воздействия. Например, сокращение мышцы или выделение слюны. Рецепторы и эффекторы имеют статические и динамические характеристики, подобные нейронным (см. рис.8, 9). Как правило, активность рецептора продолжается до тех пор, пока на него падает внешняя энергия.
Рис.10. Схема кратковременной памяти. Модель представлена кратковременной высокой активностью элементов (нейронов), показанных в виде заштрихованных кружочков.
Если представить себе, что каждый рецептор воспринимает энергию из ограниченного пространства внешнего мира или "тела", что он активирует один элемент в моделирующей установке (например, один нейрон "рецепторного поля" мозга), то совокупность активированных в данное время элементов составит мгновенную модель пространства внешнего мира, или "тела", энергию которого воспринимает система рецепторов (рис.10). Модель будет изменяться так же быстро, как изменяются воспринимаемые объекты внешнего мира, и с той скоростью, с какой их изменения улавливаются рецепторами. Для превращения такой сугубо временной модели в постоянную нужно, чтобы между активированными элементами установились связи (рис.11). В этом случае повторное возбуждение извне некоторого числа элементов модели по таким связям могло бы активировать всю модель, иными словами, произошло бы вспоминание воспринятой ранее картины. Однако при этом придется отключать рецепторы, чтобы не наслоились новые картины, воспринимаемые извне. Для непрерывного запоминания новых картин нужно подключать к рецепторам новые поля элементов. Тогда мы получим серию картин-моделей, как на кинопленке. Невозможно на одни и те же элементы воспринимать новые картины и одновременно запоминать их.
Рис.11. Схема длительной памяти. Модель представлена проторенными связями между элементами (нейронами).
Интеллект - это целенаправленные действия с моделями, так можно перефразировать первоначальное его определение. Естественно предположить, что действия будут тем более эффективными, чем более подробными будут модели. Это значит: необходимо точное отражение структуры объекта управления в моделях, отражение его изменений во времени и пространстве. Для этого нужно прежде всего множество рецепторов, поскольку объект можно отразить, либо воспринимая его большим количеством точек одновременно, либо сканируя его с высокой скоростью и передавая энергию всякий раз на новые элементы "рецепторного поля". Первый способ используется глазом, второй - телекамерой. Изображение на телевизионном экране светится, то есть запоминается в виде первичной модели, очень недолго. Чтобы запомнить "впрок", следует записать его на видеомагнитофон, а для этого нужно много кадров. Человек воспринимает глазами и на короткое время отпечатывает в мозге огромное количество картин, в которых полезная информация составляет ничтожную часть. Именно ее нужно выбрать, а все остальное - забыть, чтобы не перегружать память.
ОБОБЩЕННОСТЬ ВОСПРИЯТИЯ
Основная проблема моделирования сложных объектов для целей интеллекта - это преодоление избыточного разнообразия, борьба с избыточной информацией. Чем более развит интеллект, тем более подробными должны быть модели управляемых объектов, тем большие отрезки времени они должны отражать. И тем не менее значительная часть информации о внешней среде, не представляющая ценности для целей интеллекта, должна быть отброшена, модели стерты. Но как произвести отбор? Для этого нужны критерии и способы отбора. При отборе используются все этапы действий с моделями: первичное отражение внешней среды при восприятии, первичное запоминание воспринятого, последующий анализ отраженного в первичной модели. Выход из противоречия между необходимостью запоминать большое количество информации и ограниченностью памяти только один - в огрублении моделей и в отборе их наиболее важных частей. На рис.12 показано, как можно отразить сложный объект моделями разного уровня обобщенности. Разумеется, по мере упрощения теряется информация, возможно, ценная. Но всегда ли ценность - в подробностях картины, в деталях структуры? Нет, не всегда. Чаще главная информация представлена в грубой модели. И не все детали одинаково ценны. Следовательно, необходимо воспринимать, запоминать и забывать объекты "выборочно", обязательно "в целом" и, кроме того,- интересующие нас детали.
Рис.12. Объект и его отражение в моделях разного уровня обобщенности. "Входы" и "выходы": Эн - энергия; В - вещество.
Огрубление модели я называю термином "обобщение". Он относится одинаково к описанию как пространственных, так и временных изменений структуры.
Понятия "обобщение", "обобщенность" и "степень обобщенности" модели я считаю важнейшими в теории интеллекта. В структурном выражении обобщенная модель - это такая модель, в которой представлены только крупные блоки структуры объекта или пространственного расположения объектов, без деталей (см. рис.12).
Интенсивность возбуждения рецептора зависит не только от количества падающей на него энергии, но и от изменения его чувствительности, что описывается статической и динамической характеристиками. Яркость восприятия отражается активностью элементов первичной модели во временной памяти "рецепторного поля". Чувствительность рецептора определяется его настройкой и напряжением, регулируемых интеллектом. Восприятие объекта рецепторами непосредственно связано с характером первичной модели (ПМ на рис.1, 2). "Орган зрения" любого интеллекта должен удовлетворять ряду требований. Первое - должно быть возможным фокусирование зрения, позволяющее ярко, с высокой активностью запечатлевать избранные части (детали) картины, а все остальное представлять в крупных блоках и с меньшей активностью. Второе требование относится к восприятию трехмерных структур. В модели нужно отразить не только часть, выделенную на плоскости, но и часть, выделенную по глубине. Все другие части, расположенные с боков, впереди и позади избранной, необходимо представлять в "крупноблочном" изображении и с меньшей активностью (рис.13). Настройка рецептора должна обеспечить передвижение фокуса с одной части объекта на другую как по плоскости, так и по глубине, фиксируя эти движения в специальной модели настройки. В результате получится несколько кадров с плоскими моделями по типу системы моделей, представленной на рис.17, причем каждый будет маркирован "знаком настройки". Передвижение фокуса или центра восприятия по деталям объекта может представить самостоятельную модель, отражающую его структуру (вспомним детские рисунки из палочек!).
Рис.13. Модель, отражающая пространственное расположение объектов внешней среды с различной степенью активности и фокусирования. Объект а отражен четко и с высокой активностью. Объект б находится позади него и отражен менее четко и с меньшей активностью. Еще менее активным является отражение объектов в и г. Объект д находится впереди всех и отражен в модели весьма нечетко.
Глаза человека наилучшим образом приспособлены к восприятию внешнего мира с разной степенью обобщенности и разной активностью частей картины. При напряжении внимания предмет рассматривается сфокусированным зрением, при этом мы четко видим мелкие детали в ограниченном пространстве, периферия же видна очень расплывчато, только в крупных структурных блоках. Если намеренно не фокусировать зрение, можно видеть одновременно большое количество объектов, но все они будут нечеткими, расплывчатыми. Разная настройка на глубину позволяет получать модели пространственного расположения объектов с выделением значимой фигуры на фоне второстепенных (см. рис.13). Угол схождения глаз при фокусированном рассмотрении дает расстояние предмета от субъекта.
ВИДЫ И МЕХАНИЗМЫ ПАМЯТИ
Понятие модели неотделимо от структуры памяти так же, как и от механизмов восприятия. На рис.1, 2 были показаны два варианта ИИ. Их основное отличие - в носителях памяти, которыми определяются различия в действиях с моделями.
Слово "память" имеет два значения. С одной стороны, это явление, феномен фиксации модели в результате восприятия объекта рецепторами. С другой - это сами запечатленные модели. В последнем случае первостепенную роль играет носитель памяти.
Основной параметр всякой памяти - длительность запоминания. Наиболее короткая память у рецепторного элемента: она длится ровно столько времени, сколько необходимо для накопления энергии, нужной, чтобы выдать в мозг один импульс. В этот момент рецептор освобождается для нового восприятия энергии, его память мгновенная.
На рис.1, 2 выделен блок запоминания первичной модели ПM - на время, пока она распознается и по ней активируется распознанная модель РМ, которая в свою очередь используется для выбора моделей действия МД. Память для всех этих моделей естественно назвать активной, кратковременной или оперативной в противоположность длительной памяти - основному хранилищу моделей. Возможен и третий вид памяти - "внешняя", находящаяся вне "мозга", вне интеллекта (например, собственные записи, рисунки, которые можно повторно привлекать к использованию). Деление памяти на такие виды условно, но необходимо. В СИ активная и длительная память совмещена на одних сетевых элементах, в АИ массивы памяти совершенно различны.
Характер первичной модели, отражающей трехмерную структуру, был показан на рис.13. В моделях из длительной памяти структура фона очень неясная и обобщенная, выделяется только фигура. Для алгоритма важны параметры модели и ее частей. Они следующие: активность определяется яркостью объекта, настройкой и напряжением рецептора, четкость - фокусированием рецептора. Расстояние до рецептора для главной фигуры отмечается точно, а для "фона" - приблизительно. Степень обобщенности модели и ее деталей зависит от параметров настройки, расстояния до рецептора и помех.
В СИ мгновенная первичная модель остается в кратковременной памяти наряду с распознанной моделью. В АИ она перекодируется цифровым кодом, который должен отразить все параметры каждого объекта и их пространственных отношений. Именно это и представляет самую трудную задачу для моделирования интеллекта.
Модель во временной памяти выступает как единое целое, следовательно, между ее возбужденными элементами сразу же должны устанавливаться связи, хотя бы тоже временные. Для примера на рис.14 показана схема запоминания последовательности из семи звуков, составляющих слово. Память на слова есть у высших животных и птиц. По горизонтали отмечены номера условных тактов времени, по вертикали - номера однородных элементов, последовательно соединяемых с одним и тем же рецептором в каждый такт времени. В первый такт возбужден рецептор 1, во второй такт - рецептор 3, в третий такт - снова рецептор 1 и т.д. Модель станет действовать как единое целое только в том случае, если последовательно активируемые элементы (на рисунке они заштрихованы) в течение семи тактов будут соединены связями и сохранят активность все вместе по крайней мере на время от первого до седьмого такта. Без такого условия - это лишь разрозненные точки, не составляющие единой модели как действующей единицы информации. Отсюда, однако, следует, что каждый рецепторный элемент должен иметь связь со многими элементами "рецепторного поля" и соединяться с ними последовательно, всякий раз с новыми. Это не вызывает особых затруднений для случая, рассмотренного в нашем примере, где один звук соответствует одному элементу в каждый такт. А как обстоит дело, если мы воспринимаем не последовательность звуков, а, скажем, зрительную картину, то есть множество взаимосвязанных объектов? Тут нужны уже не столбцы элементов, а "кадры", которые будут мысленно прокручиваться наподобие киноленты. И сколько же связей нужно установить между возбужденными (яркими) точками кадров!
Рис.14. Схема запоминания последовательности звуков. Возбуж денные нейроны "рецепторного поля" заштрихованы.
К сожалению, что-нибудь другое предположить трудно. Можно представить, что энергия с рецептора подается все время на один и тот же, "свой" элемент временной памяти. Допустим, что в следующий момент активируется другой элемент от другого рецептора и между ними устанавливается связь. К следующему моменту первый и второй элементы уже утратили активность, но связь "запомнилась" и т.д. Предположение еще менее вероятное, потому что в таком случае нужны специальные механизмы памяти, отмечающие последовательность возбуждения элементов, чтобы, к примеру, иметь возможность повторить слово. Но для такого "счетчика адресов" тоже нужны структуры.
Память человека действительно обширна. Есть люди, которые могут прочесть наизусть поэму "Евгений Онегин". Но мало таких, которые способны повторить в точности длинное стихотворение после одного прослушивания. Это значит, что "кадры" временной памяти постепенно освобождаются и, таким образом, становятся способными снова запоминать новые модели. Правда, они освобождаются не совсем, кое-что переходит в постоянную память, но очень немногое, если сравнить объем информации, который мы воспринимаем ежедневно, и то, что из него остается в постоянной памяти. Как правило, мы запоминаем из воспринятого только то, что потом многократно мысленно повторяем.
ГИПОТЕЗА О МЕХАНИЗМАХ ПАМЯТИ
Трудно предложить гипотезу о механизмах памяти, пригодную для алгоритма интеллекта. Попробую изложить свою попытку. Для обозначения моделей и их сочетаний я буду пользоваться следующими заимствованными из лингвистики терминами. "Буква" - элементарная модель, самый малый значимый признак. "Алфавит" - совокупность букв-моделей, формируемых одним типом рецепторов; "алфавитов" может быть много: световые, звуковые и др. (см. ниже) "Слово" - более сложная модель, состоящая из элементарных моделей, то есть "букв", но очень хорошо организованная и выступающая как одно целое. "Фраза" - соединение "слов", чаще всего временное и непрочное. "Буква обобщенности" - знак, указывающий уровень обобщения моделей, их место в "иерархии блочности".
МОДЕЛИ И АНСАМБЛИ НЕЙРОНОВ. У человека в коре очень много нейронов, их количество оценивают в 10 и более миллиардов. Каждый нейрон соединяется с многими сотнями других. Таким образом, имеются почти беспредельные возможности для образования структур из нейронов, объединенных проходимыми ("проторенными") связями. Такие структуры - нейронные ансамбли - могут выступать в качестве моделей объектов внешнего мира. Один нейрон может включаться в несколько ансамблей, как это показано на рис.15. Модель повторно возбуждается ("вспоминается"), если возбудится некоторый процент входящих в ее ансамбль нейронов. Почему не возбуждаются все нейроны коры? Ведь связей между ними вполне достаточно. Чтобы ответить на этот вопрос, нужно сделать еще одно предположение: когда один нейрон возбуждается, соседние тормозятся. Этот принцип "индуктивного торможения" установлен И.П.Павловым. Таким образом, если допустить, что 30% нейронов данной модели возбудятся извне, то все окружающие должны бы затормозиться. Так и происходит, но связи к остальным 70% нейронов данной модели настолько проторены, что эти нейроны больше возбуждаются по связям, чем тормозятся "по площади". В результате активируется весь ансамбль, вся модель, а другие модели остаются заторможенными, несмотря на то что часть возбужденных в данной модели нейронов входит и в них. Такова гипотеза об ансамблях нейронов.
Рис.15. Нейронные ансамбли.
Для проверки этой гипотезы сотрудниками отдела биокибернетики разработан макет нейронной сети, содержащий 22 узла и наборное поле, которое позволяет осуществлять все возможные соединения между узлами. Узлы (модели нейронов) представляют собой усилители постоянного тока с нелинейной (S-образной) характеристикой. В качестве связей использованы постоянные резисторы. Вес связи считается обратно пропорциональным сопротивлению резистора.
Макет создавался для получения ответа на следующие основные вопросы:
- можно ли технически реализовать устойчиво работающую сеть из нейронных ансамблей так, чтобы при возбуждении одного ансамбля не возбуждались одновременно и другие, связанные с ним;
- можно ли построить устойчивую сеть, если ансамбли пересекаются, то есть одни и те же узлы входят в состав различных ансамблей;
- можно ли добиться четкого перехода возбуждения с одного ансамбля на другой, если они пересекаются значительной частью своих узлов.
Эксперименты с макетом дали положительные ответы на все эти вопросы. Оказалось, однако, что для успешной работы необходимо использовать централизованную систему, управляющую активностью всей сети. По своим свойствам и назначению эта система аналогична системе усиления-торможения (СУТ), которая подробно будет описана ниже. Следует отметить, что многие исследователи, пытавшиеся построить устойчивую ансамблевую сеть без централизованной системы управления активностью, встретились с большими трудностями и вынуждены были накладывать жесткие ограничения на допустимую структуру сети.
На макете было также показано, что устойчиво работающая ансамблевая сеть может иметь число ансамблей, превышающее число узлов сети. Поэтому в некоторых задачах, используя ансамблевые сети, можно получить более экономную аппаратурную реализацию. С увеличением числа узлов эта экономия становится все более ощутимой. К сожалению, построение ансамблевых сетей большого объема связано пока со значительными трудностями.
УСТРОЙСТВО "РЕЦЕПТОРНОГО ПОЛЯ". На рис.16 показана гипотетическая схема "рецепторного поля", объясняющая принцип совмещения временной и постоянной памяти. Такое совмещение, несомненно, имеет место в коре мозга.
Рис.16. Схема "Рецепторного поля": Рц - рецепторы, Н - настройка.
Система рецепторов Рц подает активность на "рецепторное поле", состоящее из довольно большого количества кадров, построенных так, что в каждом из них имеются представительства - элементы для каждого рецептора. Для удобства понимания кадры расположены в виде кольца. Число кадров значительное, но не бесконечное. Предположим, что есть переключатель в центре кольца, который или поворачивает его на один кадр в каждый такт времени, или поочередно переключает связи от рецепторов с одного кадра на другой, соседний. Имеется настройка кадров Н, обеспечивающая фокусирование, то есть позволяющая им четко воспринимать избранную деталь и неясно видеть весь объект. Она же передвигает фокус по структуре объекта. Еще одно условие: настройка "устает", поэтому после нескольких тактов рецептор отключается совсем.
Характеристики затухания активности элементов очередного кадра после отключения от них рецептора имеют вид, показанный на рис.8. Затухание активности в самом первом кадре происходит раньше, чем завершится полный круг переключения.
Картины, представленные в кадрах, показаны на рис.17. В первый такт времени система рецепторов при отсутствии фокусировки неясно воспринимает объект как целое, и он отражается в виде наиболее обобщенной модели (рис.17,а). Между активированными элементами возникают связи. Предположим, что объект "заинтересовал" интеллект (об этом - ниже), тогда в следующий такт, приходящийся на следующий кадр, зрением, умеренно сфокусированным на верхнем левом углу, преимущественно воспринимается часть объекта, обозначенная цифрой 1. Создается временная модель этой части, представляющая собой не очень четкое воспроизведение последней при обобщении всего остального объекта (рис.17,б). Затем фокусировка переходит на часть 2, далее на часть 3 объекта, и они отпечатываются в модели. Модели в предыдущих кадрах еще сохраняют активность, и от них проторяются связи к следующему кадру. В каждом кадре на соответствующих элементах отмечаются направление и степень фокусировки всей системы рецепторов (назовем ее "глазом"). После того как настройка на крупные части обойдет их и они отпечатаются на кадрах, структура их расположения вырисуется в "модели-схеме" (рис.17,в). Вся серия картин, отображенных в кадрах, объединена продольными связями. На этом восприятие может закончиться, но может быть продолжено на следующий цикл, состоящий в еще большей фокусировке (напряжении) "глаза", нацеленной на детальное рассматривание каждого блока с отражением тонких подробностей его структуры, "привязанных" к блоку, а через него - и к общей структуре объекта. На рис.17,г этому случаю соответствует модель, формирующаяся при восприятии части 1 объекта сильно сфокусированным зрением. Весь процесс рассматривания объекта запечатлевается в серии кадров. В целом - это "фраза" изучения предмета, запечатленная в кадрах рецепторного поля.
Рис.17. Система моделей разной степени обобщенности, отражающая объект.
ВСПОМИНАНИЕ, ОБОБЩЕНИЕ, ЗАБЫВАНИЕ
В первое время вся система моделей в серии кадров активна, и если отключить рецепторы, то можно заново их просмотреть с начала до конца, как бы повторив процесс реального изучения, повторно активируя запечатленные образы. Так человек и делает, мысленно повторяя только что услышанную фразу или воссоздавая в воображении процесс рассматривания сложного объекта. Это бывает в том случае, когда объект или фраза заинтересовывает наш разум. При таком повторении связи между элементами проторяются и происходит процесс перехода временной памяти в длительную, поэтому картину еще можно вспомнить некоторое время спустя. При многократном вспоминании связи проторяются сильно и объект может запомниться во всех его деталях. Если же значимость предмета не очень велика и повторения не имеют большой активности, то происходит обобщение, то есть постепенное сокращение модели за счет забывания малозначащих ее частей, которые были неактивны при восприятии или не привлекли интереса во время повторения. Так исчезают из памяти целые кадры.
В конце концов может остаться лишь очень обобщенная модель предмета, однако при этом сохраняется воспоминание о самом факте детального изучения объекта, знание о том, что он был изучен подробно. Видимо, это обобщенная модель самого процесса переключения настройки "глаза".
Образ предмета запечатлевается не в одном кадре памяти, а целой их серии, многократно, хотя и с разными деталями. Это соответствует данным физиологии о том, что удаление какой-либо части затылочной области коры не разрушает определенных участков зрительной картины, а просто обедняет ее всю.
Если объект не имел ценности и картина его не вспоминается повторно, то образ совершенно исчезает из памяти, поскольку для проторения первично возникающих связей необходима повторная активация элементов модели. Но, так или иначе, с течением времени происходит закономерное "освобождение" памяти, потому что запомненная картина-модель всегда значительно упрощена по сравнению с воспринимаемой и, следовательно, не занимает все элементы "рецепторного поля".
При восприятии изменяющейся картины рецепторы повторно подключаются к предмету, в результате получается новая серия моделей-кадров, имеющая связи с первой.
В соответствии с этой гипотезой кратковременная и длительная память реализуется на одних и тех же элементах "нейронной сети" в одном рецепторном поле, первая - за счет активности элементов, вторая - за счет развития связей. Переход между ними возможен в виде кратковременной памяти связей. Последняя задается характеристикой изменения проходимости связи во времени по такому же типу, как и характеристика изменения активности элемента, но удлиненной во времени и уменьшающейся не до нуля, а до некоторой остаточной величины, определяющей "вклад" связи в длительную память. При повторном использовании данной связи такие "вклады" (Д) накапливаются и определяют прочность памяти (рис. 18 ). Если модель повторно не возбуждается, то связи не функционируют, и их проходимость уменьшается. Повторная активация модели сопровождается тренировкой ее элементов, что выражается в изменении ее статической и динамической характеристик, а также в повышении уровня спонтанной, собственной "активности покоя" модели.
Рис.18. Типичная динамическая характеристика связи между элементами А и Б. Повышенная проходимость связи остается после прекращения возбуждения элемента А (заштрихованный участок на оси времени). Д - остаточная проходимость связи, определяющая "вклад" связи в постоянную память.
На рис.19 показаны этапы забывания и постепенного сокращения модели, так что в результате остается только несколько обобщенных и связанных с ней "частных" моделей, характеризующих объект лишь в отношении его значимости, то есть полезности.
Рис.19. Схема постепенного забывания и сокращения модели объекта, первоначально состоящей из серии кадров с разной обобщенностью и детальностью,- линия а. Менее значимые и похожие детали заменяются одной - линия б. Потом остаются только две крайние модели (линия в) и, наконец, лишь одна обобщенная модель г.
Разумеется, для того чтобы с помощью элементов одного "рецепторного поля" запоминать все новые и новые модели, нужно допустить наличие большого количества кадров. Кроме того, необходимо предположить торможение моделей как состояние, противоположное активности, возбуждению. Торможение - отрицательная активность, требующая для своего преодоления дополнительной "мощности", идущей по связи от внешнего источника - рецептора или соседнего возбужденного элемента.
О РЕАЛИЗАЦИИ ГИПОТЕЗЫ
Наша гипотеза предполагает строение "рецепторного поля" в виде сети из элементов с неограниченно большим количеством связей. Примерно такая структура имеет место в коре мозга. Воспроизвести ее техническими средствами пока не представляется возможным, разве что в очень ограниченных пределах, которые едва ли смогут обеспечить демонстративность устройства. Все надежды на алгоритмический интеллект.
В АИ все виды памяти должны существовать раздельно. Время нужно делить на такты и все расчеты активности моделей и проходимости связей осуществлять "ступенчато", от такта к такту. Первый вид памяти в АИ - это картина с рецептора. Она существует очень короткое время и считывается, перекодируется по определенным правилам, которые еще нужно создать. Получается ряд цифр, отражающих как саму структуру объекта, так и перечисленные выше параметры модели. Главный из них - это уровень активности каждого объекта модели картины. Поскольку процесс рассматривания даже неподвижной картины выражается в серии кадров типа показанных на рис.17, то и цифровое выражение модели объекта будет состоять из нескольких строк цифр, кодирующих каждый кадр восприятия. Связи выразятся адресами кадров. Тогда два-три кадра составят "фразу" - модель объекта во временной памяти. Параметр активности кадра в целом и его отдельных объектов будет понижаться по определенной характеристике, сходной с представленной на рис.18. По мере отдаления во времени кадры станут "бледнеть", утрачивать детали, так что вся "фраза" будет становиться все короче и короче. Если не произойдет повторного привлечения внимания и активации "фразы", модель сотрется из памяти. Если же активность и связи будут подновляться повторным использованием модели, то через некоторое время, предусмотренное характеристикой, модель перейдет в длительную память вместе со своими связями-адресами. Пересчет активности и связей всех моделей в кратковременной памяти обязателен для каждого такта.
Длительная память в АИ выражена "фразами", перешедшими из кратковременной памяти. Сейчас трудно представить всю организацию массива памяти. Думаю, что он должен состоять из большого числа "словарей фраз", построенных из 2-4 "слов" каждая. Во "фразах" будут широко использоваться обобщенные модели.
В СИ все модели постоянно сохраняют хотя бы минимальную активность, вследствие чего связи между ними постоянно изменяются. Это очень затрудняет воспроизведение СИ на ЦВМ, поскольку с увеличением объема сетей катастрофически возрастает объем расчетов. АИ позволяет уменьшить расчеты за счет удлинения интервалов времени между пересчетами связей массива длительной памяти.
ВОСПРИЯТИЕ И УПРАВЛЕНИЕ
Управляющие органы сложных систем можно представить как их интеллект, "тело" - как рабочие подсистемы. Сигналы представляются комплексами подвижных структур, как, например, РНК в клетках или импульсы в нервных проводниках.
В связи с этим можно говорить о "коде" моделей и сигналов.
Под словом "код" понимается определенный набор структурных элементов, из которых строятся статические модели. Письменная речь - это код букв. Есть код рисунков, код математических формул. Структура клеток и организмов записана генетическим кодом - набором генов, составленных из нуклеотидов и объединенных в ДНК. Структурный код нервной системы - это нервные клетки различного типа.
Функция моделей выражается сигналами, и к ним тоже применяется понятие кода. Примеры - код нервных импульсов, код информационных РНК, код сигнальных флагов и масса других.
Управление любым объектом предусматривает цепь из трех звеньев: рецептор - датчик, воспринимающий энергию объекта и превращающий ее в сигналы, сами органы управления (моделирующая установка, мозг, разум, интеллект) и эффектор - орган воздействия, превращающий управляющие сигналы, исходящие от интеллекта, в некоторый вид энергии, достаточно мощный, чтобы изменить деятельность объекта. Рецепторы специфичны: рецептор одного вида воспринимает только один вид энергии; но разные рецепторы одной системы превращают их в знаки одного кода, характерного для данного управляющего органа, интеллекта, разума. Например, рецепторы глаза, уха, кожи - все кодируют свои сигналы нервными импульсами. То же касается и эффекторов: они превращают сигналы универсального для системы кода в специфическую энергию воздействия. Например, сокращение мышцы или выделение слюны. Рецепторы и эффекторы имеют статические и динамические характеристики, подобные нейронным (см. рис.8, 9). Как правило, активность рецептора продолжается до тех пор, пока на него падает внешняя энергия.
Рис.10. Схема кратковременной памяти. Модель представлена кратковременной высокой активностью элементов (нейронов), показанных в виде заштрихованных кружочков.
Если представить себе, что каждый рецептор воспринимает энергию из ограниченного пространства внешнего мира или "тела", что он активирует один элемент в моделирующей установке (например, один нейрон "рецепторного поля" мозга), то совокупность активированных в данное время элементов составит мгновенную модель пространства внешнего мира, или "тела", энергию которого воспринимает система рецепторов (рис.10). Модель будет изменяться так же быстро, как изменяются воспринимаемые объекты внешнего мира, и с той скоростью, с какой их изменения улавливаются рецепторами. Для превращения такой сугубо временной модели в постоянную нужно, чтобы между активированными элементами установились связи (рис.11). В этом случае повторное возбуждение извне некоторого числа элементов модели по таким связям могло бы активировать всю модель, иными словами, произошло бы вспоминание воспринятой ранее картины. Однако при этом придется отключать рецепторы, чтобы не наслоились новые картины, воспринимаемые извне. Для непрерывного запоминания новых картин нужно подключать к рецепторам новые поля элементов. Тогда мы получим серию картин-моделей, как на кинопленке. Невозможно на одни и те же элементы воспринимать новые картины и одновременно запоминать их.
Рис.11. Схема длительной памяти. Модель представлена проторенными связями между элементами (нейронами).
Интеллект - это целенаправленные действия с моделями, так можно перефразировать первоначальное его определение. Естественно предположить, что действия будут тем более эффективными, чем более подробными будут модели. Это значит: необходимо точное отражение структуры объекта управления в моделях, отражение его изменений во времени и пространстве. Для этого нужно прежде всего множество рецепторов, поскольку объект можно отразить, либо воспринимая его большим количеством точек одновременно, либо сканируя его с высокой скоростью и передавая энергию всякий раз на новые элементы "рецепторного поля". Первый способ используется глазом, второй - телекамерой. Изображение на телевизионном экране светится, то есть запоминается в виде первичной модели, очень недолго. Чтобы запомнить "впрок", следует записать его на видеомагнитофон, а для этого нужно много кадров. Человек воспринимает глазами и на короткое время отпечатывает в мозге огромное количество картин, в которых полезная информация составляет ничтожную часть. Именно ее нужно выбрать, а все остальное - забыть, чтобы не перегружать память.
ОБОБЩЕННОСТЬ ВОСПРИЯТИЯ
Основная проблема моделирования сложных объектов для целей интеллекта - это преодоление избыточного разнообразия, борьба с избыточной информацией. Чем более развит интеллект, тем более подробными должны быть модели управляемых объектов, тем большие отрезки времени они должны отражать. И тем не менее значительная часть информации о внешней среде, не представляющая ценности для целей интеллекта, должна быть отброшена, модели стерты. Но как произвести отбор? Для этого нужны критерии и способы отбора. При отборе используются все этапы действий с моделями: первичное отражение внешней среды при восприятии, первичное запоминание воспринятого, последующий анализ отраженного в первичной модели. Выход из противоречия между необходимостью запоминать большое количество информации и ограниченностью памяти только один - в огрублении моделей и в отборе их наиболее важных частей. На рис.12 показано, как можно отразить сложный объект моделями разного уровня обобщенности. Разумеется, по мере упрощения теряется информация, возможно, ценная. Но всегда ли ценность - в подробностях картины, в деталях структуры? Нет, не всегда. Чаще главная информация представлена в грубой модели. И не все детали одинаково ценны. Следовательно, необходимо воспринимать, запоминать и забывать объекты "выборочно", обязательно "в целом" и, кроме того,- интересующие нас детали.
Рис.12. Объект и его отражение в моделях разного уровня обобщенности. "Входы" и "выходы": Эн - энергия; В - вещество.
Огрубление модели я называю термином "обобщение". Он относится одинаково к описанию как пространственных, так и временных изменений структуры.
Понятия "обобщение", "обобщенность" и "степень обобщенности" модели я считаю важнейшими в теории интеллекта. В структурном выражении обобщенная модель - это такая модель, в которой представлены только крупные блоки структуры объекта или пространственного расположения объектов, без деталей (см. рис.12).
Интенсивность возбуждения рецептора зависит не только от количества падающей на него энергии, но и от изменения его чувствительности, что описывается статической и динамической характеристиками. Яркость восприятия отражается активностью элементов первичной модели во временной памяти "рецепторного поля". Чувствительность рецептора определяется его настройкой и напряжением, регулируемых интеллектом. Восприятие объекта рецепторами непосредственно связано с характером первичной модели (ПМ на рис.1, 2). "Орган зрения" любого интеллекта должен удовлетворять ряду требований. Первое - должно быть возможным фокусирование зрения, позволяющее ярко, с высокой активностью запечатлевать избранные части (детали) картины, а все остальное представлять в крупных блоках и с меньшей активностью. Второе требование относится к восприятию трехмерных структур. В модели нужно отразить не только часть, выделенную на плоскости, но и часть, выделенную по глубине. Все другие части, расположенные с боков, впереди и позади избранной, необходимо представлять в "крупноблочном" изображении и с меньшей активностью (рис.13). Настройка рецептора должна обеспечить передвижение фокуса с одной части объекта на другую как по плоскости, так и по глубине, фиксируя эти движения в специальной модели настройки. В результате получится несколько кадров с плоскими моделями по типу системы моделей, представленной на рис.17, причем каждый будет маркирован "знаком настройки". Передвижение фокуса или центра восприятия по деталям объекта может представить самостоятельную модель, отражающую его структуру (вспомним детские рисунки из палочек!).
Рис.13. Модель, отражающая пространственное расположение объектов внешней среды с различной степенью активности и фокусирования. Объект а отражен четко и с высокой активностью. Объект б находится позади него и отражен менее четко и с меньшей активностью. Еще менее активным является отражение объектов в и г. Объект д находится впереди всех и отражен в модели весьма нечетко.
Глаза человека наилучшим образом приспособлены к восприятию внешнего мира с разной степенью обобщенности и разной активностью частей картины. При напряжении внимания предмет рассматривается сфокусированным зрением, при этом мы четко видим мелкие детали в ограниченном пространстве, периферия же видна очень расплывчато, только в крупных структурных блоках. Если намеренно не фокусировать зрение, можно видеть одновременно большое количество объектов, но все они будут нечеткими, расплывчатыми. Разная настройка на глубину позволяет получать модели пространственного расположения объектов с выделением значимой фигуры на фоне второстепенных (см. рис.13). Угол схождения глаз при фокусированном рассмотрении дает расстояние предмета от субъекта.
ВИДЫ И МЕХАНИЗМЫ ПАМЯТИ
Понятие модели неотделимо от структуры памяти так же, как и от механизмов восприятия. На рис.1, 2 были показаны два варианта ИИ. Их основное отличие - в носителях памяти, которыми определяются различия в действиях с моделями.
Слово "память" имеет два значения. С одной стороны, это явление, феномен фиксации модели в результате восприятия объекта рецепторами. С другой - это сами запечатленные модели. В последнем случае первостепенную роль играет носитель памяти.
Основной параметр всякой памяти - длительность запоминания. Наиболее короткая память у рецепторного элемента: она длится ровно столько времени, сколько необходимо для накопления энергии, нужной, чтобы выдать в мозг один импульс. В этот момент рецептор освобождается для нового восприятия энергии, его память мгновенная.
На рис.1, 2 выделен блок запоминания первичной модели ПM - на время, пока она распознается и по ней активируется распознанная модель РМ, которая в свою очередь используется для выбора моделей действия МД. Память для всех этих моделей естественно назвать активной, кратковременной или оперативной в противоположность длительной памяти - основному хранилищу моделей. Возможен и третий вид памяти - "внешняя", находящаяся вне "мозга", вне интеллекта (например, собственные записи, рисунки, которые можно повторно привлекать к использованию). Деление памяти на такие виды условно, но необходимо. В СИ активная и длительная память совмещена на одних сетевых элементах, в АИ массивы памяти совершенно различны.
Характер первичной модели, отражающей трехмерную структуру, был показан на рис.13. В моделях из длительной памяти структура фона очень неясная и обобщенная, выделяется только фигура. Для алгоритма важны параметры модели и ее частей. Они следующие: активность определяется яркостью объекта, настройкой и напряжением рецептора, четкость - фокусированием рецептора. Расстояние до рецептора для главной фигуры отмечается точно, а для "фона" - приблизительно. Степень обобщенности модели и ее деталей зависит от параметров настройки, расстояния до рецептора и помех.
В СИ мгновенная первичная модель остается в кратковременной памяти наряду с распознанной моделью. В АИ она перекодируется цифровым кодом, который должен отразить все параметры каждого объекта и их пространственных отношений. Именно это и представляет самую трудную задачу для моделирования интеллекта.
Модель во временной памяти выступает как единое целое, следовательно, между ее возбужденными элементами сразу же должны устанавливаться связи, хотя бы тоже временные. Для примера на рис.14 показана схема запоминания последовательности из семи звуков, составляющих слово. Память на слова есть у высших животных и птиц. По горизонтали отмечены номера условных тактов времени, по вертикали - номера однородных элементов, последовательно соединяемых с одним и тем же рецептором в каждый такт времени. В первый такт возбужден рецептор 1, во второй такт - рецептор 3, в третий такт - снова рецептор 1 и т.д. Модель станет действовать как единое целое только в том случае, если последовательно активируемые элементы (на рисунке они заштрихованы) в течение семи тактов будут соединены связями и сохранят активность все вместе по крайней мере на время от первого до седьмого такта. Без такого условия - это лишь разрозненные точки, не составляющие единой модели как действующей единицы информации. Отсюда, однако, следует, что каждый рецепторный элемент должен иметь связь со многими элементами "рецепторного поля" и соединяться с ними последовательно, всякий раз с новыми. Это не вызывает особых затруднений для случая, рассмотренного в нашем примере, где один звук соответствует одному элементу в каждый такт. А как обстоит дело, если мы воспринимаем не последовательность звуков, а, скажем, зрительную картину, то есть множество взаимосвязанных объектов? Тут нужны уже не столбцы элементов, а "кадры", которые будут мысленно прокручиваться наподобие киноленты. И сколько же связей нужно установить между возбужденными (яркими) точками кадров!
Рис.14. Схема запоминания последовательности звуков. Возбуж денные нейроны "рецепторного поля" заштрихованы.
К сожалению, что-нибудь другое предположить трудно. Можно представить, что энергия с рецептора подается все время на один и тот же, "свой" элемент временной памяти. Допустим, что в следующий момент активируется другой элемент от другого рецептора и между ними устанавливается связь. К следующему моменту первый и второй элементы уже утратили активность, но связь "запомнилась" и т.д. Предположение еще менее вероятное, потому что в таком случае нужны специальные механизмы памяти, отмечающие последовательность возбуждения элементов, чтобы, к примеру, иметь возможность повторить слово. Но для такого "счетчика адресов" тоже нужны структуры.
Память человека действительно обширна. Есть люди, которые могут прочесть наизусть поэму "Евгений Онегин". Но мало таких, которые способны повторить в точности длинное стихотворение после одного прослушивания. Это значит, что "кадры" временной памяти постепенно освобождаются и, таким образом, становятся способными снова запоминать новые модели. Правда, они освобождаются не совсем, кое-что переходит в постоянную память, но очень немногое, если сравнить объем информации, который мы воспринимаем ежедневно, и то, что из него остается в постоянной памяти. Как правило, мы запоминаем из воспринятого только то, что потом многократно мысленно повторяем.
ГИПОТЕЗА О МЕХАНИЗМАХ ПАМЯТИ
Трудно предложить гипотезу о механизмах памяти, пригодную для алгоритма интеллекта. Попробую изложить свою попытку. Для обозначения моделей и их сочетаний я буду пользоваться следующими заимствованными из лингвистики терминами. "Буква" - элементарная модель, самый малый значимый признак. "Алфавит" - совокупность букв-моделей, формируемых одним типом рецепторов; "алфавитов" может быть много: световые, звуковые и др. (см. ниже) "Слово" - более сложная модель, состоящая из элементарных моделей, то есть "букв", но очень хорошо организованная и выступающая как одно целое. "Фраза" - соединение "слов", чаще всего временное и непрочное. "Буква обобщенности" - знак, указывающий уровень обобщения моделей, их место в "иерархии блочности".
МОДЕЛИ И АНСАМБЛИ НЕЙРОНОВ. У человека в коре очень много нейронов, их количество оценивают в 10 и более миллиардов. Каждый нейрон соединяется с многими сотнями других. Таким образом, имеются почти беспредельные возможности для образования структур из нейронов, объединенных проходимыми ("проторенными") связями. Такие структуры - нейронные ансамбли - могут выступать в качестве моделей объектов внешнего мира. Один нейрон может включаться в несколько ансамблей, как это показано на рис.15. Модель повторно возбуждается ("вспоминается"), если возбудится некоторый процент входящих в ее ансамбль нейронов. Почему не возбуждаются все нейроны коры? Ведь связей между ними вполне достаточно. Чтобы ответить на этот вопрос, нужно сделать еще одно предположение: когда один нейрон возбуждается, соседние тормозятся. Этот принцип "индуктивного торможения" установлен И.П.Павловым. Таким образом, если допустить, что 30% нейронов данной модели возбудятся извне, то все окружающие должны бы затормозиться. Так и происходит, но связи к остальным 70% нейронов данной модели настолько проторены, что эти нейроны больше возбуждаются по связям, чем тормозятся "по площади". В результате активируется весь ансамбль, вся модель, а другие модели остаются заторможенными, несмотря на то что часть возбужденных в данной модели нейронов входит и в них. Такова гипотеза об ансамблях нейронов.
Рис.15. Нейронные ансамбли.
Для проверки этой гипотезы сотрудниками отдела биокибернетики разработан макет нейронной сети, содержащий 22 узла и наборное поле, которое позволяет осуществлять все возможные соединения между узлами. Узлы (модели нейронов) представляют собой усилители постоянного тока с нелинейной (S-образной) характеристикой. В качестве связей использованы постоянные резисторы. Вес связи считается обратно пропорциональным сопротивлению резистора.
Макет создавался для получения ответа на следующие основные вопросы:
- можно ли технически реализовать устойчиво работающую сеть из нейронных ансамблей так, чтобы при возбуждении одного ансамбля не возбуждались одновременно и другие, связанные с ним;
- можно ли построить устойчивую сеть, если ансамбли пересекаются, то есть одни и те же узлы входят в состав различных ансамблей;
- можно ли добиться четкого перехода возбуждения с одного ансамбля на другой, если они пересекаются значительной частью своих узлов.
Эксперименты с макетом дали положительные ответы на все эти вопросы. Оказалось, однако, что для успешной работы необходимо использовать централизованную систему, управляющую активностью всей сети. По своим свойствам и назначению эта система аналогична системе усиления-торможения (СУТ), которая подробно будет описана ниже. Следует отметить, что многие исследователи, пытавшиеся построить устойчивую ансамблевую сеть без централизованной системы управления активностью, встретились с большими трудностями и вынуждены были накладывать жесткие ограничения на допустимую структуру сети.
На макете было также показано, что устойчиво работающая ансамблевая сеть может иметь число ансамблей, превышающее число узлов сети. Поэтому в некоторых задачах, используя ансамблевые сети, можно получить более экономную аппаратурную реализацию. С увеличением числа узлов эта экономия становится все более ощутимой. К сожалению, построение ансамблевых сетей большого объема связано пока со значительными трудностями.
УСТРОЙСТВО "РЕЦЕПТОРНОГО ПОЛЯ". На рис.16 показана гипотетическая схема "рецепторного поля", объясняющая принцип совмещения временной и постоянной памяти. Такое совмещение, несомненно, имеет место в коре мозга.
Рис.16. Схема "Рецепторного поля": Рц - рецепторы, Н - настройка.
Система рецепторов Рц подает активность на "рецепторное поле", состоящее из довольно большого количества кадров, построенных так, что в каждом из них имеются представительства - элементы для каждого рецептора. Для удобства понимания кадры расположены в виде кольца. Число кадров значительное, но не бесконечное. Предположим, что есть переключатель в центре кольца, который или поворачивает его на один кадр в каждый такт времени, или поочередно переключает связи от рецепторов с одного кадра на другой, соседний. Имеется настройка кадров Н, обеспечивающая фокусирование, то есть позволяющая им четко воспринимать избранную деталь и неясно видеть весь объект. Она же передвигает фокус по структуре объекта. Еще одно условие: настройка "устает", поэтому после нескольких тактов рецептор отключается совсем.
Характеристики затухания активности элементов очередного кадра после отключения от них рецептора имеют вид, показанный на рис.8. Затухание активности в самом первом кадре происходит раньше, чем завершится полный круг переключения.
Картины, представленные в кадрах, показаны на рис.17. В первый такт времени система рецепторов при отсутствии фокусировки неясно воспринимает объект как целое, и он отражается в виде наиболее обобщенной модели (рис.17,а). Между активированными элементами возникают связи. Предположим, что объект "заинтересовал" интеллект (об этом - ниже), тогда в следующий такт, приходящийся на следующий кадр, зрением, умеренно сфокусированным на верхнем левом углу, преимущественно воспринимается часть объекта, обозначенная цифрой 1. Создается временная модель этой части, представляющая собой не очень четкое воспроизведение последней при обобщении всего остального объекта (рис.17,б). Затем фокусировка переходит на часть 2, далее на часть 3 объекта, и они отпечатываются в модели. Модели в предыдущих кадрах еще сохраняют активность, и от них проторяются связи к следующему кадру. В каждом кадре на соответствующих элементах отмечаются направление и степень фокусировки всей системы рецепторов (назовем ее "глазом"). После того как настройка на крупные части обойдет их и они отпечатаются на кадрах, структура их расположения вырисуется в "модели-схеме" (рис.17,в). Вся серия картин, отображенных в кадрах, объединена продольными связями. На этом восприятие может закончиться, но может быть продолжено на следующий цикл, состоящий в еще большей фокусировке (напряжении) "глаза", нацеленной на детальное рассматривание каждого блока с отражением тонких подробностей его структуры, "привязанных" к блоку, а через него - и к общей структуре объекта. На рис.17,г этому случаю соответствует модель, формирующаяся при восприятии части 1 объекта сильно сфокусированным зрением. Весь процесс рассматривания объекта запечатлевается в серии кадров. В целом - это "фраза" изучения предмета, запечатленная в кадрах рецепторного поля.
Рис.17. Система моделей разной степени обобщенности, отражающая объект.
ВСПОМИНАНИЕ, ОБОБЩЕНИЕ, ЗАБЫВАНИЕ
В первое время вся система моделей в серии кадров активна, и если отключить рецепторы, то можно заново их просмотреть с начала до конца, как бы повторив процесс реального изучения, повторно активируя запечатленные образы. Так человек и делает, мысленно повторяя только что услышанную фразу или воссоздавая в воображении процесс рассматривания сложного объекта. Это бывает в том случае, когда объект или фраза заинтересовывает наш разум. При таком повторении связи между элементами проторяются и происходит процесс перехода временной памяти в длительную, поэтому картину еще можно вспомнить некоторое время спустя. При многократном вспоминании связи проторяются сильно и объект может запомниться во всех его деталях. Если же значимость предмета не очень велика и повторения не имеют большой активности, то происходит обобщение, то есть постепенное сокращение модели за счет забывания малозначащих ее частей, которые были неактивны при восприятии или не привлекли интереса во время повторения. Так исчезают из памяти целые кадры.
В конце концов может остаться лишь очень обобщенная модель предмета, однако при этом сохраняется воспоминание о самом факте детального изучения объекта, знание о том, что он был изучен подробно. Видимо, это обобщенная модель самого процесса переключения настройки "глаза".
Образ предмета запечатлевается не в одном кадре памяти, а целой их серии, многократно, хотя и с разными деталями. Это соответствует данным физиологии о том, что удаление какой-либо части затылочной области коры не разрушает определенных участков зрительной картины, а просто обедняет ее всю.
Если объект не имел ценности и картина его не вспоминается повторно, то образ совершенно исчезает из памяти, поскольку для проторения первично возникающих связей необходима повторная активация элементов модели. Но, так или иначе, с течением времени происходит закономерное "освобождение" памяти, потому что запомненная картина-модель всегда значительно упрощена по сравнению с воспринимаемой и, следовательно, не занимает все элементы "рецепторного поля".
При восприятии изменяющейся картины рецепторы повторно подключаются к предмету, в результате получается новая серия моделей-кадров, имеющая связи с первой.
В соответствии с этой гипотезой кратковременная и длительная память реализуется на одних и тех же элементах "нейронной сети" в одном рецепторном поле, первая - за счет активности элементов, вторая - за счет развития связей. Переход между ними возможен в виде кратковременной памяти связей. Последняя задается характеристикой изменения проходимости связи во времени по такому же типу, как и характеристика изменения активности элемента, но удлиненной во времени и уменьшающейся не до нуля, а до некоторой остаточной величины, определяющей "вклад" связи в длительную память. При повторном использовании данной связи такие "вклады" (Д) накапливаются и определяют прочность памяти (рис. 18 ). Если модель повторно не возбуждается, то связи не функционируют, и их проходимость уменьшается. Повторная активация модели сопровождается тренировкой ее элементов, что выражается в изменении ее статической и динамической характеристик, а также в повышении уровня спонтанной, собственной "активности покоя" модели.
Рис.18. Типичная динамическая характеристика связи между элементами А и Б. Повышенная проходимость связи остается после прекращения возбуждения элемента А (заштрихованный участок на оси времени). Д - остаточная проходимость связи, определяющая "вклад" связи в постоянную память.
На рис.19 показаны этапы забывания и постепенного сокращения модели, так что в результате остается только несколько обобщенных и связанных с ней "частных" моделей, характеризующих объект лишь в отношении его значимости, то есть полезности.
Рис.19. Схема постепенного забывания и сокращения модели объекта, первоначально состоящей из серии кадров с разной обобщенностью и детальностью,- линия а. Менее значимые и похожие детали заменяются одной - линия б. Потом остаются только две крайние модели (линия в) и, наконец, лишь одна обобщенная модель г.
Разумеется, для того чтобы с помощью элементов одного "рецепторного поля" запоминать все новые и новые модели, нужно допустить наличие большого количества кадров. Кроме того, необходимо предположить торможение моделей как состояние, противоположное активности, возбуждению. Торможение - отрицательная активность, требующая для своего преодоления дополнительной "мощности", идущей по связи от внешнего источника - рецептора или соседнего возбужденного элемента.
О РЕАЛИЗАЦИИ ГИПОТЕЗЫ
Наша гипотеза предполагает строение "рецепторного поля" в виде сети из элементов с неограниченно большим количеством связей. Примерно такая структура имеет место в коре мозга. Воспроизвести ее техническими средствами пока не представляется возможным, разве что в очень ограниченных пределах, которые едва ли смогут обеспечить демонстративность устройства. Все надежды на алгоритмический интеллект.
В АИ все виды памяти должны существовать раздельно. Время нужно делить на такты и все расчеты активности моделей и проходимости связей осуществлять "ступенчато", от такта к такту. Первый вид памяти в АИ - это картина с рецептора. Она существует очень короткое время и считывается, перекодируется по определенным правилам, которые еще нужно создать. Получается ряд цифр, отражающих как саму структуру объекта, так и перечисленные выше параметры модели. Главный из них - это уровень активности каждого объекта модели картины. Поскольку процесс рассматривания даже неподвижной картины выражается в серии кадров типа показанных на рис.17, то и цифровое выражение модели объекта будет состоять из нескольких строк цифр, кодирующих каждый кадр восприятия. Связи выразятся адресами кадров. Тогда два-три кадра составят "фразу" - модель объекта во временной памяти. Параметр активности кадра в целом и его отдельных объектов будет понижаться по определенной характеристике, сходной с представленной на рис.18. По мере отдаления во времени кадры станут "бледнеть", утрачивать детали, так что вся "фраза" будет становиться все короче и короче. Если не произойдет повторного привлечения внимания и активации "фразы", модель сотрется из памяти. Если же активность и связи будут подновляться повторным использованием модели, то через некоторое время, предусмотренное характеристикой, модель перейдет в длительную память вместе со своими связями-адресами. Пересчет активности и связей всех моделей в кратковременной памяти обязателен для каждого такта.
Длительная память в АИ выражена "фразами", перешедшими из кратковременной памяти. Сейчас трудно представить всю организацию массива памяти. Думаю, что он должен состоять из большого числа "словарей фраз", построенных из 2-4 "слов" каждая. Во "фразах" будут широко использоваться обобщенные модели.
В СИ все модели постоянно сохраняют хотя бы минимальную активность, вследствие чего связи между ними постоянно изменяются. Это очень затрудняет воспроизведение СИ на ЦВМ, поскольку с увеличением объема сетей катастрофически возрастает объем расчетов. АИ позволяет уменьшить расчеты за счет удлинения интервалов времени между пересчетами связей массива длительной памяти.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ДЕЙСТВИЯ С МОДЕЛЯМИ
Здесь мы рассмотрим только важнейшие действия с моделями. К ним можно отнести действия активации моделей, их сравнения, а также дописывания "фразы" и обобщения моделей.
АКТИВАЦИЯ МОДЕЛЕЙ
В памяти находится масса моделей, составленных из "слов", "фраз", "букв" разных "алфавитов". Модели объединены связями, по которым они взаимодействуют друг с другом. Большинство моделей находится в неактивном состоянии. В частности, это касается всех моделей длительной памяти АИ и в меньшей степени - СИ, в котором нет разделения активной и пассивной (кратковременной и длительной) памяти. Деятельность интеллекта связана с активацией новых моделей в длительной памяти и постепенным затуханием активности моделей в кратковременной памяти. В мозге и в ИИ на физических сетях каждый элемент модели - нейрон - или целую модель - ансамбль из нейронов - можно представить как генератор специальной ("нервной") энергии, возникающей в ответ на действие такой же энергии, которая поступает по связям от других моделей. Генератор работает по статическим и динамическим характеристикам, подобным показанным на рис.8 и 9. Энергия передается по связям на другие модели; количество ее определяется проходимостью связи.
Активное состояние модели можно назвать физиологическим термином "возбуждение". В нейронах мозга оно выражается частотой импульсов, в СИ на физических сетях - это электрический потенциал. В ИИ, моделируемом на цифровых машинах, уровень активности моделей - это главный параметр, "буква", выраженная числом, и его нужно пересчитывать для каждого временного такта по статическим и динамическим характеристикам. Впрочем, для АИ это касается только моделей в кратковременной памяти. Операции активирования моделей могут быть двух видов: извлечение модели из длительной памяти с расчетом ее активности или пересчет уровня активности модели, уже находящейся в кратковременной памяти, если она получает дополнительный импульс по связям от другой модели.
В СИ выбор новой модели для активации определяется структурой связей, идущих от активной модели. В АИ новая модель вызывается из длительной памяти по "адресу", записанному в "словаре фраз", в котором первым "словом" является уже возбужденная модель. Например, есть "словарь" предмет-действие, в нем есть модель "хлеб", ей соответствует модель действия "жевать". Последняя и будет вызвана, если в оперативной (кратковременной) памяти содержится возбужденное "слово" "хлеб". Уровень активности модели "жевать" будет подсчитан, исходя из статической характеристики коэффициента проходимости связи, записанного в "словаре", и активности модели "хлеб".
В соответствии с нашей гипотезой для функционирования интеллекта необходимо еще другое состояние, противоположное по знаку возбуждению,- так называемое "торможение". Этот термин принят в нейрофизиологии. Мы его представляем как отрицательную активность, которая тоже генерируется специальными центрами и вычитается из положительной активности при расчетах. Впрочем, необходимость в торможении нужно еще уточнять при проектировании ИИ.
СРАВНЕНИЕ МОДЕЛЕЙ И РАСПОЗНАВАНИЕ ОБРАЗОВ
Второй тип операции с моделями - это их сравнение между собой с целью установления как общности, так и различия. Реализация действия целиком зависит от вида интеллекта и организации памяти. В мозге сравнение осуществляется, по всей вероятности, путем условного "наложения" моделей друг на друга. При этом их сходство и различие определяются по количеству общих элементов. Из физиологии известно, что очаг возбуждения в коре генерирует торможение на окружающие участки, затем возбуждение первого очага падает, его "соседи" освобождаются от торможения, и возбуждается другой очаг коры. Можно предполагать, что этим следующим очагом, то есть моделью, будет такой очаг, у которого много связей с первым или много общих нейронов в составляющих модели ансамблях. Сходство и различие определяются по отношению к каким-то третьим моделям-признакам, связи к которым идут от первой и второй из сравниваемых моделей. Допустим, что первая возбужденная модель вызвала к активности признак 1, а вторая - активированная по сходству - возбудила признак 2. Степень совпадения признаков - это мера общности и различия моделей. У животных нет количественного выражения для этой меры, у человека, овладевшего счетом, она есть.
Для АИ сравнение моделей - банальная операция вычитания двух строк цифр. Выраженная цифрами модель разделена на разряды со своими значениями. Можно предположить, что в первом разряде представлена наиболее обобщенная модель (какое-то материальное тело), во втором - крупные структурные блоки (голова, туловище, ноги, отличающие человека), в последующих разрядах - детали. Такой образ всегда имеет место, когда мы воспринимаем объект, даже при фокусировке зрения на его деталях. По этим разрядам и будет осуществляться сравнение.
Сравнение известной модели с неизвестными лежит в основе распознавания образов. По модели объекта, отпечатанного с рецептора в кратковременной памяти, которая не имеет связей с другими моделями и, следовательно, является неизвестной, нужно найти модель-эталон, имеющую такие связи, иначе говоря, входящую в различные "фразы" и числящуюся в "словарях". Именно связями определяется то, насколько знаком нам тот или иной объект: чем больше связей, тем лучше мы его знаем. Вероятность распознавания определяется точностью совпадений неизвестной модели с эталонами. Множественное число я употребил не случайно: объект может походить на несколько других, известных.
Распознавание в СИ осуществляется автоматически: ансамбль возбужденных с рецептора элементов, который представляет собой модель неизвестного объекта, накладывается на другую модель. Она активируется, а затем активируются связанные с ней модели, опознающие объект. Поочередно может активироваться несколько похожих моделей, каждая со своей степенью сходства.
В АИ для распознавания модели нужна специальная программа извлечения из постоянной памяти серии моделей и сравнение каждой из них с моделью объекта. Выборка моделей из памяти должна производиться начиная с самого обобщенного признака - "буквы". По ней выбирается "словарь" и далее сравниваются вторые и следующие "буквы", так же как производится поиск значения "слова" по "словарю". "Известность" наиболее близкого из искомых "слов" определяется числом вхождений его в "словари фраз". Степень вероятности опознания объекта определяется совпадением последних "букв" - деталей, потому что по первым "буквам", определяющим обобщенные признаки, всегда можно найти много похожих. Человека легко отличить от других объектов, труднее распознать - кто есть кто.
Остановлюсь на двух обстоятельствах, осложняющих распознавание. Первое - "неполнота" модели объекта, обусловленная помехами восприятия, дальностью расстояния или недостаточным напряжением рецептора. Неполнота или неясность первичной модели выражается в отсутствии ряда деталей, в "крупноблочности". При этом всегда присутствует "буква", объясняющая неполноту,- показатель низкой настройки рецептора или наличия внешних помех. Я намеренно не употребил понятие "обобщенность" применительно к такой модели, потому что оно предусматривает выражение модели крупными блоками в результате специального отказа от деталей, а не отсутствия их из-за плохого восприятия. Неполную модель можно распознать, только сравнивая ее с обобщенными моделями-эталонами, чем и определяется полнота распознавания. Например, видно, что объект - человек, но мужчина это или женщина, определить нельзя из-за неясности образа. Более четкую первичную модель можно получить за счет настройки рецепторов или приближения к объекту.
Второе обстоятельство - это различие в размерах первичной модели и моделей-эталонов. Общеизвестно, что человек может распознать объект с разного расстояния, если он хорошо изучен вблизи. Распознавания прямым наложением моделей здесь не получится. Нужно допустить специальный механизм приведения модели к одному определенному размеру в виде своеобразных "рельсов" в "рецепторном поле", как показано на рис.20. "Рельсы" эти позволяют изменять размер первичной модели, сохраняя сходство. По всей вероятности, нечто подобное есть в зрительной области коры. Для АИ перекодирование первичной модели цифровым кодом должно предусматривать приведение к стандартному размеру моделей-эталонов.
Рис.20. Схема гипотетических "рельсов" в "рецепторном поле", позволяющих производить приведение модели к одному определенному размеру. В памяти хранится модель а. При восприятии объекта с близкого расстояния большая модель б уменьшается до размеров а; при восприятии объекта с большого расстояния малые модели в или г увеличиваются до размеров а.
Есть еще ряд обстоятельств, затрудняющих распознавание: различия исходных положений объекта, его деформации и др. Многие из возникающих здесь вопросов подробно исследовались кибернетиками, и полученные ими результаты можно применить и для АИ.
ДОПИСЫВАНИЕ "ФРАЗЫ" - ВСПОМИНАНИЕ
Операцией дописывания "фразы" можно назвать активацию какой-либо одной модели, являющейся следствием активации другой модели. Активация происходит по связи, соединяющей обе эти модели. Такую операцию можно еще обозначить термином "вспоминание". Активация последовательности "слов" во "фразе" осуществляется по принципам, описанным в начале этого раздела. "Фразы" могут быть самыми различными, в них может запечатлеваться любая последовательность воспринятых образов, закрепленная в памяти повторным вспоминанием. В АИ "фразы" записаны в "словарях фраз". Их много: предмет-действие, предмет-качество и др., и наоборот. Важными являются, так сказать, вертикальные "фразы": "вверх" - от детали к обобщению, "вниз" - как расшифровка обобщенной модели детальными вариантами. Память в АИ должна состоять из коротких "фраз" в 2-4 "слова", а длинные последовательности моделей должны составляться из нескольких "фраз". Это проще, чем создавать "словари" длинных "фраз". Человеческий разум тоже оперирует короткими "фразами" образов. Вызов следующего "слова" "фразы" возможен только в случае достаточной активности первого "слова" и достаточной проходимости связи от него ко второму. Активность рассчитывается по входам на первое "слово" от других моделей (по другому "словарю"), а параметр связи записан в "словаре".
ОБОБЩЕНИЕ МОДЕЛЕЙ
Операция выделения обобщенной модели из серии конкретных моделей осуществляется их последовательным сравнением и выделением общего признака сходства между ними (пример - "четвероногие"). При этом все остальные признаки, по которым модели серии отличаются друг от друга, становятся все более неясными, иными словами, в обобщенной модели они выступают с низкой активностью. Такая обобщенная модель, полученная на материале ряда конкретных моделей, имеет "букву обобщения", указывающую название действия, в результате которого модель образовалась. Этой "буквой" она отличается от неясной модели конкретного объекта, при которой стоит "буква восприятия".
Замена ряда конкретных моделей одной обобщенной является весьма распространенной операцией. Идя по лесу, вы видите множество деревьев. Все они отражаются во временной памяти, и некоторое время спустя еще можно припомнить отдельные деревья. Однако потом конкретные образы заменятся неким обобщенным деревом, усредняющим виденные распространенные экземпляры ("лес из высоких сосен"). При этом обобщенная модель сопровождается "буквами" с адресами действий, отрезков пространства или времени. Обычно обобщенная модель имеет структурный ранг на одну степень выше, чем конкретные составляющие. Например, в "обобщенном дереве" ветки и листья не дифференцируются по породам. "Обобщенный человек" выглядит бесполым, поскольку его черты совершенно неясны.
Обобщение касается всех видов моделей - зрительных и слуховых образов, моделей действий, моделей качеств, иногда самых специфичных. "Ранг обобщения" может быть самым различным, но образное выражение обобщений высокого ранга затруднительно, и они выражаются только с помощью речи. Например, можно представить "обобщенный стул" в виде неясного образа предмета со спинкой, сиденьем и ножками, но как зрительно представить себе "обобщенную мебель"? Здесь совершенно разные предметы обобщены по признаку функции или места нахождения. Если потребовать: "Представьте мебель", то выступает ряд неясных предметов мебели и "буква обобщения", указывающая, что есть еще много подобных образов. Только речь позволила обозначить этот уровень обобщения и таким образом дала возможность произвести сами действия.
Можно ли образно представить "вещь"? Или "материальное тело"? Можно, в виде неясной структуры, отграниченной от других. Зрительный образ такой структуры имеется как "что-то", но выделить его позволили только слова речи - "вещь", "тело", "существо", "человек", "животное". Можно предполагать, что черты обобщения всегда присутствуют в конкретной модели. Так, например, понятие "материальное тело" присутствует в модели стула, отражая то обстоятельство, что стул - это пространственная структура, отграниченная от среды.
Для цифрового кодирования образов при создании АИ нужно, вероятно, отразить отдельными цифрами принадлежность данной конкретной вещи к основным уровням структурной иерархии обобщения. Для этого необходимо создать систему обозначений. Разумеется, нельзя в модели представить все возможные параметры, по которым можно обобщить, например, стулья, но следует отметить, что они принадлежат к приспособлениям для сидения, к мебели, к предметам (то есть неживым телам). Это удлинит конкретную модель, но упростит операции с ней. Впрочем, не стоит вдаваться в детали, поскольку возможны разные системы перекодирования образов в цифровые модели.
На этом я закончу рассмотрение операций с моделями, хотя далеко не исчерпал их варианты. Важно усвоить главные, потому что они постоянно присутствуют в программах интеллекта, и хотелось бы при дальнейшем изложении не касаться деталей операции, а просто обозначать ее.
Здесь мы рассмотрим только важнейшие действия с моделями. К ним можно отнести действия активации моделей, их сравнения, а также дописывания "фразы" и обобщения моделей.
АКТИВАЦИЯ МОДЕЛЕЙ
В памяти находится масса моделей, составленных из "слов", "фраз", "букв" разных "алфавитов". Модели объединены связями, по которым они взаимодействуют друг с другом. Большинство моделей находится в неактивном состоянии. В частности, это касается всех моделей длительной памяти АИ и в меньшей степени - СИ, в котором нет разделения активной и пассивной (кратковременной и длительной) памяти. Деятельность интеллекта связана с активацией новых моделей в длительной памяти и постепенным затуханием активности моделей в кратковременной памяти. В мозге и в ИИ на физических сетях каждый элемент модели - нейрон - или целую модель - ансамбль из нейронов - можно представить как генератор специальной ("нервной") энергии, возникающей в ответ на действие такой же энергии, которая поступает по связям от других моделей. Генератор работает по статическим и динамическим характеристикам, подобным показанным на рис.8 и 9. Энергия передается по связям на другие модели; количество ее определяется проходимостью связи.
Активное состояние модели можно назвать физиологическим термином "возбуждение". В нейронах мозга оно выражается частотой импульсов, в СИ на физических сетях - это электрический потенциал. В ИИ, моделируемом на цифровых машинах, уровень активности моделей - это главный параметр, "буква", выраженная числом, и его нужно пересчитывать для каждого временного такта по статическим и динамическим характеристикам. Впрочем, для АИ это касается только моделей в кратковременной памяти. Операции активирования моделей могут быть двух видов: извлечение модели из длительной памяти с расчетом ее активности или пересчет уровня активности модели, уже находящейся в кратковременной памяти, если она получает дополнительный импульс по связям от другой модели.
В СИ выбор новой модели для активации определяется структурой связей, идущих от активной модели. В АИ новая модель вызывается из длительной памяти по "адресу", записанному в "словаре фраз", в котором первым "словом" является уже возбужденная модель. Например, есть "словарь" предмет-действие, в нем есть модель "хлеб", ей соответствует модель действия "жевать". Последняя и будет вызвана, если в оперативной (кратковременной) памяти содержится возбужденное "слово" "хлеб". Уровень активности модели "жевать" будет подсчитан, исходя из статической характеристики коэффициента проходимости связи, записанного в "словаре", и активности модели "хлеб".
В соответствии с нашей гипотезой для функционирования интеллекта необходимо еще другое состояние, противоположное по знаку возбуждению,- так называемое "торможение". Этот термин принят в нейрофизиологии. Мы его представляем как отрицательную активность, которая тоже генерируется специальными центрами и вычитается из положительной активности при расчетах. Впрочем, необходимость в торможении нужно еще уточнять при проектировании ИИ.
СРАВНЕНИЕ МОДЕЛЕЙ И РАСПОЗНАВАНИЕ ОБРАЗОВ
Второй тип операции с моделями - это их сравнение между собой с целью установления как общности, так и различия. Реализация действия целиком зависит от вида интеллекта и организации памяти. В мозге сравнение осуществляется, по всей вероятности, путем условного "наложения" моделей друг на друга. При этом их сходство и различие определяются по количеству общих элементов. Из физиологии известно, что очаг возбуждения в коре генерирует торможение на окружающие участки, затем возбуждение первого очага падает, его "соседи" освобождаются от торможения, и возбуждается другой очаг коры. Можно предполагать, что этим следующим очагом, то есть моделью, будет такой очаг, у которого много связей с первым или много общих нейронов в составляющих модели ансамблях. Сходство и различие определяются по отношению к каким-то третьим моделям-признакам, связи к которым идут от первой и второй из сравниваемых моделей. Допустим, что первая возбужденная модель вызвала к активности признак 1, а вторая - активированная по сходству - возбудила признак 2. Степень совпадения признаков - это мера общности и различия моделей. У животных нет количественного выражения для этой меры, у человека, овладевшего счетом, она есть.
Для АИ сравнение моделей - банальная операция вычитания двух строк цифр. Выраженная цифрами модель разделена на разряды со своими значениями. Можно предположить, что в первом разряде представлена наиболее обобщенная модель (какое-то материальное тело), во втором - крупные структурные блоки (голова, туловище, ноги, отличающие человека), в последующих разрядах - детали. Такой образ всегда имеет место, когда мы воспринимаем объект, даже при фокусировке зрения на его деталях. По этим разрядам и будет осуществляться сравнение.
Сравнение известной модели с неизвестными лежит в основе распознавания образов. По модели объекта, отпечатанного с рецептора в кратковременной памяти, которая не имеет связей с другими моделями и, следовательно, является неизвестной, нужно найти модель-эталон, имеющую такие связи, иначе говоря, входящую в различные "фразы" и числящуюся в "словарях". Именно связями определяется то, насколько знаком нам тот или иной объект: чем больше связей, тем лучше мы его знаем. Вероятность распознавания определяется точностью совпадений неизвестной модели с эталонами. Множественное число я употребил не случайно: объект может походить на несколько других, известных.
Распознавание в СИ осуществляется автоматически: ансамбль возбужденных с рецептора элементов, который представляет собой модель неизвестного объекта, накладывается на другую модель. Она активируется, а затем активируются связанные с ней модели, опознающие объект. Поочередно может активироваться несколько похожих моделей, каждая со своей степенью сходства.
В АИ для распознавания модели нужна специальная программа извлечения из постоянной памяти серии моделей и сравнение каждой из них с моделью объекта. Выборка моделей из памяти должна производиться начиная с самого обобщенного признака - "буквы". По ней выбирается "словарь" и далее сравниваются вторые и следующие "буквы", так же как производится поиск значения "слова" по "словарю". "Известность" наиболее близкого из искомых "слов" определяется числом вхождений его в "словари фраз". Степень вероятности опознания объекта определяется совпадением последних "букв" - деталей, потому что по первым "буквам", определяющим обобщенные признаки, всегда можно найти много похожих. Человека легко отличить от других объектов, труднее распознать - кто есть кто.
Остановлюсь на двух обстоятельствах, осложняющих распознавание. Первое - "неполнота" модели объекта, обусловленная помехами восприятия, дальностью расстояния или недостаточным напряжением рецептора. Неполнота или неясность первичной модели выражается в отсутствии ряда деталей, в "крупноблочности". При этом всегда присутствует "буква", объясняющая неполноту,- показатель низкой настройки рецептора или наличия внешних помех. Я намеренно не употребил понятие "обобщенность" применительно к такой модели, потому что оно предусматривает выражение модели крупными блоками в результате специального отказа от деталей, а не отсутствия их из-за плохого восприятия. Неполную модель можно распознать, только сравнивая ее с обобщенными моделями-эталонами, чем и определяется полнота распознавания. Например, видно, что объект - человек, но мужчина это или женщина, определить нельзя из-за неясности образа. Более четкую первичную модель можно получить за счет настройки рецепторов или приближения к объекту.
Второе обстоятельство - это различие в размерах первичной модели и моделей-эталонов. Общеизвестно, что человек может распознать объект с разного расстояния, если он хорошо изучен вблизи. Распознавания прямым наложением моделей здесь не получится. Нужно допустить специальный механизм приведения модели к одному определенному размеру в виде своеобразных "рельсов" в "рецепторном поле", как показано на рис.20. "Рельсы" эти позволяют изменять размер первичной модели, сохраняя сходство. По всей вероятности, нечто подобное есть в зрительной области коры. Для АИ перекодирование первичной модели цифровым кодом должно предусматривать приведение к стандартному размеру моделей-эталонов.
Рис.20. Схема гипотетических "рельсов" в "рецепторном поле", позволяющих производить приведение модели к одному определенному размеру. В памяти хранится модель а. При восприятии объекта с близкого расстояния большая модель б уменьшается до размеров а; при восприятии объекта с большого расстояния малые модели в или г увеличиваются до размеров а.
Есть еще ряд обстоятельств, затрудняющих распознавание: различия исходных положений объекта, его деформации и др. Многие из возникающих здесь вопросов подробно исследовались кибернетиками, и полученные ими результаты можно применить и для АИ.
ДОПИСЫВАНИЕ "ФРАЗЫ" - ВСПОМИНАНИЕ
Операцией дописывания "фразы" можно назвать активацию какой-либо одной модели, являющейся следствием активации другой модели. Активация происходит по связи, соединяющей обе эти модели. Такую операцию можно еще обозначить термином "вспоминание". Активация последовательности "слов" во "фразе" осуществляется по принципам, описанным в начале этого раздела. "Фразы" могут быть самыми различными, в них может запечатлеваться любая последовательность воспринятых образов, закрепленная в памяти повторным вспоминанием. В АИ "фразы" записаны в "словарях фраз". Их много: предмет-действие, предмет-качество и др., и наоборот. Важными являются, так сказать, вертикальные "фразы": "вверх" - от детали к обобщению, "вниз" - как расшифровка обобщенной модели детальными вариантами. Память в АИ должна состоять из коротких "фраз" в 2-4 "слова", а длинные последовательности моделей должны составляться из нескольких "фраз". Это проще, чем создавать "словари" длинных "фраз". Человеческий разум тоже оперирует короткими "фразами" образов. Вызов следующего "слова" "фразы" возможен только в случае достаточной активности первого "слова" и достаточной проходимости связи от него ко второму. Активность рассчитывается по входам на первое "слово" от других моделей (по другому "словарю"), а параметр связи записан в "словаре".
ОБОБЩЕНИЕ МОДЕЛЕЙ
Операция выделения обобщенной модели из серии конкретных моделей осуществляется их последовательным сравнением и выделением общего признака сходства между ними (пример - "четвероногие"). При этом все остальные признаки, по которым модели серии отличаются друг от друга, становятся все более неясными, иными словами, в обобщенной модели они выступают с низкой активностью. Такая обобщенная модель, полученная на материале ряда конкретных моделей, имеет "букву обобщения", указывающую название действия, в результате которого модель образовалась. Этой "буквой" она отличается от неясной модели конкретного объекта, при которой стоит "буква восприятия".
Замена ряда конкретных моделей одной обобщенной является весьма распространенной операцией. Идя по лесу, вы видите множество деревьев. Все они отражаются во временной памяти, и некоторое время спустя еще можно припомнить отдельные деревья. Однако потом конкретные образы заменятся неким обобщенным деревом, усредняющим виденные распространенные экземпляры ("лес из высоких сосен"). При этом обобщенная модель сопровождается "буквами" с адресами действий, отрезков пространства или времени. Обычно обобщенная модель имеет структурный ранг на одну степень выше, чем конкретные составляющие. Например, в "обобщенном дереве" ветки и листья не дифференцируются по породам. "Обобщенный человек" выглядит бесполым, поскольку его черты совершенно неясны.
Обобщение касается всех видов моделей - зрительных и слуховых образов, моделей действий, моделей качеств, иногда самых специфичных. "Ранг обобщения" может быть самым различным, но образное выражение обобщений высокого ранга затруднительно, и они выражаются только с помощью речи. Например, можно представить "обобщенный стул" в виде неясного образа предмета со спинкой, сиденьем и ножками, но как зрительно представить себе "обобщенную мебель"? Здесь совершенно разные предметы обобщены по признаку функции или места нахождения. Если потребовать: "Представьте мебель", то выступает ряд неясных предметов мебели и "буква обобщения", указывающая, что есть еще много подобных образов. Только речь позволила обозначить этот уровень обобщения и таким образом дала возможность произвести сами действия.
Можно ли образно представить "вещь"? Или "материальное тело"? Можно, в виде неясной структуры, отграниченной от других. Зрительный образ такой структуры имеется как "что-то", но выделить его позволили только слова речи - "вещь", "тело", "существо", "человек", "животное". Можно предполагать, что черты обобщения всегда присутствуют в конкретной модели. Так, например, понятие "материальное тело" присутствует в модели стула, отражая то обстоятельство, что стул - это пространственная структура, отграниченная от среды.
Для цифрового кодирования образов при создании АИ нужно, вероятно, отразить отдельными цифрами принадлежность данной конкретной вещи к основным уровням структурной иерархии обобщения. Для этого необходимо создать систему обозначений. Разумеется, нельзя в модели представить все возможные параметры, по которым можно обобщить, например, стулья, но следует отметить, что они принадлежат к приспособлениям для сидения, к мебели, к предметам (то есть неживым телам). Это удлинит конкретную модель, но упростит операции с ней. Впрочем, не стоит вдаваться в детали, поскольку возможны разные системы перекодирования образов в цифровые модели.
На этом я закончу рассмотрение операций с моделями, хотя далеко не исчерпал их варианты. Важно усвоить главные, потому что они постоянно присутствуют в программах интеллекта, и хотелось бы при дальнейшем изложении не касаться деталей операции, а просто обозначать ее.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ВЗАИМОДЕЙСТВИЕ МОДЕЛЕЙ В ИНТЕЛЛЕКТЕ
В предыдущих главах мы разобрали следующие вопросы:
1. Принципы структурного и энергетического построения среды, в которой действуют интеллекты. Два основных типа искусственного интеллекта - сетевой (СИ) и алгоритмический (АИ).
2. Понятие о моделях, их структурное и энергетическое выражение. Хранение моделей - память.
3. Основные программы действий с моделями - в смысле их превращений и обращения с разными видами памяти.
Последние два пункта разделены довольно условно.
Теперь можно перейти к главному: как должны взаимодействовать модели в интеллекте, чтобы в результате выполнялось его назначение - управление объектами внешней среды, собственным "телом" и даже самим собой.
Если возможно бесконечное количество моделей любого сложного объекта, то мыслимо и бесконечное количество интеллектов для управления им. Поскольку трудно сразу объяснить самые высшие проявления интеллекта, придется проследить его эволюцию от простого к наиболее сложному.
Объекты внешней среды воспринимаются рецепторами, которые направляют соответствующий код в моделирующую установку ("мозг"). Здесь создаются модели среды, по которым выбираются модели действий, реализуемых через органы действий или эффекторы (у живых существ - мышцы). Кроме того, интеллекту должна быть обязательно придана энергетическая установка ("тело"), которая снабжает энергией мозг, рецепторы и особенно - эффекторы, поскольку они должны развивать некоторые усилия для воздействия на объект. В свою очередь "тело" должно получать энергию или вещество извне, причем в результате деятельности интеллекта, направленной на среду. Важнейшим элементом интеллекта являются критерии управления объектом, которые в то же время управляют действиями с моделями. Получается своеобразная цепь: объект управляется через эффекторы, последние - моделями, а сами модели управляются критериями. Какова же природа критериев?
Один из критериев ясен: для того, чтобы интеллект мог выполнять свои функции, он должен получать энергию, следовательно, должен обеспечивать снабжение "тела" извне, и качество этого снабжения является критерием деятельности интеллекта. Итак, "тело" диктует разуму. Это старая истина, вполне объясняющая разум животных. Он выполняет роль компьютера для реализации программ инстинктов, заложенных в генах. Однако даже для животных дело обстоит не так просто: критерии для своей деятельности формирует сам мозг на основе восприятия и переработки сигналов, поступающих от тела. И еще сложнее: некоторые критерии черпаются из внешней среды. Никакого парадокса тут нет - животное само является частью среды, продуктом эволюции, в которой среда всегда присутствует в качестве фактора отбора.
Разум животных давно превзойден разумом человека. Поэтому понятие критериев гораздо сложнее, чем кажется на первый взгляд.
Как говорилось, при познании сложных систем возможно бесконечное множество моделей. Это касается не только моделирования неизменных структур, пределом которого является повторение, копирование объекта, как делается в технике. Изменение объекта во времени - тоже предмет познания, поскольку само управление состоит в изменении его во времени в нужном направлении. Предметом моделирования становятся прошлое, настоящее, будущее и не только сам объект, но и среда, его окружающая. Так же бесконечны пределы моделирования управляющих действий, поскольку их можно создавать в процессе творчества, а не ограничиваться выбором из заданных. Более того, так как критерии заложены в мозге и тоже являются моделями некоторых качеств - объекта, среды, тела, самого мозга, то возникает возможность умножать критерии. Разум может быть относительно самостоятельным фактором развития мира.
Рис.21. Расширенная схема интеллекта.
П - природа; Т - техника; ВМ - внешние модели; О - общество. "Входы" и "выходы": И - информация, сигналы; Эн - энергия; ТУ - технические устройства; Рц - рецепторы; Рцэ - рецепторы органов воздействия; Н - настройка рецепторов; Рцт - рецепторы "Тела"; МУ - моделирующая установка "Мозг"; МД - модели действий; Э - эффекторы.
На рис.21 показана схема интеллекта уровня человека и его отношения к внешнему миру, к среде. На схеме она представлена четырьмя составляющими. Это прежде всего ПРИРОДА, понимаемая во всей совокупности ее факторов. Затем - ТЕХНИКА, под которой подразумеваются орудия воздействия на природу. Еще выше ВНЕШНИЕ МОДЕЛИ - это наука. Наконец, наверху - ОБЩЕСТВО. Новая схема отличается от предыдущей тем, что рецепторы получают не только энергию, косвенно сигнализирующую о внешней среде, но и прямую информацию в виде сигналов - от ОБЩЕСТВА и ВНЕШНИХ МОДЕЛЕЙ. Между средой и рецепторами Рц встроены технические устройства ТУ.1. Это всевозможные приборы, предназначенные для усиления внешних воздействий и превращения невоспринимаемых органами чувств видов энергии в воспринимаемые. Точно так же эффекторы Э могут быть вооружены инструментами ТУ.2, значительно увеличивающими мощность их воздействий. От эффекторов идут стрелки, показывающие движение не только энергии, но и информации - сигналов, направленных в высшие системы, например в ОБЩЕСТВО. Рецепторы имеют органы настройки Н, а эффекторы - свои собственные рецепторы Рцэ , обеспечивающие сигналы обратной связи. Рецепторы есть и в теле (Рцт). Моделирующая установка МУ ("Мозг") содержит модели внешней среды, тела, а также модели собственных программ и моделей действий МД. Наиболее разнообразны критерии Кр: в них представлены не только значимые качества тела, но и всех отделов внешней среды и, что самое интересное,- некоторые качества работы МУ ("мозга").
В любом интеллекте заложены исходные модели, первичная структура связей и основные критерии. Все это обеспечивает начало деятельности. Дальнейшее саморазвитие интеллекта зависит от количества элементов и их исходных характеристик - главным образом их тренируемости и способности к образованию связей. Такой интеллект, получая извне информацию, становится способным к обучению и воспитанию под действием общества и его моделей. Воспитание понимается как изменение первичных критериев и формирование новых. Высшим проявлением развития интеллекта являются творчество, самопознание и самовоспитание, то есть способность не только создавать новые модели воздействий и претворять их в вещи с помощью техники, но и формировать новые критерии, изменяющие направление деятельности интеллекта в сторону от программ, заложенных при его создании и воспитании со стороны общества.
Высшим проявлением интеллекта является воспроизведение самого себя техническими средствами и последующий неограниченный рост его мощности. Многие фантастические предположения в этом направлении вполне допустимы, и их реализация является лишь вопросом времени и средств. Но разговор об этом еще впереди. А пока обратимся к подробному рассмотрению программ интеллекта, начиная с наиболее простых его вариантов.
КРИТЕРИИ, ПОТРЕБНОСТИ, ЧУВСТВА, СТИМУЛЫ
Основу деятельности интеллекта как действий с моделями составляют изменения активности его элементов. Активность - это энергия. В живых системах каждый нейрон генерирует специфическую энергию нервных импульсов, источником которой является химическая энергия, получаемая в каждой клетке в ее митохондриях. Они преобразуют энергию глюкозы и жиров в фосфорные соединения, которые и используются клеткой для своих нужд: в нейроне - на нервные импульсы, в мышце - на механическое сокращение, в железе - на синтез новых молекул. Мощности этой "электростанции" изменяются за счет тренированности или детренированности - процессов, которые в свою очередь определяются "запросами на специфическую функцию", предъявляемыми к клетке организмом как целым через его регулирующие воздействия.
В искусственном интеллекте также необходимо сохранить параметры активности элементарной модели, ее тренированности и детренированности как важнейшие средства его деятельности. Без этих параметров я не мыслю возможности создания ИИ. Другое дело, что энергетические затраты на активацию элементов ИИ могут быть ничтожно малы и не иметь значения (впрочем, они невелики и в организме), но выражение активности числом необходимо для осуществления программ взаимодействия моделей.
В живом мозге каждая нервная клетка - тренируемый "генератор импульсов", но для того чтобы она функционировала, выдавала эти импульсы, ей нужна стимуляция, то есть раздражение извне. Источником раздражения является прежде всего тело и во вторую очередь - внешняя среда. Тело действует не только через рецепторы, но и при помощи активных химических веществ, целенаправленно раздражающих центры в подкорке, являющиеся носителями тех самых критериев, о которых говорилось выше. Рецепторы, воспринимающие воздействия внешней среды, не только активируют нейроны "рецепторных полей", но действуют и более сложным образом. Путем обработки моделей среды выделяются сигналы, воздействующие на специфические нейронные ансамбли, которые соответствуют критериям - определенным качествам внешней среды, влияющим на поведение животного наряду с "требованиями тела", такими очевидными, как голод. Примером "внешних" критериев является любознательность. Этот критерий - стимул поведения животных, хотя для него нет "представительства" в теле, а качество новизны, возбуждающее центры любознательности, принадлежит среде.
Понятие об информационных критериях как некоторых моделях-центрах, которые возбуждаются путем выделения информации из воздействий среды, но в то же время сами являются источником активности для других отделов мозга, исключительно важное. Его значение еще недостаточно осознано физиологами. У животных есть врожденные модели - программы переработки внешней информации и выделения из нее значимых, ценных качеств - критериев. Их субстрат - "центры" критериев - представляется особенно активным "генератором" нервной энергии, стимулирующим деятельность мозга. Значимые качества внешней среды могут быть самыми различными: новизна, превосходство собратьев по стае и пр.
Структурно критерии можно представлять при помощи моделей, имеющих "входы", "выходы" и характеристики примерно такого типа, как показано на рис.22. Поскольку критерий является источником энергии для деятельности интеллекта, его можно связать с понятием стимула. Возможен случай, когда в результате деятельности совершаются процессы, дающие отрицательный стимул, то есть тормозящие исходную деятельность.
Рис.22. Зависимость чувства от "платы". Чувство изменяется от "неприятно" НПр до "приятно" Пр в зависимости от удовлетворения потребности измеряемой величины "платы", которую нужно добавить к ее исходному уровню а, с тем чтобы получить полное удовлетворение. Реальный стимул к некоторому действию для удовлетворения потребности измеряется приращением чувства ДЧ от исходного уровня а до уровня б ожидаемой "платы". Притязание - это "плата", необходимая для получения максимума чувства. Пунктирными линиями показаны новые характеристики потребностей, получаемые после адаптации: если потребность систематически не удовлетворяется, характеристика смещается влево, то есть притязание уменьшается, если же потребность удовлетворяется, характеристика смещается вправо, то есть притязание возрастает.
С понятием критерия тесно связано еще одно психологическое понятие - потребность, неудовлетворение которой побуждает к действию. Потребность является источником энергии для активации моделей. Ее можно выразить через критерий, как это сделано на рис.22. Логично предположить, что когда потребность полностью удовлетворена, стимул для деятельности, направленной на ее удовлетворение, должен приблизиться к нулю. И наоборот, когда потребность совсем не удовлетворяется, иными словами, когда субъект - интеллект - не получает никакой "платы" от среды, стимул должен быть максимальным. Словом "плата" я буду широко пользоваться, понимая под ним все материальные, информационные и любые другие воздействия среды, получаемые интеллектом в ответ на его деятельность.
Явление адаптации тоже известно в психологии: если животное голодает, оно готово есть любую пищу, если же оно все время сыто, его пищевой центр адаптируется и требования к пище возрастают - подавай только вкусную. Однако если его снова заставить поголодать, все станет на свое место. Особенно распространена адаптация к приятному, к избытку "платы". К сильному голоду адаптироваться нельзя. При чисто психических функциях возможна значительная адаптация и к недостатку "платы" (пример - бедность информации). Уровнем притязаний можно назвать величину "платы", которая необходима для полного удовлетворения потребности, когда стимул приближается к нулю. Выражение конкретной потребности - это приращение "платы" от ее данного среднего уровня до уровня притязаний, до насыщения.
Понятия потребности и стимула тесно связаны с другим термином из психологии: "чувство". Его можно трактовать как субъективную меру удовлетворения потребности. Известно, что разная степень удовлетворения одной и той же потребности дает противоположные чувства - приятные или неприятные. Полный голод, когда потребность не удовлетворена,- неприятен. По мере насыщения наступает момент "нулевого чувства", если продолжать есть, появляется отчетливо приятное чувство. Оно достигает максимума при полной сытости, и стимул к еде в этот момент равен нулю. Стимул как источник деятельности начинается от полного голода, уменьшается по мере насыщения и исчезает при полной сытости. Таким образом, он изменяется от нуля до максимума. Величина чувства изменяется от отрицательного значения (неприятное чувство) до положительного (приятное). Стимул - это приращение алгебраической суммы чувств СУММА(ДЧ) от исходного до ожидаемого конечного их состояния.
Психологические компоненты приятного и неприятного наличествуют в каждой потребности. Суммарный уровень душевного комфорта (УДК) или усредненный уровень счастья - это тот показатель, к максимуму которого стремится каждый интеллект в живой природе, соответствующим образом выбирая свою деятельность. Этот показатель, как будто не имеющий отношения к искусственному интеллекту, тем не менее и для него является важнейшим рабочим параметром, так же как понятия чувств. Как ни странно, но мне кажется невозможным создание высокоразвитого искусственного интеллекта без этих параметров. Конечно, их можно было бы обозначить какими-то абстрактными символами, но это не упростило бы понимания сути дела. Я глубоко убежден, что без моделирования многих, казалось бы, чисто человеческих или даже животных чувств, создание ИИ вообще невозможно.
На рис.23 показано формирование оптимального напряжения действия (труда) как результат суммирования критерия-стимула и критерия-"тормоза" функциональной системы, взаимодействующей со средой. "Плата" а подается на рабочий элемент, формирующий соответствующее чувство Чпл. Одновременно деятельность встречает сопротивление б, вызывающее утомление Ут. Это "тормоз", ослабляющий стимул Чпл. За счет нелинейности обеих характеристик устанавливается некоторое равновесие между насыщением критерия-чувства, "тормозом" и уровнем напряжения деятельности. Практически же происходит колебательный процесс за счет тренированности и детренированности рабочего элемента. С другой стороны, управляющий элемент - критерий-стимул - действует по другим законам: он способен к адаптации.
Рис.23. Формирование оптимального напряжения действия (труда) при взаимодействии системы и среды. А - характеристики среды: а - изменение величины "платы" в ответ на напряжение; б - изменение величины сопротивления среды в ответ на напряжение. Б - характеристики рабочего элемента: изменения положительного чувства Чпл в ответ на "плату" и чувства утомления Ут от преодоления сопротивления среды. В - суммарная характеристика: сумма чувств СУММА(Ч) имеет максимум, определяющий интенсивность труда. Уровню напряжения в соответствует "плата" г, сопротивление среды д и "тормоз" деятельности е.
Принцип адаптации состоит в том, что характеристика управляющего элемента, в частности генератора критерия-стимула, своеобразно изменяется. Если потребность постоянно удовлетворяется, то крутизна его характеристики уменьшается (притязания возрастают); если она недостаточно удовлетворяется, то она увеличивается (притязания уменьшаются). Статическая характеристика рабочего элемента зависит от тренированности (см. рис.9). Динамика адаптации и тренированности, то есть скорости изменения характеристики управляющего и рабочего элементов, неодинакова, поэтому саморегулирующийся комплекс, составленный из них, функционирует даже в неизменяющейся среде с некоторыми колебаниями около среднего уровня, на который был "спроектирован" комплекс - природой или конструктором. На рис.9 показаны характеристики тренированности и детренированности рабочего элемента, а на рис.22 - адаптация управляющего элемента при разной степени удовлетворения потребности. Такая система рассчитана на работу в среде, сопротивление которой не изменяется.
В действительности же среда не стабильна. "Сопротивление" ее улавливается "тормозом". В первом приближении - это "утомление" рабочего элемента в зависимости от сопротивления его деятельности со стороны "выхода" в среде, на которую направлена его работа. На рис.23 показаны характеристики "тормоза" в зависимости от напряжения деятельности рабочего элемента и сопротивления среды.
"Плата" - это совсем не обязательно внешние воздействия среды. Источником активности могут быть внутренние структуры интеллекта (мозга), например модели некоторых качеств внешней среды, выделенные в процессе анализа ее моделей. Важно другое: модель, обозначающая критерий-стимул, становится усилителем, генерирующим избыточные мощности, которые этот усилитель передает другим моделям, стимулируя их активность. Проще всего предположить, что подобные модели-усилители запроектированы в генах живых существ. В действительности так и есть для некоторых врожденных чувств, выражающих потребности как функции инстинктов. Однако у человека, кроме биологических потребностей, появились социальные, часть которых в генах не предусмотрена и которые выражаются в так называемых "убеждениях". По мощности стимулов они иногда конкурируют с биологическими. Социальные потребности выражаются привитыми обществом моделями словесных формул, например долга ("как надо"). Видимо, усилителем может стать любая модель, если ее активно тренировать. Биологический субстрат разума - нервные клетки - это позволяют. Соответственно тренируются и связи с этими "приобретенными чувствами", так что в результате по значимости они действительно становятся в ряд с биологическими чувствами, которые уже изначально заложены как усилители. Между прочим, воспитанием можно детренировать либо натренировать и биологические центры потребностей, и их "коэффициент усиления" изменится.
Можно предположить, что как у моделей биологических, так и у натренированных приобретенных потребностей высок уровень собственной, спонтанной активности, обеспечивающий им постоянное воздействие на другие модели.
Значимость потребностей (или, иначе, их активность, "коэффициент усиления") различна. Модельно это выражается в выборе масштаба шкалы на оси абсцисс на рис.22, где представлена характеристика "плата" - чувство. Разница в значимости чувств постоянно наблюдается у животных и человека: одни - жадные, другие - агрессивные, третьи - любопытные и т.д. В их различиях выражается направленность интеллекта - система приоритетов его деятельности. Разная значимость потребностей-чувств показана на рис.24.
Рис.24. Характеристики потребностей и соответствующих чувств а, б, в. Разная значимость чувств выражается в различиях абсцисс на универсальной шкале "неприятно" - "приятно" (НПр-Пр).
Модели потребностей - чувств-стимулов - это главные модели, они всегда находятся в оперативной памяти, поскольку имеют относительно высокую активность, которая периодически еще более возрастает, если потребность долго не удовлетворяется. Активность уменьшается после получения "платы". В этом смысле важны динамические характеристики моделей чувств. Пример статической характеристики показан на рис.22.
На что расходуется энергия чувств в интеллекте? Можно предположить, что на возбуждение по связям других моделей, например для вызова их из длительной памяти в АИ. (Впрочем, положение о расходовании энергии активной моделью, воздействующей на другую, еще требует проверки расчетами. Возможно, энергия модели просто затухает согласно динамической характеристике, если на "вход" не поступают новые сигналы). Энергия чувств не уменьшается до тех пор, пока соответствующая потребность не удовлетворится получением "платы". Как говорилось выше, все модели в СИ обладают самостоятельной "спонтанной" активностью, величина которой определяется уровнем тренированности модели. Это положение особенно относится к моделям потребностей-чувств. Их постоянная активность должна найти отражение не только в СИ, но и в АИ, поскольку модели потребностей все время находятся в оперативной памяти.
...
В предыдущих главах мы разобрали следующие вопросы:
1. Принципы структурного и энергетического построения среды, в которой действуют интеллекты. Два основных типа искусственного интеллекта - сетевой (СИ) и алгоритмический (АИ).
2. Понятие о моделях, их структурное и энергетическое выражение. Хранение моделей - память.
3. Основные программы действий с моделями - в смысле их превращений и обращения с разными видами памяти.
Последние два пункта разделены довольно условно.
Теперь можно перейти к главному: как должны взаимодействовать модели в интеллекте, чтобы в результате выполнялось его назначение - управление объектами внешней среды, собственным "телом" и даже самим собой.
Если возможно бесконечное количество моделей любого сложного объекта, то мыслимо и бесконечное количество интеллектов для управления им. Поскольку трудно сразу объяснить самые высшие проявления интеллекта, придется проследить его эволюцию от простого к наиболее сложному.
Объекты внешней среды воспринимаются рецепторами, которые направляют соответствующий код в моделирующую установку ("мозг"). Здесь создаются модели среды, по которым выбираются модели действий, реализуемых через органы действий или эффекторы (у живых существ - мышцы). Кроме того, интеллекту должна быть обязательно придана энергетическая установка ("тело"), которая снабжает энергией мозг, рецепторы и особенно - эффекторы, поскольку они должны развивать некоторые усилия для воздействия на объект. В свою очередь "тело" должно получать энергию или вещество извне, причем в результате деятельности интеллекта, направленной на среду. Важнейшим элементом интеллекта являются критерии управления объектом, которые в то же время управляют действиями с моделями. Получается своеобразная цепь: объект управляется через эффекторы, последние - моделями, а сами модели управляются критериями. Какова же природа критериев?
Один из критериев ясен: для того, чтобы интеллект мог выполнять свои функции, он должен получать энергию, следовательно, должен обеспечивать снабжение "тела" извне, и качество этого снабжения является критерием деятельности интеллекта. Итак, "тело" диктует разуму. Это старая истина, вполне объясняющая разум животных. Он выполняет роль компьютера для реализации программ инстинктов, заложенных в генах. Однако даже для животных дело обстоит не так просто: критерии для своей деятельности формирует сам мозг на основе восприятия и переработки сигналов, поступающих от тела. И еще сложнее: некоторые критерии черпаются из внешней среды. Никакого парадокса тут нет - животное само является частью среды, продуктом эволюции, в которой среда всегда присутствует в качестве фактора отбора.
Разум животных давно превзойден разумом человека. Поэтому понятие критериев гораздо сложнее, чем кажется на первый взгляд.
Как говорилось, при познании сложных систем возможно бесконечное множество моделей. Это касается не только моделирования неизменных структур, пределом которого является повторение, копирование объекта, как делается в технике. Изменение объекта во времени - тоже предмет познания, поскольку само управление состоит в изменении его во времени в нужном направлении. Предметом моделирования становятся прошлое, настоящее, будущее и не только сам объект, но и среда, его окружающая. Так же бесконечны пределы моделирования управляющих действий, поскольку их можно создавать в процессе творчества, а не ограничиваться выбором из заданных. Более того, так как критерии заложены в мозге и тоже являются моделями некоторых качеств - объекта, среды, тела, самого мозга, то возникает возможность умножать критерии. Разум может быть относительно самостоятельным фактором развития мира.
Рис.21. Расширенная схема интеллекта.
П - природа; Т - техника; ВМ - внешние модели; О - общество. "Входы" и "выходы": И - информация, сигналы; Эн - энергия; ТУ - технические устройства; Рц - рецепторы; Рцэ - рецепторы органов воздействия; Н - настройка рецепторов; Рцт - рецепторы "Тела"; МУ - моделирующая установка "Мозг"; МД - модели действий; Э - эффекторы.
На рис.21 показана схема интеллекта уровня человека и его отношения к внешнему миру, к среде. На схеме она представлена четырьмя составляющими. Это прежде всего ПРИРОДА, понимаемая во всей совокупности ее факторов. Затем - ТЕХНИКА, под которой подразумеваются орудия воздействия на природу. Еще выше ВНЕШНИЕ МОДЕЛИ - это наука. Наконец, наверху - ОБЩЕСТВО. Новая схема отличается от предыдущей тем, что рецепторы получают не только энергию, косвенно сигнализирующую о внешней среде, но и прямую информацию в виде сигналов - от ОБЩЕСТВА и ВНЕШНИХ МОДЕЛЕЙ. Между средой и рецепторами Рц встроены технические устройства ТУ.1. Это всевозможные приборы, предназначенные для усиления внешних воздействий и превращения невоспринимаемых органами чувств видов энергии в воспринимаемые. Точно так же эффекторы Э могут быть вооружены инструментами ТУ.2, значительно увеличивающими мощность их воздействий. От эффекторов идут стрелки, показывающие движение не только энергии, но и информации - сигналов, направленных в высшие системы, например в ОБЩЕСТВО. Рецепторы имеют органы настройки Н, а эффекторы - свои собственные рецепторы Рцэ , обеспечивающие сигналы обратной связи. Рецепторы есть и в теле (Рцт). Моделирующая установка МУ ("Мозг") содержит модели внешней среды, тела, а также модели собственных программ и моделей действий МД. Наиболее разнообразны критерии Кр: в них представлены не только значимые качества тела, но и всех отделов внешней среды и, что самое интересное,- некоторые качества работы МУ ("мозга").
В любом интеллекте заложены исходные модели, первичная структура связей и основные критерии. Все это обеспечивает начало деятельности. Дальнейшее саморазвитие интеллекта зависит от количества элементов и их исходных характеристик - главным образом их тренируемости и способности к образованию связей. Такой интеллект, получая извне информацию, становится способным к обучению и воспитанию под действием общества и его моделей. Воспитание понимается как изменение первичных критериев и формирование новых. Высшим проявлением развития интеллекта являются творчество, самопознание и самовоспитание, то есть способность не только создавать новые модели воздействий и претворять их в вещи с помощью техники, но и формировать новые критерии, изменяющие направление деятельности интеллекта в сторону от программ, заложенных при его создании и воспитании со стороны общества.
Высшим проявлением интеллекта является воспроизведение самого себя техническими средствами и последующий неограниченный рост его мощности. Многие фантастические предположения в этом направлении вполне допустимы, и их реализация является лишь вопросом времени и средств. Но разговор об этом еще впереди. А пока обратимся к подробному рассмотрению программ интеллекта, начиная с наиболее простых его вариантов.
КРИТЕРИИ, ПОТРЕБНОСТИ, ЧУВСТВА, СТИМУЛЫ
Основу деятельности интеллекта как действий с моделями составляют изменения активности его элементов. Активность - это энергия. В живых системах каждый нейрон генерирует специфическую энергию нервных импульсов, источником которой является химическая энергия, получаемая в каждой клетке в ее митохондриях. Они преобразуют энергию глюкозы и жиров в фосфорные соединения, которые и используются клеткой для своих нужд: в нейроне - на нервные импульсы, в мышце - на механическое сокращение, в железе - на синтез новых молекул. Мощности этой "электростанции" изменяются за счет тренированности или детренированности - процессов, которые в свою очередь определяются "запросами на специфическую функцию", предъявляемыми к клетке организмом как целым через его регулирующие воздействия.
В искусственном интеллекте также необходимо сохранить параметры активности элементарной модели, ее тренированности и детренированности как важнейшие средства его деятельности. Без этих параметров я не мыслю возможности создания ИИ. Другое дело, что энергетические затраты на активацию элементов ИИ могут быть ничтожно малы и не иметь значения (впрочем, они невелики и в организме), но выражение активности числом необходимо для осуществления программ взаимодействия моделей.
В живом мозге каждая нервная клетка - тренируемый "генератор импульсов", но для того чтобы она функционировала, выдавала эти импульсы, ей нужна стимуляция, то есть раздражение извне. Источником раздражения является прежде всего тело и во вторую очередь - внешняя среда. Тело действует не только через рецепторы, но и при помощи активных химических веществ, целенаправленно раздражающих центры в подкорке, являющиеся носителями тех самых критериев, о которых говорилось выше. Рецепторы, воспринимающие воздействия внешней среды, не только активируют нейроны "рецепторных полей", но действуют и более сложным образом. Путем обработки моделей среды выделяются сигналы, воздействующие на специфические нейронные ансамбли, которые соответствуют критериям - определенным качествам внешней среды, влияющим на поведение животного наряду с "требованиями тела", такими очевидными, как голод. Примером "внешних" критериев является любознательность. Этот критерий - стимул поведения животных, хотя для него нет "представительства" в теле, а качество новизны, возбуждающее центры любознательности, принадлежит среде.
Понятие об информационных критериях как некоторых моделях-центрах, которые возбуждаются путем выделения информации из воздействий среды, но в то же время сами являются источником активности для других отделов мозга, исключительно важное. Его значение еще недостаточно осознано физиологами. У животных есть врожденные модели - программы переработки внешней информации и выделения из нее значимых, ценных качеств - критериев. Их субстрат - "центры" критериев - представляется особенно активным "генератором" нервной энергии, стимулирующим деятельность мозга. Значимые качества внешней среды могут быть самыми различными: новизна, превосходство собратьев по стае и пр.
Структурно критерии можно представлять при помощи моделей, имеющих "входы", "выходы" и характеристики примерно такого типа, как показано на рис.22. Поскольку критерий является источником энергии для деятельности интеллекта, его можно связать с понятием стимула. Возможен случай, когда в результате деятельности совершаются процессы, дающие отрицательный стимул, то есть тормозящие исходную деятельность.
Рис.22. Зависимость чувства от "платы". Чувство изменяется от "неприятно" НПр до "приятно" Пр в зависимости от удовлетворения потребности измеряемой величины "платы", которую нужно добавить к ее исходному уровню а, с тем чтобы получить полное удовлетворение. Реальный стимул к некоторому действию для удовлетворения потребности измеряется приращением чувства ДЧ от исходного уровня а до уровня б ожидаемой "платы". Притязание - это "плата", необходимая для получения максимума чувства. Пунктирными линиями показаны новые характеристики потребностей, получаемые после адаптации: если потребность систематически не удовлетворяется, характеристика смещается влево, то есть притязание уменьшается, если же потребность удовлетворяется, характеристика смещается вправо, то есть притязание возрастает.
С понятием критерия тесно связано еще одно психологическое понятие - потребность, неудовлетворение которой побуждает к действию. Потребность является источником энергии для активации моделей. Ее можно выразить через критерий, как это сделано на рис.22. Логично предположить, что когда потребность полностью удовлетворена, стимул для деятельности, направленной на ее удовлетворение, должен приблизиться к нулю. И наоборот, когда потребность совсем не удовлетворяется, иными словами, когда субъект - интеллект - не получает никакой "платы" от среды, стимул должен быть максимальным. Словом "плата" я буду широко пользоваться, понимая под ним все материальные, информационные и любые другие воздействия среды, получаемые интеллектом в ответ на его деятельность.
Явление адаптации тоже известно в психологии: если животное голодает, оно готово есть любую пищу, если же оно все время сыто, его пищевой центр адаптируется и требования к пище возрастают - подавай только вкусную. Однако если его снова заставить поголодать, все станет на свое место. Особенно распространена адаптация к приятному, к избытку "платы". К сильному голоду адаптироваться нельзя. При чисто психических функциях возможна значительная адаптация и к недостатку "платы" (пример - бедность информации). Уровнем притязаний можно назвать величину "платы", которая необходима для полного удовлетворения потребности, когда стимул приближается к нулю. Выражение конкретной потребности - это приращение "платы" от ее данного среднего уровня до уровня притязаний, до насыщения.
Понятия потребности и стимула тесно связаны с другим термином из психологии: "чувство". Его можно трактовать как субъективную меру удовлетворения потребности. Известно, что разная степень удовлетворения одной и той же потребности дает противоположные чувства - приятные или неприятные. Полный голод, когда потребность не удовлетворена,- неприятен. По мере насыщения наступает момент "нулевого чувства", если продолжать есть, появляется отчетливо приятное чувство. Оно достигает максимума при полной сытости, и стимул к еде в этот момент равен нулю. Стимул как источник деятельности начинается от полного голода, уменьшается по мере насыщения и исчезает при полной сытости. Таким образом, он изменяется от нуля до максимума. Величина чувства изменяется от отрицательного значения (неприятное чувство) до положительного (приятное). Стимул - это приращение алгебраической суммы чувств СУММА(ДЧ) от исходного до ожидаемого конечного их состояния.
Психологические компоненты приятного и неприятного наличествуют в каждой потребности. Суммарный уровень душевного комфорта (УДК) или усредненный уровень счастья - это тот показатель, к максимуму которого стремится каждый интеллект в живой природе, соответствующим образом выбирая свою деятельность. Этот показатель, как будто не имеющий отношения к искусственному интеллекту, тем не менее и для него является важнейшим рабочим параметром, так же как понятия чувств. Как ни странно, но мне кажется невозможным создание высокоразвитого искусственного интеллекта без этих параметров. Конечно, их можно было бы обозначить какими-то абстрактными символами, но это не упростило бы понимания сути дела. Я глубоко убежден, что без моделирования многих, казалось бы, чисто человеческих или даже животных чувств, создание ИИ вообще невозможно.
На рис.23 показано формирование оптимального напряжения действия (труда) как результат суммирования критерия-стимула и критерия-"тормоза" функциональной системы, взаимодействующей со средой. "Плата" а подается на рабочий элемент, формирующий соответствующее чувство Чпл. Одновременно деятельность встречает сопротивление б, вызывающее утомление Ут. Это "тормоз", ослабляющий стимул Чпл. За счет нелинейности обеих характеристик устанавливается некоторое равновесие между насыщением критерия-чувства, "тормозом" и уровнем напряжения деятельности. Практически же происходит колебательный процесс за счет тренированности и детренированности рабочего элемента. С другой стороны, управляющий элемент - критерий-стимул - действует по другим законам: он способен к адаптации.
Рис.23. Формирование оптимального напряжения действия (труда) при взаимодействии системы и среды. А - характеристики среды: а - изменение величины "платы" в ответ на напряжение; б - изменение величины сопротивления среды в ответ на напряжение. Б - характеристики рабочего элемента: изменения положительного чувства Чпл в ответ на "плату" и чувства утомления Ут от преодоления сопротивления среды. В - суммарная характеристика: сумма чувств СУММА(Ч) имеет максимум, определяющий интенсивность труда. Уровню напряжения в соответствует "плата" г, сопротивление среды д и "тормоз" деятельности е.
Принцип адаптации состоит в том, что характеристика управляющего элемента, в частности генератора критерия-стимула, своеобразно изменяется. Если потребность постоянно удовлетворяется, то крутизна его характеристики уменьшается (притязания возрастают); если она недостаточно удовлетворяется, то она увеличивается (притязания уменьшаются). Статическая характеристика рабочего элемента зависит от тренированности (см. рис.9). Динамика адаптации и тренированности, то есть скорости изменения характеристики управляющего и рабочего элементов, неодинакова, поэтому саморегулирующийся комплекс, составленный из них, функционирует даже в неизменяющейся среде с некоторыми колебаниями около среднего уровня, на который был "спроектирован" комплекс - природой или конструктором. На рис.9 показаны характеристики тренированности и детренированности рабочего элемента, а на рис.22 - адаптация управляющего элемента при разной степени удовлетворения потребности. Такая система рассчитана на работу в среде, сопротивление которой не изменяется.
В действительности же среда не стабильна. "Сопротивление" ее улавливается "тормозом". В первом приближении - это "утомление" рабочего элемента в зависимости от сопротивления его деятельности со стороны "выхода" в среде, на которую направлена его работа. На рис.23 показаны характеристики "тормоза" в зависимости от напряжения деятельности рабочего элемента и сопротивления среды.
"Плата" - это совсем не обязательно внешние воздействия среды. Источником активности могут быть внутренние структуры интеллекта (мозга), например модели некоторых качеств внешней среды, выделенные в процессе анализа ее моделей. Важно другое: модель, обозначающая критерий-стимул, становится усилителем, генерирующим избыточные мощности, которые этот усилитель передает другим моделям, стимулируя их активность. Проще всего предположить, что подобные модели-усилители запроектированы в генах живых существ. В действительности так и есть для некоторых врожденных чувств, выражающих потребности как функции инстинктов. Однако у человека, кроме биологических потребностей, появились социальные, часть которых в генах не предусмотрена и которые выражаются в так называемых "убеждениях". По мощности стимулов они иногда конкурируют с биологическими. Социальные потребности выражаются привитыми обществом моделями словесных формул, например долга ("как надо"). Видимо, усилителем может стать любая модель, если ее активно тренировать. Биологический субстрат разума - нервные клетки - это позволяют. Соответственно тренируются и связи с этими "приобретенными чувствами", так что в результате по значимости они действительно становятся в ряд с биологическими чувствами, которые уже изначально заложены как усилители. Между прочим, воспитанием можно детренировать либо натренировать и биологические центры потребностей, и их "коэффициент усиления" изменится.
Можно предположить, что как у моделей биологических, так и у натренированных приобретенных потребностей высок уровень собственной, спонтанной активности, обеспечивающий им постоянное воздействие на другие модели.
Значимость потребностей (или, иначе, их активность, "коэффициент усиления") различна. Модельно это выражается в выборе масштаба шкалы на оси абсцисс на рис.22, где представлена характеристика "плата" - чувство. Разница в значимости чувств постоянно наблюдается у животных и человека: одни - жадные, другие - агрессивные, третьи - любопытные и т.д. В их различиях выражается направленность интеллекта - система приоритетов его деятельности. Разная значимость потребностей-чувств показана на рис.24.
Рис.24. Характеристики потребностей и соответствующих чувств а, б, в. Разная значимость чувств выражается в различиях абсцисс на универсальной шкале "неприятно" - "приятно" (НПр-Пр).
Модели потребностей - чувств-стимулов - это главные модели, они всегда находятся в оперативной памяти, поскольку имеют относительно высокую активность, которая периодически еще более возрастает, если потребность долго не удовлетворяется. Активность уменьшается после получения "платы". В этом смысле важны динамические характеристики моделей чувств. Пример статической характеристики показан на рис.22.
На что расходуется энергия чувств в интеллекте? Можно предположить, что на возбуждение по связям других моделей, например для вызова их из длительной памяти в АИ. (Впрочем, положение о расходовании энергии активной моделью, воздействующей на другую, еще требует проверки расчетами. Возможно, энергия модели просто затухает согласно динамической характеристике, если на "вход" не поступают новые сигналы). Энергия чувств не уменьшается до тех пор, пока соответствующая потребность не удовлетворится получением "платы". Как говорилось выше, все модели в СИ обладают самостоятельной "спонтанной" активностью, величина которой определяется уровнем тренированности модели. Это положение особенно относится к моделям потребностей-чувств. Их постоянная активность должна найти отражение не только в СИ, но и в АИ, поскольку модели потребностей все время находятся в оперативной памяти.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
КЛАССИФИКАЦИЯ ПОТРЕБНОСТЕЙ-ЧУВСТВ
Первую группу составляют "специальные" потребности-чувства, которые определяются назначением интеллекта. Они отражают критерий оптимальности деятельности управляемого объекта. Я не буду на них останавливаться, поскольку возможно бесконечное множество назначений интеллекта. Вторую группу составляют потребности-чувства, необходимые для любого более или менее развитого интеллекта и являющиеся непременным условием его деятельности. Условно назову их "рабочими". И.П.Павлов называл их "сложными рефлексами" и выделял исследовательский рефлекс, рефлексы "цели" и "свободы". Я бы добавил к ним потребность деятельности и противоположную ей - потребность отдыха. Третью группу я обозначу как "интегральные чувства". Это "Приятно" и "Неприятно"; они присутствуют в каждом частном чувстве, только по ним чувства сравниваются и суммируются, так как в принципе каждое чувство совершенно своеобразно. В рассмотренных характеристиках чувств уже выделены компоненты Пр и НПр (см. рис.22, 23, 24). Общее качество "рабочих чувств в том, что они "работают" при любой деятельности интеллекта, направленной на удовлетворение любой специальной потребности и достижение специальной цели. Без них его деятельность была бы невозможна или во всяком случае весьма затруднительна. В то же время при целенаправленной тренировке эти потребности-чувства могут стать самодовлеющими и служить источником удовольствия (пример - любознательность ученого).
Несомненно, есть один общий процесс для всех видов деятельности. Это нарастание своеобразного неприятного чувства, которое выступает в роли тормоза для продолжения действий. Его можно трактовать как утомление, когда оно касается мышц, можно применить определения "скука", "надоело", когда речь идет о мышлении, но так или иначе оно присутствует. Его "входом" является сигнал от специальной следящей системы, которая учитывает длительность и напряжение деятельности, направленной к одной цели. Характеристика такого чувства показана на рис.25. Его интенсивность является функцией продолжительности и напряжения деятельности. При прекращении действий чувство уменьшается, проходит фазы от неприятного к приятному, затем отдых надоедает, и чувство возвращается к нулю. Любое однообразное действие накапливает потребность в отдыхе или переключении на другое действие. Это касается не только всей обобщенной программы, например распознавания и исследования, но и ее частных проявлений - опознания названия, качеств, действия, прогнозов. По каждой из этих подпрограмм ведется учет количества и напряженности одинаковых операций и соответственно нарастает потребность остановиться, переключиться или отдохнуть. Уточнение соотношения двух процессов - расходования энергии действия и накопления тормозной энергии, ведущих к одному результату - остановке действия, еще требует исследования на конкретных примерах. Торможение от утомления или однообразия - универсальный процесс, касающийся любого действия, от любых стимулов. Он необходим для всякого интеллекта.
Рис.25. Характеристика чувства утомления: А - накопление утомления в зависимости от длительности и интенсивности деятельности; Б - динамика чувства во время отдыха.
Любознательность - вторая универсальная рабочая потребность интеллекта. Многочисленные вопросы, которые у нас возникают при виде чего-либо, являются ее проявлением. Кто-что? куда-откуда? зачем-почему? и еще масса других вопросов охватывает отношения, причинность, прошлое, будущее. Качество модели, которое возбуждает любознательность,- это ее "неизвестность", отсутствие связей с другими моделями. Когда при восприятии внешнего мира в нашей кратковременной памяти отпечатываются первичные модели объектов, рецептор отключается и включается программа распознавания. Она представляет собой поиск в памяти и сравнение одинаковых или похожих, но уже известных моделей. Извлечение моделей из памяти, их активация и сравнение - это "действие", требующее энергии, которая поступает от "центра" любознательности. Вначале нужно ответить на вопрос "Кто-что?" Затем следует установление качеств, то есть ответы на вопросы "Какой?". Качеств очень много, они выражаются "частными" моделями, заключенными в одном из кадров. Существует целый ряд структурных качеств, касающихся сравнительных размеров или формы. Есть качества, воспринимаемые отдельными рецепторами, например тепло. Динамика объекта и его отношения к другим объектам тоже могут выступать как качества.
Еще одним видом распознавания является прогнозирование. Это очень важное действие, широко используемое интеллектом. Оно сводится к действию дописывания "фразы" по известным "словам", что становится возможным лишь после опознания этих исходных слов.
Программа любознательности не ограничивается только распознаванием уже воспринятой модели, но предусматривает и новое исследование среды через настройку рецепторов и нацеливание фокусированного восприятия на определенные места внешней среды или ее объект, чтобы проверить, есть ли тут важная "деталь". Исследование и распознавание продолжаются до тех пор, пока иссякнет энергия чувства любопытства и стимул нейтрализуется "тормозом" со стороны утомления.
Следующая потребность как функция "рефлекса цели" - доводить дело до конечного результата даже ценой преодоления непредвиденного сопротивления объекта деятельности. Она представляется как программа слежения, воздействующая на некоторый специальный усилитель, способный дать дополнительную энергию для избранного действия тогда, когда для его окончания не хватает главного - специального стимула.
Можно это чувство трактовать иначе: как удовольствие от самого процесса деятельности, как чувство, выражающее потребность, прямо противоположную расслаблению и отдыху. Снова получается пара программ (что бывает довольно часто): потребность действовать стимулирует напряжение, расходуется какая-то энергия, возникает утомление, которое вызывает потребность в отдыхе, после чего энергия действия восстанавливается. Отдых в свою очередь надоедает, и включается потребность деятельности. Количественное соотношение обоих процессов пока не ясно. Психологический смысл "рефлекса цели" или удовольствия, получаемого от деятельности, довольно ясен. Конечно, нет уверенности, что действия ради их самих так уж необходимы для ИИ, но, может быть, этот дополнительный стимул полезен для того, чтобы доводить дело до конца.
Еще больше сомнений вызывает "рефлекс свободы" И.П.Павлова. Суть его состоит в том, что при появлении видимой помехи, препятствующей деятельности, животное (да и человек) оставляет основную деятельность и включает специальную программу уничтожения самой помехи (тогда как в соответствии с "рефлексом цели" следовало бы включить программу преодоления мешающего воздействия помехи дополнительным стимулированием главного дела). Уничтожение препятствия сопровождается "форсировкой", называемой эмоциями. "Рефлекс свободы" часто реализуется через агрессию. Ее же можно представить как эмоцию гнева. Понимание эмоций и "экстремальных" режимов имеет значение для ИИ.
Сильно чувствуют все люди, следовательно, в принципе у всех достаточно стимулов, чтобы напряженно действовать, преодолевать сопротивление и достигать больших целей. Но в действительности это не так. Одни могут добиться желаемого, другие - нет, все зависит от характера. В модельном выражении мы определяем силу характера как способность к напряженным действиям, которая обусловливается не столько силой стимулов, сколько значимостью главного "тормоза" - утомления, скуки, "надоело". Сильные люди способны пересилить утомление, оно для них не имеет того значения, как для слабых, у которых много желаний, планов, но они не в состоянии их реализовать, поскольку быстро устают и не могут преодолеть сопротивление. Цели не достигаются, уверенность в себе исчезает, соответственно облегчаются планы и наступает детренированность механизмов системы напряжения, в частности того же "рефлекса цели". Максимум возможного напряжения - еще не все в характере, нужна, кроме того, его продолжительность: одни способны на сильное, но кратковременное напряжение, другие - на меньшее по силе, но более длительное. И уж совсем редко сочетаются оба качества силы характера: высокий уровень и большая длительность напряжения. Таким образом, характер закладывается в значимости главного "тормоза" - потребности в расслаблении, или, попросту говоря,- "чувства лени". Важную положительную роль играет ее антипод - "рефлекс цели".
ЭМОЦИИ. О них следует сказать несколько слов, заканчивая раздел о чувствах. Почему-то именно они кажутся камнем преткновения на пути воссоздания разума человека. Действительно, как может "железка" переживать горе или ужас? Понятие эмоций в психологии не очень определенное. Нет четкого отграничения эмоций от чувств, даже их номенклатура расплывчата. Все согласны, что горе, ужас, радость и гнев - эмоции, а вот любовь? Однако эмоции все-таки имеют характерные черты, хотя и не столь четкие, чтобы полностью отделить их от сильных чувств. Прежде всего они дают такую высокую активность связанным с ними моделям, что все другие модели оказываются подавленными и не могут привлечь внимание. Следствием этого является крайняя субъективность оценок: все рассматривается через призму эмоции, человек не способен замечать другие раздражители и рассуждать здраво. Эмоции включают свою специфическую двигательную программу: гнев - потребность драться; ужас - бежать; радость - петь, танцевать; горе,- наоборот,- полную неподвижность. При этом происходит активация деятельности эндокринных органов, в частности возрастает выделение адреналина, который дополнительно возбуждает кору и играет роль положительной обратной связи. В целом эмоции производят впечатление первобытных примитивных чувств, которые включаются в условиях угрозы для жизни или по исчезновении такой угрозы. Можно думать, что на заре эволюции были простые рефлексы, потом на них наслоились эмоции, и уж потом дифференцировались чувства как более тонкие критерии поведения.
Воспроизвести эмоции в модели интеллекта не представляет труда. Нужно задать соответствующие "центры" как очень сильные усилители, "входами" на них будут чувства, "выходами" - модели раздражителя и ответного действия. Например, любая угроза вызывает потребность бежать или нападать, эмоция только многократно усиливает эту потребность вместе со значимостью раздражителя, вызвавшего угрозу. Центр эмоций включается от чувства через "реле силы" и дает дополнительное усиление соответствующим двигательным программам, тормозя при этом все остальные модели, пока действие не совершится.
Не думаю, что для искусственного интеллекта стоит задавать эмоции в таком виде. Они не улучшают, а нарушают разумную деятельность и оправданы лишь у животных, поскольку включение эндокринных регуляторов позволяет на короткое время мобилизовать дополнительную мышечную силу. Возможно, что лишь для некоторых роботов понадобится такая форсировка в условиях чрезвычайной угрозы.
ТАКТЫ ДЕЯТЕЛЬНОСТИ И НАПРЯЖЕНИЕ
Видимо, любой интеллект, даже сугубо сетевой разум человека, работает дискретно. О человеке разговор особый, а для АИ такты деятельности - обязательное условие. Для него "один такт" нужно понимать как действие по введению в кратковременную память одной новой модели или повторное активирование модели, уже бывшей в памяти. В каждый момент времени имеется одна самая возбужденная, самая активная модель. Как правило, она должна состоять из "слова" или короткой "фразы" - два-три, но не больше четырех "слов".
На рис.26 показано, как осуществляются действия с моделями. Каждая следующая модель выбирается в результате элементарного действия, с учетом связей с предыдущими моделями, возможно, в пределах нескольких тактов. Стимул нужен для действий, но он же определяет уровень активности выбранной модели, заставляя ее генерировать энергию согласно ее характеристике "вход"-"выход", в которой учтена тренированность. На "входе" учитываются энергия стимула и других моделей (так, например, для М.2 не только от Д.2, но и от М.1).
Рис.26. Цепочка действий Д с моделями М.
Как отмечалось выше, действия с моделями могут иметь различный характер. Модель действий - это часть программы, и в ней тоже можно выделить иерархию: от "действий вообще" в данном направлении до конкретного действия с одной моделью (например, целая последовательность сравнений). Здесь следует ввести понятие "напряжение" как некоторый уровень активности, средний для определенного периода деятельности интеллекта. Напряжение определяется прежде всего активностью чувств или уровнем потребности, стимулом. Уже говорилось, что значимость потребностей различная: одни "жизненно необходимы" (например, страх в минуту опасности), другие (к примеру, любознательность) несут вспомогательные функции, и даже при максимальном "информационном голоде" стимул к поиску новых раздражителей нельзя сравнить со стимулом к поиску пищи или спасения.
Другой фактор напряжения - "сопротивление" объекта действия в момент его выполнения. Это понятие прежде всего касается внешней среды и подразумевает физическое сопротивление эффекторам (например, нагрузка, которую должны преодолеть мышцы, с тем чтобы действия достигли цели). Но напряжение интеллекта необходимо и для решения трудной задачи, когда поиск в памяти нужных моделей наталкивается на большое сопротивление ведущих к этим моделям связей, если они давно не использовались. Конечно, как в том, так и в другом случае для того, чтобы напряжение возникло, нужны стимулы соответствующей силы, поскольку, если их не будет, действие просто не состоится. При этом приходится учитывать "рефлекс цели" как дополнительный стимул, который начинает временно действовать тогда, когда на пути к достижению цели, сформированной за счет умеренной потребности и неспособной вызвать большое напряжение, появляется препятствие, ставящее под угрозу ее осуществление. В таких случаях сопротивление как бы усиливает саму первичную потребность.
ВРЕМЯ
Время является той независимой переменной, которая, как и пространство, всегда участвует в деятельности интеллекта. Значительную часть своих программ он относит к будущему, несколько меньшую - к прошлому, большую часть - к настоящему. Интеллект должен иметь чувственное ощущение времени. Настоящее метится особой "буквой", указывающей на то обстоятельство, что в данный момент времени внешние или внутренние рецепторы работают. Прошлое воспринимается по действию извлечения из памяти, а будущее - по специфическим действиям с моделями настоящего и прошлого. Течение времени фиксируется переключением кадров в моделях кратковременной памяти. В частности, мысли о будущем можно представить как операции с "фразами", в начале которых стоят "слова", отражающие настоящее, то есть с подключенными рецепторами. Затем рецепторы отключаются, и "фраза" продолжается путем "дописывания" ее начиная от "слова" - настоящего уже с "буквой" - "будущее".
Время движется только в одну сторону. Это четко отмечается в последовательности любых "слов", "фраз", отражающих события, даже во "фразах" исследования объекта типа показанного на рис.17, где как будто движение идет по пространственным структурам, но в действительности - параллельно и во времени. Время отмечается во всех действиях (последовательность вызова моделей из памяти, восприятия из внешней среды или из тела). Поскольку "буквы" действий всегда присутствуют в модели структур, то эта "метка" и создает отсчет времени, его направление. Операция обращения к прошлому или к будущему - это тоже действие, которое метит модели своей "буквой".
Временные отношения сложны для понимания (настоящее - это данный момент. Но, говоря "в этом году", тоже подразумевают настоящее). Модели, выражающие время, так же подлежат обобщению, как и любые другие. Один кадр восприятия внешнего мира - одна элементарная модель - соединяется с буквальным понятием "настоящее". Обобщение времени, то есть удлинение единицы его измерения, создание "крупноблочной" модели, производится одновременно с обобщением измеряемой этим масштабом деятельности или воспринимаемых во времени моделей. "Действие обобщения" касается времени и объектов деятельности. "Весь год пишу книги" - здесь обобщены действие и время. Нельзя обобщать их порознь, отрывать одно от другого. Как говорилось, "действие обобщения" состоит в том, что модели последовательно сравниваются друг с другом, выделяется общее из "букв" и "слов", и потом эта полученная при первых сравнениях модель сопоставляется со всеми последующими. Это касается моделей объектов и действий. Со временем проще - единицы его измерения одинаковы, поэтому обобщение времени - это использование иерархии его единиц. Операции с большими отрезками времени стали возможны только благодаря речи и счету.
Обобщение моделей действий по времени - основа долгосрочного планирования и предвидения. Поскольку интеллект может мыслить только короткими фразами, длительное предвидение обязательно связано с обобщенными моделями, которые могут развертываться в более частные единицы последующими операциями (об этом речь пойдет дальше).
Отношение событий во времени определяется по масштабу времени двух параллельно протекающих процессов, выраженных отдельными "фразами". Интеллект осуществляет слежение за многими объектами, поскольку существует несколько типов рецепторов и следящих систем. Слежение за временем, однако, единое. Поэтому для соотношения времени разных "фраз" по их началу, концу, продолжительности нужно сравнить их маркировку по времени.
Продолжающееся и законченное действие - понятия, тоже имеющие отношение к моделям времени. Первое - это продолжение действий, начатых в прошлом и еще не отмеченных "меткой" окончания, второе - законченное, для которого она уже есть. Обычно это касается действия, состоящего из повторяющихся однородных актов (например: "Я шагаю уже час").
Операции переключения - настоящее, прошлое, будущее, операции обобщения по времени, определения отношения начала и конца обобщенного действия к данному моменту - позволяют выразить все типы грамматических времен, используемых речью.
РЕАЛЬНОСТЬ
Еще одно важное понятие - реальность. Реально то, что есть, что воспринимается рецепторами, следящими за внешней средой, за телом, за самим разумом. Модель с "буквой" действующего рецептора реальна. Она реальна даже в том случае, когда извлекается из памяти, если в модели образа присутствует эта "буква" рецептора. Наоборот, реальность будущего проблематична. Однако не всякое будущее можно назвать нереальным. Его реальность прежде всего определяется вероятностью будущего события. Если событие произойдет непременно, его следует воспринимать как абсолютно реальное. Другое дело, если вероятность меньше единицы: реальность события тем более сомнительна, чем меньше вероятность. Но это не все.
Реальность имеет прямое отношение к чувствам. Чувства вызываются "платой", удовлетворяющей потребность. "Плата" в настоящем очевидна: она или есть, или ее нет. Плата в прошлом тоже вполне реальна: она отмечена памятью на чувство. Будущая "плата" сильно возбуждает чувства и является основным стимулом для действий. Если бы интеллект стимулировался только в настоящем времени, то его деятельность была бы весьма ограничена. Мы все время работаем "в долг", нас заставляют напрягаться будущие удовольствия от удовлетворения потребностей, но не в одинаковой степени.
Чувства возбуждаются будущей "платой" с поправкой на реальность ее получения. Голодный человек, не имеющий никакой надежды получить пищу, не станет затрачивать силы на ее поиск, он будет просто страдать. Стимул появляется тогда, когда есть надежда удовлетворить напряженную потребность в результате направленной деятельности, то есть при наличии вероятности получить за усилия "плату".
Величина стимула от будущей "платы" определяется двумя факторами. Первый и главный - напряжение потребности и ее значимость. На рис.22 показана характеристика "плата"-чувство. Исходное состояние потребности определяется точкой а, показывающей остаточную ее удовлетворенность после полученной в прошлом "платы". Приращение чувства, которое стимулирует деятельность,- это теоретическое желание ДЧ.макс от точки а до полного удовлетворения потребности как чувства - до предела притязаний. Абсолютная величина ДЧ.макс зависит также от значимости самой потребности.
Следует заметить, что истинное приращение чувства ДЧ, то есть стимул, при очень напряженной потребности меньше, чем максимально возможное. Голодный человек мечтает не о максимуме наслаждений вкусными яствами, а о том, чтобы удовлетворить острый голод какой-нибудь пищей. Однако этой поправкой на уменьшение притязаний в первом приближении можно пренебречь.
Второй фактор (или коэффициент при стимуле) - это реальность получения "платы" в результате деятельности. Она определяется вероятностью успешности действий и некоторым коэффициентом времени. Представить этот фактор не просто. Можно привести множество примеров, но я ограничусь двумя. Человек переходит дорогу и видит мчащийся на него автомобиль. Откуда берутся силы! Тут коэффициент времени равен единице, так как главное не в том, что вероятность смерти высокая (но не стопроцентная, ведь человек знает, что не все умирают под колесами), а в том, что она угрожает немедленно. Другой пример. Достоверно известно, что курение угрожает человеку раком легкого. Тоже не всем, но с вероятностью 1:10. Однако не теперь, а в будущем, для молодого, может быть, лет через сорок. И юноша не бросит курить, даже если он врач и хорошо осведомлен о вреде курения. Дело снова в коэффициенте времени. На рис.27 изображена гипотетическая функция величины этого коэффициента в зависимости от срока ожидания "платы". Показаны две кривые - одна для людей, живущих "сегодняшним днем", другая - для дальновидных и настойчивых. Коэффициент времени или поправки на будущее у них существенно разные. Видимо, этот коэффициент не является простым следствием уровня интеллекта, а заложен от природы, в генах. Интеллект только уточняет вероятность будущих событий, то есть определяет другой компонент реальности. У животных характеристика временного коэффициента падает очень круто, не говоря уже о том, что они не могут прогнозировать события далеко вперед.
Рис.27. Изменение коэффициента времени в зависимости от предполагаемого срока ожидания "платы" для двух типов характера.
Реальность будущего и оба ее компонента являются непременной принадлежностью любого интеллекта, это один из краеугольных камней всей гипотезы. Он столь же важен, как понятия о критериях-потребностях, управляющих действиями с моделями, или механизм обобщения.
Первую группу составляют "специальные" потребности-чувства, которые определяются назначением интеллекта. Они отражают критерий оптимальности деятельности управляемого объекта. Я не буду на них останавливаться, поскольку возможно бесконечное множество назначений интеллекта. Вторую группу составляют потребности-чувства, необходимые для любого более или менее развитого интеллекта и являющиеся непременным условием его деятельности. Условно назову их "рабочими". И.П.Павлов называл их "сложными рефлексами" и выделял исследовательский рефлекс, рефлексы "цели" и "свободы". Я бы добавил к ним потребность деятельности и противоположную ей - потребность отдыха. Третью группу я обозначу как "интегральные чувства". Это "Приятно" и "Неприятно"; они присутствуют в каждом частном чувстве, только по ним чувства сравниваются и суммируются, так как в принципе каждое чувство совершенно своеобразно. В рассмотренных характеристиках чувств уже выделены компоненты Пр и НПр (см. рис.22, 23, 24). Общее качество "рабочих чувств в том, что они "работают" при любой деятельности интеллекта, направленной на удовлетворение любой специальной потребности и достижение специальной цели. Без них его деятельность была бы невозможна или во всяком случае весьма затруднительна. В то же время при целенаправленной тренировке эти потребности-чувства могут стать самодовлеющими и служить источником удовольствия (пример - любознательность ученого).
Несомненно, есть один общий процесс для всех видов деятельности. Это нарастание своеобразного неприятного чувства, которое выступает в роли тормоза для продолжения действий. Его можно трактовать как утомление, когда оно касается мышц, можно применить определения "скука", "надоело", когда речь идет о мышлении, но так или иначе оно присутствует. Его "входом" является сигнал от специальной следящей системы, которая учитывает длительность и напряжение деятельности, направленной к одной цели. Характеристика такого чувства показана на рис.25. Его интенсивность является функцией продолжительности и напряжения деятельности. При прекращении действий чувство уменьшается, проходит фазы от неприятного к приятному, затем отдых надоедает, и чувство возвращается к нулю. Любое однообразное действие накапливает потребность в отдыхе или переключении на другое действие. Это касается не только всей обобщенной программы, например распознавания и исследования, но и ее частных проявлений - опознания названия, качеств, действия, прогнозов. По каждой из этих подпрограмм ведется учет количества и напряженности одинаковых операций и соответственно нарастает потребность остановиться, переключиться или отдохнуть. Уточнение соотношения двух процессов - расходования энергии действия и накопления тормозной энергии, ведущих к одному результату - остановке действия, еще требует исследования на конкретных примерах. Торможение от утомления или однообразия - универсальный процесс, касающийся любого действия, от любых стимулов. Он необходим для всякого интеллекта.
Рис.25. Характеристика чувства утомления: А - накопление утомления в зависимости от длительности и интенсивности деятельности; Б - динамика чувства во время отдыха.
Любознательность - вторая универсальная рабочая потребность интеллекта. Многочисленные вопросы, которые у нас возникают при виде чего-либо, являются ее проявлением. Кто-что? куда-откуда? зачем-почему? и еще масса других вопросов охватывает отношения, причинность, прошлое, будущее. Качество модели, которое возбуждает любознательность,- это ее "неизвестность", отсутствие связей с другими моделями. Когда при восприятии внешнего мира в нашей кратковременной памяти отпечатываются первичные модели объектов, рецептор отключается и включается программа распознавания. Она представляет собой поиск в памяти и сравнение одинаковых или похожих, но уже известных моделей. Извлечение моделей из памяти, их активация и сравнение - это "действие", требующее энергии, которая поступает от "центра" любознательности. Вначале нужно ответить на вопрос "Кто-что?" Затем следует установление качеств, то есть ответы на вопросы "Какой?". Качеств очень много, они выражаются "частными" моделями, заключенными в одном из кадров. Существует целый ряд структурных качеств, касающихся сравнительных размеров или формы. Есть качества, воспринимаемые отдельными рецепторами, например тепло. Динамика объекта и его отношения к другим объектам тоже могут выступать как качества.
Еще одним видом распознавания является прогнозирование. Это очень важное действие, широко используемое интеллектом. Оно сводится к действию дописывания "фразы" по известным "словам", что становится возможным лишь после опознания этих исходных слов.
Программа любознательности не ограничивается только распознаванием уже воспринятой модели, но предусматривает и новое исследование среды через настройку рецепторов и нацеливание фокусированного восприятия на определенные места внешней среды или ее объект, чтобы проверить, есть ли тут важная "деталь". Исследование и распознавание продолжаются до тех пор, пока иссякнет энергия чувства любопытства и стимул нейтрализуется "тормозом" со стороны утомления.
Следующая потребность как функция "рефлекса цели" - доводить дело до конечного результата даже ценой преодоления непредвиденного сопротивления объекта деятельности. Она представляется как программа слежения, воздействующая на некоторый специальный усилитель, способный дать дополнительную энергию для избранного действия тогда, когда для его окончания не хватает главного - специального стимула.
Можно это чувство трактовать иначе: как удовольствие от самого процесса деятельности, как чувство, выражающее потребность, прямо противоположную расслаблению и отдыху. Снова получается пара программ (что бывает довольно часто): потребность действовать стимулирует напряжение, расходуется какая-то энергия, возникает утомление, которое вызывает потребность в отдыхе, после чего энергия действия восстанавливается. Отдых в свою очередь надоедает, и включается потребность деятельности. Количественное соотношение обоих процессов пока не ясно. Психологический смысл "рефлекса цели" или удовольствия, получаемого от деятельности, довольно ясен. Конечно, нет уверенности, что действия ради их самих так уж необходимы для ИИ, но, может быть, этот дополнительный стимул полезен для того, чтобы доводить дело до конца.
Еще больше сомнений вызывает "рефлекс свободы" И.П.Павлова. Суть его состоит в том, что при появлении видимой помехи, препятствующей деятельности, животное (да и человек) оставляет основную деятельность и включает специальную программу уничтожения самой помехи (тогда как в соответствии с "рефлексом цели" следовало бы включить программу преодоления мешающего воздействия помехи дополнительным стимулированием главного дела). Уничтожение препятствия сопровождается "форсировкой", называемой эмоциями. "Рефлекс свободы" часто реализуется через агрессию. Ее же можно представить как эмоцию гнева. Понимание эмоций и "экстремальных" режимов имеет значение для ИИ.
Сильно чувствуют все люди, следовательно, в принципе у всех достаточно стимулов, чтобы напряженно действовать, преодолевать сопротивление и достигать больших целей. Но в действительности это не так. Одни могут добиться желаемого, другие - нет, все зависит от характера. В модельном выражении мы определяем силу характера как способность к напряженным действиям, которая обусловливается не столько силой стимулов, сколько значимостью главного "тормоза" - утомления, скуки, "надоело". Сильные люди способны пересилить утомление, оно для них не имеет того значения, как для слабых, у которых много желаний, планов, но они не в состоянии их реализовать, поскольку быстро устают и не могут преодолеть сопротивление. Цели не достигаются, уверенность в себе исчезает, соответственно облегчаются планы и наступает детренированность механизмов системы напряжения, в частности того же "рефлекса цели". Максимум возможного напряжения - еще не все в характере, нужна, кроме того, его продолжительность: одни способны на сильное, но кратковременное напряжение, другие - на меньшее по силе, но более длительное. И уж совсем редко сочетаются оба качества силы характера: высокий уровень и большая длительность напряжения. Таким образом, характер закладывается в значимости главного "тормоза" - потребности в расслаблении, или, попросту говоря,- "чувства лени". Важную положительную роль играет ее антипод - "рефлекс цели".
ЭМОЦИИ. О них следует сказать несколько слов, заканчивая раздел о чувствах. Почему-то именно они кажутся камнем преткновения на пути воссоздания разума человека. Действительно, как может "железка" переживать горе или ужас? Понятие эмоций в психологии не очень определенное. Нет четкого отграничения эмоций от чувств, даже их номенклатура расплывчата. Все согласны, что горе, ужас, радость и гнев - эмоции, а вот любовь? Однако эмоции все-таки имеют характерные черты, хотя и не столь четкие, чтобы полностью отделить их от сильных чувств. Прежде всего они дают такую высокую активность связанным с ними моделям, что все другие модели оказываются подавленными и не могут привлечь внимание. Следствием этого является крайняя субъективность оценок: все рассматривается через призму эмоции, человек не способен замечать другие раздражители и рассуждать здраво. Эмоции включают свою специфическую двигательную программу: гнев - потребность драться; ужас - бежать; радость - петь, танцевать; горе,- наоборот,- полную неподвижность. При этом происходит активация деятельности эндокринных органов, в частности возрастает выделение адреналина, который дополнительно возбуждает кору и играет роль положительной обратной связи. В целом эмоции производят впечатление первобытных примитивных чувств, которые включаются в условиях угрозы для жизни или по исчезновении такой угрозы. Можно думать, что на заре эволюции были простые рефлексы, потом на них наслоились эмоции, и уж потом дифференцировались чувства как более тонкие критерии поведения.
Воспроизвести эмоции в модели интеллекта не представляет труда. Нужно задать соответствующие "центры" как очень сильные усилители, "входами" на них будут чувства, "выходами" - модели раздражителя и ответного действия. Например, любая угроза вызывает потребность бежать или нападать, эмоция только многократно усиливает эту потребность вместе со значимостью раздражителя, вызвавшего угрозу. Центр эмоций включается от чувства через "реле силы" и дает дополнительное усиление соответствующим двигательным программам, тормозя при этом все остальные модели, пока действие не совершится.
Не думаю, что для искусственного интеллекта стоит задавать эмоции в таком виде. Они не улучшают, а нарушают разумную деятельность и оправданы лишь у животных, поскольку включение эндокринных регуляторов позволяет на короткое время мобилизовать дополнительную мышечную силу. Возможно, что лишь для некоторых роботов понадобится такая форсировка в условиях чрезвычайной угрозы.
ТАКТЫ ДЕЯТЕЛЬНОСТИ И НАПРЯЖЕНИЕ
Видимо, любой интеллект, даже сугубо сетевой разум человека, работает дискретно. О человеке разговор особый, а для АИ такты деятельности - обязательное условие. Для него "один такт" нужно понимать как действие по введению в кратковременную память одной новой модели или повторное активирование модели, уже бывшей в памяти. В каждый момент времени имеется одна самая возбужденная, самая активная модель. Как правило, она должна состоять из "слова" или короткой "фразы" - два-три, но не больше четырех "слов".
На рис.26 показано, как осуществляются действия с моделями. Каждая следующая модель выбирается в результате элементарного действия, с учетом связей с предыдущими моделями, возможно, в пределах нескольких тактов. Стимул нужен для действий, но он же определяет уровень активности выбранной модели, заставляя ее генерировать энергию согласно ее характеристике "вход"-"выход", в которой учтена тренированность. На "входе" учитываются энергия стимула и других моделей (так, например, для М.2 не только от Д.2, но и от М.1).
Рис.26. Цепочка действий Д с моделями М.
Как отмечалось выше, действия с моделями могут иметь различный характер. Модель действий - это часть программы, и в ней тоже можно выделить иерархию: от "действий вообще" в данном направлении до конкретного действия с одной моделью (например, целая последовательность сравнений). Здесь следует ввести понятие "напряжение" как некоторый уровень активности, средний для определенного периода деятельности интеллекта. Напряжение определяется прежде всего активностью чувств или уровнем потребности, стимулом. Уже говорилось, что значимость потребностей различная: одни "жизненно необходимы" (например, страх в минуту опасности), другие (к примеру, любознательность) несут вспомогательные функции, и даже при максимальном "информационном голоде" стимул к поиску новых раздражителей нельзя сравнить со стимулом к поиску пищи или спасения.
Другой фактор напряжения - "сопротивление" объекта действия в момент его выполнения. Это понятие прежде всего касается внешней среды и подразумевает физическое сопротивление эффекторам (например, нагрузка, которую должны преодолеть мышцы, с тем чтобы действия достигли цели). Но напряжение интеллекта необходимо и для решения трудной задачи, когда поиск в памяти нужных моделей наталкивается на большое сопротивление ведущих к этим моделям связей, если они давно не использовались. Конечно, как в том, так и в другом случае для того, чтобы напряжение возникло, нужны стимулы соответствующей силы, поскольку, если их не будет, действие просто не состоится. При этом приходится учитывать "рефлекс цели" как дополнительный стимул, который начинает временно действовать тогда, когда на пути к достижению цели, сформированной за счет умеренной потребности и неспособной вызвать большое напряжение, появляется препятствие, ставящее под угрозу ее осуществление. В таких случаях сопротивление как бы усиливает саму первичную потребность.
ВРЕМЯ
Время является той независимой переменной, которая, как и пространство, всегда участвует в деятельности интеллекта. Значительную часть своих программ он относит к будущему, несколько меньшую - к прошлому, большую часть - к настоящему. Интеллект должен иметь чувственное ощущение времени. Настоящее метится особой "буквой", указывающей на то обстоятельство, что в данный момент времени внешние или внутренние рецепторы работают. Прошлое воспринимается по действию извлечения из памяти, а будущее - по специфическим действиям с моделями настоящего и прошлого. Течение времени фиксируется переключением кадров в моделях кратковременной памяти. В частности, мысли о будущем можно представить как операции с "фразами", в начале которых стоят "слова", отражающие настоящее, то есть с подключенными рецепторами. Затем рецепторы отключаются, и "фраза" продолжается путем "дописывания" ее начиная от "слова" - настоящего уже с "буквой" - "будущее".
Время движется только в одну сторону. Это четко отмечается в последовательности любых "слов", "фраз", отражающих события, даже во "фразах" исследования объекта типа показанного на рис.17, где как будто движение идет по пространственным структурам, но в действительности - параллельно и во времени. Время отмечается во всех действиях (последовательность вызова моделей из памяти, восприятия из внешней среды или из тела). Поскольку "буквы" действий всегда присутствуют в модели структур, то эта "метка" и создает отсчет времени, его направление. Операция обращения к прошлому или к будущему - это тоже действие, которое метит модели своей "буквой".
Временные отношения сложны для понимания (настоящее - это данный момент. Но, говоря "в этом году", тоже подразумевают настоящее). Модели, выражающие время, так же подлежат обобщению, как и любые другие. Один кадр восприятия внешнего мира - одна элементарная модель - соединяется с буквальным понятием "настоящее". Обобщение времени, то есть удлинение единицы его измерения, создание "крупноблочной" модели, производится одновременно с обобщением измеряемой этим масштабом деятельности или воспринимаемых во времени моделей. "Действие обобщения" касается времени и объектов деятельности. "Весь год пишу книги" - здесь обобщены действие и время. Нельзя обобщать их порознь, отрывать одно от другого. Как говорилось, "действие обобщения" состоит в том, что модели последовательно сравниваются друг с другом, выделяется общее из "букв" и "слов", и потом эта полученная при первых сравнениях модель сопоставляется со всеми последующими. Это касается моделей объектов и действий. Со временем проще - единицы его измерения одинаковы, поэтому обобщение времени - это использование иерархии его единиц. Операции с большими отрезками времени стали возможны только благодаря речи и счету.
Обобщение моделей действий по времени - основа долгосрочного планирования и предвидения. Поскольку интеллект может мыслить только короткими фразами, длительное предвидение обязательно связано с обобщенными моделями, которые могут развертываться в более частные единицы последующими операциями (об этом речь пойдет дальше).
Отношение событий во времени определяется по масштабу времени двух параллельно протекающих процессов, выраженных отдельными "фразами". Интеллект осуществляет слежение за многими объектами, поскольку существует несколько типов рецепторов и следящих систем. Слежение за временем, однако, единое. Поэтому для соотношения времени разных "фраз" по их началу, концу, продолжительности нужно сравнить их маркировку по времени.
Продолжающееся и законченное действие - понятия, тоже имеющие отношение к моделям времени. Первое - это продолжение действий, начатых в прошлом и еще не отмеченных "меткой" окончания, второе - законченное, для которого она уже есть. Обычно это касается действия, состоящего из повторяющихся однородных актов (например: "Я шагаю уже час").
Операции переключения - настоящее, прошлое, будущее, операции обобщения по времени, определения отношения начала и конца обобщенного действия к данному моменту - позволяют выразить все типы грамматических времен, используемых речью.
РЕАЛЬНОСТЬ
Еще одно важное понятие - реальность. Реально то, что есть, что воспринимается рецепторами, следящими за внешней средой, за телом, за самим разумом. Модель с "буквой" действующего рецептора реальна. Она реальна даже в том случае, когда извлекается из памяти, если в модели образа присутствует эта "буква" рецептора. Наоборот, реальность будущего проблематична. Однако не всякое будущее можно назвать нереальным. Его реальность прежде всего определяется вероятностью будущего события. Если событие произойдет непременно, его следует воспринимать как абсолютно реальное. Другое дело, если вероятность меньше единицы: реальность события тем более сомнительна, чем меньше вероятность. Но это не все.
Реальность имеет прямое отношение к чувствам. Чувства вызываются "платой", удовлетворяющей потребность. "Плата" в настоящем очевидна: она или есть, или ее нет. Плата в прошлом тоже вполне реальна: она отмечена памятью на чувство. Будущая "плата" сильно возбуждает чувства и является основным стимулом для действий. Если бы интеллект стимулировался только в настоящем времени, то его деятельность была бы весьма ограничена. Мы все время работаем "в долг", нас заставляют напрягаться будущие удовольствия от удовлетворения потребностей, но не в одинаковой степени.
Чувства возбуждаются будущей "платой" с поправкой на реальность ее получения. Голодный человек, не имеющий никакой надежды получить пищу, не станет затрачивать силы на ее поиск, он будет просто страдать. Стимул появляется тогда, когда есть надежда удовлетворить напряженную потребность в результате направленной деятельности, то есть при наличии вероятности получить за усилия "плату".
Величина стимула от будущей "платы" определяется двумя факторами. Первый и главный - напряжение потребности и ее значимость. На рис.22 показана характеристика "плата"-чувство. Исходное состояние потребности определяется точкой а, показывающей остаточную ее удовлетворенность после полученной в прошлом "платы". Приращение чувства, которое стимулирует деятельность,- это теоретическое желание ДЧ.макс от точки а до полного удовлетворения потребности как чувства - до предела притязаний. Абсолютная величина ДЧ.макс зависит также от значимости самой потребности.
Следует заметить, что истинное приращение чувства ДЧ, то есть стимул, при очень напряженной потребности меньше, чем максимально возможное. Голодный человек мечтает не о максимуме наслаждений вкусными яствами, а о том, чтобы удовлетворить острый голод какой-нибудь пищей. Однако этой поправкой на уменьшение притязаний в первом приближении можно пренебречь.
Второй фактор (или коэффициент при стимуле) - это реальность получения "платы" в результате деятельности. Она определяется вероятностью успешности действий и некоторым коэффициентом времени. Представить этот фактор не просто. Можно привести множество примеров, но я ограничусь двумя. Человек переходит дорогу и видит мчащийся на него автомобиль. Откуда берутся силы! Тут коэффициент времени равен единице, так как главное не в том, что вероятность смерти высокая (но не стопроцентная, ведь человек знает, что не все умирают под колесами), а в том, что она угрожает немедленно. Другой пример. Достоверно известно, что курение угрожает человеку раком легкого. Тоже не всем, но с вероятностью 1:10. Однако не теперь, а в будущем, для молодого, может быть, лет через сорок. И юноша не бросит курить, даже если он врач и хорошо осведомлен о вреде курения. Дело снова в коэффициенте времени. На рис.27 изображена гипотетическая функция величины этого коэффициента в зависимости от срока ожидания "платы". Показаны две кривые - одна для людей, живущих "сегодняшним днем", другая - для дальновидных и настойчивых. Коэффициент времени или поправки на будущее у них существенно разные. Видимо, этот коэффициент не является простым следствием уровня интеллекта, а заложен от природы, в генах. Интеллект только уточняет вероятность будущих событий, то есть определяет другой компонент реальности. У животных характеристика временного коэффициента падает очень круто, не говоря уже о том, что они не могут прогнозировать события далеко вперед.
Рис.27. Изменение коэффициента времени в зависимости от предполагаемого срока ожидания "платы" для двух типов характера.
Реальность будущего и оба ее компонента являются непременной принадлежностью любого интеллекта, это один из краеугольных камней всей гипотезы. Он столь же важен, как понятия о критериях-потребностях, управляющих действиями с моделями, или механизм обобщения.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ФУНКЦИОНАЛЬНЫЙ АКТ
Любой интеллект функционирует дискретно. Если говорить точнее, то это сочетание непрерывных и дискретных процессов. Впрочем, существуют ли вообще чисто непрерывные процессы? Во всяком случае, в сложных системах любое непрерывное есть только статистика большого числа отдельных событий. В мозге, например, вся деятельность нейронов выражается отдельными импульсами.
Дискретность внешней деятельности интеллекта я выражаю термином "функциональный акт" (ФА), понимая под ним подготовку и выполнение последовательности движений, направленных на достижение цели. Целью является новое состояние объекта управления, выраженное его моделью, которая создается в процессе самого ФА или задается извне.
Простейший ФА состоит из трех этапов: восприятие - оценка - действие. В действительности даже у животных эта цепочка длиннее и представлена, по крайней мере, пятью элементами (рис.28 ), причем каждый элемент расчленяется в свою очередь на несколько простейших действий.
Рис.28. Этапы функционального акта.
В самом общем виде ФА можно описать так.
Первый этап - восприятие. Рецептор, настроенный на некоторый фрагмент среды, дает его первичную модель - картину.
Второй этап - анализ. Он состоит из трех моментов:
а) распознавание - сравнение первичной модели-картины с моделями-эталонами разной степени обобщенности, взятыми из постоянной памяти. В результате сравнения получается "вторичная модель" - переписанная своими моделями-"словами" картина среды, в которой отражена субъективность и ограниченность интеллекта;
б) прогнозирование будущих изменений среды - новая "фраза", дописанная по "словам" вторичной модели;
в) оценка - активирование чувств распознанными моделями объектов. Чувства зависят от состояния удовлетворения соответствующих потребностей к моменту начала ФА. В результате формируется суммарный стимул и выбирается "первичное действие" - модель действия в самой обобщенной форме.
Третий этап - планирование. "Первичное действие" развертывается в три "фразы" моделей, представляющих собой план:
а) "фраза" последовательности действий;
б) "фраза" эффекта - модель изменения среды в ответ на действия вплоть до достижения цели;
в) "фраза" необходимых усилий или "фраза" чувств.
Четвертый этап - решение, представляющее собой включение плана в действие. Решение возможно только в том случае, если суммарный стимул больше суммы "тормозов", предполагаемых в процессе выполнения действий и учтенных при планировании. "Тормоз" определяется сопротивлением среды.
Пятый этап - действия по реализации плана, то есть "считывание" модели последовательности действий под контролем обратных связей, воспринимаемых изменений объекта и затрачиваемых усилий. При рассогласовании и недостатке стимулов действия прекращаются, и производится новое планирование.
АЛГОРИТМ УПРОЩЕННОГО ФУНКЦИОНАЛЬНОГО АКТА
Реальные ФА очень сложны. Сложны модели среды, многочисленны критерии, разнообразны варианты действий. Чтобы представить алгоритм ФА, нужно упростить его до предела. На рис.29 показана схема такого упрощенного ФА.
Рис.29. Алгоритм функционального акта.
Рассмотрение его начнем с критериев (потребностей, чувств). Как минимум для понимания ФА необходимы четыре критерия. Первый (главный) - специфический, например голод как потребность "тела", второй - любознательность, третий - "рефлекс цели", четвертый - универсальный "тормоз" - утомление. Три последних критерия рабочие. Для каждого критерия необходимы характеристики и точки исходного состояния на них. Для голода, например, это будет зависимость чувства от количества пищи. Исходное состояние - некоторая низкая степень насыщения, оставшаяся после предыдущего приема пищи. Для критерия любознательности характеристика отражает потребность в информации, то есть зависит от числа и сложности новых моделей среды. Исходное состояние - некоторый "информационный голод". Критерий цели стимулируется от реальности цели, ее близости во времени и в соответствии с "процентом" выполнения плана. Вначале, естественно, он не действует. Критерий утомления включается от любого действия - в зависимости от его утомительности.
"Мысленные" этапы ФА - анализ, планирование - менее утомительны, но они надоедают, наскучивают. "Двигательные" этапы зависят от сопротивления объекта действия - "тормоз" от утомления может быть очень велик. По каждому виду действий - с моделями или с объектами, при восприятии или планировании - утомление отсчитывается от нуля. Значимость каждого критерия различна и задается заранее. Так, голод намного важнее, чем любознательность и удовольствие от достижения цели, но утомление в своем крайнем проявлении сравнимо с голодом.
ВОСПРИЯТИЕ. Восприятие среды осуществляется рецептором, для настройки которого необходимо действие. Его мы обозначим Д.1. Исходный стимул для него черпается из рабочего критерия любознательности, обеспечивающего некоторый минимальный уровень усилий. Для простоты будем считать стимул достаточным для такой настройки рецептора, чтобы получить модель среды.
В результате восприятия, как программы действия, в кратковременную память вводится модель внешней среды М.1 например одного предмета или пространственной ситуации из нескольких объектов. Каждый из них представлен "фразой", состоящей из нескольких "слов" в кадрах памяти (см. рис.17). Одно "слово" - обобщенная модель, другое - простейшая структура. В модель вводятся "буквы" настройки рецептора и координаты объекта.
Д.2 - приведение объекта к стандартным размерам - осуществляется автоматически, за счет того же любопытства и не требует большого напряжения. Получается новая модель М.2. Стимул при этом несколько уменьшается.
АНАЛИЗ. Д.3 начинает этап анализа и представляет собой программу распознавания приведенных моделей М.2 путем вызова из внешней памяти моделей-эталонов М.э, похожих на воспринятые. Для этого используются первые "буквы" каждого "слова", как в алфавитном словаре.
Д.4 - выбор наиболее похожих из вызванных моделей. Они выписываются в кратковременной памяти рядом с М.2 с последующим автоматическим сравнением и определением степени сходства. В результате получается новая "фраза" - модель распознанного объекта, переписанная собственными "словами" с указанием степени сходства,- М.3. Любознательность (источник энергии) во время этих действий значительно уменьшается и одновременно нарастает "тормоз" - "надоело". Распознавание может быть продолжено, но для упрощения задачи ограничимся этим.
Д.5 - оценка распознанного объекта как возможная "плата" для удовлетворения специальной потребности, в нашем случае - голода. Специальная "фраза" М.3', с которой связана модель распознанного объекта, вызывается из постоянной памяти и указывает степень удовлетворения потребности. Если ее подставить в характеристику главной потребности, отложив от исходной точки (см. рис.22), можно получить максимальный стимул ДЧ.макс Он определяет основную энергию для всех последующих этапов ФА. Если насытившемуся человеку предложить невкусную пищу, то есть низкую "плату", то стимул ДЧ будет очень мал. ФА закончится на первых этапах - рассмотрение и анализ, которые отработаны на стимуле "любознательность". Человек не захочет напрягаться из-за ерунды (об этом еще будет разговор). Сейчас предположим, что стимул весьма велик.
ПЛАНИРОВАНИЕ. Д.6 - определение цели. Принцип утилитарности интеллекта предусматривает автоматическое рассмотрение любой внешней картины с точки зрения ее использования для повышения удовольствия, то есть для удовлетворения потребностей. Важнейший стимул (голод) дает достаточно энергии для первой прикидки использования объекта. Суть действия состоит в создании модели цели. Зрительно это выражается в модели объекта в том виде, каким он должен стать в результате воздействий интеллекта (например, часть структуры объекта должна быть оторвана и перенесена к "телу" или попросту - взять и откусить). Такая цель может быть выражена короткой "фразой" - часть объекта, его перемещение в пространстве к новому месту. Откуда возьмется новая модель - цель? Она есть во внешней памяти в разных вариантах "фраз", связанных с моделью "съедобного" объекта. Для нахождения такой модели нужны входные данные: обобщенная модель объекта и действия с ним. Энергия для извлечения модели из внешней памяти и переноса ее в кратковременную память черпается из стимула, определившегося в предыдущем действии. При этом стимул несколько уменьшится за счет утомления. Таким образом мы получаем новую модель - цель М.4.
Д.7 - выбор движения для достижения цели. Его модель М.5 может быть представлена на разных уровнях обобщения. Самая общая модель - это "взять", "достать" как основное движение с "буквой" обобщения. Такая модель тоже имеется во внешней памяти в виде "фразы", где связаны модель-цель и модель-движение. Движения задаются моделью рецепторов, заложенных в органах движения.
Д.8 - определение сопротивления движению со стороны объекта - представляется как частная модель М.6 некоторого качества объекта. Найти ее можно по основной модели объекта или по сочетанию этой модели с моделью действия.
Д.6, Д.7 и Д.8 представляют собой самое упрощенное выражение этапа планирования. По существу, после каждого из этих действий должен производиться перерасчет стимулов, но для простоты эту процедуру мы объединим в одну операцию.
Д.9 - новый перерасчет стимулов и "тормозов" для определения их суммы М.7, который подготавливает важный этап - принятие решения. Предыдущие три действия были связаны с расходованием энергии стимула, подсчитанного в Д.5 на основании величины потребности и "платы", которую может обеспечить объект, воспринятый и распознанный на первых двух этапах. За время планирования этот стимул изменился: во-первых, за счет утомления от самой процедуры расчетов, во-вторых, за счет уточнения "ценности" объекта, которая была связана с уточнением цели, в-третьих, за счет будущих усилий для запланированных движений. Последний пункт особенно важен: мы не начинаем действий, если не уверены в том, что они нам под силу.
ПРИНЯТИЕ РЕШЕНИЯ. Подсчетом стимулов заканчиваются "мысленные" этапы ФА. Решение занимает промежуточное положение: с одной стороны, действия еще не начаты, а с другой - их начало уже определено, и для этого обеспечены стимулы. Они должны быть значительно сильнее, чем для предыдущих этапов, поскольку призваны обеспечить высокое напряжение моделей движений, способное преодолеть действительное, а не воображаемое сопротивление объекта, например мышечное усилие для поднятия тяжести. Важно понять, что во время восприятия и анализа стимул ДЧ, как функция неудовлетворенной потребности, может быть достаточно большим, но он не используется, поскольку напряжение нужно лишь для преодоления сопротивления связей, чтобы вызывать модели из внешней памяти.
Однако такое положение бывает не всегда. Стимул для действий, в том числе и для мыслительных, то есть "чистых" действий с моделями, расходуется на преодоление сопротивления связей при введении новых моделей из памяти и их активации. Это сопровождается утомлением. Оно сильно возрастает, если процесс мышления требует большого напряжения, длится непрерывно и не достигает успеха (нет решения задачи). Удовлетворения потребности при этом нет, наоборот, она активируется и стимул все более возрастает. Соответственно возрастанию стимула и противостоящего ему утомления увеличивается напряжение при низком УДК. Такое положение возникает при интенсивной умственной работе или в трудных жизненных ситуациях, вызывающих сильные чувства и не предлагающих легкого решения.
Д.10- решение. Внешне это короткий акт - включение в действие ранее составленных планов, но он весьма значителен. В момент решения необходимо скачкообразно повысить напряжение, чтобы активировать модели плана M.8, поскольку нужно преодолеть сопротивление действию со стороны объекта. У человека это связано с сокращением мышц, то есть большим расходом энергии. Решение вызывает особенно сильное напряжение, когда оно бесповоротно, когда уже невозможно остановить начатое действие (пример - прыжок через ров, разрез кожных покровов при операции).
ДЕЙСТВИЯ. Д.11 - действия в буквальном смысле слова: сокращение мышц у человека либо включение двигательных или манипуляционных устройств у ИИ.
Действия - это считывание модели плана. Она может быть задана в двух вариантах: в виде структурного образа объекта внешней среды как модель-цель или в виде последовательности ощущений с рецепторов органов движения. В первом случае обратной связью является орган зрения, воспринимающий объект и сверяющий изменения, которые он претерпел, с моделью цели действий. Во втором случае рецепторы с мышц сами дают обратную связь. Однако как в том, так и в другом варианте само считывание состоит в активации моделей, непосредственно управляющих органами движения. Сами по себе они не представлены в рецепторных зонах, а выражаются только через рецепторы органов движения, но тем не менее это элементы интеллекта, такие же, как и другие. Сложные двигательные акты состоят из последовательности автоматических элементарных движений ("слова" и "фразы" из "букв").
Активность моделей действий должна быть настолько велика, чтобы органы движения, управляемые от них, были способны преодолеть сопротивление объекта воздействий. От модели плана, записанной в кратковременной памяти, поэтапно включаются модели элементарных движений, управляющие эффекторами. Одновременно рецепторами "глаза" и "мышц" воспринимается эффект производимых движений. Как и всякое восприятие, он тоже записывается в кратковременную память в виде модели М.9. Таким образом, в кратковременной памяти активно функционирует несколько параллельных моделей: "старые" модели плана, "новые" модели объекта, измененного действием, и модели с рецепторов "мышц", показывающие их сокращения и усилия. Не представлены, но есть модели самих движений - как последовательность активации эффекторов. Эти модели, доведенные до высокой активности многократными повторениями, в дальнейшем могут стать основой автоматических сложных движений. Такими являются любые хорошо заученные двигательные акты, например произнесение слов. Разговаривая, мы просто "включаем" модели слов, а орган слуха воспринимает произносимое и выполняет роль обратной связи (в отличие от имитации чужого произношения, когда мы "считываем" звуковой образ).
Модели выполненных действий, по крайней мере две из них - изменение объекта и мышечных усилий, дают материал для чувственного контроля действий, корректируют планы получения "платы" и утомления.
Д.12 - подсчет уровня чувств, стимулов и "тормозов" после выполнения первого этапа движений (предположим, что весь план был разбит на 2-3 этапа). Для этого нужно определить, в какой степени модель измененного действием объекта М.10 соответствует модели - цели данного этапа действий. Недовыполнение плана уменьшает реальность всего ФА, снижает активность потребности и уменьшает стимул. С другой стороны, уже определено, каково действительное сопротивление и насколько оно соответствует "силам" эффектора. От этого зависит действительное утомление, то есть величина "тормоза", которая вычитается из стимула для определения их суммы. Если план выполнен, этапный эффект получен, а сопротивление оказалось меньше предполагавшегося, стимул возрастает и следующий этап может быть выполнен быстрее. Если же это невозможно вследствие особенностей объекта, ФА в целом может вызвать в дальнейшем большее удовлетворение. При более сильном сопротивлении "тормоз" может полностью нейтрализовать стимул и возникнет необходимость в прекращении действия, ФА останется незаконченным. Однако в этом случае включается другой "рабочий" стимул - "рефлекс цели". Невыполнение плана, отдаление цели или появление обстоятельств, угрожающих ее осуществлению, являются для него "платой" (довольно странной, но это так), уменьшающей чувство приятного, но побуждающей к деятельности, как и всякая угроза. Он суммируется с положительным стимулом надежды на истинную "плату", позволяет пересилить "тормоз" и продолжать действия, то есть перейти к их следующему этапу, который осуществляется по тем же принципам.
Уровень душевного комфорта в процессе выполнения действий зависит от их эффективности. При затруднениях он оказывается ниже предполагавшегося, если же сопротивление было переоценено,- то выше.
Д.13 - завершение ФА. Оно сводится к подведению итогов, определению окончательных чувств и УДК, но в этом и состоит его важность.
Предположим, что план выполнен полностью, "плата" получена, и это прежде всего резко изменяет главное чувство. Точка на характеристике потребности (в нашем примере - голод) перемещается в зону "приятного" и соответственно стимул для действия уменьшается до нуля. С другой стороны, накопившееся утомление представляет неприятный компонент чувственной сферы и понижает сумму чувств, то есть УДК. Третий, снова приятный, компонент дает "рефлекс цели". Он тем значительней, чем больше было преодоленных трудностей. Характеристика этого компонента показана на рис.30. В ходе выполнения ФА "утомились", или "прискучили", или "насытились" обе рабочие потребности - любознательности и цели, следовательно, их значимость уменьшилась. Так закончился ФА, представленный в самом упрощенном виде.
Рис.30. Характеристика "рефлекса цели": ДЧ.ц - стимул цели в зависимости от степени выполнения плана.
Воспроизведение простого ФА в алгоритмическом интеллекте, мне кажется, не будет трудным. Потребности и их чувства, то есть критерии, задаются в виде "центров" со своими характеристиками и постоянно находятся в оперативной памяти. То же самое касается центров - моделей настройки рецепторов. Они всегда обладают хотя бы минимальной активностью. Направление рецепторов на цель и их дополнительное активирование включаются как действие, модель которого ("куда направить взгляд") всегда имеется в оперативной памяти, поскольку она часто используется. Компоненты этого действия - настройка и активация рецепторов. Действие дает "первичную картину", которая тут же перекодируется цифровым кодом по особой подпрограмме. Так получается цифровая первичная модель. Этап "анализ" сводится к извлечению цифровых моделей из длительной памяти и сравнению их с первичной моделью. В результате создается вторичная модель. Планирование осуществляется по тем же принципам. Пересчет чувств, УДК, определение стимулов и "тормозов" производится после каждого этапа. Построив планы и получив достаточный суммарный стимул, АИ "принимает решение" - включает считывание плана действий. Для этого цифровая модель перекодируется в сигналы, управляющие органами движения - эффекторами. Они изменяют структуру объекта согласно "модели цели", полученной при планировании. Контроль за изменениями структуры объекта осуществляется рецептором зрения, напряжение мышц при работе оценивается специальными рецепторами, полученные картины кодируются и сравниваются с планом. В промежутках между отдельными движениями пересчитываются чувства и стимулы. "Отработанные" модели находятся в оперативной памяти до тех пор, пока активность их снижается, согласно характеристике, до определенного порога, после чего они стираются. Результат ФА в виде основных моделей - "первичной картины", последовательности действий и картины объекта после осуществления ФА - переносится в длительную память. Основная трудность алгоритмизации даже простого ФА состоит в перекодировании пространственной структуры объекта.
"КРУГИ" ВОСПРИЯТИЯ
В предыдущем описании ФА был предложен наиболее легкий процесс распознавания моделей - по полному совпадению с эталонами. В действительности это не так. Сложные структуры, воспринятые рецепторами и запечатленные в кратковременной памяти как первичная модель, почти никогда не имеют во внешней памяти точного аналога. Поэтому распознавание всегда носит вероятностный характер. Модель объекта представлена в нескольких кадрах, в которых запечатлены его образы с разной степенью обобщенности и некоторое количество деталей. Сравнение идет по нисходящей - от самых обобщенных моделей до подробностей. При этом требуются усилия - стимулы, поскольку нужно вызывать из памяти все новые модели - эталоны. Усилия утомляют, накапливаются "тормозы", стимулы любознательности ограничены, поэтому сравнение идет только до уравнивания стимулов и "тормозов". При этом не достигается полное распознавание объекта со всеми его качествами, а происходит лишь приблизительное опознание. Как уже говорилось, есть механизм (программа) учета степени вероятности. Этот показатель представляет "вход" для любознательности, так как всякое нераспознанное - в целом или в частностях - является новым и интригующим. Во внешней памяти у развитого интеллекта есть множество вариантов объектов с разным набором деталей, имеющих равное значение для разных целей. Поэтому возможно запоминание нескольких вариантов "своих моделей", соответствующих "первичной модели" с разной степенью вероятности.
Какая точность нужна? И все ли необходимые для ФА детали содержатся в первичной модели?
Точность - это детали и качества. Некоторые из них являются значимыми качествами-критериями. Именно они воздействуют на центр потребности, определяют величину возможной "платы", которую представляет объект. Пример: зеленое или спелое яблоко - качество степени съедобности, в разной мере значимое для сытого и голодного человека. Его нужно точно распознать. Отсюда следует, что предел необходимой точности исследования и распознавания определяет задачу поиска качеств, значимых для данной потребности. Для удовлетворения любознательности достаточны новизна и точность сами по себе (скажем, рябина, а не калина). Для специальных потребностей нужны "избранные" детали. При первом нецеленаправленном осмотре их можно и не заметить.
Итак, первый "круг" восприятия и распознавания действует за счет стимула любознательности и дает нам приблизительную "первичную модель", которая выявляет вероятностное совпадение с не очень подробными моделями-эталонами. Второй пункт анализа как этапа ФА направлен на определение ценности объекта для удовлетворения специальной потребности и выдвигает новые задачи. Степень точности модели может оказаться недостаточной, потому что специальная потребность (чувство) предусматривает некоторые значимые для нее детали. Как только ориентировочно, по неточным моделям, определяется ценность объекта, сразу же начинается второй "круг" - целенаправленное исследование его. Возбуждение специфической потребности ("голод") при восприятии объекта вызывает добавочное действие после Д.4. Оно состоит в том, что из внешней памяти по связям (адресам) потребности вызываются детали, которыми должен обладать объект, чтобы удовлетворить "голод". Во временную память вводятся "фразы" вариантов объекта, в разной степени ценных как "плата". С ними сравнивается имеющаяся уже первичная модель и обнаруживается, во-первых, ее недостаточность, а во-вторых, выявляются нужные детали, которые следует поискать в объекте, чтобы повысить вероятность "платы". Для этого включается новое действие - настройка рецептора с целью специального поиска нужной детали. В результате исследования появляется "усовершенствованная" первичная модель, которая снова подвергается анализу. Распознавание определяет, есть ли в ней искомая деталь, и если таковой нет, это понижает "ценность" объекта как "платы", что сказывается на последующем перерасчете чувств и стимулов. Модель цели на следующем этапе тоже может измениться, поскольку изменилась первичная модель.
...
Любой интеллект функционирует дискретно. Если говорить точнее, то это сочетание непрерывных и дискретных процессов. Впрочем, существуют ли вообще чисто непрерывные процессы? Во всяком случае, в сложных системах любое непрерывное есть только статистика большого числа отдельных событий. В мозге, например, вся деятельность нейронов выражается отдельными импульсами.
Дискретность внешней деятельности интеллекта я выражаю термином "функциональный акт" (ФА), понимая под ним подготовку и выполнение последовательности движений, направленных на достижение цели. Целью является новое состояние объекта управления, выраженное его моделью, которая создается в процессе самого ФА или задается извне.
Простейший ФА состоит из трех этапов: восприятие - оценка - действие. В действительности даже у животных эта цепочка длиннее и представлена, по крайней мере, пятью элементами (рис.28 ), причем каждый элемент расчленяется в свою очередь на несколько простейших действий.
Рис.28. Этапы функционального акта.
В самом общем виде ФА можно описать так.
Первый этап - восприятие. Рецептор, настроенный на некоторый фрагмент среды, дает его первичную модель - картину.
Второй этап - анализ. Он состоит из трех моментов:
а) распознавание - сравнение первичной модели-картины с моделями-эталонами разной степени обобщенности, взятыми из постоянной памяти. В результате сравнения получается "вторичная модель" - переписанная своими моделями-"словами" картина среды, в которой отражена субъективность и ограниченность интеллекта;
б) прогнозирование будущих изменений среды - новая "фраза", дописанная по "словам" вторичной модели;
в) оценка - активирование чувств распознанными моделями объектов. Чувства зависят от состояния удовлетворения соответствующих потребностей к моменту начала ФА. В результате формируется суммарный стимул и выбирается "первичное действие" - модель действия в самой обобщенной форме.
Третий этап - планирование. "Первичное действие" развертывается в три "фразы" моделей, представляющих собой план:
а) "фраза" последовательности действий;
б) "фраза" эффекта - модель изменения среды в ответ на действия вплоть до достижения цели;
в) "фраза" необходимых усилий или "фраза" чувств.
Четвертый этап - решение, представляющее собой включение плана в действие. Решение возможно только в том случае, если суммарный стимул больше суммы "тормозов", предполагаемых в процессе выполнения действий и учтенных при планировании. "Тормоз" определяется сопротивлением среды.
Пятый этап - действия по реализации плана, то есть "считывание" модели последовательности действий под контролем обратных связей, воспринимаемых изменений объекта и затрачиваемых усилий. При рассогласовании и недостатке стимулов действия прекращаются, и производится новое планирование.
АЛГОРИТМ УПРОЩЕННОГО ФУНКЦИОНАЛЬНОГО АКТА
Реальные ФА очень сложны. Сложны модели среды, многочисленны критерии, разнообразны варианты действий. Чтобы представить алгоритм ФА, нужно упростить его до предела. На рис.29 показана схема такого упрощенного ФА.
Рис.29. Алгоритм функционального акта.
Рассмотрение его начнем с критериев (потребностей, чувств). Как минимум для понимания ФА необходимы четыре критерия. Первый (главный) - специфический, например голод как потребность "тела", второй - любознательность, третий - "рефлекс цели", четвертый - универсальный "тормоз" - утомление. Три последних критерия рабочие. Для каждого критерия необходимы характеристики и точки исходного состояния на них. Для голода, например, это будет зависимость чувства от количества пищи. Исходное состояние - некоторая низкая степень насыщения, оставшаяся после предыдущего приема пищи. Для критерия любознательности характеристика отражает потребность в информации, то есть зависит от числа и сложности новых моделей среды. Исходное состояние - некоторый "информационный голод". Критерий цели стимулируется от реальности цели, ее близости во времени и в соответствии с "процентом" выполнения плана. Вначале, естественно, он не действует. Критерий утомления включается от любого действия - в зависимости от его утомительности.
"Мысленные" этапы ФА - анализ, планирование - менее утомительны, но они надоедают, наскучивают. "Двигательные" этапы зависят от сопротивления объекта действия - "тормоз" от утомления может быть очень велик. По каждому виду действий - с моделями или с объектами, при восприятии или планировании - утомление отсчитывается от нуля. Значимость каждого критерия различна и задается заранее. Так, голод намного важнее, чем любознательность и удовольствие от достижения цели, но утомление в своем крайнем проявлении сравнимо с голодом.
ВОСПРИЯТИЕ. Восприятие среды осуществляется рецептором, для настройки которого необходимо действие. Его мы обозначим Д.1. Исходный стимул для него черпается из рабочего критерия любознательности, обеспечивающего некоторый минимальный уровень усилий. Для простоты будем считать стимул достаточным для такой настройки рецептора, чтобы получить модель среды.
В результате восприятия, как программы действия, в кратковременную память вводится модель внешней среды М.1 например одного предмета или пространственной ситуации из нескольких объектов. Каждый из них представлен "фразой", состоящей из нескольких "слов" в кадрах памяти (см. рис.17). Одно "слово" - обобщенная модель, другое - простейшая структура. В модель вводятся "буквы" настройки рецептора и координаты объекта.
Д.2 - приведение объекта к стандартным размерам - осуществляется автоматически, за счет того же любопытства и не требует большого напряжения. Получается новая модель М.2. Стимул при этом несколько уменьшается.
АНАЛИЗ. Д.3 начинает этап анализа и представляет собой программу распознавания приведенных моделей М.2 путем вызова из внешней памяти моделей-эталонов М.э, похожих на воспринятые. Для этого используются первые "буквы" каждого "слова", как в алфавитном словаре.
Д.4 - выбор наиболее похожих из вызванных моделей. Они выписываются в кратковременной памяти рядом с М.2 с последующим автоматическим сравнением и определением степени сходства. В результате получается новая "фраза" - модель распознанного объекта, переписанная собственными "словами" с указанием степени сходства,- М.3. Любознательность (источник энергии) во время этих действий значительно уменьшается и одновременно нарастает "тормоз" - "надоело". Распознавание может быть продолжено, но для упрощения задачи ограничимся этим.
Д.5 - оценка распознанного объекта как возможная "плата" для удовлетворения специальной потребности, в нашем случае - голода. Специальная "фраза" М.3', с которой связана модель распознанного объекта, вызывается из постоянной памяти и указывает степень удовлетворения потребности. Если ее подставить в характеристику главной потребности, отложив от исходной точки (см. рис.22), можно получить максимальный стимул ДЧ.макс Он определяет основную энергию для всех последующих этапов ФА. Если насытившемуся человеку предложить невкусную пищу, то есть низкую "плату", то стимул ДЧ будет очень мал. ФА закончится на первых этапах - рассмотрение и анализ, которые отработаны на стимуле "любознательность". Человек не захочет напрягаться из-за ерунды (об этом еще будет разговор). Сейчас предположим, что стимул весьма велик.
ПЛАНИРОВАНИЕ. Д.6 - определение цели. Принцип утилитарности интеллекта предусматривает автоматическое рассмотрение любой внешней картины с точки зрения ее использования для повышения удовольствия, то есть для удовлетворения потребностей. Важнейший стимул (голод) дает достаточно энергии для первой прикидки использования объекта. Суть действия состоит в создании модели цели. Зрительно это выражается в модели объекта в том виде, каким он должен стать в результате воздействий интеллекта (например, часть структуры объекта должна быть оторвана и перенесена к "телу" или попросту - взять и откусить). Такая цель может быть выражена короткой "фразой" - часть объекта, его перемещение в пространстве к новому месту. Откуда возьмется новая модель - цель? Она есть во внешней памяти в разных вариантах "фраз", связанных с моделью "съедобного" объекта. Для нахождения такой модели нужны входные данные: обобщенная модель объекта и действия с ним. Энергия для извлечения модели из внешней памяти и переноса ее в кратковременную память черпается из стимула, определившегося в предыдущем действии. При этом стимул несколько уменьшится за счет утомления. Таким образом мы получаем новую модель - цель М.4.
Д.7 - выбор движения для достижения цели. Его модель М.5 может быть представлена на разных уровнях обобщения. Самая общая модель - это "взять", "достать" как основное движение с "буквой" обобщения. Такая модель тоже имеется во внешней памяти в виде "фразы", где связаны модель-цель и модель-движение. Движения задаются моделью рецепторов, заложенных в органах движения.
Д.8 - определение сопротивления движению со стороны объекта - представляется как частная модель М.6 некоторого качества объекта. Найти ее можно по основной модели объекта или по сочетанию этой модели с моделью действия.
Д.6, Д.7 и Д.8 представляют собой самое упрощенное выражение этапа планирования. По существу, после каждого из этих действий должен производиться перерасчет стимулов, но для простоты эту процедуру мы объединим в одну операцию.
Д.9 - новый перерасчет стимулов и "тормозов" для определения их суммы М.7, который подготавливает важный этап - принятие решения. Предыдущие три действия были связаны с расходованием энергии стимула, подсчитанного в Д.5 на основании величины потребности и "платы", которую может обеспечить объект, воспринятый и распознанный на первых двух этапах. За время планирования этот стимул изменился: во-первых, за счет утомления от самой процедуры расчетов, во-вторых, за счет уточнения "ценности" объекта, которая была связана с уточнением цели, в-третьих, за счет будущих усилий для запланированных движений. Последний пункт особенно важен: мы не начинаем действий, если не уверены в том, что они нам под силу.
ПРИНЯТИЕ РЕШЕНИЯ. Подсчетом стимулов заканчиваются "мысленные" этапы ФА. Решение занимает промежуточное положение: с одной стороны, действия еще не начаты, а с другой - их начало уже определено, и для этого обеспечены стимулы. Они должны быть значительно сильнее, чем для предыдущих этапов, поскольку призваны обеспечить высокое напряжение моделей движений, способное преодолеть действительное, а не воображаемое сопротивление объекта, например мышечное усилие для поднятия тяжести. Важно понять, что во время восприятия и анализа стимул ДЧ, как функция неудовлетворенной потребности, может быть достаточно большим, но он не используется, поскольку напряжение нужно лишь для преодоления сопротивления связей, чтобы вызывать модели из внешней памяти.
Однако такое положение бывает не всегда. Стимул для действий, в том числе и для мыслительных, то есть "чистых" действий с моделями, расходуется на преодоление сопротивления связей при введении новых моделей из памяти и их активации. Это сопровождается утомлением. Оно сильно возрастает, если процесс мышления требует большого напряжения, длится непрерывно и не достигает успеха (нет решения задачи). Удовлетворения потребности при этом нет, наоборот, она активируется и стимул все более возрастает. Соответственно возрастанию стимула и противостоящего ему утомления увеличивается напряжение при низком УДК. Такое положение возникает при интенсивной умственной работе или в трудных жизненных ситуациях, вызывающих сильные чувства и не предлагающих легкого решения.
Д.10- решение. Внешне это короткий акт - включение в действие ранее составленных планов, но он весьма значителен. В момент решения необходимо скачкообразно повысить напряжение, чтобы активировать модели плана M.8, поскольку нужно преодолеть сопротивление действию со стороны объекта. У человека это связано с сокращением мышц, то есть большим расходом энергии. Решение вызывает особенно сильное напряжение, когда оно бесповоротно, когда уже невозможно остановить начатое действие (пример - прыжок через ров, разрез кожных покровов при операции).
ДЕЙСТВИЯ. Д.11 - действия в буквальном смысле слова: сокращение мышц у человека либо включение двигательных или манипуляционных устройств у ИИ.
Действия - это считывание модели плана. Она может быть задана в двух вариантах: в виде структурного образа объекта внешней среды как модель-цель или в виде последовательности ощущений с рецепторов органов движения. В первом случае обратной связью является орган зрения, воспринимающий объект и сверяющий изменения, которые он претерпел, с моделью цели действий. Во втором случае рецепторы с мышц сами дают обратную связь. Однако как в том, так и в другом варианте само считывание состоит в активации моделей, непосредственно управляющих органами движения. Сами по себе они не представлены в рецепторных зонах, а выражаются только через рецепторы органов движения, но тем не менее это элементы интеллекта, такие же, как и другие. Сложные двигательные акты состоят из последовательности автоматических элементарных движений ("слова" и "фразы" из "букв").
Активность моделей действий должна быть настолько велика, чтобы органы движения, управляемые от них, были способны преодолеть сопротивление объекта воздействий. От модели плана, записанной в кратковременной памяти, поэтапно включаются модели элементарных движений, управляющие эффекторами. Одновременно рецепторами "глаза" и "мышц" воспринимается эффект производимых движений. Как и всякое восприятие, он тоже записывается в кратковременную память в виде модели М.9. Таким образом, в кратковременной памяти активно функционирует несколько параллельных моделей: "старые" модели плана, "новые" модели объекта, измененного действием, и модели с рецепторов "мышц", показывающие их сокращения и усилия. Не представлены, но есть модели самих движений - как последовательность активации эффекторов. Эти модели, доведенные до высокой активности многократными повторениями, в дальнейшем могут стать основой автоматических сложных движений. Такими являются любые хорошо заученные двигательные акты, например произнесение слов. Разговаривая, мы просто "включаем" модели слов, а орган слуха воспринимает произносимое и выполняет роль обратной связи (в отличие от имитации чужого произношения, когда мы "считываем" звуковой образ).
Модели выполненных действий, по крайней мере две из них - изменение объекта и мышечных усилий, дают материал для чувственного контроля действий, корректируют планы получения "платы" и утомления.
Д.12 - подсчет уровня чувств, стимулов и "тормозов" после выполнения первого этапа движений (предположим, что весь план был разбит на 2-3 этапа). Для этого нужно определить, в какой степени модель измененного действием объекта М.10 соответствует модели - цели данного этапа действий. Недовыполнение плана уменьшает реальность всего ФА, снижает активность потребности и уменьшает стимул. С другой стороны, уже определено, каково действительное сопротивление и насколько оно соответствует "силам" эффектора. От этого зависит действительное утомление, то есть величина "тормоза", которая вычитается из стимула для определения их суммы. Если план выполнен, этапный эффект получен, а сопротивление оказалось меньше предполагавшегося, стимул возрастает и следующий этап может быть выполнен быстрее. Если же это невозможно вследствие особенностей объекта, ФА в целом может вызвать в дальнейшем большее удовлетворение. При более сильном сопротивлении "тормоз" может полностью нейтрализовать стимул и возникнет необходимость в прекращении действия, ФА останется незаконченным. Однако в этом случае включается другой "рабочий" стимул - "рефлекс цели". Невыполнение плана, отдаление цели или появление обстоятельств, угрожающих ее осуществлению, являются для него "платой" (довольно странной, но это так), уменьшающей чувство приятного, но побуждающей к деятельности, как и всякая угроза. Он суммируется с положительным стимулом надежды на истинную "плату", позволяет пересилить "тормоз" и продолжать действия, то есть перейти к их следующему этапу, который осуществляется по тем же принципам.
Уровень душевного комфорта в процессе выполнения действий зависит от их эффективности. При затруднениях он оказывается ниже предполагавшегося, если же сопротивление было переоценено,- то выше.
Д.13 - завершение ФА. Оно сводится к подведению итогов, определению окончательных чувств и УДК, но в этом и состоит его важность.
Предположим, что план выполнен полностью, "плата" получена, и это прежде всего резко изменяет главное чувство. Точка на характеристике потребности (в нашем примере - голод) перемещается в зону "приятного" и соответственно стимул для действия уменьшается до нуля. С другой стороны, накопившееся утомление представляет неприятный компонент чувственной сферы и понижает сумму чувств, то есть УДК. Третий, снова приятный, компонент дает "рефлекс цели". Он тем значительней, чем больше было преодоленных трудностей. Характеристика этого компонента показана на рис.30. В ходе выполнения ФА "утомились", или "прискучили", или "насытились" обе рабочие потребности - любознательности и цели, следовательно, их значимость уменьшилась. Так закончился ФА, представленный в самом упрощенном виде.
Рис.30. Характеристика "рефлекса цели": ДЧ.ц - стимул цели в зависимости от степени выполнения плана.
Воспроизведение простого ФА в алгоритмическом интеллекте, мне кажется, не будет трудным. Потребности и их чувства, то есть критерии, задаются в виде "центров" со своими характеристиками и постоянно находятся в оперативной памяти. То же самое касается центров - моделей настройки рецепторов. Они всегда обладают хотя бы минимальной активностью. Направление рецепторов на цель и их дополнительное активирование включаются как действие, модель которого ("куда направить взгляд") всегда имеется в оперативной памяти, поскольку она часто используется. Компоненты этого действия - настройка и активация рецепторов. Действие дает "первичную картину", которая тут же перекодируется цифровым кодом по особой подпрограмме. Так получается цифровая первичная модель. Этап "анализ" сводится к извлечению цифровых моделей из длительной памяти и сравнению их с первичной моделью. В результате создается вторичная модель. Планирование осуществляется по тем же принципам. Пересчет чувств, УДК, определение стимулов и "тормозов" производится после каждого этапа. Построив планы и получив достаточный суммарный стимул, АИ "принимает решение" - включает считывание плана действий. Для этого цифровая модель перекодируется в сигналы, управляющие органами движения - эффекторами. Они изменяют структуру объекта согласно "модели цели", полученной при планировании. Контроль за изменениями структуры объекта осуществляется рецептором зрения, напряжение мышц при работе оценивается специальными рецепторами, полученные картины кодируются и сравниваются с планом. В промежутках между отдельными движениями пересчитываются чувства и стимулы. "Отработанные" модели находятся в оперативной памяти до тех пор, пока активность их снижается, согласно характеристике, до определенного порога, после чего они стираются. Результат ФА в виде основных моделей - "первичной картины", последовательности действий и картины объекта после осуществления ФА - переносится в длительную память. Основная трудность алгоритмизации даже простого ФА состоит в перекодировании пространственной структуры объекта.
"КРУГИ" ВОСПРИЯТИЯ
В предыдущем описании ФА был предложен наиболее легкий процесс распознавания моделей - по полному совпадению с эталонами. В действительности это не так. Сложные структуры, воспринятые рецепторами и запечатленные в кратковременной памяти как первичная модель, почти никогда не имеют во внешней памяти точного аналога. Поэтому распознавание всегда носит вероятностный характер. Модель объекта представлена в нескольких кадрах, в которых запечатлены его образы с разной степенью обобщенности и некоторое количество деталей. Сравнение идет по нисходящей - от самых обобщенных моделей до подробностей. При этом требуются усилия - стимулы, поскольку нужно вызывать из памяти все новые модели - эталоны. Усилия утомляют, накапливаются "тормозы", стимулы любознательности ограничены, поэтому сравнение идет только до уравнивания стимулов и "тормозов". При этом не достигается полное распознавание объекта со всеми его качествами, а происходит лишь приблизительное опознание. Как уже говорилось, есть механизм (программа) учета степени вероятности. Этот показатель представляет "вход" для любознательности, так как всякое нераспознанное - в целом или в частностях - является новым и интригующим. Во внешней памяти у развитого интеллекта есть множество вариантов объектов с разным набором деталей, имеющих равное значение для разных целей. Поэтому возможно запоминание нескольких вариантов "своих моделей", соответствующих "первичной модели" с разной степенью вероятности.
Какая точность нужна? И все ли необходимые для ФА детали содержатся в первичной модели?
Точность - это детали и качества. Некоторые из них являются значимыми качествами-критериями. Именно они воздействуют на центр потребности, определяют величину возможной "платы", которую представляет объект. Пример: зеленое или спелое яблоко - качество степени съедобности, в разной мере значимое для сытого и голодного человека. Его нужно точно распознать. Отсюда следует, что предел необходимой точности исследования и распознавания определяет задачу поиска качеств, значимых для данной потребности. Для удовлетворения любознательности достаточны новизна и точность сами по себе (скажем, рябина, а не калина). Для специальных потребностей нужны "избранные" детали. При первом нецеленаправленном осмотре их можно и не заметить.
Итак, первый "круг" восприятия и распознавания действует за счет стимула любознательности и дает нам приблизительную "первичную модель", которая выявляет вероятностное совпадение с не очень подробными моделями-эталонами. Второй пункт анализа как этапа ФА направлен на определение ценности объекта для удовлетворения специальной потребности и выдвигает новые задачи. Степень точности модели может оказаться недостаточной, потому что специальная потребность (чувство) предусматривает некоторые значимые для нее детали. Как только ориентировочно, по неточным моделям, определяется ценность объекта, сразу же начинается второй "круг" - целенаправленное исследование его. Возбуждение специфической потребности ("голод") при восприятии объекта вызывает добавочное действие после Д.4. Оно состоит в том, что из внешней памяти по связям (адресам) потребности вызываются детали, которыми должен обладать объект, чтобы удовлетворить "голод". Во временную память вводятся "фразы" вариантов объекта, в разной степени ценных как "плата". С ними сравнивается имеющаяся уже первичная модель и обнаруживается, во-первых, ее недостаточность, а во-вторых, выявляются нужные детали, которые следует поискать в объекте, чтобы повысить вероятность "платы". Для этого включается новое действие - настройка рецептора с целью специального поиска нужной детали. В результате исследования появляется "усовершенствованная" первичная модель, которая снова подвергается анализу. Распознавание определяет, есть ли в ней искомая деталь, и если таковой нет, это понижает "ценность" объекта как "платы", что сказывается на последующем перерасчете чувств и стимулов. Модель цели на следующем этапе тоже может измениться, поскольку изменилась первичная модель.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ПРОГНОЗИРОВАНИЕ И ОПРЕДЕЛЕНИЕ ДИНАМИКИ
Эти термины относятся к анализу, мы их опустили для простоты в описании ФА, предположив, что объект и среда совершенно статичны. В действительности же интеллект имеет дело с динамикой. Факт динамичности устанавливается глазом человека при первом восприятии, когда за доли секунды он определяет "первую производную" изменений положения или структуры объекта. Для алгоритмического интеллекта, возможно, понадобятся две первичные модели вместо одной и автоматический механизм их сравнения для определения динамики.
Однако и неподвижные в данный момент объекты необязательно неизменны в продолжение тех отрезков времени, в которых проектируется ФА. Поэтому динамика, прогнозирование изменения объекта, является непременным действием анализа. Ее необходимость выявляется при распознавании: уже тогда, когда первичная модель заменяется, "переписывается" вторичной, в ней заложена возможность и вероятность динамики. Динамичность маркируется особой "буквой".
Прогнозирование состоит в том, что модель объекта представляется "словом" "фразы", в которой записана вероятная последовательность изменения структуры объекта или его пространственного положения в среде. Соответствующие "фразы" хранятся во внешней памяти и вызываются в кратковременную память специальным действием. Я не буду вводить дополнительные обозначения, поскольку они недопустимо усложняют схему. Распознавание будущего по "фразе" динамики носит вероятностный характер и состоит в определении промежуточных и конечного состояний объектов - в виде его новой модели, которую и нужно оценить с позиции значимости как "платы". Это не так просто.
Динамика и прогнозирование сталкивают нас с новым фактором, новой переменной - временем. При описании простейшего ФА мы не учитывали время. На самом же деле, оценивая динамику объекта, интеллект определяет время, в течение которого объект сохраняет значимость в качестве "платы", удовлетворяющей потребность. Пример: зеленая ягода. Поскольку сейчас она в пищу не годится, ФА не состоится. Другой пример: автомашина идет по дороге, которую нужно перейти. Она представляет угрозу, оценка уровня которой прямо определяется динамикой и расстоянием до автомашины. "Плата" обычно ожидается только в будущем, но она уже сейчас определяет действия. Как уже говорилось, любой развитый интеллект всегда работает на будущее. Но ценность объекта в будущем и сейчас не одинакова, и, следовательно, не одинаково его значение как стимула действий.
Для расчета динамических систем введено понятие "реальность будущего". Это очень важное понятие для любого интеллекта. Мы его разлагаем на два компонента: вероятность будущего события и "коэффициент будущего". Уже на этапе анализа реальность вводится в расчет для определения величины "платы", а следовательно, и стимула. В Д.5 нужно ввести поправку для динамических систем: умножить стимул на "коэффициент реальности", полученный как произведение вероятности будущего события и значимости будущего - "коэффициента времени", рассчитанного по кривой, показанной на рис.27. Стимул может оказаться существенно меньше или даже исчезнуть совсем.
В этапе "планирование" время присутствует постоянно. Модель цели учитывает динамику объекта ("где и когда его можно взять?", "в каком он будет состоянии?" и обязательно - "сколько для этого потребуется времени?").
Д.7 - модель движений для достижения цели - полностью зависит от времени. Здесь выступает тесная связь времени и сложности действий. Простые движения быстры, сложная последовательность их напротив, продолжительна. Не будем пока говорить о том, как планируются сложные движения, ограничимся констатацией того факта, что они требуют определенного времени для своего выполнения. Следовательно, они отдаляют получение "платы", уменьшают "коэффициент будущего", увеличивают усилия и связанное с ним утомление. Все это сказывается на Д.9 - пересчете стимулов после планирования.
Планирование всегда является прогнозированием, следовательно, оно вероятностно. Этот фактор присутствует в планах. Степень вероятности достижения цели в результате действий оценивается по подробности исходной модели объекта и по наличию в памяти соответствующих моделей, полученных из предыдущего опыта. Эти модели-"фразы" извлекаются из постоянной памяти в то время, когда рассчитывается последовательность движений и их результат - как "фразы" плана. Результат характеризуется определенной вероятностью.
При этом может оказаться, что исходная модель объекта снова была недостаточно полной. Одно дело - модель распознавания и модель для оценки и другое дело - модель для воздействия на объект. "Фразы" действий могут потребовать новых деталей, а для этого понадобится новый, третий, "круг" исследования - снова настройка рецептора на искомую деталь, снова ее восприятие, новая первичная модель и анализ - уже с позиций выполнения действий.
Итак, при Д.9 - пересчете стимулов - учитывается поправка на реальность достижения цели как функцию вероятности и требуемого времени. Нужно помнить, что само планирование несет с собой утомление, как всякое однообразное действие; это ограничивает его продолжительность и заставляет скорее переходить к решению, не добиваясь стопроцентной вероятности результата при расчете получения "платы".
ИЕРАРХИЯ ФУНКЦИОНАЛЬНЫХ АКТОВ
Юноша пять лет учился в институте - это ФА продолжительностью в пять лет, который он планировал на такое время, исходя из существующих правил обучения. У него была цель - получить высшее образование для работы, призванной в свою очередь удовлетворить набор потребностей, существующих к моменту поступления. Этот длинный ФА будет разделен на пять более коротких - по годам учения, те - на еще более короткие - семестры и т.д., вплоть до уроков и заданий на завтра. Такая совокупность ФА разной продолжительности и разных частных целей при одной общей - окончании института - представляет иерархию ФА. Вся жизнь человека состоит из подобных сложных ФА, направленных на удовлетворение различных потребностей и рассчитанных на неодинаковую продолжительность. Подчиненные ФА выступают при этом в двух образах - как самостоятельные и как компоненты главного.
Так мы подошли к применению принципа обобщенности к ФА. Обобщение модели относилось к моделированию внешнего мира: обобщенная структура из крупных блоков, обобщение повторяющихся объектов во времени или по этапам исследования, "буква обобщенности" как маркировка этого вида действия с моделями, даже если оно происходит автоматически в результате процесса забывания незначащих деталей.
Действия, как сокращения мышц и как операции с моделями в смысле вызова их из постоянной памяти, сравнения, прогнозирования, представлены в интеллекте моделями. Следовательно, они тоже могут обобщаться.
Обобщенные модели можно себе представить как "неясные", или "крупноблочные", без деталей, но имеющие "букву обобщенности". Она указывает, что модель получена путем действия с множеством моделей, а не через восприятие рецепторами с плохой настройкой. "Буква обобщенности" такая же, как "буква настройки рецептора", обе они показывают, как получена соответствующая модель. Обобщенная модель всегда известна, то есть имеет связи с другими моделями. Если нам нужно вообразить "собаку вообще", мы представляем какую-нибудь одну из множества виденных собак, обычно не очень ясно. Обобщенный образ собаки проявляется, когда мы пытаемся ее нарисовать, а не просто вспомнить. Он же проступает скрыто, неявно при распознавании конкретной собаки. Явная обобщенность выступает в интеллекте только через речь. Об этом еще будет разговор.
По такому же принципу возможно обобщение модели действия. Например, действие "взять" состоит из набора нескольких конкретных движений, изменяющихся в зависимости от объекта деятельности, но имеющих нечто общее - фиксацию предмета и перенесение его к субъекту. В конкретном выражении это проявляется двояко: или в работе некоторых мышц, принимающих участие во всех реализациях действия "взять", или в зрительном образе объектов, фиксированных рукой и перенесенных ближе к себе. Обобщенное действие "учиться" представить труднее, потому что оно составлено из очень разнообразных конкретных действий. Их круг расширяется по мере развития ребенка. Обобщение происходит после появления ряда моделей, имеющих общие "буквы".
Обобщенный ФА становится возможным только при развитии памяти и программы обобщения. Его условием является способность запоминать длительные периоды времени с возможностью повторения моделей и последовательного сравнения их с целью обобщения. Так получаются "фразы", охватывающие периоды времени. Как говорилось, структуры "фраз" таковы, что сами по себе они не длинны, а удлинение периодов времени достигается обобщением и созданием иерархии "фраз", расшифровывающих обобщенную модель новой короткой "фразой".
Обобщение изменений среды во времени, тем не менее, не исключает ее оценки как "платы", направленной на удовлетворение потребности. В результате оценки длительного будущего появляется стимул к действию. Обобщенной модели изменений среды в пространстве или во времени соответствует обобщенная модель действия. Эти модели "среда - оценка - действие" хранятся во внешней памяти в вариантах с разной степенью обобщенности.
Как возникает обобщенный ФА? Восприятие конкретного объекта сопровождается анализом его первичной модели, в который входит и прогнозирование. "Фраза" прогноза может охватывать большой отрезок времени в случае, когда объект изменяется медленно. Если изменения не только длительны, но и многообразны, то их обобщенная модель (из двух-четырех слов) развертывается в целый набор коротких "фраз", описывающих каждое обобщенное "слово". Так прогнозируются этапы изменений внешней среды, ее "расписание" во времени, пространстве, качествах. Воздействия или качества прогнозируемого изменяющегося объекта оцениваются с "коэффициентом реальности", формируются конечная цель и обобщенный стимул. В памяти хранятся модели обобщенного действия и их развертывания в частные действия применительно к каждому этапу изменений объекта. Они оцениваются по "трудности", которая выступает как "тормоз" тоже в обобщенном варианте с "коэффициентом реальности". Производится суммирование стимулов и "тормозов", и если сумма оказывается положительной, принимается решение начать обобщенный ФА. Истинное начало выражается во включении первого подчиненного ФА, то есть действий, направленных на достижение первой цели, точнее, промежуточной цели.
Проектирование такого подчиненного ФА осуществляется по общим принципам - или после принятия решения по обобщенному, "главному" ФА, или до этого, когда при предварительном планировании обобщенного ФА подробно расписывается его первый этап.
Выполнение иерархии ФА имеет свои особенности. Они в значительной мере определяются степенями зависимостей между ФА разных уровней. Например, проведение хирургической операции как цепи этапных ФА целиком определяется конечным результатом всей операции. Наоборот, в труде рабочего цели годичного или месячного периодов могут быть малозначащими, а определяющим уровнем является рабочий день или отдельные трудовые циклы с частными целями.
Для того чтобы выполнялось любое действие, необходимы стимулы. Для простейшего ФА мы их уже определили. Основные стимулы - в цели, в удовлетворении специального критерия, а рабочие критерии (чувства, любознательность, цель, утомление) играют вспомогательную роль. О поправке на реальность тоже уже говорилось. Подчиненный ФА при очень большой зависимости от главного функционирует преимущественно за счет его стимулов. Конечно, при этом действуют рабочие стимулы - "рефлекс цели" для достижения промежуточного рубежа, утомление от действий, требующее временного отдыха, и любознательность, поскольку в ходе деятельности производятся исследования. Таким образом, постоянно действующий стимул ФА верхнего уровня периодически сильно уменьшается за счет утомления, и действие может остановиться на некоторое время после очередного этапа, если условия среды это позволяют. В результате отдыха действие главного стимула восстанавливается, и включается следующий этапный ФА.
После каждого такого этапа производится перерасчет не только стимулов собственно этого ФА, но и главного. Учитывается возросшая вероятность достижения последней цели, увеличивается значение "коэффициента будущего" и "рефлекса цели", поскольку цель приближается во времени.
Схема двухуровневого функционального акта показана на рис.31.
Рис.31. Схема двухуровневого функционального акта. Включение очередного низшего ФА происходит после выполнения предыдущего.
Условия успешного окончания длительных ФА особенно трудны. Во-первых, их планирование менее достоверно, поскольку ниже вероятность достижения цели из-за трудностей долгосрочного прогнозирования среды как в смысле ее "платежеспособности", так и "сопротивления". Во-вторых, нелегко оценить свои силы на продолжительное время вперед. В модельном представлении это выражается характеристиками потребностей - как "основной", так и "рабочими", например утомляемостью. Вследствие такой неопределенности длительного ФА возможно прекращение деятельности на любом его этапе, когда баланс стимулов и "тормозов" сместится в сторону последних. Правда, часто остановка имеет временный характер, если главным "тормозом" является утомление. После некоторой паузы оно уменьшается, и стимулы вновь побуждают действовать. Но бывают "тормозы" иного характера, к ним мы и перейдем теперь.
СЕТЬ ФУНКЦИОНАЛЬНЫХ АКТОВ
Развитый интеллект тем и отличается от простого, что он управляет сложными системами по многим или, по крайней мере, нескольким критериям. Это касается только "специальных" потребностей, поскольку "рабочие" одинаковы для всех интеллектов. Например, у животных "специальные" потребности представлены инстинктами: самосохранения, продолжения рода, стадным. Каждый из них объединяет несколько составляющих: инстинкт самосохранения - потребности в безопасности и пище, стадный - потребности в общении, в самовыражении, стремление к лидерству, альтруизм. Так, даже у животных набирается с десяток потребностей, у людей же их гораздо больше. Для удовлетворения каждой потребности не обязательно нужны отдельные ФА (к примеру, общение и самовыражение объединяются), но для большинства других ставятся разные цели. Совсем нередко потребности прямо противоречат друг другу, например, такие, как безопасность и голод. Конкуренция между ФА за время, силы и средства имеет место всегда. Это означает, что ФА, направленный на удовлетворение одной потребности, должен быть тормозом для другого ФА, ведущего к иной цели. При этом компромиссы далеко не всегда возможны, поскольку условия деятельности не позволяют беспрепятственно разделять действия во времени и пространстве. Такое разделение возможно только при суммировании коротких ФА за большие промежутки времени, да и то не всегда.
Множество потребностей создает дополнительные трудности в планировании и выполнении ФА. С одной стороны, сама идея ФА предусматривает доведение его до конца, до завершения, а с другой - деятельность, направленная к одной цели, ведет к недопустимому перенапряжению другой потребности, длительное время не получающей удовлетворения. Следовательно, интеллект должен учитывать все потребности, когда планирует ФА для удовлетворения одной из них. Потребности, не получающие удовлетворения, как правило, являются "специальными" "тормозами" в противоположность "универсальному" "тормозу" - утомлению или скуке. Такое положение требует значительного усложнения расчетов суммы стимулов и "тормозов" на всех этапах ФА.
Уже при первичной оценке внешней среды - на этапе анализа - выступают противоречия потребностей. Среда удовлетворяет их неравномерно, поэтому в каждый момент одни потребности напряжены, другие пассивны, третьи активно насыщены. Оценка производится главным образом по той потребности, которая наиболее остра; другие потребности выступают в качестве "оппонентов", ограничителей. Если внешние раздражители активируют несколько неудовлетворенных потребностей, реализации которых служат разные ФА, то альтернативы возникают уже при выборе самого обобщенного "первичного" действия. Сравнение производится по суммарному приращению интегральных чувств Д (Пр-НПр), поскольку трудно сравнивать чувства сами по себе вследствие их специфичности. Часто оценки потребностей оказываются равноценными на этапе анализа, тогда выбор самого выгодного ФА откладывается до планирования. Планы конкурирующих ФА приходится прорабатывать до той степени подробности, пока не определятся преимущества одного над другим за счет выявления значимых качеств либо за счет преимуществ большей реальности цели или меньшей утомительности действий.
Оценка среды и планирование "действий" на данный момент затрудняются не только наличием нескольких неудовлетворенных потребностей, но еще и планами ФА высших иерархических уровней (пример: студенту хочется пойти в кино, и это возможно, если учесть, что завтра преподаватель не будет спрашивать, но "нужно учиться". И он садится за книги). Высший ФА не только дает стимулы для низших, удовлетворяющих данную потребность, но он же - источник "тормозов" для тех ФА, которые направлены на реализацию других потребностей, даже если эти последние - "сиюминутные" и не имеют конкурирующих ФА высшего этажа. Следовательно, планы высших ФА нужно включать в расчет стимулов и "тормозов". Эти планы находятся в памяти и связаны с расписанием внешней среды. Слово "расписание" подчеркивает закономерность независимых от интеллекта изменений среды во времени таким образом, что в одни периоды действуют раздражители, представляющие "плату" для одних потребностей, в другие периоды - другие раздражители, направленные на другие потребности.
Деятельность интеллекта, обладающего многими потребностями, в разнообразной среде представляет собой сеть из ФА. Они подразделяются по направленности на разные потребности и по сложности иерархии. Есть среди них длительные ФА, есть минутные. Они перемежаются таким образом, что между отдельными этапами длительных ФА, которые обусловлены "расписанием" среды и накоплением утомления, включаются короткие ФА, направленные на другие потребности. В результате получается очень сложная динамика действий-поступков, которую и можно назвать поведением.
Но дело не ограничивается лишь переключением действий. Это только видимая сторона деятельности интеллекта. Есть еще и другая.
"МЫСЛИ"
Большинство ФА не доводится до действий, а останавливается на этапах анализа и планирования. Эти этапы - "мысли". Таким условным названием можно обозначить последовательное возбуждение новых моделей при введении их в кратковременную память или повторную активацию их при следующем действии. "Мысли" быстры и относительно легки, так как эти модели требуют небольшой энергии стимулов, достаточной для того, чтобы только ввести их в кратковременную память (по сравнению с активностью, необходимой для возбуждения мышц, преодолевающих сопротивление среды).
Какую же модель считать "мыслью"? В кратковременной памяти одновременно находится много моделей, даже очень много, с разной степенью активности. Видимо, "мыслью" должна быть одна из них, самая активная. Такой будет каждая новая или вновь активированная модель, и только она одна. Но почему новая активнее уже введенных? Это совсем не легко представить при количественном, модельном подходе к делу. Например, были нужны "сильные" модели для сокращения мышц, которые после выполнения своей задачи отключаются. По законам динамических характеристик активность их снижается постепенно, и эти "отработанные" модели должны бы быть более активными, чем новые модели, поступающие во время отдыха, без всякого напряжения. Все это трудно согласовать без введения дополнительных ограничений. Мысль в каждый момент только одна - это мы знаем, наблюдая себя. Впрочем, это не довод.
Рассмотрим алгоритм формирования кратковременной памяти в связи с ФА. Как уже говорилось, модели в ней образуются от восприятия среды или вводятся из внешней памяти через действия по активации. Действия осуществляются как заданные акты выбора адреса и включения модели и определяются чувствами и активностью других моделей в памяти (рис. 32). Акту действия, например сравнения моделей, предшествует сложный пересчет уровня активности всех моделей в кратковременной памяти. Выбор следующего действия с моделями, то есть поиск адреса новой модели, определяется всей совокупностью активных моделей. Это легко заявить, но трудно воспроизвести. Однако другого выхода просто не существует, если отвергнуть идею сетевого интеллекта СИ, в котором в течение каждого такта нужно пересчитывать активность всех его моделей, поскольку в нем нет разделения памяти на кратковременную и длительную.
Рис.32. Схема последовательной активации моделей в кратковременной памяти: Д.1, Д.2, Д.3 - действия; М.1, М.2 - модели. СУММА(ДЧ) - суммарный стимул как приращение чувств, активирующее модели. Д.об - обобщенное действие, поступающее с ФА высшего уровня, которое играет роль дополнительного стимула.
Для сокращения числа моделей, расчет активности которых нужно осуществлять в течение каждого такта, следует предусмотреть более быстрое их удаление из кратковременной памяти и перевод в длительную, но с сохранением повышенной проходимости связей между моделями, составляющими одну "фразу", что позволяет легко "вспомнить" ее, пока она еще "свежа". Естественно предложить удалять из памяти "отработанные" модели, те, которые уже были использованы для выбора адреса последующих и сообщения им активности. Сюда войдут прежде всего многочисленные модели внешней среды, которые вводятся от рецепторов в большом количестве, автоматически, без отбора. Первоначальная активность этих моделей невелика, в ходе последующего анализа, точнее - действия распознавания, они заменяются "своими" моделями и становятся ненужными. Для них должны предусматриваться "крутые" динамические характеристики. Если внешняя среда еще понадобится при втором "круге", ее можно воспринять заново. То же самое и с моделями вариантов планов: как только выбран один, другие уже не нужны. Значимость моделей в кратковременной памяти должна все время проверяться по их связям с потребностями. Связи надо прерывать, как только этапы ФА уходят вперед. К сожалению, выдвинуть подобные пожелания легче, чем выполнить.
Поиск и "выбраковывание" из памяти ненужных моделей приводит нас к необходимости специального уменьшения их активности, то есть введения торможения. Оно должно дополнить динамические характеристики моделей (см. рис. 18 ), отражающие постепенность самостоятельного затухания активности возбужденных моделей. Торможение сделает их более крутыми. Оно всегда имеет место в сетевых моделях и в мозге. Другим выходом является создание специального алгоритма изменения характеристик для тех моделей, которые уже использованы. Пока трудно сказать, что выгоднее для АИ.
Второй вопрос - о доминировании "главной" модели над всеми прочими. Уже было сказано, что "новая" модель должна быть "мыслью" и для этого она должна быть активнее всех остальных. То же касается и "старой" модели, если она снова понадобится и активируется повторно, будучи вовлеченной в действия. В разделе об иерархии и сети из ФА было указано на множественность одновременно происходящих или готовящихся действий, призванных удовлетворить различные потребности интеллекта в изменяющейся внешней среде. Как в этом хаосе обеспечить целенаправленные действия, чтобы раз начатый ФА доходил до конца, а не останавливался посредине, будучи прерванным конкурирующим ФА? Конечно, есть "рефлекс цели", но он работает на все ФА и не может стать достаточно сильным механизмом, обеспечивающим приоритет главному ФА. Суть этого приоритета состоит в том, что модели, вовлеченные в главный ФА, должны активно направлять его вперед, то есть вмешиваться в выбор адреса модели для следующего переключения и даже в выбор самого действия. Нужно примирить противоположные требования: обеспечить "консерватизм", то есть доведение до конца начатого, и "гибкость" как способность переключиться на новое, если этого настоятельно требует внешняя среда или изменившиеся потребности. В свое время - в 1963г.- я предложил для этой цели специальную программу.
Эти термины относятся к анализу, мы их опустили для простоты в описании ФА, предположив, что объект и среда совершенно статичны. В действительности же интеллект имеет дело с динамикой. Факт динамичности устанавливается глазом человека при первом восприятии, когда за доли секунды он определяет "первую производную" изменений положения или структуры объекта. Для алгоритмического интеллекта, возможно, понадобятся две первичные модели вместо одной и автоматический механизм их сравнения для определения динамики.
Однако и неподвижные в данный момент объекты необязательно неизменны в продолжение тех отрезков времени, в которых проектируется ФА. Поэтому динамика, прогнозирование изменения объекта, является непременным действием анализа. Ее необходимость выявляется при распознавании: уже тогда, когда первичная модель заменяется, "переписывается" вторичной, в ней заложена возможность и вероятность динамики. Динамичность маркируется особой "буквой".
Прогнозирование состоит в том, что модель объекта представляется "словом" "фразы", в которой записана вероятная последовательность изменения структуры объекта или его пространственного положения в среде. Соответствующие "фразы" хранятся во внешней памяти и вызываются в кратковременную память специальным действием. Я не буду вводить дополнительные обозначения, поскольку они недопустимо усложняют схему. Распознавание будущего по "фразе" динамики носит вероятностный характер и состоит в определении промежуточных и конечного состояний объектов - в виде его новой модели, которую и нужно оценить с позиции значимости как "платы". Это не так просто.
Динамика и прогнозирование сталкивают нас с новым фактором, новой переменной - временем. При описании простейшего ФА мы не учитывали время. На самом же деле, оценивая динамику объекта, интеллект определяет время, в течение которого объект сохраняет значимость в качестве "платы", удовлетворяющей потребность. Пример: зеленая ягода. Поскольку сейчас она в пищу не годится, ФА не состоится. Другой пример: автомашина идет по дороге, которую нужно перейти. Она представляет угрозу, оценка уровня которой прямо определяется динамикой и расстоянием до автомашины. "Плата" обычно ожидается только в будущем, но она уже сейчас определяет действия. Как уже говорилось, любой развитый интеллект всегда работает на будущее. Но ценность объекта в будущем и сейчас не одинакова, и, следовательно, не одинаково его значение как стимула действий.
Для расчета динамических систем введено понятие "реальность будущего". Это очень важное понятие для любого интеллекта. Мы его разлагаем на два компонента: вероятность будущего события и "коэффициент будущего". Уже на этапе анализа реальность вводится в расчет для определения величины "платы", а следовательно, и стимула. В Д.5 нужно ввести поправку для динамических систем: умножить стимул на "коэффициент реальности", полученный как произведение вероятности будущего события и значимости будущего - "коэффициента времени", рассчитанного по кривой, показанной на рис.27. Стимул может оказаться существенно меньше или даже исчезнуть совсем.
В этапе "планирование" время присутствует постоянно. Модель цели учитывает динамику объекта ("где и когда его можно взять?", "в каком он будет состоянии?" и обязательно - "сколько для этого потребуется времени?").
Д.7 - модель движений для достижения цели - полностью зависит от времени. Здесь выступает тесная связь времени и сложности действий. Простые движения быстры, сложная последовательность их напротив, продолжительна. Не будем пока говорить о том, как планируются сложные движения, ограничимся констатацией того факта, что они требуют определенного времени для своего выполнения. Следовательно, они отдаляют получение "платы", уменьшают "коэффициент будущего", увеличивают усилия и связанное с ним утомление. Все это сказывается на Д.9 - пересчете стимулов после планирования.
Планирование всегда является прогнозированием, следовательно, оно вероятностно. Этот фактор присутствует в планах. Степень вероятности достижения цели в результате действий оценивается по подробности исходной модели объекта и по наличию в памяти соответствующих моделей, полученных из предыдущего опыта. Эти модели-"фразы" извлекаются из постоянной памяти в то время, когда рассчитывается последовательность движений и их результат - как "фразы" плана. Результат характеризуется определенной вероятностью.
При этом может оказаться, что исходная модель объекта снова была недостаточно полной. Одно дело - модель распознавания и модель для оценки и другое дело - модель для воздействия на объект. "Фразы" действий могут потребовать новых деталей, а для этого понадобится новый, третий, "круг" исследования - снова настройка рецептора на искомую деталь, снова ее восприятие, новая первичная модель и анализ - уже с позиций выполнения действий.
Итак, при Д.9 - пересчете стимулов - учитывается поправка на реальность достижения цели как функцию вероятности и требуемого времени. Нужно помнить, что само планирование несет с собой утомление, как всякое однообразное действие; это ограничивает его продолжительность и заставляет скорее переходить к решению, не добиваясь стопроцентной вероятности результата при расчете получения "платы".
ИЕРАРХИЯ ФУНКЦИОНАЛЬНЫХ АКТОВ
Юноша пять лет учился в институте - это ФА продолжительностью в пять лет, который он планировал на такое время, исходя из существующих правил обучения. У него была цель - получить высшее образование для работы, призванной в свою очередь удовлетворить набор потребностей, существующих к моменту поступления. Этот длинный ФА будет разделен на пять более коротких - по годам учения, те - на еще более короткие - семестры и т.д., вплоть до уроков и заданий на завтра. Такая совокупность ФА разной продолжительности и разных частных целей при одной общей - окончании института - представляет иерархию ФА. Вся жизнь человека состоит из подобных сложных ФА, направленных на удовлетворение различных потребностей и рассчитанных на неодинаковую продолжительность. Подчиненные ФА выступают при этом в двух образах - как самостоятельные и как компоненты главного.
Так мы подошли к применению принципа обобщенности к ФА. Обобщение модели относилось к моделированию внешнего мира: обобщенная структура из крупных блоков, обобщение повторяющихся объектов во времени или по этапам исследования, "буква обобщенности" как маркировка этого вида действия с моделями, даже если оно происходит автоматически в результате процесса забывания незначащих деталей.
Действия, как сокращения мышц и как операции с моделями в смысле вызова их из постоянной памяти, сравнения, прогнозирования, представлены в интеллекте моделями. Следовательно, они тоже могут обобщаться.
Обобщенные модели можно себе представить как "неясные", или "крупноблочные", без деталей, но имеющие "букву обобщенности". Она указывает, что модель получена путем действия с множеством моделей, а не через восприятие рецепторами с плохой настройкой. "Буква обобщенности" такая же, как "буква настройки рецептора", обе они показывают, как получена соответствующая модель. Обобщенная модель всегда известна, то есть имеет связи с другими моделями. Если нам нужно вообразить "собаку вообще", мы представляем какую-нибудь одну из множества виденных собак, обычно не очень ясно. Обобщенный образ собаки проявляется, когда мы пытаемся ее нарисовать, а не просто вспомнить. Он же проступает скрыто, неявно при распознавании конкретной собаки. Явная обобщенность выступает в интеллекте только через речь. Об этом еще будет разговор.
По такому же принципу возможно обобщение модели действия. Например, действие "взять" состоит из набора нескольких конкретных движений, изменяющихся в зависимости от объекта деятельности, но имеющих нечто общее - фиксацию предмета и перенесение его к субъекту. В конкретном выражении это проявляется двояко: или в работе некоторых мышц, принимающих участие во всех реализациях действия "взять", или в зрительном образе объектов, фиксированных рукой и перенесенных ближе к себе. Обобщенное действие "учиться" представить труднее, потому что оно составлено из очень разнообразных конкретных действий. Их круг расширяется по мере развития ребенка. Обобщение происходит после появления ряда моделей, имеющих общие "буквы".
Обобщенный ФА становится возможным только при развитии памяти и программы обобщения. Его условием является способность запоминать длительные периоды времени с возможностью повторения моделей и последовательного сравнения их с целью обобщения. Так получаются "фразы", охватывающие периоды времени. Как говорилось, структуры "фраз" таковы, что сами по себе они не длинны, а удлинение периодов времени достигается обобщением и созданием иерархии "фраз", расшифровывающих обобщенную модель новой короткой "фразой".
Обобщение изменений среды во времени, тем не менее, не исключает ее оценки как "платы", направленной на удовлетворение потребности. В результате оценки длительного будущего появляется стимул к действию. Обобщенной модели изменений среды в пространстве или во времени соответствует обобщенная модель действия. Эти модели "среда - оценка - действие" хранятся во внешней памяти в вариантах с разной степенью обобщенности.
Как возникает обобщенный ФА? Восприятие конкретного объекта сопровождается анализом его первичной модели, в который входит и прогнозирование. "Фраза" прогноза может охватывать большой отрезок времени в случае, когда объект изменяется медленно. Если изменения не только длительны, но и многообразны, то их обобщенная модель (из двух-четырех слов) развертывается в целый набор коротких "фраз", описывающих каждое обобщенное "слово". Так прогнозируются этапы изменений внешней среды, ее "расписание" во времени, пространстве, качествах. Воздействия или качества прогнозируемого изменяющегося объекта оцениваются с "коэффициентом реальности", формируются конечная цель и обобщенный стимул. В памяти хранятся модели обобщенного действия и их развертывания в частные действия применительно к каждому этапу изменений объекта. Они оцениваются по "трудности", которая выступает как "тормоз" тоже в обобщенном варианте с "коэффициентом реальности". Производится суммирование стимулов и "тормозов", и если сумма оказывается положительной, принимается решение начать обобщенный ФА. Истинное начало выражается во включении первого подчиненного ФА, то есть действий, направленных на достижение первой цели, точнее, промежуточной цели.
Проектирование такого подчиненного ФА осуществляется по общим принципам - или после принятия решения по обобщенному, "главному" ФА, или до этого, когда при предварительном планировании обобщенного ФА подробно расписывается его первый этап.
Выполнение иерархии ФА имеет свои особенности. Они в значительной мере определяются степенями зависимостей между ФА разных уровней. Например, проведение хирургической операции как цепи этапных ФА целиком определяется конечным результатом всей операции. Наоборот, в труде рабочего цели годичного или месячного периодов могут быть малозначащими, а определяющим уровнем является рабочий день или отдельные трудовые циклы с частными целями.
Для того чтобы выполнялось любое действие, необходимы стимулы. Для простейшего ФА мы их уже определили. Основные стимулы - в цели, в удовлетворении специального критерия, а рабочие критерии (чувства, любознательность, цель, утомление) играют вспомогательную роль. О поправке на реальность тоже уже говорилось. Подчиненный ФА при очень большой зависимости от главного функционирует преимущественно за счет его стимулов. Конечно, при этом действуют рабочие стимулы - "рефлекс цели" для достижения промежуточного рубежа, утомление от действий, требующее временного отдыха, и любознательность, поскольку в ходе деятельности производятся исследования. Таким образом, постоянно действующий стимул ФА верхнего уровня периодически сильно уменьшается за счет утомления, и действие может остановиться на некоторое время после очередного этапа, если условия среды это позволяют. В результате отдыха действие главного стимула восстанавливается, и включается следующий этапный ФА.
После каждого такого этапа производится перерасчет не только стимулов собственно этого ФА, но и главного. Учитывается возросшая вероятность достижения последней цели, увеличивается значение "коэффициента будущего" и "рефлекса цели", поскольку цель приближается во времени.
Схема двухуровневого функционального акта показана на рис.31.
Рис.31. Схема двухуровневого функционального акта. Включение очередного низшего ФА происходит после выполнения предыдущего.
Условия успешного окончания длительных ФА особенно трудны. Во-первых, их планирование менее достоверно, поскольку ниже вероятность достижения цели из-за трудностей долгосрочного прогнозирования среды как в смысле ее "платежеспособности", так и "сопротивления". Во-вторых, нелегко оценить свои силы на продолжительное время вперед. В модельном представлении это выражается характеристиками потребностей - как "основной", так и "рабочими", например утомляемостью. Вследствие такой неопределенности длительного ФА возможно прекращение деятельности на любом его этапе, когда баланс стимулов и "тормозов" сместится в сторону последних. Правда, часто остановка имеет временный характер, если главным "тормозом" является утомление. После некоторой паузы оно уменьшается, и стимулы вновь побуждают действовать. Но бывают "тормозы" иного характера, к ним мы и перейдем теперь.
СЕТЬ ФУНКЦИОНАЛЬНЫХ АКТОВ
Развитый интеллект тем и отличается от простого, что он управляет сложными системами по многим или, по крайней мере, нескольким критериям. Это касается только "специальных" потребностей, поскольку "рабочие" одинаковы для всех интеллектов. Например, у животных "специальные" потребности представлены инстинктами: самосохранения, продолжения рода, стадным. Каждый из них объединяет несколько составляющих: инстинкт самосохранения - потребности в безопасности и пище, стадный - потребности в общении, в самовыражении, стремление к лидерству, альтруизм. Так, даже у животных набирается с десяток потребностей, у людей же их гораздо больше. Для удовлетворения каждой потребности не обязательно нужны отдельные ФА (к примеру, общение и самовыражение объединяются), но для большинства других ставятся разные цели. Совсем нередко потребности прямо противоречат друг другу, например, такие, как безопасность и голод. Конкуренция между ФА за время, силы и средства имеет место всегда. Это означает, что ФА, направленный на удовлетворение одной потребности, должен быть тормозом для другого ФА, ведущего к иной цели. При этом компромиссы далеко не всегда возможны, поскольку условия деятельности не позволяют беспрепятственно разделять действия во времени и пространстве. Такое разделение возможно только при суммировании коротких ФА за большие промежутки времени, да и то не всегда.
Множество потребностей создает дополнительные трудности в планировании и выполнении ФА. С одной стороны, сама идея ФА предусматривает доведение его до конца, до завершения, а с другой - деятельность, направленная к одной цели, ведет к недопустимому перенапряжению другой потребности, длительное время не получающей удовлетворения. Следовательно, интеллект должен учитывать все потребности, когда планирует ФА для удовлетворения одной из них. Потребности, не получающие удовлетворения, как правило, являются "специальными" "тормозами" в противоположность "универсальному" "тормозу" - утомлению или скуке. Такое положение требует значительного усложнения расчетов суммы стимулов и "тормозов" на всех этапах ФА.
Уже при первичной оценке внешней среды - на этапе анализа - выступают противоречия потребностей. Среда удовлетворяет их неравномерно, поэтому в каждый момент одни потребности напряжены, другие пассивны, третьи активно насыщены. Оценка производится главным образом по той потребности, которая наиболее остра; другие потребности выступают в качестве "оппонентов", ограничителей. Если внешние раздражители активируют несколько неудовлетворенных потребностей, реализации которых служат разные ФА, то альтернативы возникают уже при выборе самого обобщенного "первичного" действия. Сравнение производится по суммарному приращению интегральных чувств Д (Пр-НПр), поскольку трудно сравнивать чувства сами по себе вследствие их специфичности. Часто оценки потребностей оказываются равноценными на этапе анализа, тогда выбор самого выгодного ФА откладывается до планирования. Планы конкурирующих ФА приходится прорабатывать до той степени подробности, пока не определятся преимущества одного над другим за счет выявления значимых качеств либо за счет преимуществ большей реальности цели или меньшей утомительности действий.
Оценка среды и планирование "действий" на данный момент затрудняются не только наличием нескольких неудовлетворенных потребностей, но еще и планами ФА высших иерархических уровней (пример: студенту хочется пойти в кино, и это возможно, если учесть, что завтра преподаватель не будет спрашивать, но "нужно учиться". И он садится за книги). Высший ФА не только дает стимулы для низших, удовлетворяющих данную потребность, но он же - источник "тормозов" для тех ФА, которые направлены на реализацию других потребностей, даже если эти последние - "сиюминутные" и не имеют конкурирующих ФА высшего этажа. Следовательно, планы высших ФА нужно включать в расчет стимулов и "тормозов". Эти планы находятся в памяти и связаны с расписанием внешней среды. Слово "расписание" подчеркивает закономерность независимых от интеллекта изменений среды во времени таким образом, что в одни периоды действуют раздражители, представляющие "плату" для одних потребностей, в другие периоды - другие раздражители, направленные на другие потребности.
Деятельность интеллекта, обладающего многими потребностями, в разнообразной среде представляет собой сеть из ФА. Они подразделяются по направленности на разные потребности и по сложности иерархии. Есть среди них длительные ФА, есть минутные. Они перемежаются таким образом, что между отдельными этапами длительных ФА, которые обусловлены "расписанием" среды и накоплением утомления, включаются короткие ФА, направленные на другие потребности. В результате получается очень сложная динамика действий-поступков, которую и можно назвать поведением.
Но дело не ограничивается лишь переключением действий. Это только видимая сторона деятельности интеллекта. Есть еще и другая.
"МЫСЛИ"
Большинство ФА не доводится до действий, а останавливается на этапах анализа и планирования. Эти этапы - "мысли". Таким условным названием можно обозначить последовательное возбуждение новых моделей при введении их в кратковременную память или повторную активацию их при следующем действии. "Мысли" быстры и относительно легки, так как эти модели требуют небольшой энергии стимулов, достаточной для того, чтобы только ввести их в кратковременную память (по сравнению с активностью, необходимой для возбуждения мышц, преодолевающих сопротивление среды).
Какую же модель считать "мыслью"? В кратковременной памяти одновременно находится много моделей, даже очень много, с разной степенью активности. Видимо, "мыслью" должна быть одна из них, самая активная. Такой будет каждая новая или вновь активированная модель, и только она одна. Но почему новая активнее уже введенных? Это совсем не легко представить при количественном, модельном подходе к делу. Например, были нужны "сильные" модели для сокращения мышц, которые после выполнения своей задачи отключаются. По законам динамических характеристик активность их снижается постепенно, и эти "отработанные" модели должны бы быть более активными, чем новые модели, поступающие во время отдыха, без всякого напряжения. Все это трудно согласовать без введения дополнительных ограничений. Мысль в каждый момент только одна - это мы знаем, наблюдая себя. Впрочем, это не довод.
Рассмотрим алгоритм формирования кратковременной памяти в связи с ФА. Как уже говорилось, модели в ней образуются от восприятия среды или вводятся из внешней памяти через действия по активации. Действия осуществляются как заданные акты выбора адреса и включения модели и определяются чувствами и активностью других моделей в памяти (рис. 32). Акту действия, например сравнения моделей, предшествует сложный пересчет уровня активности всех моделей в кратковременной памяти. Выбор следующего действия с моделями, то есть поиск адреса новой модели, определяется всей совокупностью активных моделей. Это легко заявить, но трудно воспроизвести. Однако другого выхода просто не существует, если отвергнуть идею сетевого интеллекта СИ, в котором в течение каждого такта нужно пересчитывать активность всех его моделей, поскольку в нем нет разделения памяти на кратковременную и длительную.
Рис.32. Схема последовательной активации моделей в кратковременной памяти: Д.1, Д.2, Д.3 - действия; М.1, М.2 - модели. СУММА(ДЧ) - суммарный стимул как приращение чувств, активирующее модели. Д.об - обобщенное действие, поступающее с ФА высшего уровня, которое играет роль дополнительного стимула.
Для сокращения числа моделей, расчет активности которых нужно осуществлять в течение каждого такта, следует предусмотреть более быстрое их удаление из кратковременной памяти и перевод в длительную, но с сохранением повышенной проходимости связей между моделями, составляющими одну "фразу", что позволяет легко "вспомнить" ее, пока она еще "свежа". Естественно предложить удалять из памяти "отработанные" модели, те, которые уже были использованы для выбора адреса последующих и сообщения им активности. Сюда войдут прежде всего многочисленные модели внешней среды, которые вводятся от рецепторов в большом количестве, автоматически, без отбора. Первоначальная активность этих моделей невелика, в ходе последующего анализа, точнее - действия распознавания, они заменяются "своими" моделями и становятся ненужными. Для них должны предусматриваться "крутые" динамические характеристики. Если внешняя среда еще понадобится при втором "круге", ее можно воспринять заново. То же самое и с моделями вариантов планов: как только выбран один, другие уже не нужны. Значимость моделей в кратковременной памяти должна все время проверяться по их связям с потребностями. Связи надо прерывать, как только этапы ФА уходят вперед. К сожалению, выдвинуть подобные пожелания легче, чем выполнить.
Поиск и "выбраковывание" из памяти ненужных моделей приводит нас к необходимости специального уменьшения их активности, то есть введения торможения. Оно должно дополнить динамические характеристики моделей (см. рис. 18 ), отражающие постепенность самостоятельного затухания активности возбужденных моделей. Торможение сделает их более крутыми. Оно всегда имеет место в сетевых моделях и в мозге. Другим выходом является создание специального алгоритма изменения характеристик для тех моделей, которые уже использованы. Пока трудно сказать, что выгоднее для АИ.
Второй вопрос - о доминировании "главной" модели над всеми прочими. Уже было сказано, что "новая" модель должна быть "мыслью" и для этого она должна быть активнее всех остальных. То же касается и "старой" модели, если она снова понадобится и активируется повторно, будучи вовлеченной в действия. В разделе об иерархии и сети из ФА было указано на множественность одновременно происходящих или готовящихся действий, призванных удовлетворить различные потребности интеллекта в изменяющейся внешней среде. Как в этом хаосе обеспечить целенаправленные действия, чтобы раз начатый ФА доходил до конца, а не останавливался посредине, будучи прерванным конкурирующим ФА? Конечно, есть "рефлекс цели", но он работает на все ФА и не может стать достаточно сильным механизмом, обеспечивающим приоритет главному ФА. Суть этого приоритета состоит в том, что модели, вовлеченные в главный ФА, должны активно направлять его вперед, то есть вмешиваться в выбор адреса модели для следующего переключения и даже в выбор самого действия. Нужно примирить противоположные требования: обеспечить "консерватизм", то есть доведение до конца начатого, и "гибкость" как способность переключиться на новое, если этого настоятельно требует внешняя среда или изменившиеся потребности. В свое время - в 1963г.- я предложил для этой цели специальную программу.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Страница 4 из 5 • 1, 2, 3, 4, 5
Похожие темы
» 02.03. СПОСОБНОСТЬ БОЛТАТЬ - ЕЩЕ НЕ ПРИЗНАК ИНТЕЛЛЕКТА
» Батальоны искусственного интеллекта - Battle Isle
» Батальоны искусственного интеллекта - Battle Isle
Страница 4 из 5
Права доступа к этому форуму:
Вы не можете отвечать на сообщения