02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Страница 3 из 5
Страница 3 из 5 • 1, 2, 3, 4, 5
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
СОЗДАНИЕ ИСКУССТВЕННОГО РАЗУМА
Любое техническое устройство можно считать разумным, если оно способно выделять, перерабатывать и выдавать информацию. Каждый из этих трех компонентов может быть выражен в разной степени или даже существовать самостоятельно, будучи "приключенным" к естественному разуму.
Выделение первичной информации осуществляется у человека или животных рецепторами, кодирующими энергию внешних воздействий нервными импульсами, уже представляющими собой элементарную модель. В ней количественно отражено изменение одного вида энергии в ограниченном пространстве, в ограниченное время.
Увеличение объема первичной информации осуществляется у животных путем использования рецепторов, улавливающих разные виды энергии. Число однородных рецепторных клеток, воспринимающих воздействия с разных точек окружающего пространства и в разных диапазонах количества попадающей на них внешней энергии, огромно.
Этот процесс осуществляется и в технических устройствах. Датчики воспринимают световую, тепловую, химическую, механическую энергии и превращают их в электрический потенциал. Зачастую по чувствительности и безынерционности они превосходят естественные рецепторы. Отличие пока состоит в том, что рецепторные клетки гораздо меньше датчиков. Экономичностью размеров рецепторных клеток объясняется их большое число в организме и, следовательно, возможность выделить огромный объем первичной информации. Однако сокращение размеров датчиков - чисто технологическая задача. Живые системы имеют явно избыточное количество рецепторов. Чувствительность большинства из них искусственно понижается настройкой, осуществляющей преимущественное выделение информации с того места пространства, где сосредоточены наиболее важные для жизнедеятельности воздействия.
Переработка информации сводится к возбуждению (активизации) моделей, в которых отражено пространственное или временное распределение возбужденных рецепторов в соответствующих картинах внешнего мира. Этот процесс можно условно разделить на три компонента:
1. Запоминание во временной памяти, изменение степени возбуждения (потенциала уровня активности) группы или одного рецептора за некоторый промежуток времени.
2. Сравнение полученной временной модели с некоторым эталоном, записанным в постоянной памяти постоянной моделью. Сравнение осуществляется по вероятностному, а не по тождественному принципу.
3. При совпадении временной и постоянной моделей последняя возбуждается, то есть повышается ее "потенциал", и сигнал может распространиться по связям на другие модели.
После того как появились вычислительные машины, этот процесс тоже воспроизводится в технических устройствах. Любую информацию, полученную с датчиков, можно представить в виде набора цифр, сравнить их с некоторым другим набором и при точном или приблизительном совпадении выдать сигнал, отражающий наличие именно такой картины вовне; это обозначено условным местом модели в некоторой матрице пространства или времени.
Наконец, третий элемент "разумной" деятельности выражается в новом превращении информационной модели в физические воздействия, направленные вовне,- в виде импульсов энергии (иногда вместе с ее материальными носителями - эффекторами). Эти воздействия служат для управления внешним миром - неодушевленными предметами либо живыми существами. В последнем случае пространственное и временное распределение энергии может отражать в определенном коде передаваемую информацию, иными словами, производится "считывание моделей".
И этот процесс уже реализован в технике. Модели, записанные в памяти вычислительной машины, управляют сложными техническими процессами, движением космических кораблей.
Таким образом, основные элементы разума реализованы человеком в технических устройствах. Все дело - в объеме перерабатываемой информации и программах переработки. В этом состоит пока еще огромная разница между уровнями развития техники и естественного разума.
Однако понятие "объем информации" очень сложно. Можно сказать, что это - количество разнообразия, воспринимаемое и выдаваемое моделирующей ("разумной") системой в единицу времени. К сожалению, само разнообразие понимается по-разному. Не определено истинное разнообразие природы, так как структуру любой системы можно "начинать" с элементарных частиц, с атомов, молекул, их агрегатов, крупных составных частей. В зависимости от "уровня" изменится количество разнообразия. Фактически разнообразие объекта определяется разнообразием его модели, которую способна создать моделирующая установка - будь то мозг или машина. Однако даже подробное описание объекта, начатое с какого-то низкого уровня его структуры,- еще не вся информация о нем. Из первоначальной модели низшего этажа можно вывести целую иерархию моделей смысла и качеств, причем количество информации - разнообразие - в этих высших моделях может значительно превысить разнообразие первичной модели. Разум обязательно включает способность образовывать модели высших этажей, без которых нет полноты понимания окружающего мира и нет общих правил управления им.
Итак, "количество разума" - это не только количество разнообразия (информации), которое система способна представить в виде моделей внешних объектов на нижнем этаже, но также и число этажей моделей смысла и качеств, выделяемых из первичных. По всей вероятности, можно создать некоторую систему исчисления разумности как в смысле общего количества этажей информации, так и скорости ее переработки.
Попытаемся дать классификацию "разумных" систем, чтобы по ней представить себе возможность создания искусственных устройств различных классов с разной степенью "разумности".
Всякая переработка информации осуществляется за счет определенных программ, отражающих взаимодействие элементов системы. Любая программа предусматривает цель, выражающуюся в достижении или поддержании некоторого состояния системы. Все естественные сложные системы ("типа живых") имеют несколько программ, отражающих несколько целей. Искусственные же системы можно создать для реализации одной цели, одной программы. Точно так же можно искусственно выделить часть сложной системы, осуществляющей одну из программ, одну цель. Разные программы могут противоречить друг другу. Следовательно, необходимы дополнительные механизмы (программы!) доминирования и соответственно подавления в зависимости от некоторых показателей, например степени приближения к цели. Для осуществления этого каждая программа должна иметь изменяющийся "вес", что можно представить, например, в виде изменения уровня активности моделей, связанных с понятием "чувства". Таким образом, чувства являются универсальными и очень важными. Чувства отражают степень "напряженности" соответствующей программы, связанной с необходимостью и трудностью достижения цели. Как уже говорилось, для живых систем можно выделить три типа программ - "для себя" (выражается инстинктом самосохранения), "для рода" (выражается инстинктом продолжения рода), "для вида" (состоит в особых качествах изменчивости, а у некоторых животных - в стадном инстинкте). Только у человека программа "для вида" приобрела особую важность, трансформировавшись в программы общественного поведения, что связано со значительным усложнением мозга.
Любую из основных программ живые системы реализуют, перерабатывая с неодинаковой степенью "разумности" разное количество информации и пользуясь биологическими структурами соответствующей сложности. Как уже упоминалось, мы выделили три уровня сложности систем: одноклеточные, многоклеточные животные (до человека включительно) и общество. В последнем наслаиваются три степени разнообразия: структуры из молекул, из клеток, из индивидуумов. К этому нужно еще добавить разнообразие вещей, создаваемых людьми.
Если отнести к разумным все системы, в которых создаются модели и перерабатывается информация, то в зависимости от объема информации, сложности программ ее переработки и числа иерархических этажей моделей можно условно выделить несколько классов разума:
1. Автомат с жесткими программами выделения и переработки информации без обучения, с ограниченными возможностями рецепторов и набором моделей. Здесь возможно несколько вариантов (с обратными связями и без них, с простыми моделями внешней среды и с этажными моделями смысла, с наличием механизмов доминирования и переключения на разные программы). Представителями подобного рода систем являются животные с нервной системой, но без коры головного мозга. Правда, обучаемость присуща всем живым существам, даже одноклеточным, но в этих случаях она ограничена и требует многих повторений.
2. Автомат с обучением имеет программу формирования новых моделей на базе готовых - врожденных. Он соответствует корковым животным. Количество возможных моделей, их этажность, длительность памяти - все эти качества различны, и в зависимости от них автомат подымается по шкале разумности. Однако на этом уровне из перечисленных шести программ человека есть только три - восприятия, действия, чувств - и примитивное сознание в виде программы внимания. Но даже эти программы имеют ограниченный объем, учитывая их качества - сложность, способность к предвидению, число этажей смысла и качеств, память.
3. Следующую ступень представляет собой автомат с программами человека. Я не буду их перечислять. Степень "разумности" тоже может быть различной в зависимости от объема знаний, уровня сознания и способности к творчеству. В конце концов все сводится к объему, уровню и особенностям переработки информации, количеству моделей, их изменениям и взаимодействию.
Возможна ли система более разумная, чем человек? Конечно. Прежде всего такой системой является общество, вернее, ограниченные организованные общественные системы В сущности они тоже имеют программы животного "для себя" - это настоящее, "для рода" - будущее, сложные рефлексы - любопытства, свободы, самовыражения. Все оди являются отражением человеческих качеств, точно так же как качества человека - биологического существа - являются отражением свойств его элементов - клеток. Тем не менее объем информации накладывает свой отпечаток, и наряду с прежними качествами появляются новые. Общественные системы пока еще в значительной степени можно уподобить низшим животным, у которых диффзренцировка клеток не зашла далеко и программы целого отражают программы частей. Специфические качества общества как высшей системы появятся, когда будет создан искусственный разум - мозг общества, способный к собственным программам переработки информации: восприятию воздействия и созданию моделей, действиям и сознанию.
Сами принципы выделения и переработки информации измениться не могут, так как они не зависят от технических средств. Информация - это всегда модель, всегда упрощение и искажение оригинала, будь то его структура или функция. Но форма моделей меняется. В клетках - это ДНК, в мозгу - структуры из нейронов, в обществе недавнего прошлого, да и поныне,- это вещи и книги, являющиеся только придатком мозга. Однако уже создается иная форма моделей в виде памяти в машинах и иной способ передачи информации - от одной машины к другой без посредства человека. Надо думать, что именно эти формы моделей и их передачи будут совершенствоваться и вытеснять традиционные.
Прежде чем раздумывать об особенностях интеллекта, превосходящего человеческий, попытаемся разобраться в некоторых принципиальных вопросах создания искусственного разума в его низших формах либо приближающегося к человеку.
Очень велико разнообразие естественных разумных существ. Как уже было сказано, они различаются по основным программам, по классу - жесткие или с самоорганизацией, по уровню высших этажей моделей, например сознания. В разной степени развития представлены у животных программы восприятия и моделирования внешнего мира, программы действий, чувств, не говоря уже о второй сигнальной системе - речи или уровнях сознания, присущих только людям. Таким образом, перед нами огромный диапазон систем, способных перерабатывать информацию, - от технических автоматов до человека. Поэтому прежде чем моделировать разум, нужно определить его объем. К сожалению, технические возможности моделирования пока столь ограниченны, что приходится начинать именно с них и выяснять, какой объем информации можно переработать существующей техникой. Сейчас много говорят о будто бы практически неограниченных возможностях вычислительных машин - об огромном объеме их памяти и быстродействии. Складывается впечатление, что техническая база для создания искусственного разума уже готова. В действительности это не так.
На рис.1 показана схема системы для выделения, переработки и сообщения информации с этажными моделями. Рецепторы 1-7 получают внешние воздействия в разных пространственных и временных отношениях, а отраженные в них картины внешнего мира распознаются через активизацию (возбуждение) моделей a, b и альфа, бета на первом этаже, A и I-III - на втором. В правой стороне схемы тот же путь проделывается в сторону действий - от высших моделей B' IV', V' через c', d', гамма', дельта' к возбуждению органов действий 1'-6'. С первого взгляда все кажется просто - дело сводится к распознаванию разных комбинаций возбужденных рецепторов 1-7. Для этого достаточно составить их матрицу и находить по ней модели высших этажей простым перебором, пользуясь огромной памятью и быстродействием машин. Однако стоит только представить себе тысячу, даже сто рецепторов, хотя бы с десятью моментами времени, как оказывается, что машина уже не может справиться с задачей перебора. Более того, задача будет вообще неразрешимой, поскольку из любого набора в 20 возбужденных рецепторов на нижнем этаже могут одновременно активизироваться сотни возможных комбинаций из них на высшем. Практически это означает, что придет в движение вся сеть. Следовательно, матрицы, простой перебор и два состояния ("да - нет") рецептора и модели непригодны для построения сколько-нибудь сложного разумного автомата. Необходимы по крайней мере какие-то специальные алгоритмы, позволяющие выбрать из всех моделей одну доминирующую и избежать сплошного перебора комбинаций. По существу, к этому и сводится задача построения "разумной" системы-автомата.
Неизбежно нужна семантическая сеть из моделей разной активности, с разными связями между ними. Попробуем выяснить значение отдельных свойств системы-сети, претендующей на разумность. Технические возможности ограничены, поэтому нужно отобрать лишь самые необходимые свойства, чтобы, тем не менее, попытаться достигнуть уровня человеческого разума.
1. Нужна ли СУТ? Нельзя ли обойтись разными степенями активности, связанными с различной силой действующих раздражителей, и изменением характеристик моделей, обусловленных тренированностью? Мне кажется, что СУТ необходима, так как простого доминирования недостаточно для того, чтобы отделить сферу сознания (внимание) от подсознания, а следовательно, обеспечить выбор в каждый данный момент наиболее важной модели.
2. Насколько можно ограничить набор "основных" программ искусственной системы? Как говорилось выше, у человека число этих программ значительно: кроме инстинктов самосохранения и продолжения рода, а также сложных рефлексов вроде любопытства и свободы, есть еще комплекс общественных программ - принадлежность к государству, нации, классу, профессии, убеждения, вкусы и пр. Однако и человека можно представить в некоторых искусственных условиях, когда действует всего несколько программ, например инстинкт самосохранения. Бывают периоды профессиональной деятельности, когда человек работает как сложный автомат под влиянием одного стимула. Искусственную систему в пределе можно представить как "думающую машину" с одной программой - скажем, чтение и реферирование литературы. Единственным стимулом (программой) в этом случае будет интерес, позволяющий отделить важное от второстепенного. Разве что еще понадобится "долг", заставляющий ценой затраты усилий "выдавать продукцию" в виде рефератов. Попутно замечу, что, видимо, невозможно создать машину, которая будет лишь читать, то есть обращаться с речевыми моделями. Уже говорилось выше, что речь мыслима только как надстройка, система "вторых сигналов" над моделями конкретных образов.
Итак, в пределе можно представить разум с одной программой, с одним стимулом к деятельности.
3. Нужны ли чувства? Как было сказано, чувства отражают "напряженность" основной программы как в отношении необходимости определенных действий, вызванной внутренними и внешними раздражителями, так и в отношении оценки эффективности этих действий. Каждая система программ (например, общественных или продолжения рода) имеет свою систему чувств. Чувства оказывают определяющее влияние на уровень активности ("потенциал") связанных с ними моделей внешнего мира или собственных действий. Разные программы - разные чувства. Они сравниваются на неких универсальных чувствах приятного и неприятного. Переключение с одной программы деятельности на другую происходит вследствие "конкуренции" чувств. Поэтому немыслима многопрограммная искусственная разумная система без чувств. Даже "думающая" машина с одной программой требует одного чувства, хотя бы просто "приятно - неприятно". Отличие важного от неважного тоже определяется по чувственной оценке. Связь модели с чувством - это ее "вес", активность, без чего обработка информации по моделям в несколько этажей немыслима.
4. В какой степени можно ограничить число рецепторов и время запоминания последовательности их возбуждения? Видимо, возможно вообще отказаться от моделирования рецепторов и начать прямо с этажа первичных моделей-образов, которые возбуждаются в результате опознания среды по информации, выделяемой рецепторами. Разумеется, ее разнообразие нужно ограничить. Что касается времени, то все зависит от соразмерности скорости тактов со скоростью человеческих реакций. Ясно, что нельзя доказать разумность на очень примитивном ассортименте первичных моделей и при короткой памяти.
Эти же соображения касаются и разнообразия действий.
5. Каково число иерархических этажей моделей смысла (понятий) и качеств? Оно, видимо, невелико и у человека. Многообразие внешнего мира запоминается во временной памяти связей между моделями при последовательном их узнавании, а не по принципу, что для каждой сложной ситуации есть своя модель на высшем этаже. Тем не менее несколько этажей моделей понятий и смысла необходимы.
Если реализовать все перечисленные пункты в минимально допустимом объеме, мы получим самую низкую ступень разумной системы, действующей в ограниченном отрезке времени, когда процессами обучения можно еще пренебречь. Для следующей ступени обучение в виде изменения проходимости связей, тренированности моделей и даже образования новых уже необходимо. В зависимости от объема перерабатываемой информации искусственная система с такими качествами будет соответствовать животному с корой головного мозга или ребенку, еще не умеющему говорить.
Следующий уровень - это система с речью. "Вторые сигналы" необходимы для образования моделей сложных и абстрактных понятий, без них искусственный разум останется на уровне животного. Разумеется, можно мыслить разный объем речи - словарный запас, грамматику, синтаксис. Сложность структуры языка тесно связана с уровнями сознания. В них отражены понятия времени, "Я" и "не-Я", субъект, объект, условия, обстоятельства. Воспроизведение всех сложностей требует большой сети.
Высшим проявлением интеллекта является творчество. Я не вижу никаких принципиальных препятствий к моделированию этого процесса. Он получится почти автоматически, как только вырисуется программа воображения, то есть синтеза новых моделей на нижнем этаже при наличии исходных моделей смысла и качеств на высшем. Воспроизведение корковых моделей в словах рукописи или в вещи является уже сравнительно несложным делом (хотя не следует преуменьшать трудности управления органами движения).
К сожалению, это совсем не значит, что все можно сделать легко и уже сейчас. Хотя задача и представляется мне технической, но именно техники, нужной для ее решения, пока нет.
...
Любое техническое устройство можно считать разумным, если оно способно выделять, перерабатывать и выдавать информацию. Каждый из этих трех компонентов может быть выражен в разной степени или даже существовать самостоятельно, будучи "приключенным" к естественному разуму.
Выделение первичной информации осуществляется у человека или животных рецепторами, кодирующими энергию внешних воздействий нервными импульсами, уже представляющими собой элементарную модель. В ней количественно отражено изменение одного вида энергии в ограниченном пространстве, в ограниченное время.
Увеличение объема первичной информации осуществляется у животных путем использования рецепторов, улавливающих разные виды энергии. Число однородных рецепторных клеток, воспринимающих воздействия с разных точек окружающего пространства и в разных диапазонах количества попадающей на них внешней энергии, огромно.
Этот процесс осуществляется и в технических устройствах. Датчики воспринимают световую, тепловую, химическую, механическую энергии и превращают их в электрический потенциал. Зачастую по чувствительности и безынерционности они превосходят естественные рецепторы. Отличие пока состоит в том, что рецепторные клетки гораздо меньше датчиков. Экономичностью размеров рецепторных клеток объясняется их большое число в организме и, следовательно, возможность выделить огромный объем первичной информации. Однако сокращение размеров датчиков - чисто технологическая задача. Живые системы имеют явно избыточное количество рецепторов. Чувствительность большинства из них искусственно понижается настройкой, осуществляющей преимущественное выделение информации с того места пространства, где сосредоточены наиболее важные для жизнедеятельности воздействия.
Переработка информации сводится к возбуждению (активизации) моделей, в которых отражено пространственное или временное распределение возбужденных рецепторов в соответствующих картинах внешнего мира. Этот процесс можно условно разделить на три компонента:
1. Запоминание во временной памяти, изменение степени возбуждения (потенциала уровня активности) группы или одного рецептора за некоторый промежуток времени.
2. Сравнение полученной временной модели с некоторым эталоном, записанным в постоянной памяти постоянной моделью. Сравнение осуществляется по вероятностному, а не по тождественному принципу.
3. При совпадении временной и постоянной моделей последняя возбуждается, то есть повышается ее "потенциал", и сигнал может распространиться по связям на другие модели.
После того как появились вычислительные машины, этот процесс тоже воспроизводится в технических устройствах. Любую информацию, полученную с датчиков, можно представить в виде набора цифр, сравнить их с некоторым другим набором и при точном или приблизительном совпадении выдать сигнал, отражающий наличие именно такой картины вовне; это обозначено условным местом модели в некоторой матрице пространства или времени.
Наконец, третий элемент "разумной" деятельности выражается в новом превращении информационной модели в физические воздействия, направленные вовне,- в виде импульсов энергии (иногда вместе с ее материальными носителями - эффекторами). Эти воздействия служат для управления внешним миром - неодушевленными предметами либо живыми существами. В последнем случае пространственное и временное распределение энергии может отражать в определенном коде передаваемую информацию, иными словами, производится "считывание моделей".
И этот процесс уже реализован в технике. Модели, записанные в памяти вычислительной машины, управляют сложными техническими процессами, движением космических кораблей.
Таким образом, основные элементы разума реализованы человеком в технических устройствах. Все дело - в объеме перерабатываемой информации и программах переработки. В этом состоит пока еще огромная разница между уровнями развития техники и естественного разума.
Однако понятие "объем информации" очень сложно. Можно сказать, что это - количество разнообразия, воспринимаемое и выдаваемое моделирующей ("разумной") системой в единицу времени. К сожалению, само разнообразие понимается по-разному. Не определено истинное разнообразие природы, так как структуру любой системы можно "начинать" с элементарных частиц, с атомов, молекул, их агрегатов, крупных составных частей. В зависимости от "уровня" изменится количество разнообразия. Фактически разнообразие объекта определяется разнообразием его модели, которую способна создать моделирующая установка - будь то мозг или машина. Однако даже подробное описание объекта, начатое с какого-то низкого уровня его структуры,- еще не вся информация о нем. Из первоначальной модели низшего этажа можно вывести целую иерархию моделей смысла и качеств, причем количество информации - разнообразие - в этих высших моделях может значительно превысить разнообразие первичной модели. Разум обязательно включает способность образовывать модели высших этажей, без которых нет полноты понимания окружающего мира и нет общих правил управления им.
Итак, "количество разума" - это не только количество разнообразия (информации), которое система способна представить в виде моделей внешних объектов на нижнем этаже, но также и число этажей моделей смысла и качеств, выделяемых из первичных. По всей вероятности, можно создать некоторую систему исчисления разумности как в смысле общего количества этажей информации, так и скорости ее переработки.
Попытаемся дать классификацию "разумных" систем, чтобы по ней представить себе возможность создания искусственных устройств различных классов с разной степенью "разумности".
Всякая переработка информации осуществляется за счет определенных программ, отражающих взаимодействие элементов системы. Любая программа предусматривает цель, выражающуюся в достижении или поддержании некоторого состояния системы. Все естественные сложные системы ("типа живых") имеют несколько программ, отражающих несколько целей. Искусственные же системы можно создать для реализации одной цели, одной программы. Точно так же можно искусственно выделить часть сложной системы, осуществляющей одну из программ, одну цель. Разные программы могут противоречить друг другу. Следовательно, необходимы дополнительные механизмы (программы!) доминирования и соответственно подавления в зависимости от некоторых показателей, например степени приближения к цели. Для осуществления этого каждая программа должна иметь изменяющийся "вес", что можно представить, например, в виде изменения уровня активности моделей, связанных с понятием "чувства". Таким образом, чувства являются универсальными и очень важными. Чувства отражают степень "напряженности" соответствующей программы, связанной с необходимостью и трудностью достижения цели. Как уже говорилось, для живых систем можно выделить три типа программ - "для себя" (выражается инстинктом самосохранения), "для рода" (выражается инстинктом продолжения рода), "для вида" (состоит в особых качествах изменчивости, а у некоторых животных - в стадном инстинкте). Только у человека программа "для вида" приобрела особую важность, трансформировавшись в программы общественного поведения, что связано со значительным усложнением мозга.
Любую из основных программ живые системы реализуют, перерабатывая с неодинаковой степенью "разумности" разное количество информации и пользуясь биологическими структурами соответствующей сложности. Как уже упоминалось, мы выделили три уровня сложности систем: одноклеточные, многоклеточные животные (до человека включительно) и общество. В последнем наслаиваются три степени разнообразия: структуры из молекул, из клеток, из индивидуумов. К этому нужно еще добавить разнообразие вещей, создаваемых людьми.
Если отнести к разумным все системы, в которых создаются модели и перерабатывается информация, то в зависимости от объема информации, сложности программ ее переработки и числа иерархических этажей моделей можно условно выделить несколько классов разума:
1. Автомат с жесткими программами выделения и переработки информации без обучения, с ограниченными возможностями рецепторов и набором моделей. Здесь возможно несколько вариантов (с обратными связями и без них, с простыми моделями внешней среды и с этажными моделями смысла, с наличием механизмов доминирования и переключения на разные программы). Представителями подобного рода систем являются животные с нервной системой, но без коры головного мозга. Правда, обучаемость присуща всем живым существам, даже одноклеточным, но в этих случаях она ограничена и требует многих повторений.
2. Автомат с обучением имеет программу формирования новых моделей на базе готовых - врожденных. Он соответствует корковым животным. Количество возможных моделей, их этажность, длительность памяти - все эти качества различны, и в зависимости от них автомат подымается по шкале разумности. Однако на этом уровне из перечисленных шести программ человека есть только три - восприятия, действия, чувств - и примитивное сознание в виде программы внимания. Но даже эти программы имеют ограниченный объем, учитывая их качества - сложность, способность к предвидению, число этажей смысла и качеств, память.
3. Следующую ступень представляет собой автомат с программами человека. Я не буду их перечислять. Степень "разумности" тоже может быть различной в зависимости от объема знаний, уровня сознания и способности к творчеству. В конце концов все сводится к объему, уровню и особенностям переработки информации, количеству моделей, их изменениям и взаимодействию.
Возможна ли система более разумная, чем человек? Конечно. Прежде всего такой системой является общество, вернее, ограниченные организованные общественные системы В сущности они тоже имеют программы животного "для себя" - это настоящее, "для рода" - будущее, сложные рефлексы - любопытства, свободы, самовыражения. Все оди являются отражением человеческих качеств, точно так же как качества человека - биологического существа - являются отражением свойств его элементов - клеток. Тем не менее объем информации накладывает свой отпечаток, и наряду с прежними качествами появляются новые. Общественные системы пока еще в значительной степени можно уподобить низшим животным, у которых диффзренцировка клеток не зашла далеко и программы целого отражают программы частей. Специфические качества общества как высшей системы появятся, когда будет создан искусственный разум - мозг общества, способный к собственным программам переработки информации: восприятию воздействия и созданию моделей, действиям и сознанию.
Сами принципы выделения и переработки информации измениться не могут, так как они не зависят от технических средств. Информация - это всегда модель, всегда упрощение и искажение оригинала, будь то его структура или функция. Но форма моделей меняется. В клетках - это ДНК, в мозгу - структуры из нейронов, в обществе недавнего прошлого, да и поныне,- это вещи и книги, являющиеся только придатком мозга. Однако уже создается иная форма моделей в виде памяти в машинах и иной способ передачи информации - от одной машины к другой без посредства человека. Надо думать, что именно эти формы моделей и их передачи будут совершенствоваться и вытеснять традиционные.
Прежде чем раздумывать об особенностях интеллекта, превосходящего человеческий, попытаемся разобраться в некоторых принципиальных вопросах создания искусственного разума в его низших формах либо приближающегося к человеку.
Очень велико разнообразие естественных разумных существ. Как уже было сказано, они различаются по основным программам, по классу - жесткие или с самоорганизацией, по уровню высших этажей моделей, например сознания. В разной степени развития представлены у животных программы восприятия и моделирования внешнего мира, программы действий, чувств, не говоря уже о второй сигнальной системе - речи или уровнях сознания, присущих только людям. Таким образом, перед нами огромный диапазон систем, способных перерабатывать информацию, - от технических автоматов до человека. Поэтому прежде чем моделировать разум, нужно определить его объем. К сожалению, технические возможности моделирования пока столь ограниченны, что приходится начинать именно с них и выяснять, какой объем информации можно переработать существующей техникой. Сейчас много говорят о будто бы практически неограниченных возможностях вычислительных машин - об огромном объеме их памяти и быстродействии. Складывается впечатление, что техническая база для создания искусственного разума уже готова. В действительности это не так.
На рис.1 показана схема системы для выделения, переработки и сообщения информации с этажными моделями. Рецепторы 1-7 получают внешние воздействия в разных пространственных и временных отношениях, а отраженные в них картины внешнего мира распознаются через активизацию (возбуждение) моделей a, b и альфа, бета на первом этаже, A и I-III - на втором. В правой стороне схемы тот же путь проделывается в сторону действий - от высших моделей B' IV', V' через c', d', гамма', дельта' к возбуждению органов действий 1'-6'. С первого взгляда все кажется просто - дело сводится к распознаванию разных комбинаций возбужденных рецепторов 1-7. Для этого достаточно составить их матрицу и находить по ней модели высших этажей простым перебором, пользуясь огромной памятью и быстродействием машин. Однако стоит только представить себе тысячу, даже сто рецепторов, хотя бы с десятью моментами времени, как оказывается, что машина уже не может справиться с задачей перебора. Более того, задача будет вообще неразрешимой, поскольку из любого набора в 20 возбужденных рецепторов на нижнем этаже могут одновременно активизироваться сотни возможных комбинаций из них на высшем. Практически это означает, что придет в движение вся сеть. Следовательно, матрицы, простой перебор и два состояния ("да - нет") рецептора и модели непригодны для построения сколько-нибудь сложного разумного автомата. Необходимы по крайней мере какие-то специальные алгоритмы, позволяющие выбрать из всех моделей одну доминирующую и избежать сплошного перебора комбинаций. По существу, к этому и сводится задача построения "разумной" системы-автомата.
Неизбежно нужна семантическая сеть из моделей разной активности, с разными связями между ними. Попробуем выяснить значение отдельных свойств системы-сети, претендующей на разумность. Технические возможности ограничены, поэтому нужно отобрать лишь самые необходимые свойства, чтобы, тем не менее, попытаться достигнуть уровня человеческого разума.
1. Нужна ли СУТ? Нельзя ли обойтись разными степенями активности, связанными с различной силой действующих раздражителей, и изменением характеристик моделей, обусловленных тренированностью? Мне кажется, что СУТ необходима, так как простого доминирования недостаточно для того, чтобы отделить сферу сознания (внимание) от подсознания, а следовательно, обеспечить выбор в каждый данный момент наиболее важной модели.
2. Насколько можно ограничить набор "основных" программ искусственной системы? Как говорилось выше, у человека число этих программ значительно: кроме инстинктов самосохранения и продолжения рода, а также сложных рефлексов вроде любопытства и свободы, есть еще комплекс общественных программ - принадлежность к государству, нации, классу, профессии, убеждения, вкусы и пр. Однако и человека можно представить в некоторых искусственных условиях, когда действует всего несколько программ, например инстинкт самосохранения. Бывают периоды профессиональной деятельности, когда человек работает как сложный автомат под влиянием одного стимула. Искусственную систему в пределе можно представить как "думающую машину" с одной программой - скажем, чтение и реферирование литературы. Единственным стимулом (программой) в этом случае будет интерес, позволяющий отделить важное от второстепенного. Разве что еще понадобится "долг", заставляющий ценой затраты усилий "выдавать продукцию" в виде рефератов. Попутно замечу, что, видимо, невозможно создать машину, которая будет лишь читать, то есть обращаться с речевыми моделями. Уже говорилось выше, что речь мыслима только как надстройка, система "вторых сигналов" над моделями конкретных образов.
Итак, в пределе можно представить разум с одной программой, с одним стимулом к деятельности.
3. Нужны ли чувства? Как было сказано, чувства отражают "напряженность" основной программы как в отношении необходимости определенных действий, вызванной внутренними и внешними раздражителями, так и в отношении оценки эффективности этих действий. Каждая система программ (например, общественных или продолжения рода) имеет свою систему чувств. Чувства оказывают определяющее влияние на уровень активности ("потенциал") связанных с ними моделей внешнего мира или собственных действий. Разные программы - разные чувства. Они сравниваются на неких универсальных чувствах приятного и неприятного. Переключение с одной программы деятельности на другую происходит вследствие "конкуренции" чувств. Поэтому немыслима многопрограммная искусственная разумная система без чувств. Даже "думающая" машина с одной программой требует одного чувства, хотя бы просто "приятно - неприятно". Отличие важного от неважного тоже определяется по чувственной оценке. Связь модели с чувством - это ее "вес", активность, без чего обработка информации по моделям в несколько этажей немыслима.
4. В какой степени можно ограничить число рецепторов и время запоминания последовательности их возбуждения? Видимо, возможно вообще отказаться от моделирования рецепторов и начать прямо с этажа первичных моделей-образов, которые возбуждаются в результате опознания среды по информации, выделяемой рецепторами. Разумеется, ее разнообразие нужно ограничить. Что касается времени, то все зависит от соразмерности скорости тактов со скоростью человеческих реакций. Ясно, что нельзя доказать разумность на очень примитивном ассортименте первичных моделей и при короткой памяти.
Эти же соображения касаются и разнообразия действий.
5. Каково число иерархических этажей моделей смысла (понятий) и качеств? Оно, видимо, невелико и у человека. Многообразие внешнего мира запоминается во временной памяти связей между моделями при последовательном их узнавании, а не по принципу, что для каждой сложной ситуации есть своя модель на высшем этаже. Тем не менее несколько этажей моделей понятий и смысла необходимы.
Если реализовать все перечисленные пункты в минимально допустимом объеме, мы получим самую низкую ступень разумной системы, действующей в ограниченном отрезке времени, когда процессами обучения можно еще пренебречь. Для следующей ступени обучение в виде изменения проходимости связей, тренированности моделей и даже образования новых уже необходимо. В зависимости от объема перерабатываемой информации искусственная система с такими качествами будет соответствовать животному с корой головного мозга или ребенку, еще не умеющему говорить.
Следующий уровень - это система с речью. "Вторые сигналы" необходимы для образования моделей сложных и абстрактных понятий, без них искусственный разум останется на уровне животного. Разумеется, можно мыслить разный объем речи - словарный запас, грамматику, синтаксис. Сложность структуры языка тесно связана с уровнями сознания. В них отражены понятия времени, "Я" и "не-Я", субъект, объект, условия, обстоятельства. Воспроизведение всех сложностей требует большой сети.
Высшим проявлением интеллекта является творчество. Я не вижу никаких принципиальных препятствий к моделированию этого процесса. Он получится почти автоматически, как только вырисуется программа воображения, то есть синтеза новых моделей на нижнем этаже при наличии исходных моделей смысла и качеств на высшем. Воспроизведение корковых моделей в словах рукописи или в вещи является уже сравнительно несложным делом (хотя не следует преуменьшать трудности управления органами движения).
К сожалению, это совсем не значит, что все можно сделать легко и уже сейчас. Хотя задача и представляется мне технической, но именно техники, нужной для ее решения, пока нет.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Рассмотрим существующие возможности для реализации гипотезы о механизмах мышления. Мне представляются три метода: алгоритм, сеть и физическая модель.
АЛГОРИТМИЧЕСКИЙ МЕТОД моделирования психики почти безраздельно господствует в науке. Разумеется, его применяют для воспроизведения только частных программ, поскольку еще не существует общей гипотезы о механизмах мышления. Я не буду ссылаться на соответствующую литературу, чтобы доказать ограниченность ставившихся разными авторами задач. Нас интересуют разумные системы, по крайней мере на уровне высших животных с теми же атрибутами, которые уже перечислялись: этажность, разная активность моделей, разная проходимость связей, СУТ, выделяющая сферы сознания и подсознания, чувства и желания, в которых отражены основные программы (хотя бы одна из них).
Задача сводится к расчету уровня активности разных моделей, и особенно тех, что определяют "выходы" модели действий.
Составим структуру системы, состоящей из моделей. Каждую модель представляем в виде комплекса нескольких одинаковых моделей с разным "весом", которым определяется уровень их активности, например A.1, A.2, A.3, A.4, A.5. При возбуждении комплекса моделей в зависимости от уровня их активности возбуждается A.1 или A.5 по принципу "да - нет".
По каждому блоку составляется номенклатура (список) моделей отдельно для каждого этажа. Связи между моделями выражаются таблицами-матрицами, в которых нужно отразить также и проходимость. Примитивно это можно выразить соответствием индексов при буквах, обозначающих модель. Например, модель высшего этажа внешнего мира B имеет связи с моделью действий C. При высшей проходимости связи можно допустить, что B.5 вызывает активность C.3, то есть на два пункта ниже. При плохой проходимости разница может составлять три или даже пять пунктов: B.5 -> C.1. Для отражения всех связей как внутри каждого из блоков, так и между ними понадобится множество таблиц-матриц, число которых катастрофически возрастает с увеличением числа моделей.
Деятельность СУТ можно отразить в повышении индекса активности модели, находящейся в сознании, и понижении индекса активности модели, находящейся в подсознании, например B5 и B3. (Возможно, что пяти степеней активности окажется недостаточно для воспроизведения необходимого разнообразия функций).
Активность чувств нужно связать с состоянием тела ("снизу") или усилением воздействий со стороны внешнего мира ("сверху"). Работу модели следует подчинить "тактам" времени - за каждый такт пересчитывать активность (индекс при модели A.1 или A.3). Характеристики "генераторов" модели можно отразить в закономерном изменении их от такта к такту при отсутствии новых возбуждающих воздействий со стороны других моделей. Это - динамическая характеристика (например, A.4-A.3-A.2 или A.4-A.4-A.3-A.3-A.2...). Переменный характер связи после возбуждения "ведомой" модели выражается изменением разницы в индексах тоже по тактам времени.
После того как структура и характеристики выработаны, задаются начальные условия системы - распределение активности моделей и начальные проходимости связей. Затем задаются среда и исходное положение в ней модели. После этого начинается расчет по тактам времени, и внешне это выражается в действиях (например, передвижении по лабиринту).
К сожалению, все эти условности (введение которых необходимо для приближения модели к гипотезе) очень усложняют алгоритм расчетов. Для того чтобы получить результат, то есть окончательный уровень активности к концу цикла, нужно проверять его и пересчитывать по десяткам таблиц-матриц, в которых отражены различные поправки. В итоге теряется смысл алгоритмического метода, поскольку главное достоинство его - простота - исчезает, а недостаток - жесткость - остается.
МЕТОД СЕТЕЙ. Задача состоит в том, чтобы воспроизвести семантическую сеть, в которой отражены свойства мозга: переменная активность моделей из нейронов, изменяющаяся проходимость связей и самоорганизация - проторение новых связей и образование новых моделей. На такой сети нужно смоделировать все шесть программ поведения человека - восприятие, действия, чувства, речь, сознание, творчество. Конечно, было бы интересно создать "полную" модель личности, но пока невозможно построить структуру такой сложности и просчитать ее. Поэтому приходится ограничивать задачу воссозданием отдельных программ, захватывая другие только в минимальной степени, поскольку практически невозможно выделить одну программу, претендуя в то же время на ее достаточное выражение.
Подробное описание методики сетевых моделей представляет собой задачу специального труда. Здесь я лишь коротко изложу план подобной работы.
1. Постановка задачи. Следует выбрать для моделирования одну или несколько психических функций. Если предполагается решать прикладные задачи в виде создания автомата для выполнения определенных целей, тогда нужно четко их поставить. Возможна еще большая точность - определение психических программ и круга деятельности автомата, наделенного ими.
2. Сбор сведений из психологии, касающихся задачи. Может быть, постановка специальных психологических экспериментов.
3. Составление гипотезы о механизмах программы. Разумеется, мы считаем, что для этого нужно использовать нашу общую гипотезу о психике, выбрав и развив те ее разделы, которые имеют отношение к задаче. Гипотеза в общем виде представляет собой костяк структуры будущей сети, основные блоки которой необходимы для выполнения программы. Например, выбираются рецепторы, система их настройки, блок моделей конкретных образов внешнего мира, блок двигательных моделей, блок чувств и эмоций. Обязательно присутствует СУТ, без которой невозможна реализация ни одной программы. Для воспроизведения высших психических функций задаются блоки речи, сознания. Короче говоря, из общей гипотезы выбираются те ее составные, которые будут участвовать в данной модели.
4. Выбор среды, в которой предстоит действовать автомату, определяется поставленными целями. Если задача состоит в создании программы, то и тогда нужно выбрать конкретную обстановку, в которой наилучшим образом будет показана эта программа. Обычно любую среду можно свести к лабиринту (неподвижному или изменчивому), населенному живыми существами того или иного уровня развития. Тем самым определяется круг воздействий на автомат из среды и его обратные реакции.
5. Составление номенклатуры - алфавитов моделей, которые предполагается включить в сеть, исходя из целей гипотезы, программ и среды. Алфавиты обязательно состоят из нескольких этажей. Внизу располагаются конкретные понятия среды и собственных ответных действий или слова речи, если имеется в виду ее использование. Выше - обобщенные понятия, которые также связываются с "ключевыми" словами. То же касается чувств и желаний. Некоторые модели высших этажей получаются от пространственного, другие - от временного суммирования энергии, от моделей низших этажей. Кроме того, выделяются модели качеств. После того как составлены алфавиты, уже приблизительно определяется размер модели. Правда, если предполагаются программы обучения и особенно самоорганизации с созданием новых моделей, исходный объем модели может в дальнейшем значительно возрасти. Однако этот рост тоже следует как-то планировать. Размер модели знать необходимо, так как система расчетов жестко ограничивает его. Если после составления алфавитов оказалось, что модель велика, нужно ее тут же сократить, отказавшись от всего, без чего можно обойтись, и даже, возможно, пересмотреть исходные положения о количестве выбранных программ.
6. Далее следует собственно составление схемы или структуры модели. Ее можно представить на плоскости сначала в упрощенном варианте - в виде блоков и линий связей между ними, а затем и в виде тонкой структуры с изображением всех отобранных элементов алфавитов и соединяющих их связей. К сожалению, если модель велика (состоит, например, из тысячи элементов), ее подробная схема с массой связей уже теряет наглядность. Есть и табличный способ выражения модели. В принципе предполагается, что каждая из моделей может быть связана со всеми другими. Это значит, что модель можно изобразить в виде матрицы (таблицы), в которой по вертикали и горизонтали перечислены все элементы, а на пересечениях показаны характеристики связей, например их проходимость. Поскольку все-таки многие модели не будут взаимосвязаны, можно представить модель в виде собрания таблиц по блокам и между блоками. Это особенно важно для этажных моделей внутри блоков. Во всяком случае, для составления программы на машину нет необходимости в графическом изображении модели.
7. Этот пункт является, пожалуй, самым трудным: нужно выбрать характеристики моделей и связей. По существу это функциональная основа всей модели. Выше были описаны типы характеристик. В случае простых моделей - это кривые (или формулы), отражающие зависимости между энергией входов и выхода,- для статистических характеристик; изменение активности во времени при включении и выключении внешних воздействий - для динамических характеристик. В случае сложных информационных моделей, объединяющих на высшем этаже последовательность возбуждения во времени неких моделей низших этажей, нужно строить характеристики (матрицы) для узнавания последовательности и для "генератора", включаемого после узнавания. Следующей степенью сложности могут быть характеристики моделей качеств, так как они должны отражать первую или вторую производные от изменения внешних раздражителей либо выделять информацию еще более сложных видов. Однако все это вполне преодолимые трудности.
Характеристики моделей первого порядка отражают "временную активную память". Для обучающихся систем нужны также законы адаптации и тренировки, то есть характеристики соответственно второго и третьего порядков.
Не менее важно и, пожалуй, более трудно выразить характеристики связей. В них нужно отразить "временную память связи". Это кривые первого порядка, фиксирующие на время последовательность возбуждения моделей и "длительную память связи", используемую при обучении. Отдельно отражается порядок установления (проторения) связей, используемых для обучения и создания новых моделей.
Элементами характеристик являются также "пороги возбудимости", ответы на тормозные и усиливающие воздействия со стороны соседних моделей и особенно СУТ. Еще одним важным показателем является "временная задержка" при переключении возбуждения с одной модели на другую. Именно эта величина определяет такты времени - интервалы, через которые нужно пересчитывать активность всех элементов модели, чтобы учесть влияние обратных связей.
Нет необходимости задавать характеристики очень сложными математическими выражениями с претензией отразить все физиологические данные. Чем сложнее математические построения, тем меньше предельный объем модели. Эффект модели - в сложности и разнообразии структуры, а не в формулах для элементов. Разумеется, некоторый минимум необходим. Для выбора характеристик приходится прибегать к маленьким служебным моделям, чтобы нащупать порядок величин и отразить требуемые свойства.
Теперь модель вчерне готова. Нужно составить алгоритм и программы для ЭВМ, чтобы рассчитывать изменение активности элементов и таким образом дать модели жизнь.
8. Суть алгоритмов расчета сводится к тому, чтобы определить уровень активности генератора ("потенциал") каждой модели через короткие интервалы времени - такты. Высота активности определяется по статистической характеристике как функция количества энергии, поступившей на модель за предыдущий такт со всех ее входов - по связям от других моделей с учетом их проходимости. Проходимость изменяется от временной памяти связи - от такта к такту, согласно характеристикам. После этого вносится поправка на действие СУТ - активность всех моделей сравнивается, выбирается самая возбужденная, и она дополнительно усиливается в зависимости от характеристик СУТ. Все другие модели соответственно тормозятся. В этом состоит один тур расчета. Активность отражает "поведение" модели за такт времени.
Это самый простой случай - модель без обучения и самоорганизации. Если же такие программы предусмотрены, то, кроме того, производится расчет изменения характеристик за каждый такт - отражение второго этажа регулирования модели (тренировка, адаптация, изменение возбудимости и порога, изменение постоянной памяти всех связей). Это большой объем расчетов, хотя они обязательны не для каждого цикла. Создание новых моделей возможно только как формирование высших этажей над информацией, выделяемой рецепторами. Практически это означает, что при повторении одновременного возбуждения некоторого пространственного комплекса низших моделей над ними создается объединяющая модель высшего этажа. То же самое касается высшей модели, соответствующей временной последовательности возбуждения некоторого комплекса низших моделей. Это вполне возможно.
Разумеется, я описал самый общий алгоритм расчетов. Его можно изменять как угодно, лишь бы получить должный результат. В конце концов мы заново "изобретаем" мозг и не связаны никакими ограничениями.
9. После того как программа расчетов для ЭВМ составлена, можно приступать к исследованию модели. Для этого прежде всего нужно задать ее исходное состояние в виде проходимости связей и начального уровня активности элементов и определить место модели в среде, то есть задать внешние воздействия. Само исследование заключается в просчитывании уровня активности каждой модели, входящей в состав всей модели, от такта к такту. На выход программы можно выдавать все модели или любую из них. Практически невозможно следить за таблицами с множеством цифр, если модель велика, и можно опустить все внутренние отношения, ограничившись регистрацией действий, как это будет в случае с техническими автоматами, обладающими "разумом". Однако интерес научного исследования заключается как раз в том, чтобы проследить внутренние мотивы внешнего поведения. Это тем более необходимо, что первые испытания модели обязательно выявят ее несовершенство и потребуют исправления недочетов. Нужен анализ, даже если он будет продолжительным, так как придется выражать графически изменение активности во времени многих моделей. Другая цель исследований модели заключается в изучении ее поведения при различных внешних условиях и разных "типах характера", что отражается в характеристиках моделей чувств и СУТ.
Важным моментом в исследовании модели является трактовка ее поведения. Как можно доказать, что оно разумное? Видимо, только объективным сравнением с поведением человека в соответствующей ситуации. Однако сделать это нелегко, поскольку объем моделей у испытуемого неизмеримо больший. Потребуется поместить его в искусственную среду с ограниченным числом раздражителей. Поведение разных людей в этих условиях тоже будет различным. Таким образом, для сравнения и доказательств нужны специальные психологические эксперименты. Разумеется, после того как будут созданы большие модели, обладающие речью, определение разумности не составит труда. Пока же мы считаем важными и скромные результаты, которые подкрепляются возможностью проследить механизмы психических реакций хотя бы в одной гипотетической трактовке.
В отделе биокибернетики Института кибернетики АН УССР уже три года проводится практическая работа по созданию моделей психики.
Главная трудность, с которой мы столкнулись, связана с недостаточной мощностью вычислительных машин. Опыты проводились на ЦВМ М20. Для того чтобы просчитать один цикл простенькой модели РЭС, состоящей из 90 моделей без обучения, понадобилось 1.5мин. машинного времени. Модель МОД, состоящая из 300 моделей с обучением, требует уже 5мин., а модель из 1000 элементов с речью, обучением и самоорганизацией, видимо, потребует около 30мин. А ведь эта модель тоже еще очень мала и совершенно несравнима с естественным мозгом.
Другие пункты плана создания модели также сопряжены с трудностями, хотя они более преодолимы. Так, например, нелегко представить себе сеть из сотен моделей (не говоря уже о тысячах), нелегко подобрать характеристики, которые не могут быть одинаковыми для разных этажей и качеств.
Впереди видятся примерно такие возможности увеличения размеров и полноты моделей:
1. Использование самых современных машин с большой оперативной памятью, высоким быстродействием, быстрым вводом. При этих условиях удастся получить приемлемые сроки просчета цикла.
2. Совершенствование программ, с тем чтобы не просчитывать те части модели, элементы которых имеют низкую активность.
3. Ограничение рассчитываемой части модели только ее логикой. При этом остаются в стороне рецепторная и эффекторная части, которые требуют множества элементов и, следовательно, места в программе ЭВМ, но не дают специфики психики.
4. Этой же цели служит максимальное сокращение второстепенных программ или выведение их на другие машины, связанные с главной.
5. Часть модели можно представлять не в виде сети, а в виде алгоритма. Например, это касается СУТ, которую, конечно, можно представить в виде особой сети с большим числом моделей, но проще воспользоваться алгоритмом для сравнения активности всех моделей и выбора наиболее возбужденной из них.
6. Наконец, для преодоления трудностей программирования сложных моделей можно пытаться создать новый тип программы, обеспечивающий автоматический рост сети, с тем чтобы программа сама себя увеличивала. Впрочем, пока это находится в сфере предположений.
Как свидетельствуют эти пункты, еще имеется достаточно возможностей для увеличения и совершенствования моделей из семантических сетей, которые можно рассчитывать на универсальных цифровых машинах. Однако при всех условиях эти возможности ограничены. При современной технике трудно получить приемлемое время расчета одного цикла для модели, состоящей из нескольких тысяч элементов.
Третий тип моделей разума можно представить в виде ФИЗИЧЕСКОЙ СЕТИ, составленной из искусственных нейронов. Работы в этом направлении ведутся во многих лабораториях. Кибернетики составили уже сотни моделей нейронов и множество ансамблей из них. К сожалению, пока все модели довольно сложны, однако надежды на их упрощение и уменьшение вполне реальны, поскольку технология развивается быстро. Когда это произойдет, появится возможность создать систему типа аналоговой машины, в которой будут воспроизведены те же структуры и программы, что и в семантической сети. Это будет настоящий искусственный мозг, хотя и отличный от естественного. Преимущества его перед разумом-программой ЭВМ очень велики, так как переработка информации в нем, то есть передача энергии между моделями, станет осуществляться сразу по всем связям. Поскольку речь идет об электрических сигналах, можно рассчитывать, что по скорости переработки информации искусственный мозг значительно превзойдет естественный. Разумеется, все зависит от элементов: воспроизведут ли они нужные характеристики "генераторов" и связей, в том числе и такие, как способность к тренировке, временная и постоянная память связей, способность к изменению возбудимости под влиянием тормозных и усиливающих воздействий со стороны СУТ. Пожалуй, всего труднее будет обеспечить способность к установлению новых связей, так как для этого нужно уже заранее проложить большой избыток проводников между моделями.
Я недостаточно знаком с аналоговой техникой, чтобы обсуждать реальные возможности и трудности создания электронного искусственного мозга. Полагаю, что если будет создана программа-разум на ЭВМ, то тем самым определится структура мозга и будут заданы характеристики его элементов - моделей. Надо надеяться, что технологи решат задачу воплощения этой сети в физических элементах, хотя, возможно, и не так быстро. Конечно, речь идет не о простом повторении семантической сети, поскольку условия будут другими. Поэтому проектирование такой системы должно происходить при активном участии специалистов по моделированию психики. Их задача - дать первое техническое задание и потом скорректировать его в зависимости от возможностей техники.
АЛГОРИТМИЧЕСКИЙ МЕТОД моделирования психики почти безраздельно господствует в науке. Разумеется, его применяют для воспроизведения только частных программ, поскольку еще не существует общей гипотезы о механизмах мышления. Я не буду ссылаться на соответствующую литературу, чтобы доказать ограниченность ставившихся разными авторами задач. Нас интересуют разумные системы, по крайней мере на уровне высших животных с теми же атрибутами, которые уже перечислялись: этажность, разная активность моделей, разная проходимость связей, СУТ, выделяющая сферы сознания и подсознания, чувства и желания, в которых отражены основные программы (хотя бы одна из них).
Задача сводится к расчету уровня активности разных моделей, и особенно тех, что определяют "выходы" модели действий.
Составим структуру системы, состоящей из моделей. Каждую модель представляем в виде комплекса нескольких одинаковых моделей с разным "весом", которым определяется уровень их активности, например A.1, A.2, A.3, A.4, A.5. При возбуждении комплекса моделей в зависимости от уровня их активности возбуждается A.1 или A.5 по принципу "да - нет".
По каждому блоку составляется номенклатура (список) моделей отдельно для каждого этажа. Связи между моделями выражаются таблицами-матрицами, в которых нужно отразить также и проходимость. Примитивно это можно выразить соответствием индексов при буквах, обозначающих модель. Например, модель высшего этажа внешнего мира B имеет связи с моделью действий C. При высшей проходимости связи можно допустить, что B.5 вызывает активность C.3, то есть на два пункта ниже. При плохой проходимости разница может составлять три или даже пять пунктов: B.5 -> C.1. Для отражения всех связей как внутри каждого из блоков, так и между ними понадобится множество таблиц-матриц, число которых катастрофически возрастает с увеличением числа моделей.
Деятельность СУТ можно отразить в повышении индекса активности модели, находящейся в сознании, и понижении индекса активности модели, находящейся в подсознании, например B5 и B3. (Возможно, что пяти степеней активности окажется недостаточно для воспроизведения необходимого разнообразия функций).
Активность чувств нужно связать с состоянием тела ("снизу") или усилением воздействий со стороны внешнего мира ("сверху"). Работу модели следует подчинить "тактам" времени - за каждый такт пересчитывать активность (индекс при модели A.1 или A.3). Характеристики "генераторов" модели можно отразить в закономерном изменении их от такта к такту при отсутствии новых возбуждающих воздействий со стороны других моделей. Это - динамическая характеристика (например, A.4-A.3-A.2 или A.4-A.4-A.3-A.3-A.2...). Переменный характер связи после возбуждения "ведомой" модели выражается изменением разницы в индексах тоже по тактам времени.
После того как структура и характеристики выработаны, задаются начальные условия системы - распределение активности моделей и начальные проходимости связей. Затем задаются среда и исходное положение в ней модели. После этого начинается расчет по тактам времени, и внешне это выражается в действиях (например, передвижении по лабиринту).
К сожалению, все эти условности (введение которых необходимо для приближения модели к гипотезе) очень усложняют алгоритм расчетов. Для того чтобы получить результат, то есть окончательный уровень активности к концу цикла, нужно проверять его и пересчитывать по десяткам таблиц-матриц, в которых отражены различные поправки. В итоге теряется смысл алгоритмического метода, поскольку главное достоинство его - простота - исчезает, а недостаток - жесткость - остается.
МЕТОД СЕТЕЙ. Задача состоит в том, чтобы воспроизвести семантическую сеть, в которой отражены свойства мозга: переменная активность моделей из нейронов, изменяющаяся проходимость связей и самоорганизация - проторение новых связей и образование новых моделей. На такой сети нужно смоделировать все шесть программ поведения человека - восприятие, действия, чувства, речь, сознание, творчество. Конечно, было бы интересно создать "полную" модель личности, но пока невозможно построить структуру такой сложности и просчитать ее. Поэтому приходится ограничивать задачу воссозданием отдельных программ, захватывая другие только в минимальной степени, поскольку практически невозможно выделить одну программу, претендуя в то же время на ее достаточное выражение.
Подробное описание методики сетевых моделей представляет собой задачу специального труда. Здесь я лишь коротко изложу план подобной работы.
1. Постановка задачи. Следует выбрать для моделирования одну или несколько психических функций. Если предполагается решать прикладные задачи в виде создания автомата для выполнения определенных целей, тогда нужно четко их поставить. Возможна еще большая точность - определение психических программ и круга деятельности автомата, наделенного ими.
2. Сбор сведений из психологии, касающихся задачи. Может быть, постановка специальных психологических экспериментов.
3. Составление гипотезы о механизмах программы. Разумеется, мы считаем, что для этого нужно использовать нашу общую гипотезу о психике, выбрав и развив те ее разделы, которые имеют отношение к задаче. Гипотеза в общем виде представляет собой костяк структуры будущей сети, основные блоки которой необходимы для выполнения программы. Например, выбираются рецепторы, система их настройки, блок моделей конкретных образов внешнего мира, блок двигательных моделей, блок чувств и эмоций. Обязательно присутствует СУТ, без которой невозможна реализация ни одной программы. Для воспроизведения высших психических функций задаются блоки речи, сознания. Короче говоря, из общей гипотезы выбираются те ее составные, которые будут участвовать в данной модели.
4. Выбор среды, в которой предстоит действовать автомату, определяется поставленными целями. Если задача состоит в создании программы, то и тогда нужно выбрать конкретную обстановку, в которой наилучшим образом будет показана эта программа. Обычно любую среду можно свести к лабиринту (неподвижному или изменчивому), населенному живыми существами того или иного уровня развития. Тем самым определяется круг воздействий на автомат из среды и его обратные реакции.
5. Составление номенклатуры - алфавитов моделей, которые предполагается включить в сеть, исходя из целей гипотезы, программ и среды. Алфавиты обязательно состоят из нескольких этажей. Внизу располагаются конкретные понятия среды и собственных ответных действий или слова речи, если имеется в виду ее использование. Выше - обобщенные понятия, которые также связываются с "ключевыми" словами. То же касается чувств и желаний. Некоторые модели высших этажей получаются от пространственного, другие - от временного суммирования энергии, от моделей низших этажей. Кроме того, выделяются модели качеств. После того как составлены алфавиты, уже приблизительно определяется размер модели. Правда, если предполагаются программы обучения и особенно самоорганизации с созданием новых моделей, исходный объем модели может в дальнейшем значительно возрасти. Однако этот рост тоже следует как-то планировать. Размер модели знать необходимо, так как система расчетов жестко ограничивает его. Если после составления алфавитов оказалось, что модель велика, нужно ее тут же сократить, отказавшись от всего, без чего можно обойтись, и даже, возможно, пересмотреть исходные положения о количестве выбранных программ.
6. Далее следует собственно составление схемы или структуры модели. Ее можно представить на плоскости сначала в упрощенном варианте - в виде блоков и линий связей между ними, а затем и в виде тонкой структуры с изображением всех отобранных элементов алфавитов и соединяющих их связей. К сожалению, если модель велика (состоит, например, из тысячи элементов), ее подробная схема с массой связей уже теряет наглядность. Есть и табличный способ выражения модели. В принципе предполагается, что каждая из моделей может быть связана со всеми другими. Это значит, что модель можно изобразить в виде матрицы (таблицы), в которой по вертикали и горизонтали перечислены все элементы, а на пересечениях показаны характеристики связей, например их проходимость. Поскольку все-таки многие модели не будут взаимосвязаны, можно представить модель в виде собрания таблиц по блокам и между блоками. Это особенно важно для этажных моделей внутри блоков. Во всяком случае, для составления программы на машину нет необходимости в графическом изображении модели.
7. Этот пункт является, пожалуй, самым трудным: нужно выбрать характеристики моделей и связей. По существу это функциональная основа всей модели. Выше были описаны типы характеристик. В случае простых моделей - это кривые (или формулы), отражающие зависимости между энергией входов и выхода,- для статистических характеристик; изменение активности во времени при включении и выключении внешних воздействий - для динамических характеристик. В случае сложных информационных моделей, объединяющих на высшем этаже последовательность возбуждения во времени неких моделей низших этажей, нужно строить характеристики (матрицы) для узнавания последовательности и для "генератора", включаемого после узнавания. Следующей степенью сложности могут быть характеристики моделей качеств, так как они должны отражать первую или вторую производные от изменения внешних раздражителей либо выделять информацию еще более сложных видов. Однако все это вполне преодолимые трудности.
Характеристики моделей первого порядка отражают "временную активную память". Для обучающихся систем нужны также законы адаптации и тренировки, то есть характеристики соответственно второго и третьего порядков.
Не менее важно и, пожалуй, более трудно выразить характеристики связей. В них нужно отразить "временную память связи". Это кривые первого порядка, фиксирующие на время последовательность возбуждения моделей и "длительную память связи", используемую при обучении. Отдельно отражается порядок установления (проторения) связей, используемых для обучения и создания новых моделей.
Элементами характеристик являются также "пороги возбудимости", ответы на тормозные и усиливающие воздействия со стороны соседних моделей и особенно СУТ. Еще одним важным показателем является "временная задержка" при переключении возбуждения с одной модели на другую. Именно эта величина определяет такты времени - интервалы, через которые нужно пересчитывать активность всех элементов модели, чтобы учесть влияние обратных связей.
Нет необходимости задавать характеристики очень сложными математическими выражениями с претензией отразить все физиологические данные. Чем сложнее математические построения, тем меньше предельный объем модели. Эффект модели - в сложности и разнообразии структуры, а не в формулах для элементов. Разумеется, некоторый минимум необходим. Для выбора характеристик приходится прибегать к маленьким служебным моделям, чтобы нащупать порядок величин и отразить требуемые свойства.
Теперь модель вчерне готова. Нужно составить алгоритм и программы для ЭВМ, чтобы рассчитывать изменение активности элементов и таким образом дать модели жизнь.
8. Суть алгоритмов расчета сводится к тому, чтобы определить уровень активности генератора ("потенциал") каждой модели через короткие интервалы времени - такты. Высота активности определяется по статистической характеристике как функция количества энергии, поступившей на модель за предыдущий такт со всех ее входов - по связям от других моделей с учетом их проходимости. Проходимость изменяется от временной памяти связи - от такта к такту, согласно характеристикам. После этого вносится поправка на действие СУТ - активность всех моделей сравнивается, выбирается самая возбужденная, и она дополнительно усиливается в зависимости от характеристик СУТ. Все другие модели соответственно тормозятся. В этом состоит один тур расчета. Активность отражает "поведение" модели за такт времени.
Это самый простой случай - модель без обучения и самоорганизации. Если же такие программы предусмотрены, то, кроме того, производится расчет изменения характеристик за каждый такт - отражение второго этажа регулирования модели (тренировка, адаптация, изменение возбудимости и порога, изменение постоянной памяти всех связей). Это большой объем расчетов, хотя они обязательны не для каждого цикла. Создание новых моделей возможно только как формирование высших этажей над информацией, выделяемой рецепторами. Практически это означает, что при повторении одновременного возбуждения некоторого пространственного комплекса низших моделей над ними создается объединяющая модель высшего этажа. То же самое касается высшей модели, соответствующей временной последовательности возбуждения некоторого комплекса низших моделей. Это вполне возможно.
Разумеется, я описал самый общий алгоритм расчетов. Его можно изменять как угодно, лишь бы получить должный результат. В конце концов мы заново "изобретаем" мозг и не связаны никакими ограничениями.
9. После того как программа расчетов для ЭВМ составлена, можно приступать к исследованию модели. Для этого прежде всего нужно задать ее исходное состояние в виде проходимости связей и начального уровня активности элементов и определить место модели в среде, то есть задать внешние воздействия. Само исследование заключается в просчитывании уровня активности каждой модели, входящей в состав всей модели, от такта к такту. На выход программы можно выдавать все модели или любую из них. Практически невозможно следить за таблицами с множеством цифр, если модель велика, и можно опустить все внутренние отношения, ограничившись регистрацией действий, как это будет в случае с техническими автоматами, обладающими "разумом". Однако интерес научного исследования заключается как раз в том, чтобы проследить внутренние мотивы внешнего поведения. Это тем более необходимо, что первые испытания модели обязательно выявят ее несовершенство и потребуют исправления недочетов. Нужен анализ, даже если он будет продолжительным, так как придется выражать графически изменение активности во времени многих моделей. Другая цель исследований модели заключается в изучении ее поведения при различных внешних условиях и разных "типах характера", что отражается в характеристиках моделей чувств и СУТ.
Важным моментом в исследовании модели является трактовка ее поведения. Как можно доказать, что оно разумное? Видимо, только объективным сравнением с поведением человека в соответствующей ситуации. Однако сделать это нелегко, поскольку объем моделей у испытуемого неизмеримо больший. Потребуется поместить его в искусственную среду с ограниченным числом раздражителей. Поведение разных людей в этих условиях тоже будет различным. Таким образом, для сравнения и доказательств нужны специальные психологические эксперименты. Разумеется, после того как будут созданы большие модели, обладающие речью, определение разумности не составит труда. Пока же мы считаем важными и скромные результаты, которые подкрепляются возможностью проследить механизмы психических реакций хотя бы в одной гипотетической трактовке.
В отделе биокибернетики Института кибернетики АН УССР уже три года проводится практическая работа по созданию моделей психики.
Главная трудность, с которой мы столкнулись, связана с недостаточной мощностью вычислительных машин. Опыты проводились на ЦВМ М20. Для того чтобы просчитать один цикл простенькой модели РЭС, состоящей из 90 моделей без обучения, понадобилось 1.5мин. машинного времени. Модель МОД, состоящая из 300 моделей с обучением, требует уже 5мин., а модель из 1000 элементов с речью, обучением и самоорганизацией, видимо, потребует около 30мин. А ведь эта модель тоже еще очень мала и совершенно несравнима с естественным мозгом.
Другие пункты плана создания модели также сопряжены с трудностями, хотя они более преодолимы. Так, например, нелегко представить себе сеть из сотен моделей (не говоря уже о тысячах), нелегко подобрать характеристики, которые не могут быть одинаковыми для разных этажей и качеств.
Впереди видятся примерно такие возможности увеличения размеров и полноты моделей:
1. Использование самых современных машин с большой оперативной памятью, высоким быстродействием, быстрым вводом. При этих условиях удастся получить приемлемые сроки просчета цикла.
2. Совершенствование программ, с тем чтобы не просчитывать те части модели, элементы которых имеют низкую активность.
3. Ограничение рассчитываемой части модели только ее логикой. При этом остаются в стороне рецепторная и эффекторная части, которые требуют множества элементов и, следовательно, места в программе ЭВМ, но не дают специфики психики.
4. Этой же цели служит максимальное сокращение второстепенных программ или выведение их на другие машины, связанные с главной.
5. Часть модели можно представлять не в виде сети, а в виде алгоритма. Например, это касается СУТ, которую, конечно, можно представить в виде особой сети с большим числом моделей, но проще воспользоваться алгоритмом для сравнения активности всех моделей и выбора наиболее возбужденной из них.
6. Наконец, для преодоления трудностей программирования сложных моделей можно пытаться создать новый тип программы, обеспечивающий автоматический рост сети, с тем чтобы программа сама себя увеличивала. Впрочем, пока это находится в сфере предположений.
Как свидетельствуют эти пункты, еще имеется достаточно возможностей для увеличения и совершенствования моделей из семантических сетей, которые можно рассчитывать на универсальных цифровых машинах. Однако при всех условиях эти возможности ограничены. При современной технике трудно получить приемлемое время расчета одного цикла для модели, состоящей из нескольких тысяч элементов.
Третий тип моделей разума можно представить в виде ФИЗИЧЕСКОЙ СЕТИ, составленной из искусственных нейронов. Работы в этом направлении ведутся во многих лабораториях. Кибернетики составили уже сотни моделей нейронов и множество ансамблей из них. К сожалению, пока все модели довольно сложны, однако надежды на их упрощение и уменьшение вполне реальны, поскольку технология развивается быстро. Когда это произойдет, появится возможность создать систему типа аналоговой машины, в которой будут воспроизведены те же структуры и программы, что и в семантической сети. Это будет настоящий искусственный мозг, хотя и отличный от естественного. Преимущества его перед разумом-программой ЭВМ очень велики, так как переработка информации в нем, то есть передача энергии между моделями, станет осуществляться сразу по всем связям. Поскольку речь идет об электрических сигналах, можно рассчитывать, что по скорости переработки информации искусственный мозг значительно превзойдет естественный. Разумеется, все зависит от элементов: воспроизведут ли они нужные характеристики "генераторов" и связей, в том числе и такие, как способность к тренировке, временная и постоянная память связей, способность к изменению возбудимости под влиянием тормозных и усиливающих воздействий со стороны СУТ. Пожалуй, всего труднее будет обеспечить способность к установлению новых связей, так как для этого нужно уже заранее проложить большой избыток проводников между моделями.
Я недостаточно знаком с аналоговой техникой, чтобы обсуждать реальные возможности и трудности создания электронного искусственного мозга. Полагаю, что если будет создана программа-разум на ЭВМ, то тем самым определится структура мозга и будут заданы характеристики его элементов - моделей. Надо надеяться, что технологи решат задачу воплощения этой сети в физических элементах, хотя, возможно, и не так быстро. Конечно, речь идет не о простом повторении семантической сети, поскольку условия будут другими. Поэтому проектирование такой системы должно происходить при активном участии специалистов по моделированию психики. Их задача - дать первое техническое задание и потом скорректировать его в зависимости от возможностей техники.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ЗАКЛЮЧЕНИЕ
Создание искусственного разума - вопрос только времени. Первое: люди овладели качеством СЛОЖНОСТЬ, научились создавать искусственные системы, по сложности приближающиеся к естественным. Следует надеяться, что они превзойдут этот уровень. Второе условие: ученые поняли, что выделение и переработка информации - модели и действия с ними - процесс объективный. Его можно воспроизвести отдельно от человека, в системах из неживых элементов, при условии их большой сложности. Этого достаточно. Естественный разум - только моделирующая установка из биологических элементов, обеспечивающая выделение и переработку информации. То же возможно воспроизвести искусственно.
Выше уже говорилось о многообразии разумов. Для любого объекта можно получить бесконечное множество моделей, имея разные программы моделирования. Природа создала огромное количество биологических видов, и каждый из них обладает способностью к выделению и переработке информации. У низших животных это осуществляется на уровне клеток, у высших - в нервной системе и особенно в коре головного мозга. Однако даже у высших животных кора остается только вычислительной машиной для тела, в котором заложены программы жизни. Лишь у человека она превратилась в орудие более высокой системы - общества. Многообразие естественных моделирующих установок доказывает, что можно создать разум лучше человеческого.
Главный недостаток человеческого разума- ограниченность. Ограничен объем памяти, мала скорость переработки информации, очень медленно обучение, трудны вспоминание и выборка.
Другой, не менее важный недостаток - искажения. Природа и степень их различны. Прежде всего, искажения - неизбежный спутник всякого моделирования. Для того чтобы упростить сложный объект до модели, обязательно нужно опустить какие-то детали, причем никогда нельзя быть уверенным в том, что опущенное неважно. Моделирование всегда предполагает цель - "для чего?", и эта цель определяет отбор второстепенных деталей. У человека это выражается искажениями вследствие субъективности, так как именно чувства являются выразителями "для чего?". Чувства изменяют матрицы, модели-эталоны, с которыми сравнивается модель во временной памяти, составленная при восприятии внешнего мира. Чем ярче чувства, тем больше возможная степень искажения.
Но это еще не все. Основная программа мозга заключается в том, что внешняя картина воспринимается поочередной концентрацией внимания-усиления на ее деталях. Степень усиления неравномерна, зависит от его периодического ослабления при утомлении, от чувств, отражающих важность той или иной детали для человека в данный момент. В памяти запечатлевается последовательность восприятия деталей картины, но сами они неравноценны, имеют разный "вес" и искажают действительность, когда человек пытается представить картину перед своим внутренним взором. Кроме того, человек просто не может увидеть сложность сразу, он должен представлять ее поочередным вспоминанием частностей. Все это делает модели качественными. Конечно, это как раз то, что нужно было человеку раньше (как и животному), чтобы в каждый момент реагировать на наиболее важный раздражитель. Объективная истина для животного цены не имеет. Она понадобилась обществу, поскольку необходима для воспроизведения системы. (Между прочим, жесткие программы на клеточном уровне, по которым происходит размножение, отражают объективную истину, так как неопределенности нет места в генетическом коде).
Можно ли создать разум лучше человеческого?
Конечно. Природа богата и разнообразна, но ее возможности построения более совершенных систем далеко не исчерпаны. Мыслится создание моделирующих установок, лишенных многих недостатков мозга.
Прежде всего: системы будут разные. Можно предположить несколько типов разума.
Оперативный разум для управления сложными системами (например, лечение больного, воспитание человека, управление обществом). Во всех этих случаях (с возрастанием степени сложности) нельзя предусмотреть жесткую систему управления, поскольку сложность объекта значительно превышает сложность возможных моделей и, кроме того, объект имеет свойство самоорганизации. Разум для оперативного управления должен строиться по типу естественного - с основными программами, зафиксированными в чувствах, и с СУТ, обеспечивающей относительно целесообразную реакцию в каждый данный момент. По всей вероятности, это должна быть семантическая сеть со всеми ее человеческими программами, включая сознание и творчество. Разумеется, средства восприятия объекта и воздействия на него будут различными. В медицине - это датчики, аппараты и лекарства, в психологии главное - слово, но наряду с ним также датчики и лекарства, в обществе на входах - статистика и анализ производства, потребления, психики граждан, на выходах - управление производством и воспитанием.
Второй тип - разум-память, вместилище различного рода сведений и система их выборки для сообщения людям или перевода в память оперативного разума. Уже сейчас разработана техника хранения колоссальных объемов информации. Как мне кажется, в будущем совершенствование ее пойдет по нескольким направлениям. Во-первых, изменится язык науки. Качественные - словесные - модели уступят место количественным - структурным и математическим. В конечном итоге любую сложную систему можно представить в виде структуры и характеристик ее элементов, точных или вероятностных. Как уже говорилось, возможно множество подобных моделей и целая иерархия обобщенных и частных. Сейчас все они выражаются словами с добавлением цифр и рисунков. В будущем их станут кодировать цифрами. Разумеется, сохранятся программы считывания информации словесным кодом - для людей. Надо полагать, что разум-память построят по алгоритмическому, а не по сетевому принципу. Выборка будет осуществляться через многочисленные автоматические каталоги - наборы моделей высших этажей и качеств. Вероятно, эта система будет связана с обычными библиотеками на микрофильмах.
Видимо, возможны и другие типы разума с различной спецификой программы и техники. Например, мне кажется интересным аналитический разум - моделирующая установка, предназначенная для создания "действующих" моделей систем разных этажей сложности. Не знаю, построят ли их по аналоговому или цифровому принципу либо это будет гибрид со стандартизированными аналоговыми блоками, объединенными в разных отношениях на базе цифровой машины.
Еще один тип - синтетический разум, "машина творчества". Возможно искусственное воспроизведение программы создания новых моделей, как и любой другой. Стимулом для творчества может быть удовольствие от процесса поиска и его успешных результатов. Задание для новых произведений представляет собой обобщенные модели смысла и качеств высших этажей. Общий алгоритм решения творческих задач известен. Дело сводится к поиску нужных деталей, причем иногда из совершенно необычной сферы фактов. Я думаю, этот процесс вполне доступен искусственному разуму, имеющему в своем распоряжении огромный материал моделей из разных областей знания.
Оперативный разум может объединять все другие типы, используя их как вспомогательные для анализа объектов управления, синтеза новых воздействий и фиксирования в памяти всего необходимого фактического материала. По всей вероятности, коллективная деятельность нескольких или даже многих искусственных разумов окажется гораздо эффективней, чем совместная работа людей. Дело в том, что в отличие от качественного - словесного - языка людей у машин будет единый количественный язык моделей. Это упростит и ускорит общение между машинами, хотя влияние индивидуальности и субъективности останется, поскольку запрограммированы чувства и самоорганизация. У человека медленно и ограниченно обучение, затруднено обращение к коллективной памяти - книгам. Все это упростится при машинных формах переработки информации. Особенно важен новый язык науки - язык структурных действующих моделей и возможность быстрого считывания их электрическими сигналами.
Проблема роботов-автоматов, способных выполнять функции человека, тесно соприкасается с моделированием психики. По существу робот - это разум плюс органы чувств и движения. О разуме уже достаточно говорилось. Его можно воспроизвести в разных вариантах сложности, с разными программами. На первый взгляд кажется, что создать глаз, руку или гортань гораздо проще, чем мозг, поскольку эти органы есть у всех животных. Но и это тоже оказалось очень трудным. Однако нет сомнения в том, что соответствующие конструкции будут созданы. Тогда все дело решит технология. Можно ожидать огромного разнообразия этих машин, еще большего, чем разнообразие организмов. Мыслится производство роботов по любым заданиям - специализированных, универсальных, все более совершенных по форме и функциям. У них будет важное преимущество перед животными - связь через радио и единый язык для общения.
Я не хочу фантазировать об устройстве общества будущего и влиянии на него техники, включая разумные машины. Уверен, что эти влияния могут стать определяющими не только в материальной жизни, но и в психике. В частности, искусственный разум изменит состояние обучения и воспитания детей, медицины, управления в любых сферах, регулирования психики и внедрится во все области науки. Однако во всем, что я перечислил до сих пор, искусственный разум выступит в качестве вспомогательного орудия для человека в области переработки информации, как это было до недавнего времени с энергией. Разумные машины будут служить обществу.
К сожалению, можно предположить и другие аспекты проблемы, которые нуждаются в обсуждении уже сейчас. Их по крайней мере две.
Первое - ущерб человеку от внедрения искусственного разума в творчество. Не исключено, что придет время, и искусственный разум сможет не только конструировать машины, но писать стихи и музыку, открывать новые законы природы. Это повлечет за собой ослабление стимула творчества у людей.
Вторая проблема состоит в превращении искусственного разума, действующего по программам человека, в личность, имеющую собственные интересы, Я уже говорил о том, что нельзя выполнить разум без всяких чувств, так как ойи отражают степень эффективности в реализации поставленных целей. Минимальные чувства - добро и зло, приятное и неприятное. Этого уже достаточно, чтобы при наличии самоорганизации, то есть способности к созданию новых моделей, появились новые, производные чувства и новые, собственные цели деятельности. Личность тем и отличается от автомата, что имеет собственные интересы - потребности, цели, оценки. Искусственный разум неизбежно превратится в личность, как только у него будет воспроизведена самоорганизация.
Пределы независимости личности, границы ее возможного отличия от первоначально заданных программ - эти понятия имеют количественное выражение. Поведение одних людей остается в пределах преподанных воспитанием норм, другие люди выходят за эти границы - вплоть до преступлений против общества. Многое зависит от прочности воспитания и "воспитуемости" - индивидуальных свойств коры головного мозга и подкорки. Все эти качества будут задаваться и искусственному разуму, с тем чтобы они служили некоторой гарантией "лояльного" поведения в отношении людей (вспомним "Законы роботехники" А. Азимова!). Правда, гарантии относительные, и они тем меньше, чем выше уровень самоорганизации. В то же время поведение искусственной личности, даже если она будет умна, не обещает быть всегда "разумным". Вероятность ошибок остается, поскольку сохранится ограниченность познавательных возможностей и субъективность суждений.
Так возникает опасность не только ошибочного, но и злонамеренного поведения разумных машин в отношении людей. Опасность велика, если это касается машин, принимающих участие в управлении обществом даже в сфере чистой экономики.
Смогут ли люди ограничить развитие систем искусственного разума или, по крайней мере, держать их под контролем?
Боюсь, что ни то, ни другое невозможно.
Создание и совершенствование разума необходимо для целей познания и оптимального управления сложными системами - организмом, психикой, обществом. Человеческий мозг и традиционные средства переработки информации не могут обеспечить этого, особенно теперь, когда стремительно возрастающее разнообразие вещей и моделей догоняет разнообразие природы, требуя в то же время более активного управления. Развитие разума действительно необходимо, хотя и не обязательно до уровня высокой самоорганизации. Вся беда в том, что есть любознательность ученых - еще один психологический фактор, не позволяющий ограничить развитие любой науки.
Контроль над сложным искусственным разумом осуществить трудно. Конечно, можно выдавать на выход все его мысли, но прочесть их практически не удастся из-за сложности и, главное, обилия. Внутренние процессы в системах "машинного" регулирования будут недоступны контролю, когда речь идет о столь сложных программах, как управление обществом. Разумеется, внешние выходы в виде воздействий на людей будут доступны критике, как и при "ручном" управлении, но мнения людей разноречивы, а отказаться от машинного управления станет так же невозможно, как сейчас невозможно отказаться от электричества.
Еще один вопрос: размножение машин. Можно не сомневаться, что со временем люди овладеют биосинтезом и смогут воспроизвести биологические системы в их естественном виде. Но это уже иная проблема. Я не думаю, что развитие искусственного разума пойдет по этому пути. Человек имеет в своем распоряжении больше возможностей для создания новых сложных систем и едва ли будет пытаться повторить природу, тем более что она несовершенна. Вполне мыслима такая фабрика искусственных организмов - от примитивных роботов до сложнейших интеллектов,- которая сможет обойтись без помощи людей. Она не только обеспечит серийное производство, но и неограниченную "изменчивость", конструирование все новых видов с новыми качествами.
Разум находится на столбовой дороге развития мира, которое можно задержать, но не остановить. Следовательно, вопрос только в регулировании прогресса и в поиске новых решений проблемы человека в будущем мире.
Создание искусственного разума - вопрос только времени. Первое: люди овладели качеством СЛОЖНОСТЬ, научились создавать искусственные системы, по сложности приближающиеся к естественным. Следует надеяться, что они превзойдут этот уровень. Второе условие: ученые поняли, что выделение и переработка информации - модели и действия с ними - процесс объективный. Его можно воспроизвести отдельно от человека, в системах из неживых элементов, при условии их большой сложности. Этого достаточно. Естественный разум - только моделирующая установка из биологических элементов, обеспечивающая выделение и переработку информации. То же возможно воспроизвести искусственно.
Выше уже говорилось о многообразии разумов. Для любого объекта можно получить бесконечное множество моделей, имея разные программы моделирования. Природа создала огромное количество биологических видов, и каждый из них обладает способностью к выделению и переработке информации. У низших животных это осуществляется на уровне клеток, у высших - в нервной системе и особенно в коре головного мозга. Однако даже у высших животных кора остается только вычислительной машиной для тела, в котором заложены программы жизни. Лишь у человека она превратилась в орудие более высокой системы - общества. Многообразие естественных моделирующих установок доказывает, что можно создать разум лучше человеческого.
Главный недостаток человеческого разума- ограниченность. Ограничен объем памяти, мала скорость переработки информации, очень медленно обучение, трудны вспоминание и выборка.
Другой, не менее важный недостаток - искажения. Природа и степень их различны. Прежде всего, искажения - неизбежный спутник всякого моделирования. Для того чтобы упростить сложный объект до модели, обязательно нужно опустить какие-то детали, причем никогда нельзя быть уверенным в том, что опущенное неважно. Моделирование всегда предполагает цель - "для чего?", и эта цель определяет отбор второстепенных деталей. У человека это выражается искажениями вследствие субъективности, так как именно чувства являются выразителями "для чего?". Чувства изменяют матрицы, модели-эталоны, с которыми сравнивается модель во временной памяти, составленная при восприятии внешнего мира. Чем ярче чувства, тем больше возможная степень искажения.
Но это еще не все. Основная программа мозга заключается в том, что внешняя картина воспринимается поочередной концентрацией внимания-усиления на ее деталях. Степень усиления неравномерна, зависит от его периодического ослабления при утомлении, от чувств, отражающих важность той или иной детали для человека в данный момент. В памяти запечатлевается последовательность восприятия деталей картины, но сами они неравноценны, имеют разный "вес" и искажают действительность, когда человек пытается представить картину перед своим внутренним взором. Кроме того, человек просто не может увидеть сложность сразу, он должен представлять ее поочередным вспоминанием частностей. Все это делает модели качественными. Конечно, это как раз то, что нужно было человеку раньше (как и животному), чтобы в каждый момент реагировать на наиболее важный раздражитель. Объективная истина для животного цены не имеет. Она понадобилась обществу, поскольку необходима для воспроизведения системы. (Между прочим, жесткие программы на клеточном уровне, по которым происходит размножение, отражают объективную истину, так как неопределенности нет места в генетическом коде).
Можно ли создать разум лучше человеческого?
Конечно. Природа богата и разнообразна, но ее возможности построения более совершенных систем далеко не исчерпаны. Мыслится создание моделирующих установок, лишенных многих недостатков мозга.
Прежде всего: системы будут разные. Можно предположить несколько типов разума.
Оперативный разум для управления сложными системами (например, лечение больного, воспитание человека, управление обществом). Во всех этих случаях (с возрастанием степени сложности) нельзя предусмотреть жесткую систему управления, поскольку сложность объекта значительно превышает сложность возможных моделей и, кроме того, объект имеет свойство самоорганизации. Разум для оперативного управления должен строиться по типу естественного - с основными программами, зафиксированными в чувствах, и с СУТ, обеспечивающей относительно целесообразную реакцию в каждый данный момент. По всей вероятности, это должна быть семантическая сеть со всеми ее человеческими программами, включая сознание и творчество. Разумеется, средства восприятия объекта и воздействия на него будут различными. В медицине - это датчики, аппараты и лекарства, в психологии главное - слово, но наряду с ним также датчики и лекарства, в обществе на входах - статистика и анализ производства, потребления, психики граждан, на выходах - управление производством и воспитанием.
Второй тип - разум-память, вместилище различного рода сведений и система их выборки для сообщения людям или перевода в память оперативного разума. Уже сейчас разработана техника хранения колоссальных объемов информации. Как мне кажется, в будущем совершенствование ее пойдет по нескольким направлениям. Во-первых, изменится язык науки. Качественные - словесные - модели уступят место количественным - структурным и математическим. В конечном итоге любую сложную систему можно представить в виде структуры и характеристик ее элементов, точных или вероятностных. Как уже говорилось, возможно множество подобных моделей и целая иерархия обобщенных и частных. Сейчас все они выражаются словами с добавлением цифр и рисунков. В будущем их станут кодировать цифрами. Разумеется, сохранятся программы считывания информации словесным кодом - для людей. Надо полагать, что разум-память построят по алгоритмическому, а не по сетевому принципу. Выборка будет осуществляться через многочисленные автоматические каталоги - наборы моделей высших этажей и качеств. Вероятно, эта система будет связана с обычными библиотеками на микрофильмах.
Видимо, возможны и другие типы разума с различной спецификой программы и техники. Например, мне кажется интересным аналитический разум - моделирующая установка, предназначенная для создания "действующих" моделей систем разных этажей сложности. Не знаю, построят ли их по аналоговому или цифровому принципу либо это будет гибрид со стандартизированными аналоговыми блоками, объединенными в разных отношениях на базе цифровой машины.
Еще один тип - синтетический разум, "машина творчества". Возможно искусственное воспроизведение программы создания новых моделей, как и любой другой. Стимулом для творчества может быть удовольствие от процесса поиска и его успешных результатов. Задание для новых произведений представляет собой обобщенные модели смысла и качеств высших этажей. Общий алгоритм решения творческих задач известен. Дело сводится к поиску нужных деталей, причем иногда из совершенно необычной сферы фактов. Я думаю, этот процесс вполне доступен искусственному разуму, имеющему в своем распоряжении огромный материал моделей из разных областей знания.
Оперативный разум может объединять все другие типы, используя их как вспомогательные для анализа объектов управления, синтеза новых воздействий и фиксирования в памяти всего необходимого фактического материала. По всей вероятности, коллективная деятельность нескольких или даже многих искусственных разумов окажется гораздо эффективней, чем совместная работа людей. Дело в том, что в отличие от качественного - словесного - языка людей у машин будет единый количественный язык моделей. Это упростит и ускорит общение между машинами, хотя влияние индивидуальности и субъективности останется, поскольку запрограммированы чувства и самоорганизация. У человека медленно и ограниченно обучение, затруднено обращение к коллективной памяти - книгам. Все это упростится при машинных формах переработки информации. Особенно важен новый язык науки - язык структурных действующих моделей и возможность быстрого считывания их электрическими сигналами.
Проблема роботов-автоматов, способных выполнять функции человека, тесно соприкасается с моделированием психики. По существу робот - это разум плюс органы чувств и движения. О разуме уже достаточно говорилось. Его можно воспроизвести в разных вариантах сложности, с разными программами. На первый взгляд кажется, что создать глаз, руку или гортань гораздо проще, чем мозг, поскольку эти органы есть у всех животных. Но и это тоже оказалось очень трудным. Однако нет сомнения в том, что соответствующие конструкции будут созданы. Тогда все дело решит технология. Можно ожидать огромного разнообразия этих машин, еще большего, чем разнообразие организмов. Мыслится производство роботов по любым заданиям - специализированных, универсальных, все более совершенных по форме и функциям. У них будет важное преимущество перед животными - связь через радио и единый язык для общения.
Я не хочу фантазировать об устройстве общества будущего и влиянии на него техники, включая разумные машины. Уверен, что эти влияния могут стать определяющими не только в материальной жизни, но и в психике. В частности, искусственный разум изменит состояние обучения и воспитания детей, медицины, управления в любых сферах, регулирования психики и внедрится во все области науки. Однако во всем, что я перечислил до сих пор, искусственный разум выступит в качестве вспомогательного орудия для человека в области переработки информации, как это было до недавнего времени с энергией. Разумные машины будут служить обществу.
К сожалению, можно предположить и другие аспекты проблемы, которые нуждаются в обсуждении уже сейчас. Их по крайней мере две.
Первое - ущерб человеку от внедрения искусственного разума в творчество. Не исключено, что придет время, и искусственный разум сможет не только конструировать машины, но писать стихи и музыку, открывать новые законы природы. Это повлечет за собой ослабление стимула творчества у людей.
Вторая проблема состоит в превращении искусственного разума, действующего по программам человека, в личность, имеющую собственные интересы, Я уже говорил о том, что нельзя выполнить разум без всяких чувств, так как ойи отражают степень эффективности в реализации поставленных целей. Минимальные чувства - добро и зло, приятное и неприятное. Этого уже достаточно, чтобы при наличии самоорганизации, то есть способности к созданию новых моделей, появились новые, производные чувства и новые, собственные цели деятельности. Личность тем и отличается от автомата, что имеет собственные интересы - потребности, цели, оценки. Искусственный разум неизбежно превратится в личность, как только у него будет воспроизведена самоорганизация.
Пределы независимости личности, границы ее возможного отличия от первоначально заданных программ - эти понятия имеют количественное выражение. Поведение одних людей остается в пределах преподанных воспитанием норм, другие люди выходят за эти границы - вплоть до преступлений против общества. Многое зависит от прочности воспитания и "воспитуемости" - индивидуальных свойств коры головного мозга и подкорки. Все эти качества будут задаваться и искусственному разуму, с тем чтобы они служили некоторой гарантией "лояльного" поведения в отношении людей (вспомним "Законы роботехники" А. Азимова!). Правда, гарантии относительные, и они тем меньше, чем выше уровень самоорганизации. В то же время поведение искусственной личности, даже если она будет умна, не обещает быть всегда "разумным". Вероятность ошибок остается, поскольку сохранится ограниченность познавательных возможностей и субъективность суждений.
Так возникает опасность не только ошибочного, но и злонамеренного поведения разумных машин в отношении людей. Опасность велика, если это касается машин, принимающих участие в управлении обществом даже в сфере чистой экономики.
Смогут ли люди ограничить развитие систем искусственного разума или, по крайней мере, держать их под контролем?
Боюсь, что ни то, ни другое невозможно.
Создание и совершенствование разума необходимо для целей познания и оптимального управления сложными системами - организмом, психикой, обществом. Человеческий мозг и традиционные средства переработки информации не могут обеспечить этого, особенно теперь, когда стремительно возрастающее разнообразие вещей и моделей догоняет разнообразие природы, требуя в то же время более активного управления. Развитие разума действительно необходимо, хотя и не обязательно до уровня высокой самоорганизации. Вся беда в том, что есть любознательность ученых - еще один психологический фактор, не позволяющий ограничить развитие любой науки.
Контроль над сложным искусственным разумом осуществить трудно. Конечно, можно выдавать на выход все его мысли, но прочесть их практически не удастся из-за сложности и, главное, обилия. Внутренние процессы в системах "машинного" регулирования будут недоступны контролю, когда речь идет о столь сложных программах, как управление обществом. Разумеется, внешние выходы в виде воздействий на людей будут доступны критике, как и при "ручном" управлении, но мнения людей разноречивы, а отказаться от машинного управления станет так же невозможно, как сейчас невозможно отказаться от электричества.
Еще один вопрос: размножение машин. Можно не сомневаться, что со временем люди овладеют биосинтезом и смогут воспроизвести биологические системы в их естественном виде. Но это уже иная проблема. Я не думаю, что развитие искусственного разума пойдет по этому пути. Человек имеет в своем распоряжении больше возможностей для создания новых сложных систем и едва ли будет пытаться повторить природу, тем более что она несовершенна. Вполне мыслима такая фабрика искусственных организмов - от примитивных роботов до сложнейших интеллектов,- которая сможет обойтись без помощи людей. Она не только обеспечит серийное производство, но и неограниченную "изменчивость", конструирование все новых видов с новыми качествами.
Разум находится на столбовой дороге развития мира, которое можно задержать, но не остановить. Следовательно, вопрос только в регулировании прогресса и в поиске новых решений проблемы человека в будущем мире.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Н.М.АМОСОВ, А.М.КАСАТКИН, Л.М.КАСАТКИНА, С.А.ТАЛАЕВ
АВТОМАТЫ И РАЗУМНОЕ ПОВЕДЕНИЕ
ОПЫТ МОДЕЛИРОВАНИЯ
DJVU, 4.28Мб
ОТ АВТОРОВ
Искусственный разум - одна из наиболее интересных и волнующих проблем современной науки. Она имеет два аспекта - теоретический и прикладной. Целью теоретических исследований является разработка методов построения систем (физических или математических), которые, не уступая по эффективности человеческому мозгу, могли бы обеспечивать решение разнообразных сложных задач, не уступающих сложности задач, решаемых человеком. Речь идет не только о строго сформулированных на каком-либо формальном языке задачах, но и о задачах, представленных на содержательном уровне или выраженных средствами обычного разговорного языка. Исследования в этой области часто связаны с изучением структуры мыслительных процессов человека и широко используют данные психологии, нейрофизиологии и других наук о мозге. Разрабатывая искусственный разум, мы вынуждены расширять, углублять и делать конструктивными наши знания о разуме естественном.
В прикладном аспекте исследования по искусственному разуму составляют новый, высший, этап развития процессов автоматизации производственно-технической и интеллектуальной деятельности человека. Характерным для этого этапа является стремление автоматизировать наиболее сложные формы практической деятельности, относимые по традиции к проявлениям сугубо человеческих способностей. Таким образом, речь идет о построении машин, которые смогут эффективно заменить человека не только при выполнении монотонной н утомительной в физическом отношении работы, но и в деятельности по управлению сложными системами и процессами, принятию решений в трудно поддающихся обычному анализу ситуациях, конструированию, составлению прогнозов и т.п. В настоящее время этот процесс находится на начальной стадии развития. Дальнейшее его течение тесно связано с прогрессом в области теоретических исследований по искусственному разуму.
Широкий круг вопросов и перспективность исследований привлекли к проблеме искусственного разума специалистов различного профиля - математиков, инженеров, психологов и др. Первые серьезные исследования были проведены математиками и касались проблем автоматизации интеллектуальной деятельности человека при доказательстве теорем, решении игровых задач и т.п. Вскоре, однако, была осознана необходимость более широкой постановки задач. Стало понятно, что наиболее интересные и практически важные результаты могут быть получены только путем воспроизведения в автоматах неформальных приемов человеческого мышления. Для решения задач такого типа были широко использованы эвристические приемы и методы, которые остаются основным инструментом построения "разумных" автоматов до настоящего времени. Арсенал приемов такого рода весьма широк и включает как отдельные полезные эвристики (например, сокращающие перебор), так и хорошо организованные эвристические процедуры построения моделей (например, процедуру эвристического программирования). Классификация эвристических приемов пока, к сожалению, не разработана. Использование эвристических приемов и методов привело к новым интересным результатам. Однако в проведенных разработках "крен" в сторону воспроизведения функций с хорошо выраженной логической структурой сохранился. Никого сейчас особенно не удивит появление, например, еще одной программы классификации пли, скажем, решения формально-логических задач одного класса. Таких автоматов с "узко направленным интеллектом" создано достаточно много. В то же время воспроизведение менее формальных аспектов человеческой деятельности по-прежнему вызывает серьезные затруднения. Прежде всего это касается "обычных", простых, на первый взгляд, форм поведения. Однако структура решения таких "простых" задач на самом деле весьма сложна. Более того, мыслительные процессы, ответственные за их решение, составляют неотъемлемую часть процессов, организующих любое действительно сложное поведение человека.
В последние годы исследования по построению автоматов, ориентированных на решение задач упомянутого типа, широко развиваются в области конструирования роботов - автономных технических систем, снабженных устройствами, обеспечивающими непосредственное воздействие на окружающую среду. Получены важные и весьма эффектные результаты. В подавляющем большинстве случаев, однако, роботы конструируются для решения узких технических задач (обслуживание определенных станков, транспортировка деталей и т.п.) и способны работать лишь в средах с малым разнообразием. Центральными при построении роботов являются проблемы организации процессов восприятия информации о среде и построения на основе этой информации системы адекватных поведенческих реакций. Структуры, реализующие эти функции, составляют "мозг" робота, и именно при их разработке могут быть использованы данные о механизмах и структуре решения соответствующих задач человеком.
Таким образом, одна из актуальных задач в области исследований по искусственному разуму состоит в том, чтобы путем изучения и моделирования основных закономерностей человеческого мышления разработать методы синтеза автоматов, воспроизводящих разумную деятельность человека при его взаимодействии с естественной средой. Этой области и были посвящены исследования авторов книги, проводившиеся ими в течение ряда лет. В качестве конкретного объекта моделирования были избраны процессы формирования "двигательного" поведения - планирование и целенаправленное передвижение человека в естественной среде. Поведение такого рода связано с решением целого ряда задач неформального плана и рассматривается как характерный пример сложной целесообразной деятельности человека - деятельности, логическая структура которой выражена весьма слабо и проблема автоматизации которой является сейчас одной из наиболее актуальных проблем искусственного разума.
ЧАСТЬ ПЕРВАЯ. ЭВРИСТИЧЕСКИЕ МЕТОДЫ В ПРОБЛЕМЕ "ИСКУССТВЕННЫЙ РАЗУМ"
РАЗДЕЛ I. ИСКУССТВЕННЫЙ РАЗУМ И МОДЕЛИ РАЗУМНОГО ПОВЕДЕНИЯ ЧЕЛОВЕКА
Развитие кибернетики и вычислительной техники послужило стимулом к интенсивному развитию исследований в новых для точных наук областях знаний. Направления, связанные с использованием цифровых вычислительных машин (ЦВМ), возникли в психологии, нейрофизиологии, экономике и ряде других наук, где применение количественных методов сдерживалось до сих пор отсутствием адекватной техники. По мере своего развития эти направления обособлялись, формировали собственный понятийный и технический аппарат. Новые технические возможности влекли постановку новых задач. В то же время проявилась и общность между не связанными ранее областями исследований. Огромную роль в этом сыграл и развиваемый кибернетикой единый подход к изучению объектов различной природы.
Результатом всех перечисленных процессов явилась определенная перегруппировка традиционных направлений научных исследований. Оказались, например, тесно связанными область изучения нейрофизиологических образований в коре головного мозга, некоторые области формальной логики и область конструирования систем, обладающих высокой надежностью. Сложившаяся в последние десятилетия группа научных направлений, связанных с решением проблемы построения автоматов, способных к сложному, "разумному" поведению, составила основу нового, более общего направления, получившего название искусственный разум. Это название (будем пользоваться его сокращением - ИР) может быть использовано не только для обозначения определенного направления исследований. Говорят также о СИСТЕМАХ ИР, имея в виду "разумные" системы, разрабатываемые упомянутым направлением; о ПРОБЛЕМЕ ИР, как о проблеме, разрабатывающей принципы и технические приемы построения упомянутых систем; об ОБЛАСТИ ИР, имея в виду совокупность вопросов, прямо или косвенно связанных с решением упомянутой проблемы.
Мы полагаем, что существующее в настоящее время действительно сложное и плохо поддающееся анализу состояние разработок в области искусственного разума свидетельствует отнюдь не об отсутствии общей проблематики или надуманности самой проблемы. Напротив, эти трудности связаны с ее развитием и становлением. Усилия, которые прилагает множество исследователей к ее разработке, позволяют надеяться на то, что в недалеком будущем проблема благополучно преодолеет кризисный этап своего развития, приобретя четкую и ясную структуру.
До тех пор, однако, пока этого не произошло, оценка значимости выполненных работ вызывает определенные затруднения. Поэтому, предлагая на суд читателей полученные нами результаты, мы считаем необходимым предпослать основному содержанию книги изложение нашего взгляда на проблему ИР. Это изложение не будет носить обзорного характера - мы стремились лишь наметить границы той области, в которой проводились исследования, и указать в том виде, как нам это представляется, возможные связи с другими направлениями исследований по проблеме.
ГЛАВА 1. ПРОБЛЕМА "ИСКУССТВЕННЫЙ РАЗУМ"
Мы рассматриваем ИР как одно из направлений более широкой и развитой проблемы - проблемы автоматизации. Автоматизация того или иного объекта всегда является таким процессом, при котором функции, выполнявшиеся ранее человеком, передаются различного рода техническим устройствам. Проблемы автоматизации есть, следовательно, проблемы разработки теоретических принципов и практических методов построения устройств, способных в заранее заданных конкретных условиях организовывать поведение, в некотором смысле эквивалентное поведению находящегося в таких же условиях человека. Уточним сказанное.
Говоря о поведении, мы использовали этот термин в узком смысле, обозначая им упорядоченную во времени и пространстве совокупность операций, выполняемых человеком или машиной и непосредственно направленных на изменение окружающей среды.
Операции, выполняемые техническим устройством, должны обеспечить тот же результат, что и в случае целенаправленной деятельности человека. При этом системы операций, выполняемые человеком и машиной, могут быть различными как в отношении их пространственно-временной организации, так и в отношении характера отдельных операций. При автоматизации требуется лишь функциональная эквивалентность поведений человека и машины, т.е. совпадение конечных результатов поведения в обоих рассматриваемых случаях. Именно в смысле такой функциональной эквивалентности говорят о машинах, управляющих различными процессами, решающих задачи и т.п.
Естественно, что функциональная эквивалентность поведений человека и машины может быть достигнута только в рамках каким-то образом ограниченных конкретных условий. Конкретные условия, в которых организуется целенаправленное поведение человека или машины, определяются, прежде всего, объемом и сложностью решаемых задач.
#1. ЗАДАЧИ АВТОМАТИЗАЦИИ РАЗУМНОЙ ДЕЯТЕЛЬНОСТИ
Попытки автоматизации сложных видов человеческой деятельности показали, что современный аппарат теории автоматического управления недостаточно эффективен. Возможны различные пути преодоления существующих здесь трудностей. Вокруг одного из них и объединены усилия исследователей. В самом общем виде используемый ими подход можно охарактеризовать следующим образом.
Рассматривается поведение человека, обеспечивающее достижение поставленной цели в определенной среде. Так как методы синтеза искусственных устройств с функционально эквивалентным поведением не разработаны, то относительно возможного вида и свойств таких искусственных устройств заранее можно сказать очень мало. В природе, однако, существует система, решающая нужные задачи,- человек. Его, следовательно, можно рассматривать в качестве "прототипа" искомого устройства.
Такой подход развивается в настоящее время рядом направлении. Последние разделяются обычно по характеру решаемых ими задач. Так, говорят о направлениях, исследующих проблемы распознавания образов, решения интеллектуальных задач (доказательство теорем, математические задачи, игры), автоматического перевода и др. Можно проводить и более детальную классификацию, выделяя в качестве отдельных направлений в области ИР работы по решению еще более узких классов задач, например: распознавание букв фиксированного алфавита, доказательство геометрических теорем и т.п. Такие классификации в ряде случаев оказываются весьма полезными. Однако при рассмотрении проблемы ИР в целом более важно фиксировать не классы задач, решаемых в рамках тех или иных конкретных направлений, а особенности реализуемых этими направлениями исследований, т.е. особенности практического использования ими знаний о человеке при построении автоматических систем. Поэтому здесь и в дальнейшем мы не будем рассматривать специфику решения частных задач ИР. Нас будут интересовать те общие черты, которые характерны для различных направлений, те принципы синтеза "разумных" автоматов, которые объединяют многообразные работы по ИР в самостоятельную область научных исследований.
Укажем теперь некоторые особенности, характеризующие проблему ИР в целом. В принципе - это ПРИКЛАДНАЯ, ТЕХНИЧЕСКАЯ проблема, поскольку окончательным результатом проводимых в ее рамках исследований является не решение задач познавательного характера, а разработка тех или иных технических устройств автоматизации сложной деятельности человека. Отличительный признак этой проблемы - ее направленность на ИССЛЕДОВАНИЕ ЧЕЛОВЕКА И ЧЕЛОВЕЧЕСКОЙ ДЕЯТЕЛЬНОСТИ как прототипов разрабатываемых систем. Основным требованием к разрабатываемым системам является функциональная эквивалентность поведения технических устройств и поведения человека в определяемом заранее классе внешних условий. Поскольку в рамках ИР рассматривается, как правило, достаточно сложное поведение человека и машин, последнее требование часто формулируется как требование разумности поведения технических устройств. Наконец, проблема ИР имеет комплексный характер, что естественным образом следует из ее основных особенностей. Действительно, решая задачи автоматизации в самых различных областях научно-производственной деятельности, разработчики ИР в каждом отдельном случае должны максимально использовать сведения, имеющиеся в соответствующей конкретной области. С другой стороны, рассматривая человека в качестве прототипа своих систем, разработчики неизбежно вступают в контакт с целым рядом конкретных наук, изучающих человека.
Имея в виду изложенные особенности, мы можем с большим, чем ранее, основанием говорить об искусственном разуме как о самостоятельной научной проблеме. Составляя одно из направлений автоматизации, проблема ИР в качестве своей основной задачи рассматривает задачу построения устройств, способных автономно выполнять те или иные сложные функции. Проблема ИР, однако, развивает в этой области свой особый подход, в основе которого лежит многостороннее и последовательное изучение человека, его поведения. Ясно, что при таком подходе ставятся специфичные задачи и выполняются исследования, не характерные ни для одной из традиционных технических областей. Этот подход, этот комплекс своеобразных проблем и выделяют ИР как обособленное научно-техническое направление.
#2. О СТРУКТУРЕ ПРОБЛЕМЫ
Рассматривая структуру проблемы ИР, следует, видимо, воспользоваться наиболее общим и традиционным разделением всех изучаемых в ней вопросов на теоретические и технические.
В теории ИР, как и в теориях многих других наук, можно условно выделить две части. Одна из них разрабатывает формальные средства описания, языки и математический аппарат, обслуживающие проблему в целом. В настоящее время эта часть теории ИР развивается в рамках более обширной области языка и аппаратных средств кибернетики. Другую часть теории составляют содержательные представления, используемые в данной области. Здесь разрабатываются принципы, категории и понятийный аппарат проблемы ИР. Именно в этой части теории сформулированы основные взгляды на проблему и подходы к изучению человека как прототипа автоматических систем управления. Некоторые из вопросов содержательной теории ИР и будут рассмотрены в настоящем разделе.
Известно, что процесс решения задач автоматизации может быть в общем случае разделен на три последовательных этапа: составление описания объекта управления, задание критериев управления или функций цели и, наконец, разработка на этой основе общей стратегии управления и правил принятия конкретных решений. В дальнейшем задача сводится к построению технических средств, вырабатывающих управляющие воздействия в соответствии с найденными правилами.
При автоматизации управления сложными системами реализация каждого из этапов решения задачи связана с существенными трудностями. Именно эти трудности и пытаются разрешить, обращаясь к изучению человека.
Изучая физиологию и психику человека, мы, к сожалению, еще не в состоянии выделить и использовать при решении технических задач те принципы, тот "внутренний язык", с помощью которых мозг решает каждую из основных задач управления: составление описания объекта, формирование цели, синтез правил или алгоритмов принятия решений. Можно, однако, не задаваясь вопросом о способах решения мозгом каждой из упомянутых задач в отдельности, исследовать целостные нервные или информационные механизмы и структуры, порождающие поведение человека.
Одна из важных особенностей этого подхода состоит в следующем.
Любое исследование связано с выдвижением некоторых гипотез, объясняющих известные факты, и с последующей экспериментальной проверкой вытекающих из этих гипотез предсказаний. В случае исследования сложных объектов (а человеческое поведение, несомненно, является таковым) эта схема нарушается. Возникающие здесь трудности связаны с тем обстоятельством, что достаточно интересные и содержательные гипотезы о сложных системах сами неизбежно являются сложными системами высказываний. А это означает, что выведение проверяемых следствий из таких гипотез является трудной задачей, требующей для своего решения развития специальных методов и средств. Принципиальное решение этой задачи уже найдено современной наукой. Оно состоит в том, что проверяемая гипотеза, сформулированная в конструктивном виде, подвергается моделированию, как правило, с помощью ЦВМ.
Модель гипотезы, таким образом, "отчуждается" от субъективных и ограниченных авторских оценок и может явиться объектом тщательного и независимого исследования.
Результаты экспериментов с моделью и составляют, по существу, полную систему предсказаний, вытекающих из предположений и допущений, входящих в исходную гипотезу. В случае, если предсказания модели совпадают с известными или полученными в ходе специальных экспериментов данными, гипотеза может считаться правомерной. В противном случае гипотеза корректируется, в ее модель вносятся изменения и проверка повторяется.
Существенно, что на этом пути могут быть получены подтверждения лишь ПРАВОМЕРНОСТИ гипотезы. Истинность же ее может быть установлена только в ходе проверки каждого из составляющих гипотезу предположений путем непосредственного исследования объекта. Это связано с тем обстоятельством, что всякое поведение, всякая система наблюдаемых признаков могут, как правило, порождаться различными внутренними механизмами объекта. Иными словами, всегда может существовать некоторое множество гипотез, удовлетворительно объясняющих данную совокупность эмпирических фактов. Процедура модельной проверки гипотез может быть построена таким образом, чтобы выявлять их сравнительную "силу". Это позволяет рассматривать лишь наиболее удачные из множества правомерных гипотез.
При конструировании сложных моделей поведения человека неизбежно придется создавать различного рода объяснительные или описательные гипотезы и, следовательно, использовать для их проверки модельный метод. Спецификой работы является то, что мы не стремимся к установлению истинности выдвигаемых гипотез; ДЛЯ ПРОБЛЕМЫ ИР ДОСТАТОЧНО, ЧТОБЫ ЭТИ ГИПОТЕЗЫ БЫЛИ ПРАВОМЕРНЫ. В самом деле, определенная ранее особенность работ по ИР состоит в требовании только функциональной эквивалентности поведений человека и разрабатываемых устройств. А это означает, что для решения практических задач могут быть использованы модели любых правомерных гипотез, поскольку признаком их правомерности как раз и является совпадение поведений модели и рассматриваемого объекта.
Таким образом, исследуя поведение человека с целью создания искусственного разума, мы имеем возможность самым широким образом использовать при построении рабочих гипотез различного рода данные, имеющиеся в конкретных науках, правдоподобные аналогии, удобные предположения, упрощения и т.п. При этом можно исключать из рассмотрения неудовлетворительные и отбирать лучшие варианты гипотез путем исследования поведения их вычислительных моделей.
Дальнейшее рассмотрение вопросов содержательной теории ИР будет проведено ниже, при описании основных направлений в моделировании поведения. А пока завершим краткое обсуждение общей структуры проблемы упоминанием о технических средствах реализации систем ИР.
Одним из наиболее распространенных способов реализации систем искусственного разума является их представление в виде программ для ЦВМ. Широкое использование этого способа обусловлено тем, что в качестве технических средств реализации сложных информационных моделей ЦВМ обладают рядом ценных свойств. Важнейшим из них является алгоритмическая универсальность.
Принципиальный недостаток цифровых вычислительных машин - последовательный способ их действия. Недостаток этот проявляется при реализации на ЦВМ моделей большой сложности, имеющих, как правило, параллельные цепи. Вытягивание параллельных процессов "в цепочку", необходимое для их представления в ЦВМ, приводит не только к увеличению затрат машинного времени, но и к дополнительным затратам памяти для хранения промежуточных результатов. В некоторых случаях такие непроизводительные затраты становятся недопустимо большими и могут полностью обесценить преимущества ЦВМ.
Перспективы использования ЦВМ для реализации систем ИР связаны, прежде всего, с дальнейшим совершенствованием вычислительной техники и средств математического обеспечения. Большое значение для развития ИР будет иметь, в частности, создание машин пятого поколения, обладающих значительными объемами оперативной памяти н обеспечивающих реализацию параллельных процессов переработки информации. В настоящее время развитие работ по ИР тесно связано с прогрессом в разработке специальных технических средств моделирования, ориентированных на реализацию в них параллельных процессов. Арсенал средств такого рода велик и представлен прежде всего электронной техникой. Для решения некоторых задач моделирования оказывается целесообразным применение устройств, принцип действия которых основан на использовании свойств физико-химических процессов, протекающих в растворах, коллоидах и т.п. (например, управляемые элементы с памятью - различного рода химотроны, мемисторы и др.). Широко используются также комбинированные системы, содержащие цифровую и аналоговую части. При этом аналоговая часть, реализованная с помощью электронных схем и специальных устройств, предназначается для модельного представления параллельно протекающих процессов, цифровая - для логических и вычислительных операций, имеющих последовательный характер. Использование комплексов такого рода оказывается, как правило, весьма эффективным. Возникающие здесь специфические задачи связаны с организацией взаимодействия между цифровыми и аналоговыми частями устройства.
Таким образом, развитие техники ИР находится в тесной связи с прогрессом в области электроники и вычислительной техники. В области ИР, однако, создан и ряд специальных средств, учитывающих особенности работ по построению сложных моделей. К таким средствам можно отнести специализированные алгоритмические языки (типа IPL), физические элементы, используемые при моделировании нейронных сетей, и т.п. В целом же проблема ИР оказывается в состоянии как ассимилировать новые достижения техники, полученные в других областях (например, топографическая и лазерная техника используются для моделирования памяти), так и со своей стороны оказывать влияние на их развитие, предъявляя свои требования к разрабатываемым устройствам и выдвигая новые идеи их построения. Такого рода взаимное обогащение способствует дальнейшему развитию исследований по проблеме ИР.
АВТОМАТЫ И РАЗУМНОЕ ПОВЕДЕНИЕ
ОПЫТ МОДЕЛИРОВАНИЯ
DJVU, 4.28Мб
ОТ АВТОРОВ
Искусственный разум - одна из наиболее интересных и волнующих проблем современной науки. Она имеет два аспекта - теоретический и прикладной. Целью теоретических исследований является разработка методов построения систем (физических или математических), которые, не уступая по эффективности человеческому мозгу, могли бы обеспечивать решение разнообразных сложных задач, не уступающих сложности задач, решаемых человеком. Речь идет не только о строго сформулированных на каком-либо формальном языке задачах, но и о задачах, представленных на содержательном уровне или выраженных средствами обычного разговорного языка. Исследования в этой области часто связаны с изучением структуры мыслительных процессов человека и широко используют данные психологии, нейрофизиологии и других наук о мозге. Разрабатывая искусственный разум, мы вынуждены расширять, углублять и делать конструктивными наши знания о разуме естественном.
В прикладном аспекте исследования по искусственному разуму составляют новый, высший, этап развития процессов автоматизации производственно-технической и интеллектуальной деятельности человека. Характерным для этого этапа является стремление автоматизировать наиболее сложные формы практической деятельности, относимые по традиции к проявлениям сугубо человеческих способностей. Таким образом, речь идет о построении машин, которые смогут эффективно заменить человека не только при выполнении монотонной н утомительной в физическом отношении работы, но и в деятельности по управлению сложными системами и процессами, принятию решений в трудно поддающихся обычному анализу ситуациях, конструированию, составлению прогнозов и т.п. В настоящее время этот процесс находится на начальной стадии развития. Дальнейшее его течение тесно связано с прогрессом в области теоретических исследований по искусственному разуму.
Широкий круг вопросов и перспективность исследований привлекли к проблеме искусственного разума специалистов различного профиля - математиков, инженеров, психологов и др. Первые серьезные исследования были проведены математиками и касались проблем автоматизации интеллектуальной деятельности человека при доказательстве теорем, решении игровых задач и т.п. Вскоре, однако, была осознана необходимость более широкой постановки задач. Стало понятно, что наиболее интересные и практически важные результаты могут быть получены только путем воспроизведения в автоматах неформальных приемов человеческого мышления. Для решения задач такого типа были широко использованы эвристические приемы и методы, которые остаются основным инструментом построения "разумных" автоматов до настоящего времени. Арсенал приемов такого рода весьма широк и включает как отдельные полезные эвристики (например, сокращающие перебор), так и хорошо организованные эвристические процедуры построения моделей (например, процедуру эвристического программирования). Классификация эвристических приемов пока, к сожалению, не разработана. Использование эвристических приемов и методов привело к новым интересным результатам. Однако в проведенных разработках "крен" в сторону воспроизведения функций с хорошо выраженной логической структурой сохранился. Никого сейчас особенно не удивит появление, например, еще одной программы классификации пли, скажем, решения формально-логических задач одного класса. Таких автоматов с "узко направленным интеллектом" создано достаточно много. В то же время воспроизведение менее формальных аспектов человеческой деятельности по-прежнему вызывает серьезные затруднения. Прежде всего это касается "обычных", простых, на первый взгляд, форм поведения. Однако структура решения таких "простых" задач на самом деле весьма сложна. Более того, мыслительные процессы, ответственные за их решение, составляют неотъемлемую часть процессов, организующих любое действительно сложное поведение человека.
В последние годы исследования по построению автоматов, ориентированных на решение задач упомянутого типа, широко развиваются в области конструирования роботов - автономных технических систем, снабженных устройствами, обеспечивающими непосредственное воздействие на окружающую среду. Получены важные и весьма эффектные результаты. В подавляющем большинстве случаев, однако, роботы конструируются для решения узких технических задач (обслуживание определенных станков, транспортировка деталей и т.п.) и способны работать лишь в средах с малым разнообразием. Центральными при построении роботов являются проблемы организации процессов восприятия информации о среде и построения на основе этой информации системы адекватных поведенческих реакций. Структуры, реализующие эти функции, составляют "мозг" робота, и именно при их разработке могут быть использованы данные о механизмах и структуре решения соответствующих задач человеком.
Таким образом, одна из актуальных задач в области исследований по искусственному разуму состоит в том, чтобы путем изучения и моделирования основных закономерностей человеческого мышления разработать методы синтеза автоматов, воспроизводящих разумную деятельность человека при его взаимодействии с естественной средой. Этой области и были посвящены исследования авторов книги, проводившиеся ими в течение ряда лет. В качестве конкретного объекта моделирования были избраны процессы формирования "двигательного" поведения - планирование и целенаправленное передвижение человека в естественной среде. Поведение такого рода связано с решением целого ряда задач неформального плана и рассматривается как характерный пример сложной целесообразной деятельности человека - деятельности, логическая структура которой выражена весьма слабо и проблема автоматизации которой является сейчас одной из наиболее актуальных проблем искусственного разума.
ЧАСТЬ ПЕРВАЯ. ЭВРИСТИЧЕСКИЕ МЕТОДЫ В ПРОБЛЕМЕ "ИСКУССТВЕННЫЙ РАЗУМ"
РАЗДЕЛ I. ИСКУССТВЕННЫЙ РАЗУМ И МОДЕЛИ РАЗУМНОГО ПОВЕДЕНИЯ ЧЕЛОВЕКА
Развитие кибернетики и вычислительной техники послужило стимулом к интенсивному развитию исследований в новых для точных наук областях знаний. Направления, связанные с использованием цифровых вычислительных машин (ЦВМ), возникли в психологии, нейрофизиологии, экономике и ряде других наук, где применение количественных методов сдерживалось до сих пор отсутствием адекватной техники. По мере своего развития эти направления обособлялись, формировали собственный понятийный и технический аппарат. Новые технические возможности влекли постановку новых задач. В то же время проявилась и общность между не связанными ранее областями исследований. Огромную роль в этом сыграл и развиваемый кибернетикой единый подход к изучению объектов различной природы.
Результатом всех перечисленных процессов явилась определенная перегруппировка традиционных направлений научных исследований. Оказались, например, тесно связанными область изучения нейрофизиологических образований в коре головного мозга, некоторые области формальной логики и область конструирования систем, обладающих высокой надежностью. Сложившаяся в последние десятилетия группа научных направлений, связанных с решением проблемы построения автоматов, способных к сложному, "разумному" поведению, составила основу нового, более общего направления, получившего название искусственный разум. Это название (будем пользоваться его сокращением - ИР) может быть использовано не только для обозначения определенного направления исследований. Говорят также о СИСТЕМАХ ИР, имея в виду "разумные" системы, разрабатываемые упомянутым направлением; о ПРОБЛЕМЕ ИР, как о проблеме, разрабатывающей принципы и технические приемы построения упомянутых систем; об ОБЛАСТИ ИР, имея в виду совокупность вопросов, прямо или косвенно связанных с решением упомянутой проблемы.
Мы полагаем, что существующее в настоящее время действительно сложное и плохо поддающееся анализу состояние разработок в области искусственного разума свидетельствует отнюдь не об отсутствии общей проблематики или надуманности самой проблемы. Напротив, эти трудности связаны с ее развитием и становлением. Усилия, которые прилагает множество исследователей к ее разработке, позволяют надеяться на то, что в недалеком будущем проблема благополучно преодолеет кризисный этап своего развития, приобретя четкую и ясную структуру.
До тех пор, однако, пока этого не произошло, оценка значимости выполненных работ вызывает определенные затруднения. Поэтому, предлагая на суд читателей полученные нами результаты, мы считаем необходимым предпослать основному содержанию книги изложение нашего взгляда на проблему ИР. Это изложение не будет носить обзорного характера - мы стремились лишь наметить границы той области, в которой проводились исследования, и указать в том виде, как нам это представляется, возможные связи с другими направлениями исследований по проблеме.
ГЛАВА 1. ПРОБЛЕМА "ИСКУССТВЕННЫЙ РАЗУМ"
Мы рассматриваем ИР как одно из направлений более широкой и развитой проблемы - проблемы автоматизации. Автоматизация того или иного объекта всегда является таким процессом, при котором функции, выполнявшиеся ранее человеком, передаются различного рода техническим устройствам. Проблемы автоматизации есть, следовательно, проблемы разработки теоретических принципов и практических методов построения устройств, способных в заранее заданных конкретных условиях организовывать поведение, в некотором смысле эквивалентное поведению находящегося в таких же условиях человека. Уточним сказанное.
Говоря о поведении, мы использовали этот термин в узком смысле, обозначая им упорядоченную во времени и пространстве совокупность операций, выполняемых человеком или машиной и непосредственно направленных на изменение окружающей среды.
Операции, выполняемые техническим устройством, должны обеспечить тот же результат, что и в случае целенаправленной деятельности человека. При этом системы операций, выполняемые человеком и машиной, могут быть различными как в отношении их пространственно-временной организации, так и в отношении характера отдельных операций. При автоматизации требуется лишь функциональная эквивалентность поведений человека и машины, т.е. совпадение конечных результатов поведения в обоих рассматриваемых случаях. Именно в смысле такой функциональной эквивалентности говорят о машинах, управляющих различными процессами, решающих задачи и т.п.
Естественно, что функциональная эквивалентность поведений человека и машины может быть достигнута только в рамках каким-то образом ограниченных конкретных условий. Конкретные условия, в которых организуется целенаправленное поведение человека или машины, определяются, прежде всего, объемом и сложностью решаемых задач.
#1. ЗАДАЧИ АВТОМАТИЗАЦИИ РАЗУМНОЙ ДЕЯТЕЛЬНОСТИ
Попытки автоматизации сложных видов человеческой деятельности показали, что современный аппарат теории автоматического управления недостаточно эффективен. Возможны различные пути преодоления существующих здесь трудностей. Вокруг одного из них и объединены усилия исследователей. В самом общем виде используемый ими подход можно охарактеризовать следующим образом.
Рассматривается поведение человека, обеспечивающее достижение поставленной цели в определенной среде. Так как методы синтеза искусственных устройств с функционально эквивалентным поведением не разработаны, то относительно возможного вида и свойств таких искусственных устройств заранее можно сказать очень мало. В природе, однако, существует система, решающая нужные задачи,- человек. Его, следовательно, можно рассматривать в качестве "прототипа" искомого устройства.
Такой подход развивается в настоящее время рядом направлении. Последние разделяются обычно по характеру решаемых ими задач. Так, говорят о направлениях, исследующих проблемы распознавания образов, решения интеллектуальных задач (доказательство теорем, математические задачи, игры), автоматического перевода и др. Можно проводить и более детальную классификацию, выделяя в качестве отдельных направлений в области ИР работы по решению еще более узких классов задач, например: распознавание букв фиксированного алфавита, доказательство геометрических теорем и т.п. Такие классификации в ряде случаев оказываются весьма полезными. Однако при рассмотрении проблемы ИР в целом более важно фиксировать не классы задач, решаемых в рамках тех или иных конкретных направлений, а особенности реализуемых этими направлениями исследований, т.е. особенности практического использования ими знаний о человеке при построении автоматических систем. Поэтому здесь и в дальнейшем мы не будем рассматривать специфику решения частных задач ИР. Нас будут интересовать те общие черты, которые характерны для различных направлений, те принципы синтеза "разумных" автоматов, которые объединяют многообразные работы по ИР в самостоятельную область научных исследований.
Укажем теперь некоторые особенности, характеризующие проблему ИР в целом. В принципе - это ПРИКЛАДНАЯ, ТЕХНИЧЕСКАЯ проблема, поскольку окончательным результатом проводимых в ее рамках исследований является не решение задач познавательного характера, а разработка тех или иных технических устройств автоматизации сложной деятельности человека. Отличительный признак этой проблемы - ее направленность на ИССЛЕДОВАНИЕ ЧЕЛОВЕКА И ЧЕЛОВЕЧЕСКОЙ ДЕЯТЕЛЬНОСТИ как прототипов разрабатываемых систем. Основным требованием к разрабатываемым системам является функциональная эквивалентность поведения технических устройств и поведения человека в определяемом заранее классе внешних условий. Поскольку в рамках ИР рассматривается, как правило, достаточно сложное поведение человека и машин, последнее требование часто формулируется как требование разумности поведения технических устройств. Наконец, проблема ИР имеет комплексный характер, что естественным образом следует из ее основных особенностей. Действительно, решая задачи автоматизации в самых различных областях научно-производственной деятельности, разработчики ИР в каждом отдельном случае должны максимально использовать сведения, имеющиеся в соответствующей конкретной области. С другой стороны, рассматривая человека в качестве прототипа своих систем, разработчики неизбежно вступают в контакт с целым рядом конкретных наук, изучающих человека.
Имея в виду изложенные особенности, мы можем с большим, чем ранее, основанием говорить об искусственном разуме как о самостоятельной научной проблеме. Составляя одно из направлений автоматизации, проблема ИР в качестве своей основной задачи рассматривает задачу построения устройств, способных автономно выполнять те или иные сложные функции. Проблема ИР, однако, развивает в этой области свой особый подход, в основе которого лежит многостороннее и последовательное изучение человека, его поведения. Ясно, что при таком подходе ставятся специфичные задачи и выполняются исследования, не характерные ни для одной из традиционных технических областей. Этот подход, этот комплекс своеобразных проблем и выделяют ИР как обособленное научно-техническое направление.
#2. О СТРУКТУРЕ ПРОБЛЕМЫ
Рассматривая структуру проблемы ИР, следует, видимо, воспользоваться наиболее общим и традиционным разделением всех изучаемых в ней вопросов на теоретические и технические.
В теории ИР, как и в теориях многих других наук, можно условно выделить две части. Одна из них разрабатывает формальные средства описания, языки и математический аппарат, обслуживающие проблему в целом. В настоящее время эта часть теории ИР развивается в рамках более обширной области языка и аппаратных средств кибернетики. Другую часть теории составляют содержательные представления, используемые в данной области. Здесь разрабатываются принципы, категории и понятийный аппарат проблемы ИР. Именно в этой части теории сформулированы основные взгляды на проблему и подходы к изучению человека как прототипа автоматических систем управления. Некоторые из вопросов содержательной теории ИР и будут рассмотрены в настоящем разделе.
Известно, что процесс решения задач автоматизации может быть в общем случае разделен на три последовательных этапа: составление описания объекта управления, задание критериев управления или функций цели и, наконец, разработка на этой основе общей стратегии управления и правил принятия конкретных решений. В дальнейшем задача сводится к построению технических средств, вырабатывающих управляющие воздействия в соответствии с найденными правилами.
При автоматизации управления сложными системами реализация каждого из этапов решения задачи связана с существенными трудностями. Именно эти трудности и пытаются разрешить, обращаясь к изучению человека.
Изучая физиологию и психику человека, мы, к сожалению, еще не в состоянии выделить и использовать при решении технических задач те принципы, тот "внутренний язык", с помощью которых мозг решает каждую из основных задач управления: составление описания объекта, формирование цели, синтез правил или алгоритмов принятия решений. Можно, однако, не задаваясь вопросом о способах решения мозгом каждой из упомянутых задач в отдельности, исследовать целостные нервные или информационные механизмы и структуры, порождающие поведение человека.
Одна из важных особенностей этого подхода состоит в следующем.
Любое исследование связано с выдвижением некоторых гипотез, объясняющих известные факты, и с последующей экспериментальной проверкой вытекающих из этих гипотез предсказаний. В случае исследования сложных объектов (а человеческое поведение, несомненно, является таковым) эта схема нарушается. Возникающие здесь трудности связаны с тем обстоятельством, что достаточно интересные и содержательные гипотезы о сложных системах сами неизбежно являются сложными системами высказываний. А это означает, что выведение проверяемых следствий из таких гипотез является трудной задачей, требующей для своего решения развития специальных методов и средств. Принципиальное решение этой задачи уже найдено современной наукой. Оно состоит в том, что проверяемая гипотеза, сформулированная в конструктивном виде, подвергается моделированию, как правило, с помощью ЦВМ.
Модель гипотезы, таким образом, "отчуждается" от субъективных и ограниченных авторских оценок и может явиться объектом тщательного и независимого исследования.
Результаты экспериментов с моделью и составляют, по существу, полную систему предсказаний, вытекающих из предположений и допущений, входящих в исходную гипотезу. В случае, если предсказания модели совпадают с известными или полученными в ходе специальных экспериментов данными, гипотеза может считаться правомерной. В противном случае гипотеза корректируется, в ее модель вносятся изменения и проверка повторяется.
Существенно, что на этом пути могут быть получены подтверждения лишь ПРАВОМЕРНОСТИ гипотезы. Истинность же ее может быть установлена только в ходе проверки каждого из составляющих гипотезу предположений путем непосредственного исследования объекта. Это связано с тем обстоятельством, что всякое поведение, всякая система наблюдаемых признаков могут, как правило, порождаться различными внутренними механизмами объекта. Иными словами, всегда может существовать некоторое множество гипотез, удовлетворительно объясняющих данную совокупность эмпирических фактов. Процедура модельной проверки гипотез может быть построена таким образом, чтобы выявлять их сравнительную "силу". Это позволяет рассматривать лишь наиболее удачные из множества правомерных гипотез.
При конструировании сложных моделей поведения человека неизбежно придется создавать различного рода объяснительные или описательные гипотезы и, следовательно, использовать для их проверки модельный метод. Спецификой работы является то, что мы не стремимся к установлению истинности выдвигаемых гипотез; ДЛЯ ПРОБЛЕМЫ ИР ДОСТАТОЧНО, ЧТОБЫ ЭТИ ГИПОТЕЗЫ БЫЛИ ПРАВОМЕРНЫ. В самом деле, определенная ранее особенность работ по ИР состоит в требовании только функциональной эквивалентности поведений человека и разрабатываемых устройств. А это означает, что для решения практических задач могут быть использованы модели любых правомерных гипотез, поскольку признаком их правомерности как раз и является совпадение поведений модели и рассматриваемого объекта.
Таким образом, исследуя поведение человека с целью создания искусственного разума, мы имеем возможность самым широким образом использовать при построении рабочих гипотез различного рода данные, имеющиеся в конкретных науках, правдоподобные аналогии, удобные предположения, упрощения и т.п. При этом можно исключать из рассмотрения неудовлетворительные и отбирать лучшие варианты гипотез путем исследования поведения их вычислительных моделей.
Дальнейшее рассмотрение вопросов содержательной теории ИР будет проведено ниже, при описании основных направлений в моделировании поведения. А пока завершим краткое обсуждение общей структуры проблемы упоминанием о технических средствах реализации систем ИР.
Одним из наиболее распространенных способов реализации систем искусственного разума является их представление в виде программ для ЦВМ. Широкое использование этого способа обусловлено тем, что в качестве технических средств реализации сложных информационных моделей ЦВМ обладают рядом ценных свойств. Важнейшим из них является алгоритмическая универсальность.
Принципиальный недостаток цифровых вычислительных машин - последовательный способ их действия. Недостаток этот проявляется при реализации на ЦВМ моделей большой сложности, имеющих, как правило, параллельные цепи. Вытягивание параллельных процессов "в цепочку", необходимое для их представления в ЦВМ, приводит не только к увеличению затрат машинного времени, но и к дополнительным затратам памяти для хранения промежуточных результатов. В некоторых случаях такие непроизводительные затраты становятся недопустимо большими и могут полностью обесценить преимущества ЦВМ.
Перспективы использования ЦВМ для реализации систем ИР связаны, прежде всего, с дальнейшим совершенствованием вычислительной техники и средств математического обеспечения. Большое значение для развития ИР будет иметь, в частности, создание машин пятого поколения, обладающих значительными объемами оперативной памяти н обеспечивающих реализацию параллельных процессов переработки информации. В настоящее время развитие работ по ИР тесно связано с прогрессом в разработке специальных технических средств моделирования, ориентированных на реализацию в них параллельных процессов. Арсенал средств такого рода велик и представлен прежде всего электронной техникой. Для решения некоторых задач моделирования оказывается целесообразным применение устройств, принцип действия которых основан на использовании свойств физико-химических процессов, протекающих в растворах, коллоидах и т.п. (например, управляемые элементы с памятью - различного рода химотроны, мемисторы и др.). Широко используются также комбинированные системы, содержащие цифровую и аналоговую части. При этом аналоговая часть, реализованная с помощью электронных схем и специальных устройств, предназначается для модельного представления параллельно протекающих процессов, цифровая - для логических и вычислительных операций, имеющих последовательный характер. Использование комплексов такого рода оказывается, как правило, весьма эффективным. Возникающие здесь специфические задачи связаны с организацией взаимодействия между цифровыми и аналоговыми частями устройства.
Таким образом, развитие техники ИР находится в тесной связи с прогрессом в области электроники и вычислительной техники. В области ИР, однако, создан и ряд специальных средств, учитывающих особенности работ по построению сложных моделей. К таким средствам можно отнести специализированные алгоритмические языки (типа IPL), физические элементы, используемые при моделировании нейронных сетей, и т.п. В целом же проблема ИР оказывается в состоянии как ассимилировать новые достижения техники, полученные в других областях (например, топографическая и лазерная техника используются для моделирования памяти), так и со своей стороны оказывать влияние на их развитие, предъявляя свои требования к разрабатываемым устройствам и выдвигая новые идеи их построения. Такого рода взаимное обогащение способствует дальнейшему развитию исследований по проблеме ИР.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ГЛАВА 2. ОСНОВНЫЕ ПОДХОДЫ К СОЗДАНИЮ МОДЕЛЕЙ РАЗУМНОГО ПОВЕДЕНИЯ
Прежде чем приступить к непосредственному изложению конкретных результатов, полученных нами при моделировании разумного поведения, рассмотрим основные направления работ по этой проблеме.
Для каждого направления характерна своя схема проведения исследований, предполагающая определенный способ рассмотрения человека как прототипа систем ИР. Обсуждению принципиальных особенностей различных схем такого рода и посвящена настоящая глава.
#1. ФЕНОМЕНОЛОГИЧЕСКИЕ МОДЕЛИ ПОВЕДЕНИЯ
Это направление исследований связано с разработкой автоматических систем, которые, но сути, представляют собой (или содержат в себе) действующие модели внешнего наблюдаемого поведения человека. Для данного направления характерна примерно следующая схема проведения исследований.
1. Пусть необходимо построить автомат для решения некоторой задачи при условии, что применение традиционных методов синтеза либо невозможно, либо неэффективно. Пусть также имеется человек (или группа людей), способный решать интересующую нас задачу. Будем считать, что искомый автомат решает поставленную задачу, если его поведение функционально эквивалентно поведению человека. В соответствии со спецификой задачи зададим критерии функциональной эквивалентности.
2. Организуем наблюдение за поведением человека, решающего задачу в определенной контролируемой ситуации, и будем фиксировать в протоколах производимые им действия и словесные высказывания.
3. Анализируя протоколы, попытаемся выявить и описать систему (т.е. состав и последовательность) производимых человеком действий, направленных на преобразование исходной ситуации к виду, являющемуся решением задачи.
4. В соответствии с полученным описанием построим устройство, реализующее соответствующую систему операций. Будем полагать, что такое устройство и является искомым автоматом.
5. Исследуем поведение автомата при решении задачи. Если оно недостаточно полно (по отношению к принятым критериям) соответствует поведению человека или по каким-либо другим причинам пе является удовлетворительным, то: либо обратимся еще раз к выполнению п.4 и произведем необходимые изменения в автомате, либо вернемся еще раз к п.3 и попытаемся уточнить описание поведения, либо, уточнив задачу и условия эксперимента, вернемся к выполнению п.2. Будем продолжать такой циклический процесс до тех пор, пока поведение автомата не будет в достаточной мере удовлетворять предъявляемым к нему требованиям.
Остановимся на некоторых особенностях описанной схемы и проиллюстрируем их на примере конкретной разработки. Следует отметить, что рассматриваемое направление является одним из наиболее развитых в области ИР, и в его рамках получен ряд интересных результатов, имеющих как познавательное, так и прикладное значение. Одну из таких работ, имеющую в целом прикладную направленность, мы и используем в качестве примера. Эта работа выполнена Дж.Кларксоном и посвящена задаче принятия решений при выборе политики инвестиций. Автором разработана и реализована в виде программы для ЦВМ модель, иллюстрирующая действия банковского служащего - инвестора. Задачей инвестора является размещение доверенного ему клиентом капитала в тех или иных акциях и облигациях. При этом инвестор должен принимать во внимание весьма разнообразные сведения о деятельности фирм и рыночной стоимости их акций, предсказания относительно будущего состояния экономики и фондовой биржи, установленные законом ограничения на процесс доверенной инвестиции, влияние налогов на доход от тех или иных ценных бумаг, стабильность этого дохода и, наконец, пожелания доверителя относительно сочетания дохода и прироста капитала. Выбор плана инвестирования в этих условиях можно отнести к задачам принятия решений при неполной информации. Строгие методы решения таких задач пока не разработаны. В то же время банковские служащие справляются с ними достаточно хорошо. Это и создает ситуацию, описанную в п.1 нашей схемы, когда целесообразно искать решение задачи путем исследования поведения человека.
ИЗУЧЕНИЕ ДЕЯТЕЛЬНОСТИ. Посмотрим, как реализуется в рассматриваемой работе этап наблюдения за поведением инвестора. Цитируем: "Изучение проводилось путем опроса служащих и наблюдения за работой опекунских советов, обсуждающих ранее вынесенные и предстоящие решения. Впоследствии внимание было сосредоточено на работе служащего одного из банков, несущего основную ответственность за все решения, касающиеся выбора портфелей внутри данного банка... С согласия служащего его действия в процессе принятия решения фиксировались в "протоколах". Эти протоколы регистрировали весь процесс принятия решений служащим в ходе его текущей работы". Видно, таким образом, что, получив общее представление об исследуемом процессе путем изучения работы, различных групп людей, автор в дальнейшем сосредоточивает внимание на поведении одного служащего. Такой переход весьма характерен для рассматриваемой группы исследований. Изучение поведения именно одного человека является, видимо, целесообразным в связи со следующим обстоятельством. У каждого специалиста вырабатывается свой специфичный "стиль" решения задач, и у разных людей он, естественно, различен. Избавиться от связанных с этим трудностей можно двумя путями. Один из них - исключить из рассмотрения несущественные "стилевые" особенности путем установления наблюдений за достаточно большой группой людей. Ясно, что это требует больших затрат времени и усилий. Другой путь предполагает разработку модели поведения именно высококвалифицированного специалиста. В результате модель, очевидно, может воспроизвести и некоторые несущественные особенности его поведения. Это является, однако, вполне приемлемой платой за упрощение исследования в целом, тем более что к оптимальности разрабатываемых таким способом моделей и решений жесткие требования, как правило, не предъявляются.
Существенной особенностью рассматриваемого этапа является осознанное и последовательное использование феноменологического подхода в описании поведения. Это означает, что в протоколах фиксируются только наблюдаемые факты поведения, непосредственно связанные с решением задачи. Вот как формулирует эту особенность своих исследований Кларксон: ""Протоколом" называется дословная запись мыслей и действий субъекта, думающего или решающего задачу вслух. Эта методика дает нам подробное описание того, что делает человек, и, следовательно, позволяет избежать трудностей, присущих методике бесед и заполнения анкет, в которых человека просят объяснить, почему он производит то или иное действие". Подчеркнутая здесь направленность исследования на описание внешнего поведения, на фиксацию только наблюдаемого "что делается" и является характерной чертой рассматриваемого подхода в целом.
СОСТАВЛЕНИЕ ОПИСАНИЯ. ГИПОТЕЗЫ. Третий этап исследований состоит в выяснении операционной структуры изучаемой деятельности и проводится путем анализа имеющихся протоколов. В большинстве случаев проанализировать сложную деятельность достаточно трудно, так как описание необходимо представить в возможно более компактной и конструктивной форме. Как правило, оказывается возможным выделить в изучаемой деятельности более или менее крупные "блоки" операций. Это, однако, составляет лишь небольшую часть всей работы. Основное ее содержание сводится к установлению "тонкой" структуры блоков. Здесь исследователь сталкивается с анализом сложной и гибко организованной системы операций, содержащей большое количество логических функций, условных переходов, процедур поиска и т.п. При формализации такой системы исследователю постоянно приходится выдвигать гипотезы относительно конкретного вида тех или иных зависимостей, числовых значений вводимых им параметров, коэффициентов и т.п. В ходе исследования отдельные гипотезы могут уточняться или отбрасываться. Основанием для этого служит постоянное обращение к анализу протоколов. Зачастую также приходится возвращаться к предыдущему этапу и организовывать новые целенаправленные наблюдения за поведением человека, дополняя таким образом анализируемый материал и получая основания для выдвижения новых и коррекции уже имеющихся гипотез. Результатом таких действий является построение некоторого варианта описания, удовлетворяющего исследователя. Это описание имеет две важных особенности.
Первая из них состоит в том, что построенное описание неизбежно содержит в себе некоторые произвольные или недостаточно обоснованные моменты. Иначе говоря, описание имеет гипотетический характер. Если это не так и исследователь построил адекватное описание в виде строго доказательной дедуктивной конструкции, то это означает прежде всего, что он имел дело с достаточно простой задачей и следует подумать, нельзя ли решить ее более простыми способами. В самом деле, невозможность использования корректного математического аппарата описания является одним из основных признаков сложности, а разрабатываемые нами методы ИР предназначены прежде всего для решения сложных задач. Гипотетический характер описания является, таким образом, практически неизбежной особенностью работ, основанных на анализе протоколов поведения. В связи с этим можно сказать, что содержанием третьего этапа является именно построение рабочей гипотезы относительно операционной структуры рассматриваемого поведения.
Вторая особенность полученного описания также связана со сложностью рассматриваемого поведения человека. Она состоит в том, что в ходе построения описания и связанного с этим выдвижения различных предположений и гипотез исследователь, начиная с некоторого момента, как правило, теряет представление об общих свойствах развиваемой им системы в целом. Окончательное описание является, так сказать, "локально продуманной" системой. Это означает, что исследователь может проанализировать и предсказать свойства ее ограниченных частей. Что же касается системы в целом, то ее поведение не может быть изучено без использования некоторых специальных средств. Как уже упоминалось ранее, эта особенность в общем случае может быть сформулирована в следующем виде: достаточно интересная гипотеза о сложной системе сама является сложной системой. Неизбежной поэтому является организация некоторого эмпирического исследования разработанной гипотезы. Для того чтобы это исследование стало возможным, необходимо представить гипотезу в виде такой действующей модели, которая может явиться непосредственным объектом экспериментального изучения. Решение задачи моделирования гипотезы составляет следующий, четвертый, этап работы. Прежде чем перейти к его описанию, остановимся еще на некоторых особенностях третьего этапа.
"РАЗРЫВЫ" В ОПИСАНИИ. Решая ту или иную конкретную задачу, человек, как правило, использует уже имеющийся у него опыт решения задач аналогичного типа. Это тем более справедливо, если испытуемым является специалист в определенной области. Такой специалист применяет при решении задачи сложные совокупности решающих правил, выработанных им в ходе практической деятельности, зачастую плохо сформулированных или даже неосознаваемых им. Часть этих правил находит явное выражение в действиях или высказываниях испытуемого при решении задачи и соответственно фиксируется в протоколе. Некоторые же правила не вербализуются, а определяют поведение человека, не будучи сами выражены в явной форме. В этих случаях при последующем анализе протоколов выявляются "разрывы" в описании решения задачи. Для заполнения таких "разрывов" используются различные приемы. Один из них состоит в следующем.
Сталкиваясь с "догадкой" испытуемого, со "скачком" в его рассуждениях, т.е. с "разрывом", исследователь заполняет его собственной догадкой, собственным эвристическим предположением. Этот шаг часто сопровождается замечаниями, например, такого типа: "испытуемый ведет себя так, будто решает такую-то систему уравнений". При этом не задается вопрос о том, что на самом деле делает испытуемый. В дальнейшем "такая-то система уравнений" включается в описание общей операционной структуры поведения и выступает в этом описании как очередная гипотеза, подлежащая проверке. Посмотрим, к чему может привести использование такого приема.
Если догадка исследователя оказалась удачной и блок, в который она включена, функционирует удовлетворительно при решении различных задач рассматриваемого класса, то эта догадка, естественно, включается в окончательный вариант описания. Если выдвинутая исследователем догадка окажется неудачной, то, как и в предыдущем случае, это выявится только при экспериментальном исследовании целостной модели гипотезы (описания). При плохом совпадении поведения модели с поведением испытуемого исследователю придется возвратиться к рассмотрению сделанного им необоснованного предположения и исследовать его более тщательно. Чрезвычайно важной поэтому является фиксация в ходе построения описания всех тех мест, где его элементы носят предположительный характер. Опасность состоит в том, что эвристические предположения исследователя могут оказаться незамеченными и незафиксированными им самим. В этом случае они могут стать таким источником ошибок, который очень трудно обнаружить в ходе дальнейшего исследования и который может привести к неудаче всей работы.
Другой прием "заполнения разрывов" связан с проведением направленных дополнительных экспериментов с испытуемым. Характер последних определяется спецификой рассматриваемой деятельности, однако общая феноменологическая ориентированность исследования в этом случае сохраняется. Универсальных рецептов организации таких экспериментов не существует, многое зависит здесь от находчивости и изобретательности исследователя. Приведем пример. При построении модели инвестиции было обнаружено, что многие решения по выбору ценных бумаг были сформулированы банковским служащим до начала работы над конкретной задачей, т.е. на основе имеющегося у него опыта. Естественно, эти решения не были отражены и в протоколах. Для того чтобы выявить структуру таких решений, был использован следующий остроумный прием. Служащему предложили читать вслух статьи из выписываемой им специальной литературы и вслух же комментировать содержащиеся в них факты и мысли. Все высказывания служащего тщательно протоколировались. Анализ протоколов позволил выявить ряд важных решающих правил, лежащих в основе деятельности этого специалиста при решении им конкретных задач. Мы видим, таким образом, что "заполнение разрывов" было выполнено в этом случае на основе последовательного использования основной методики протоколирования.
С отказом от последовательного использования методики протоколирования связан еще один прием "заполнения разрывов". Столкнувшись с "разрывом", исследователь задает себе вопрос о том, почему человек в данных условиях выполнил данное действие. И ответ на это "почему" исследователь ищет в структуре внутренних, реализующихся в мозге человека, процессов переработки информации. Исследование таких процессов может, безусловно, привести к построению нужного описания и к заполнению "разрыва". Необходимо лишь иметь в виду, что оно предполагает переход на другой уровень, другой язык и другую методику исследования. В ряде случаев этот переход является целесообразным и приводит к хорошим результатам. Рассмотрение таких "комбинированных" работ представляет определенный интерес, и мы вернемся к нему впоследствии, обсудив более подробно особенности подходов, связанных с моделированием процессов и "механизмов" мышления человека.
...
Прежде чем приступить к непосредственному изложению конкретных результатов, полученных нами при моделировании разумного поведения, рассмотрим основные направления работ по этой проблеме.
Для каждого направления характерна своя схема проведения исследований, предполагающая определенный способ рассмотрения человека как прототипа систем ИР. Обсуждению принципиальных особенностей различных схем такого рода и посвящена настоящая глава.
#1. ФЕНОМЕНОЛОГИЧЕСКИЕ МОДЕЛИ ПОВЕДЕНИЯ
Это направление исследований связано с разработкой автоматических систем, которые, но сути, представляют собой (или содержат в себе) действующие модели внешнего наблюдаемого поведения человека. Для данного направления характерна примерно следующая схема проведения исследований.
1. Пусть необходимо построить автомат для решения некоторой задачи при условии, что применение традиционных методов синтеза либо невозможно, либо неэффективно. Пусть также имеется человек (или группа людей), способный решать интересующую нас задачу. Будем считать, что искомый автомат решает поставленную задачу, если его поведение функционально эквивалентно поведению человека. В соответствии со спецификой задачи зададим критерии функциональной эквивалентности.
2. Организуем наблюдение за поведением человека, решающего задачу в определенной контролируемой ситуации, и будем фиксировать в протоколах производимые им действия и словесные высказывания.
3. Анализируя протоколы, попытаемся выявить и описать систему (т.е. состав и последовательность) производимых человеком действий, направленных на преобразование исходной ситуации к виду, являющемуся решением задачи.
4. В соответствии с полученным описанием построим устройство, реализующее соответствующую систему операций. Будем полагать, что такое устройство и является искомым автоматом.
5. Исследуем поведение автомата при решении задачи. Если оно недостаточно полно (по отношению к принятым критериям) соответствует поведению человека или по каким-либо другим причинам пе является удовлетворительным, то: либо обратимся еще раз к выполнению п.4 и произведем необходимые изменения в автомате, либо вернемся еще раз к п.3 и попытаемся уточнить описание поведения, либо, уточнив задачу и условия эксперимента, вернемся к выполнению п.2. Будем продолжать такой циклический процесс до тех пор, пока поведение автомата не будет в достаточной мере удовлетворять предъявляемым к нему требованиям.
Остановимся на некоторых особенностях описанной схемы и проиллюстрируем их на примере конкретной разработки. Следует отметить, что рассматриваемое направление является одним из наиболее развитых в области ИР, и в его рамках получен ряд интересных результатов, имеющих как познавательное, так и прикладное значение. Одну из таких работ, имеющую в целом прикладную направленность, мы и используем в качестве примера. Эта работа выполнена Дж.Кларксоном и посвящена задаче принятия решений при выборе политики инвестиций. Автором разработана и реализована в виде программы для ЦВМ модель, иллюстрирующая действия банковского служащего - инвестора. Задачей инвестора является размещение доверенного ему клиентом капитала в тех или иных акциях и облигациях. При этом инвестор должен принимать во внимание весьма разнообразные сведения о деятельности фирм и рыночной стоимости их акций, предсказания относительно будущего состояния экономики и фондовой биржи, установленные законом ограничения на процесс доверенной инвестиции, влияние налогов на доход от тех или иных ценных бумаг, стабильность этого дохода и, наконец, пожелания доверителя относительно сочетания дохода и прироста капитала. Выбор плана инвестирования в этих условиях можно отнести к задачам принятия решений при неполной информации. Строгие методы решения таких задач пока не разработаны. В то же время банковские служащие справляются с ними достаточно хорошо. Это и создает ситуацию, описанную в п.1 нашей схемы, когда целесообразно искать решение задачи путем исследования поведения человека.
ИЗУЧЕНИЕ ДЕЯТЕЛЬНОСТИ. Посмотрим, как реализуется в рассматриваемой работе этап наблюдения за поведением инвестора. Цитируем: "Изучение проводилось путем опроса служащих и наблюдения за работой опекунских советов, обсуждающих ранее вынесенные и предстоящие решения. Впоследствии внимание было сосредоточено на работе служащего одного из банков, несущего основную ответственность за все решения, касающиеся выбора портфелей внутри данного банка... С согласия служащего его действия в процессе принятия решения фиксировались в "протоколах". Эти протоколы регистрировали весь процесс принятия решений служащим в ходе его текущей работы". Видно, таким образом, что, получив общее представление об исследуемом процессе путем изучения работы, различных групп людей, автор в дальнейшем сосредоточивает внимание на поведении одного служащего. Такой переход весьма характерен для рассматриваемой группы исследований. Изучение поведения именно одного человека является, видимо, целесообразным в связи со следующим обстоятельством. У каждого специалиста вырабатывается свой специфичный "стиль" решения задач, и у разных людей он, естественно, различен. Избавиться от связанных с этим трудностей можно двумя путями. Один из них - исключить из рассмотрения несущественные "стилевые" особенности путем установления наблюдений за достаточно большой группой людей. Ясно, что это требует больших затрат времени и усилий. Другой путь предполагает разработку модели поведения именно высококвалифицированного специалиста. В результате модель, очевидно, может воспроизвести и некоторые несущественные особенности его поведения. Это является, однако, вполне приемлемой платой за упрощение исследования в целом, тем более что к оптимальности разрабатываемых таким способом моделей и решений жесткие требования, как правило, не предъявляются.
Существенной особенностью рассматриваемого этапа является осознанное и последовательное использование феноменологического подхода в описании поведения. Это означает, что в протоколах фиксируются только наблюдаемые факты поведения, непосредственно связанные с решением задачи. Вот как формулирует эту особенность своих исследований Кларксон: ""Протоколом" называется дословная запись мыслей и действий субъекта, думающего или решающего задачу вслух. Эта методика дает нам подробное описание того, что делает человек, и, следовательно, позволяет избежать трудностей, присущих методике бесед и заполнения анкет, в которых человека просят объяснить, почему он производит то или иное действие". Подчеркнутая здесь направленность исследования на описание внешнего поведения, на фиксацию только наблюдаемого "что делается" и является характерной чертой рассматриваемого подхода в целом.
СОСТАВЛЕНИЕ ОПИСАНИЯ. ГИПОТЕЗЫ. Третий этап исследований состоит в выяснении операционной структуры изучаемой деятельности и проводится путем анализа имеющихся протоколов. В большинстве случаев проанализировать сложную деятельность достаточно трудно, так как описание необходимо представить в возможно более компактной и конструктивной форме. Как правило, оказывается возможным выделить в изучаемой деятельности более или менее крупные "блоки" операций. Это, однако, составляет лишь небольшую часть всей работы. Основное ее содержание сводится к установлению "тонкой" структуры блоков. Здесь исследователь сталкивается с анализом сложной и гибко организованной системы операций, содержащей большое количество логических функций, условных переходов, процедур поиска и т.п. При формализации такой системы исследователю постоянно приходится выдвигать гипотезы относительно конкретного вида тех или иных зависимостей, числовых значений вводимых им параметров, коэффициентов и т.п. В ходе исследования отдельные гипотезы могут уточняться или отбрасываться. Основанием для этого служит постоянное обращение к анализу протоколов. Зачастую также приходится возвращаться к предыдущему этапу и организовывать новые целенаправленные наблюдения за поведением человека, дополняя таким образом анализируемый материал и получая основания для выдвижения новых и коррекции уже имеющихся гипотез. Результатом таких действий является построение некоторого варианта описания, удовлетворяющего исследователя. Это описание имеет две важных особенности.
Первая из них состоит в том, что построенное описание неизбежно содержит в себе некоторые произвольные или недостаточно обоснованные моменты. Иначе говоря, описание имеет гипотетический характер. Если это не так и исследователь построил адекватное описание в виде строго доказательной дедуктивной конструкции, то это означает прежде всего, что он имел дело с достаточно простой задачей и следует подумать, нельзя ли решить ее более простыми способами. В самом деле, невозможность использования корректного математического аппарата описания является одним из основных признаков сложности, а разрабатываемые нами методы ИР предназначены прежде всего для решения сложных задач. Гипотетический характер описания является, таким образом, практически неизбежной особенностью работ, основанных на анализе протоколов поведения. В связи с этим можно сказать, что содержанием третьего этапа является именно построение рабочей гипотезы относительно операционной структуры рассматриваемого поведения.
Вторая особенность полученного описания также связана со сложностью рассматриваемого поведения человека. Она состоит в том, что в ходе построения описания и связанного с этим выдвижения различных предположений и гипотез исследователь, начиная с некоторого момента, как правило, теряет представление об общих свойствах развиваемой им системы в целом. Окончательное описание является, так сказать, "локально продуманной" системой. Это означает, что исследователь может проанализировать и предсказать свойства ее ограниченных частей. Что же касается системы в целом, то ее поведение не может быть изучено без использования некоторых специальных средств. Как уже упоминалось ранее, эта особенность в общем случае может быть сформулирована в следующем виде: достаточно интересная гипотеза о сложной системе сама является сложной системой. Неизбежной поэтому является организация некоторого эмпирического исследования разработанной гипотезы. Для того чтобы это исследование стало возможным, необходимо представить гипотезу в виде такой действующей модели, которая может явиться непосредственным объектом экспериментального изучения. Решение задачи моделирования гипотезы составляет следующий, четвертый, этап работы. Прежде чем перейти к его описанию, остановимся еще на некоторых особенностях третьего этапа.
"РАЗРЫВЫ" В ОПИСАНИИ. Решая ту или иную конкретную задачу, человек, как правило, использует уже имеющийся у него опыт решения задач аналогичного типа. Это тем более справедливо, если испытуемым является специалист в определенной области. Такой специалист применяет при решении задачи сложные совокупности решающих правил, выработанных им в ходе практической деятельности, зачастую плохо сформулированных или даже неосознаваемых им. Часть этих правил находит явное выражение в действиях или высказываниях испытуемого при решении задачи и соответственно фиксируется в протоколе. Некоторые же правила не вербализуются, а определяют поведение человека, не будучи сами выражены в явной форме. В этих случаях при последующем анализе протоколов выявляются "разрывы" в описании решения задачи. Для заполнения таких "разрывов" используются различные приемы. Один из них состоит в следующем.
Сталкиваясь с "догадкой" испытуемого, со "скачком" в его рассуждениях, т.е. с "разрывом", исследователь заполняет его собственной догадкой, собственным эвристическим предположением. Этот шаг часто сопровождается замечаниями, например, такого типа: "испытуемый ведет себя так, будто решает такую-то систему уравнений". При этом не задается вопрос о том, что на самом деле делает испытуемый. В дальнейшем "такая-то система уравнений" включается в описание общей операционной структуры поведения и выступает в этом описании как очередная гипотеза, подлежащая проверке. Посмотрим, к чему может привести использование такого приема.
Если догадка исследователя оказалась удачной и блок, в который она включена, функционирует удовлетворительно при решении различных задач рассматриваемого класса, то эта догадка, естественно, включается в окончательный вариант описания. Если выдвинутая исследователем догадка окажется неудачной, то, как и в предыдущем случае, это выявится только при экспериментальном исследовании целостной модели гипотезы (описания). При плохом совпадении поведения модели с поведением испытуемого исследователю придется возвратиться к рассмотрению сделанного им необоснованного предположения и исследовать его более тщательно. Чрезвычайно важной поэтому является фиксация в ходе построения описания всех тех мест, где его элементы носят предположительный характер. Опасность состоит в том, что эвристические предположения исследователя могут оказаться незамеченными и незафиксированными им самим. В этом случае они могут стать таким источником ошибок, который очень трудно обнаружить в ходе дальнейшего исследования и который может привести к неудаче всей работы.
Другой прием "заполнения разрывов" связан с проведением направленных дополнительных экспериментов с испытуемым. Характер последних определяется спецификой рассматриваемой деятельности, однако общая феноменологическая ориентированность исследования в этом случае сохраняется. Универсальных рецептов организации таких экспериментов не существует, многое зависит здесь от находчивости и изобретательности исследователя. Приведем пример. При построении модели инвестиции было обнаружено, что многие решения по выбору ценных бумаг были сформулированы банковским служащим до начала работы над конкретной задачей, т.е. на основе имеющегося у него опыта. Естественно, эти решения не были отражены и в протоколах. Для того чтобы выявить структуру таких решений, был использован следующий остроумный прием. Служащему предложили читать вслух статьи из выписываемой им специальной литературы и вслух же комментировать содержащиеся в них факты и мысли. Все высказывания служащего тщательно протоколировались. Анализ протоколов позволил выявить ряд важных решающих правил, лежащих в основе деятельности этого специалиста при решении им конкретных задач. Мы видим, таким образом, что "заполнение разрывов" было выполнено в этом случае на основе последовательного использования основной методики протоколирования.
С отказом от последовательного использования методики протоколирования связан еще один прием "заполнения разрывов". Столкнувшись с "разрывом", исследователь задает себе вопрос о том, почему человек в данных условиях выполнил данное действие. И ответ на это "почему" исследователь ищет в структуре внутренних, реализующихся в мозге человека, процессов переработки информации. Исследование таких процессов может, безусловно, привести к построению нужного описания и к заполнению "разрыва". Необходимо лишь иметь в виду, что оно предполагает переход на другой уровень, другой язык и другую методику исследования. В ряде случаев этот переход является целесообразным и приводит к хорошим результатам. Рассмотрение таких "комбинированных" работ представляет определенный интерес, и мы вернемся к нему впоследствии, обсудив более подробно особенности подходов, связанных с моделированием процессов и "механизмов" мышления человека.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
МОДЕЛИРОВАНИЕ ГИПОТЕЗ. Следующий этап построения автомата, который нам необходимо рассмотреть, связан с построением действующей модели гипотезы-описания, разработанной на основе анализа протоколов. Цель такого моделирования ясна из предыдущего обсуждения. Можно сказать, что если гипотеза представляет собой сложную систему взаимосвязанных высказываний и предположений, то модель гипотезы есть некоторая система, в которой автоматизирован вывод следствий из составляющих гипотезу совокупностей высказываний. Для того чтобы выявить специфику такого моделирования и разобраться в возникающих здесь трудностях, рассмотрим более подробно содержание работ, связанных с построением модели, и уточним смысл некоторых из используемых понятий.
Прежде всего отметим, что обсуждаемый прием - моделирование гипотез - рассматривается многими исследователями как необходимый элемент, дополняющий традиционную гипотетико-индуктивную схему исследований в тех случаях, когда она применяется для изучения сложных систем. В рамках интересующей нас проблематики моделирование гипотез может осуществляться по двум различным схемам, особенности которых мы сейчас и рассмотрим.
КОНЦЕПТУАЛЬНЫЕ И ДЕЙСТВУЮЩИЕ МОДЕЛИ ГИПОТЕЗ. В настоящее время существуют различные подходы к определению понятия модели. Из множества возможных классификаций в дальнейшем будем использовать разделение моделей на статические (концептуальные) и динамические (действующие). В концептуальной модели основные свойства моделируемого объекта отражены с помощью совокупности высказываний в некотором определенном языке, содержащем необходимый и достаточный для данных целей набор понятий. Концептуальные модели могут строиться и с помощью слов естественного языка. Эти модели являются статическими в том смысле, что неспособны сами по себе изменять свои внутренние состояния и взаимодействовать с какими-либо внешними объектами. Легко видеть, что в рассматриваемом нами случае гипотеза относительно операционной структуры поведения человека, построенная на основе анализа протоколов, является концептуальной моделью.
Действующая модель является некоторой автономной системой, способной изменять собственные внутренние состояния или окружающую ее среду без непосредственного вмешательства человека. Действующие модели могут быть построены, например, в виде физических устройств - и тогда они способны взаимодействовать с объектами реального мира; в виде вычислительных систем - их поведение в этом случае связано с изменением условных сред, например с преобразованием числовых массивов. Будучи в достаточной степени автономной системой, действующая модель может явиться объектом наблюдения и эмпирического исследования. Именно поэтому и необходимо представление проверяемой гипотезы в виде действующей модели.
Таким образом, говоря о моделировании гипотезы, мы имеем в виду, по существу, построение действующей модели объекта на основе концептуальной модели этого же объекта.
Всегда ли возможно решение такой задачи? Для того чтобы ответить на этот вопрос, необходимо более подробно рассмотреть понятия конструктивности описания.
КОНСТРУКТИВНОСТЬ ОПИСАНИЯ. Понятие конструктивности в настоящее время определено недостаточно. Мы не будем здесь анализировать это понятие в полном объеме, а ограничимся лишь такой его содержательной интерпретацией, которая необходима для дальнейшего изложения.
Рассмотрим простой пример. Пусть некоторый математический объект X описан выражением a2-b2, причем известно, какие значения могут принимать a и b. Объект X для нас в данном случае полностью определен, поскольку предполагается, что операции возведения в квадрат и вычитания мы выполнять умеем. Если будут предложены конкретные значения a и b, то мы сможем определить значение X. Таким образом, описание a2-b2 как бы содержит в себе инструкцию по выполнению действий, необходимых для определения X. Такое описание будем называть конструктивным. Пусть, далее, нам дано то же описание и требуется построить автомат, вычисляющий X при некоторых a и b. Если существуют автоматические устройства, выполняющие все необходимые операции (возведение в квадрат и т.п.), то искомый автомат мы построить сможем. Будем говорить, что и в этом случае описание a2-b2 оказалось конструктивным. Здесь конструктивность описания зависела не от нашей способности выполнять нужные действия, а от наличия устройств, выполняющих их автоматически. Это указывает на важное свойство понятия конструктивности - его относительность.
Существенно также, что упоминавшиеся операции определены строго и недвусмысленно: мы знаем, например, что возвести данное число в квадрат можно единственным способом.
Таким образом, рассмотренное в примере описание содержит указания по выполнению определенных действий, операций. Существуют описания и другого рода, однако именно класс описаний, содержащих инструкции к действиям, является наиболее важным для нашего рассмотрения. В дальнейшем мы будем иметь в виду описания именно этого класса.
Для того чтобы более точно определить понятие конструктивности, рассмотрим некоторую систему операций S. Будем считать, что в S входит конечное число операций и правила выполнения каждой из них зафиксированы. Назовем операции S средствами реализации. Описание будет конструктивным относительно S в том случае, если все входящие в него указания могут быть единственным образом выполнены с помощью операций, составляющих S.
Итак, решение задачи построения действующей модели объекта на основе его концептуальной модели-гипотезы возможно в том случае, если последняя представлена в виде описания, конструктивного относительно средств реализации модели. Выше упоминалось, что действующая модель объекта может быть построена с помощью различных средств. Те или иные конкретные средства моделирования определят и ту совокупность операций, которую сможет реализовать модель. Так, например, модель может быть построена в виде программы для ЦВМ с помощью определенного алгоритмического языка. В этом случае совокупность операций данного языка и составит имеющиеся в распоряжении исследователя средства реализации. Так, для языка типа АЛГОЛ это будут операции безусловного и условного переходов, присваивания, вычисления в циклах и т.п. Если модель строится в виде электронного устройства, то средства реализации будут определены возможностями и характеристиками используемых элементов и блоков аппаратуры. Так, в них могут входить операции усиления, дифференцирования и т.п.
Таким образом, выбирая конкретный способ построении модели, мы определяем тем самым набор "изобразительных средств", совокупность конкретных операций, с помощью которых следует реализовать описание. Естественно, это возможно только в тех случаях, когда язык описания, его "изобразительные средства" определенным образом согласованы со средствами реализации действующей модели, когда возможен "перевод" одних в другие. Требование такой согласованности, "переводимости" мы и формулируем в виде требования конструктивности описания относительно средств моделирования.
Итак, мы можем уточнить обсуждаемую схему процесса построения моделей поведения, отметив следующую ее особенность. Исследователь, приступающий к составлению описания поведения испытуемого (п.3 схемы), должен предварительно выбрать форму и технические средства построения действующей модели поведения и разработать описание в виде, конструктивном относительно избранных средств реализации.
В настоящее время наиболее распространено построение действующих моделей в виде программ для ЦВМ. Соответственно и описания поведения строятся в виде, удобном для их последующей алгоритмизации. Как правило, уже на начальных этапах составления описаний исследователи широко применяют представления и язык, ориентированные на последующее использование вычислительных машин. Этот подход хорошо иллюстрирует уже цитированная нами работа по построению модели процесса доверительной инвестиции. Описание здесь строится в виде набора блок-схем, характеризующих процессы оперирования с имеющимися в некоторой памяти информационными списками, и процессы выбора определенных решающих правил с помощью фиксированного набора инструкций. На основе блок-схемного описания строится программа для ЦВМ.
С широким использованием языка вычислительных машин связано также то обстоятельство, что, анализируя деятельность человека, современный исследователь видит в ней прежде всего операции запоминания и выборки, преобразования списков, поиска нужной информации и т.п. Вычислительные машины действительно являются высокоэффективным средством моделирования, и с их помощью осуществлен значительный прогресс в рассматриваемой нами области ИР. Определенная опасность существует, однако, в связи с тем, что, ориентируясь на использование ЦВМ, исследователи зачастую сознательно или неосознанно сужают круг используемых ими представлений и, как следствие, обнаруживают в деятельности человека прежде всего то, что легко и удобно представить с помощью существующих вычислительных средств. В отношении ряда задач такой подход может оказаться неэффективным и даже задержать развитие исследований, как это произошло, например, при поиске методов сокращения полного перебора вариантов (а идея перебора явно "подсказана" способом организации информационных процессов в машинах) при решении задач типа шахматных. Существующие методы построения действующих вычислительных моделей зачастую оказываются неэффективными и в тех случаях, когда решение задачи требует одновременной переработки информации сразу по многим каналам. Таким образом, в каждом конкретном случае выбор способа построения действующей модели и, следовательно, языка описания объекта является весьма ответственным этапом, и принятие решения здесь должно основываться на тщательном анализе специфики решаемой задачи.
Требование конструктивности описания на практике удается выполнить далеко не всегда. В связи со сложностью исследуемого поведения описание часто содержит фрагменты, заданные неконструктивно. Это приводит к тому, что на основе данного описания может быть построена не единственная действующая модель. В самом деле, сталкиваясь с неконструктивным фрагментом, исследователь вынужден каким-то образом ликвидировать имеющиеся в нем неопределенности для того, чтобы продолжать работу. При этом он выдвигает дополнительные предположения, упрощает описание и т.п. Как правило, эти операции можно выполнить различными способами. В зависимости от способа действующая модель будет реализована по-разному. Рассматриваемая ситуация в определенном смысле аналогична "заполнению разрывов" в описании. Так же, как и при "заполнении разрывов", введение новых предположений и упрощений может оказаться удачным в большей или меньшей степени, что может быть выявлено на этапе исследования поведения модели. Как и раньше, чрезвычайно важной является тщательная фиксация всех принимаемых эвристических предположений с тем, чтобы в случае необходимости можно было вернуться к их более подробному рассмотрению и коррекции.
Итак, мы рассмотрели некоторые особенности четвертого этапа исследований, связанного с построением действующих моделей гипотез. Заметим, что термин "моделирование гипотезы" в данном контексте, вообще говоря, не корректен. Понятие моделирования является более широким и содержательным, чем процедуры, составляющие описанный этап. Возможно, точнее было бы говорить о специфичных преобразованиях, даже о перекодировании моделей-гипотез. Учитывая, однако, определенное удобство и достаточную распространенность этого термина, мы и в дальнейшем будем использовать выражение "моделирование гипотезы", обозначая им процессы построения действующей модели объекта на основе его концептуальной, статической модели гипотезы.
ИССЛЕДОВАНИЕ МОДЕЛЕЙ. Рассмотрим наконец последний, пятый, этап построения модели поведения, связанный с экспериментальным исследованием разработанной действующей модели гипотезы. Основная задача этого этапа состоит в том, чтобы убедиться в пригодности модели для решения поставленной перед ней задачи. Ответ на этот вопрос можно получить, подавая на входы модели различные совокупности исходных данных и наблюдая ее выходные реакции. Мы не будем останавливаться на обсуждении особенностей этого процесса, поскольку он в значительной мере определяется спецификой решаемых задач.
Если поведение модели удовлетворяет предъявляемым требованиям, то ее построение можно считать законченным, и дальнейшая судьба модели определяется способами ее практической эксплуатации. Иначе говоря, с этого момента модель может рассматриваться как автомат, способный выполнять определенные функции человека, что и являлось конечной целью предпринятой разработки. Такая формулировка цели, как уже не раз указывалось, характерна для работ в области ИР.
На практике, однако, редко случается, чтобы исследование модели показало ее абсолютную непригодность или, наоборот, идеальное соответствие требованиям. Чаще всего исследователь обнаруживает, что в некоторых ситуациях модель оказывается не в состоянии найти нужное решение или вырабатываемое решение не удовлетворяет введенным заранее критериям. Обнаружение таких недостатков вынуждает исследователя вернуться к рассмотрению выполненных этапов работы в поисках возможных источников ошибок. Кратко рассмотрим основные приемы такого поиска.
ЛОКАЛИЗАЦИЯ ОШИБКИ. Для сложных моделей решение задачи локализации ошибки часто связано с существенными трудностями. В отдельных случаях удается локализовать ошибку только на основе тщательного анализа характера нарушений в работе модели. Более общим приемом является сравнение поведения модели с поведением человека, зафиксированным в протоколах. Сопоставляя последовательности действий человека и модели, можно определить момент, когда эти последовательности "расходятся", т.е. модель выбирает действие, отличное от выполненного человеком. Анализ причин такого "расхождения" может привести к обнаружению искомой ошибки.
Однако не всегда факт "расхождения" свидетельствует о наличии ошибки в модели. Это бывает в тех случаях, когда ситуация допускает несколько равноценных решений и действие модели является "оправданным", несмотря на его отличие от соответствующего действия человека. В качестве примера такой ситуации укажем на случай, когда в связи с отсутствием нужной информации или по характеру задачи на некотором этапе человек и машина используют стратегии случайного поиска. Совпадение решений здесь весьма маловероятно, однако действие модели оказывается правомерным.
Понятно, что возникшее в некоторый момент расхождение может привести к еще большим расхождениям в последующие моменты. В ходе решения задачи различия могут накапливаться, так что через некоторое время сравнение становится невозможным. Для того чтобы продолжить поиск ошибки, целесообразно использовать стратегию "возвращения модели на шаг назад". В нашем случае эта стратегия состоит в следующем. Сравниваются последовательные действия человека и модели. При обнаружении их расхождения проводится анализ его причин. При этом либо выявляется ошибка в модели, либо действие модели признается правомерным. В последнем случае восстанавливается состояние модели, предшествовавшее выбору данного действия, и в него вносятся изменения таким образом, чтобы модель выполнила другое действие, соответствующее действию человека. Затем сравнение продолжается. Необходимо отметить, что реализация описанной стратегии может потребовать изменения большого числа параметров модели и всегда связана с выполнением достаточно сложных информационных преобразований. Поэтому ее использование целесообразно планировать заранее, с тем, чтобы "встраивать" в модель необходимые управляющие устройства.
КРИТЕРИИ СРАВНЕНИЯ. Особые проблемы связаны также с выбором критериев для сравнения поведения человека и модели. В самом деле, значительная часть протоколов, фиксирующих деятельность человека, представляет собой запись его словесных высказываний, в то время как модели - в общем случае - не содержат механизмов, имитирующих вербальное поведение. Кроме того, в ходе решения задач человек зачастую выполняет действия, не связанные непосредственно с поиском решения, а также действия, воспроизведение которых в модели по тем или иным причинам нецелесообразно (например, характеризующиеся явной избыточностью или неоптимальностью). Протокол, таким образом, содержит "сырой" материал, использование которого для сравнения предполагает некоторую обработку. Для выполнения такой обработки и необходимо четко сформулировать критерии сравнения, а также заранее зафиксировать конечный набор правил интерпретации протокольных записей.
Конкретный вид критериев и правил интерпретации определяется исходя из целей исследования в каждом отдельном случае. Так, например, при построении модели инвестиции использован критерий конечного результата; в работе приведены данные по сравнению результатов выбора портфелей ценных бумаг, произведенного инвестором и его моделью в реальных условиях.
КОРРЕКЦИЯ МОДЕЛЕЙ. Для того чтобы обнаружить и исправить ошибку, исследователю необходимо возвратиться к более тщательному рассмотрению и проверке обоснованности допущений и предположений, принятых им в ходе конструирования данного блока. Возвратившись к рассмотрению соответствующего этапа, исследователь может исправить обнаруженную ошибку, внеся необходимые изменения. При этом ему придется в дальнейшем "провести" сделанное изменение через все последующие этапы моделирования.
В ряде случаев при "доводке" модели выясняется, что информации, собранной в ходе экспериментов с человеком, недостаточно для успешного решения задачи. Это вызывает постановку новых экспериментов, пополнение протоколов и соответствующую коррекцию гипотезы и модели. Отметим, что использование описанных циклов является характерным для всех методов, основанных в той или иной степени на использовании эвристических предположений. Некоторые авторы, публикуя полученные ими результаты в окончательном виде, избегают описания этих циклических процессов "доводки", в то время как последние часто составляют значительную часть проделанной работы, а их описание и обсуждение возникающих здесь специфических трудностей могут явиться весьма поучительными.
ОБСУЖДЕНИЕ. Мы обсудили, таким образом, ряд особенностей процесса построения одного типа моделей, которые в дальнейшем будем условно называть просто моделями поведения. То обстоятельство, что этому (далеко не исчерпывающему) обсуждению уделено сравнительно большое внимание, объясняется прежде всего типичностью используемой здесь схемы для широкого круга исследований в области искусственного разума. В дальнейшем, сталкиваясь с подобными схемами, будем пользоваться введенными понятиями и представлениями, не уделяя больше времени их подробному описанию. В большинстве случаев приведенные выше комментарии к отдельным этапам процесса построения моделей поведения с очевидными изменениями приложимы и к этапам построения моделей другого рода, а именно - моделей "процессов" и моделей "механизмов".
Прежде чем продолжить изложение, сделаем еще одно важное замечание. Все, что было сказано выше о процессе построения действующих моделей поведения человека, явилось результатом рассмотрения этой задачи со вполне определенной и ограниченной точки зрения, а именно - точки зрения разработчиков систем искусственного разума. Предполагалось, иначе говоря, что целью работы является построение системы, поведение которой в конечном счете должно быть функционально эквивалентным поведению человека при решении определенных задач. Именно такое требование, как указывалось ранее, является необходимым, чтобы обеспечить возможность использования модели в целях автоматизации.
Необходимо отметить, что аналогичные схемы исследований широко используются также для решения задач познавательного характера, когда действующая модель рассматривается как теория соответствующего поведения человека и строится как таковая. В этом случае описанный процесс имеет ряд особенностей, на обсуждении которых мы не останавливались.
Правильное понимание указанного различия необходимо при оценке конкретных исследований. Это тем более важно, что часто приходится иметь дело с исследованиями смешанного характера: автор, разработавший достаточно интересную познавательную модель, в редких случаях удерживается от соблазна обсудить ее применимость в практических целях, и, наоборот, разработчик системы, автоматизирующей решение достаточно сложных "человеческих" задач, нередко представляет ее и как модель процессов, реально выполняемых человеком. Все это создает иногда почву для различного рода малоэффективных дискуссий относительно "соотношения решения задач человеком и машиной", примеры которых можно найти в литературе по психологии.
Прежде всего отметим, что обсуждаемый прием - моделирование гипотез - рассматривается многими исследователями как необходимый элемент, дополняющий традиционную гипотетико-индуктивную схему исследований в тех случаях, когда она применяется для изучения сложных систем. В рамках интересующей нас проблематики моделирование гипотез может осуществляться по двум различным схемам, особенности которых мы сейчас и рассмотрим.
КОНЦЕПТУАЛЬНЫЕ И ДЕЙСТВУЮЩИЕ МОДЕЛИ ГИПОТЕЗ. В настоящее время существуют различные подходы к определению понятия модели. Из множества возможных классификаций в дальнейшем будем использовать разделение моделей на статические (концептуальные) и динамические (действующие). В концептуальной модели основные свойства моделируемого объекта отражены с помощью совокупности высказываний в некотором определенном языке, содержащем необходимый и достаточный для данных целей набор понятий. Концептуальные модели могут строиться и с помощью слов естественного языка. Эти модели являются статическими в том смысле, что неспособны сами по себе изменять свои внутренние состояния и взаимодействовать с какими-либо внешними объектами. Легко видеть, что в рассматриваемом нами случае гипотеза относительно операционной структуры поведения человека, построенная на основе анализа протоколов, является концептуальной моделью.
Действующая модель является некоторой автономной системой, способной изменять собственные внутренние состояния или окружающую ее среду без непосредственного вмешательства человека. Действующие модели могут быть построены, например, в виде физических устройств - и тогда они способны взаимодействовать с объектами реального мира; в виде вычислительных систем - их поведение в этом случае связано с изменением условных сред, например с преобразованием числовых массивов. Будучи в достаточной степени автономной системой, действующая модель может явиться объектом наблюдения и эмпирического исследования. Именно поэтому и необходимо представление проверяемой гипотезы в виде действующей модели.
Таким образом, говоря о моделировании гипотезы, мы имеем в виду, по существу, построение действующей модели объекта на основе концептуальной модели этого же объекта.
Всегда ли возможно решение такой задачи? Для того чтобы ответить на этот вопрос, необходимо более подробно рассмотреть понятия конструктивности описания.
КОНСТРУКТИВНОСТЬ ОПИСАНИЯ. Понятие конструктивности в настоящее время определено недостаточно. Мы не будем здесь анализировать это понятие в полном объеме, а ограничимся лишь такой его содержательной интерпретацией, которая необходима для дальнейшего изложения.
Рассмотрим простой пример. Пусть некоторый математический объект X описан выражением a2-b2, причем известно, какие значения могут принимать a и b. Объект X для нас в данном случае полностью определен, поскольку предполагается, что операции возведения в квадрат и вычитания мы выполнять умеем. Если будут предложены конкретные значения a и b, то мы сможем определить значение X. Таким образом, описание a2-b2 как бы содержит в себе инструкцию по выполнению действий, необходимых для определения X. Такое описание будем называть конструктивным. Пусть, далее, нам дано то же описание и требуется построить автомат, вычисляющий X при некоторых a и b. Если существуют автоматические устройства, выполняющие все необходимые операции (возведение в квадрат и т.п.), то искомый автомат мы построить сможем. Будем говорить, что и в этом случае описание a2-b2 оказалось конструктивным. Здесь конструктивность описания зависела не от нашей способности выполнять нужные действия, а от наличия устройств, выполняющих их автоматически. Это указывает на важное свойство понятия конструктивности - его относительность.
Существенно также, что упоминавшиеся операции определены строго и недвусмысленно: мы знаем, например, что возвести данное число в квадрат можно единственным способом.
Таким образом, рассмотренное в примере описание содержит указания по выполнению определенных действий, операций. Существуют описания и другого рода, однако именно класс описаний, содержащих инструкции к действиям, является наиболее важным для нашего рассмотрения. В дальнейшем мы будем иметь в виду описания именно этого класса.
Для того чтобы более точно определить понятие конструктивности, рассмотрим некоторую систему операций S. Будем считать, что в S входит конечное число операций и правила выполнения каждой из них зафиксированы. Назовем операции S средствами реализации. Описание будет конструктивным относительно S в том случае, если все входящие в него указания могут быть единственным образом выполнены с помощью операций, составляющих S.
Итак, решение задачи построения действующей модели объекта на основе его концептуальной модели-гипотезы возможно в том случае, если последняя представлена в виде описания, конструктивного относительно средств реализации модели. Выше упоминалось, что действующая модель объекта может быть построена с помощью различных средств. Те или иные конкретные средства моделирования определят и ту совокупность операций, которую сможет реализовать модель. Так, например, модель может быть построена в виде программы для ЦВМ с помощью определенного алгоритмического языка. В этом случае совокупность операций данного языка и составит имеющиеся в распоряжении исследователя средства реализации. Так, для языка типа АЛГОЛ это будут операции безусловного и условного переходов, присваивания, вычисления в циклах и т.п. Если модель строится в виде электронного устройства, то средства реализации будут определены возможностями и характеристиками используемых элементов и блоков аппаратуры. Так, в них могут входить операции усиления, дифференцирования и т.п.
Таким образом, выбирая конкретный способ построении модели, мы определяем тем самым набор "изобразительных средств", совокупность конкретных операций, с помощью которых следует реализовать описание. Естественно, это возможно только в тех случаях, когда язык описания, его "изобразительные средства" определенным образом согласованы со средствами реализации действующей модели, когда возможен "перевод" одних в другие. Требование такой согласованности, "переводимости" мы и формулируем в виде требования конструктивности описания относительно средств моделирования.
Итак, мы можем уточнить обсуждаемую схему процесса построения моделей поведения, отметив следующую ее особенность. Исследователь, приступающий к составлению описания поведения испытуемого (п.3 схемы), должен предварительно выбрать форму и технические средства построения действующей модели поведения и разработать описание в виде, конструктивном относительно избранных средств реализации.
В настоящее время наиболее распространено построение действующих моделей в виде программ для ЦВМ. Соответственно и описания поведения строятся в виде, удобном для их последующей алгоритмизации. Как правило, уже на начальных этапах составления описаний исследователи широко применяют представления и язык, ориентированные на последующее использование вычислительных машин. Этот подход хорошо иллюстрирует уже цитированная нами работа по построению модели процесса доверительной инвестиции. Описание здесь строится в виде набора блок-схем, характеризующих процессы оперирования с имеющимися в некоторой памяти информационными списками, и процессы выбора определенных решающих правил с помощью фиксированного набора инструкций. На основе блок-схемного описания строится программа для ЦВМ.
С широким использованием языка вычислительных машин связано также то обстоятельство, что, анализируя деятельность человека, современный исследователь видит в ней прежде всего операции запоминания и выборки, преобразования списков, поиска нужной информации и т.п. Вычислительные машины действительно являются высокоэффективным средством моделирования, и с их помощью осуществлен значительный прогресс в рассматриваемой нами области ИР. Определенная опасность существует, однако, в связи с тем, что, ориентируясь на использование ЦВМ, исследователи зачастую сознательно или неосознанно сужают круг используемых ими представлений и, как следствие, обнаруживают в деятельности человека прежде всего то, что легко и удобно представить с помощью существующих вычислительных средств. В отношении ряда задач такой подход может оказаться неэффективным и даже задержать развитие исследований, как это произошло, например, при поиске методов сокращения полного перебора вариантов (а идея перебора явно "подсказана" способом организации информационных процессов в машинах) при решении задач типа шахматных. Существующие методы построения действующих вычислительных моделей зачастую оказываются неэффективными и в тех случаях, когда решение задачи требует одновременной переработки информации сразу по многим каналам. Таким образом, в каждом конкретном случае выбор способа построения действующей модели и, следовательно, языка описания объекта является весьма ответственным этапом, и принятие решения здесь должно основываться на тщательном анализе специфики решаемой задачи.
Требование конструктивности описания на практике удается выполнить далеко не всегда. В связи со сложностью исследуемого поведения описание часто содержит фрагменты, заданные неконструктивно. Это приводит к тому, что на основе данного описания может быть построена не единственная действующая модель. В самом деле, сталкиваясь с неконструктивным фрагментом, исследователь вынужден каким-то образом ликвидировать имеющиеся в нем неопределенности для того, чтобы продолжать работу. При этом он выдвигает дополнительные предположения, упрощает описание и т.п. Как правило, эти операции можно выполнить различными способами. В зависимости от способа действующая модель будет реализована по-разному. Рассматриваемая ситуация в определенном смысле аналогична "заполнению разрывов" в описании. Так же, как и при "заполнении разрывов", введение новых предположений и упрощений может оказаться удачным в большей или меньшей степени, что может быть выявлено на этапе исследования поведения модели. Как и раньше, чрезвычайно важной является тщательная фиксация всех принимаемых эвристических предположений с тем, чтобы в случае необходимости можно было вернуться к их более подробному рассмотрению и коррекции.
Итак, мы рассмотрели некоторые особенности четвертого этапа исследований, связанного с построением действующих моделей гипотез. Заметим, что термин "моделирование гипотезы" в данном контексте, вообще говоря, не корректен. Понятие моделирования является более широким и содержательным, чем процедуры, составляющие описанный этап. Возможно, точнее было бы говорить о специфичных преобразованиях, даже о перекодировании моделей-гипотез. Учитывая, однако, определенное удобство и достаточную распространенность этого термина, мы и в дальнейшем будем использовать выражение "моделирование гипотезы", обозначая им процессы построения действующей модели объекта на основе его концептуальной, статической модели гипотезы.
ИССЛЕДОВАНИЕ МОДЕЛЕЙ. Рассмотрим наконец последний, пятый, этап построения модели поведения, связанный с экспериментальным исследованием разработанной действующей модели гипотезы. Основная задача этого этапа состоит в том, чтобы убедиться в пригодности модели для решения поставленной перед ней задачи. Ответ на этот вопрос можно получить, подавая на входы модели различные совокупности исходных данных и наблюдая ее выходные реакции. Мы не будем останавливаться на обсуждении особенностей этого процесса, поскольку он в значительной мере определяется спецификой решаемых задач.
Если поведение модели удовлетворяет предъявляемым требованиям, то ее построение можно считать законченным, и дальнейшая судьба модели определяется способами ее практической эксплуатации. Иначе говоря, с этого момента модель может рассматриваться как автомат, способный выполнять определенные функции человека, что и являлось конечной целью предпринятой разработки. Такая формулировка цели, как уже не раз указывалось, характерна для работ в области ИР.
На практике, однако, редко случается, чтобы исследование модели показало ее абсолютную непригодность или, наоборот, идеальное соответствие требованиям. Чаще всего исследователь обнаруживает, что в некоторых ситуациях модель оказывается не в состоянии найти нужное решение или вырабатываемое решение не удовлетворяет введенным заранее критериям. Обнаружение таких недостатков вынуждает исследователя вернуться к рассмотрению выполненных этапов работы в поисках возможных источников ошибок. Кратко рассмотрим основные приемы такого поиска.
ЛОКАЛИЗАЦИЯ ОШИБКИ. Для сложных моделей решение задачи локализации ошибки часто связано с существенными трудностями. В отдельных случаях удается локализовать ошибку только на основе тщательного анализа характера нарушений в работе модели. Более общим приемом является сравнение поведения модели с поведением человека, зафиксированным в протоколах. Сопоставляя последовательности действий человека и модели, можно определить момент, когда эти последовательности "расходятся", т.е. модель выбирает действие, отличное от выполненного человеком. Анализ причин такого "расхождения" может привести к обнаружению искомой ошибки.
Однако не всегда факт "расхождения" свидетельствует о наличии ошибки в модели. Это бывает в тех случаях, когда ситуация допускает несколько равноценных решений и действие модели является "оправданным", несмотря на его отличие от соответствующего действия человека. В качестве примера такой ситуации укажем на случай, когда в связи с отсутствием нужной информации или по характеру задачи на некотором этапе человек и машина используют стратегии случайного поиска. Совпадение решений здесь весьма маловероятно, однако действие модели оказывается правомерным.
Понятно, что возникшее в некоторый момент расхождение может привести к еще большим расхождениям в последующие моменты. В ходе решения задачи различия могут накапливаться, так что через некоторое время сравнение становится невозможным. Для того чтобы продолжить поиск ошибки, целесообразно использовать стратегию "возвращения модели на шаг назад". В нашем случае эта стратегия состоит в следующем. Сравниваются последовательные действия человека и модели. При обнаружении их расхождения проводится анализ его причин. При этом либо выявляется ошибка в модели, либо действие модели признается правомерным. В последнем случае восстанавливается состояние модели, предшествовавшее выбору данного действия, и в него вносятся изменения таким образом, чтобы модель выполнила другое действие, соответствующее действию человека. Затем сравнение продолжается. Необходимо отметить, что реализация описанной стратегии может потребовать изменения большого числа параметров модели и всегда связана с выполнением достаточно сложных информационных преобразований. Поэтому ее использование целесообразно планировать заранее, с тем, чтобы "встраивать" в модель необходимые управляющие устройства.
КРИТЕРИИ СРАВНЕНИЯ. Особые проблемы связаны также с выбором критериев для сравнения поведения человека и модели. В самом деле, значительная часть протоколов, фиксирующих деятельность человека, представляет собой запись его словесных высказываний, в то время как модели - в общем случае - не содержат механизмов, имитирующих вербальное поведение. Кроме того, в ходе решения задач человек зачастую выполняет действия, не связанные непосредственно с поиском решения, а также действия, воспроизведение которых в модели по тем или иным причинам нецелесообразно (например, характеризующиеся явной избыточностью или неоптимальностью). Протокол, таким образом, содержит "сырой" материал, использование которого для сравнения предполагает некоторую обработку. Для выполнения такой обработки и необходимо четко сформулировать критерии сравнения, а также заранее зафиксировать конечный набор правил интерпретации протокольных записей.
Конкретный вид критериев и правил интерпретации определяется исходя из целей исследования в каждом отдельном случае. Так, например, при построении модели инвестиции использован критерий конечного результата; в работе приведены данные по сравнению результатов выбора портфелей ценных бумаг, произведенного инвестором и его моделью в реальных условиях.
КОРРЕКЦИЯ МОДЕЛЕЙ. Для того чтобы обнаружить и исправить ошибку, исследователю необходимо возвратиться к более тщательному рассмотрению и проверке обоснованности допущений и предположений, принятых им в ходе конструирования данного блока. Возвратившись к рассмотрению соответствующего этапа, исследователь может исправить обнаруженную ошибку, внеся необходимые изменения. При этом ему придется в дальнейшем "провести" сделанное изменение через все последующие этапы моделирования.
В ряде случаев при "доводке" модели выясняется, что информации, собранной в ходе экспериментов с человеком, недостаточно для успешного решения задачи. Это вызывает постановку новых экспериментов, пополнение протоколов и соответствующую коррекцию гипотезы и модели. Отметим, что использование описанных циклов является характерным для всех методов, основанных в той или иной степени на использовании эвристических предположений. Некоторые авторы, публикуя полученные ими результаты в окончательном виде, избегают описания этих циклических процессов "доводки", в то время как последние часто составляют значительную часть проделанной работы, а их описание и обсуждение возникающих здесь специфических трудностей могут явиться весьма поучительными.
ОБСУЖДЕНИЕ. Мы обсудили, таким образом, ряд особенностей процесса построения одного типа моделей, которые в дальнейшем будем условно называть просто моделями поведения. То обстоятельство, что этому (далеко не исчерпывающему) обсуждению уделено сравнительно большое внимание, объясняется прежде всего типичностью используемой здесь схемы для широкого круга исследований в области искусственного разума. В дальнейшем, сталкиваясь с подобными схемами, будем пользоваться введенными понятиями и представлениями, не уделяя больше времени их подробному описанию. В большинстве случаев приведенные выше комментарии к отдельным этапам процесса построения моделей поведения с очевидными изменениями приложимы и к этапам построения моделей другого рода, а именно - моделей "процессов" и моделей "механизмов".
Прежде чем продолжить изложение, сделаем еще одно важное замечание. Все, что было сказано выше о процессе построения действующих моделей поведения человека, явилось результатом рассмотрения этой задачи со вполне определенной и ограниченной точки зрения, а именно - точки зрения разработчиков систем искусственного разума. Предполагалось, иначе говоря, что целью работы является построение системы, поведение которой в конечном счете должно быть функционально эквивалентным поведению человека при решении определенных задач. Именно такое требование, как указывалось ранее, является необходимым, чтобы обеспечить возможность использования модели в целях автоматизации.
Необходимо отметить, что аналогичные схемы исследований широко используются также для решения задач познавательного характера, когда действующая модель рассматривается как теория соответствующего поведения человека и строится как таковая. В этом случае описанный процесс имеет ряд особенностей, на обсуждении которых мы не останавливались.
Правильное понимание указанного различия необходимо при оценке конкретных исследований. Это тем более важно, что часто приходится иметь дело с исследованиями смешанного характера: автор, разработавший достаточно интересную познавательную модель, в редких случаях удерживается от соблазна обсудить ее применимость в практических целях, и, наоборот, разработчик системы, автоматизирующей решение достаточно сложных "человеческих" задач, нередко представляет ее и как модель процессов, реально выполняемых человеком. Все это создает иногда почву для различного рода малоэффективных дискуссий относительно "соотношения решения задач человеком и машиной", примеры которых можно найти в литературе по психологии.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#2. МОДЕЛИ ПРОЦЕССОВ ПЕРЕРАБОТКИ ИНФОРМАЦИИ
Для решения некоторых задач автоматизации изучение и имитация внешнего, наблюдаемого, поведения человека недостаточны. В этих случаях может оказаться эффективным подход, основанный на изучении и воспроизведении процессов переработки информации, реализуемых мозгом человека и лежащих в основе различных форм внешнего поведения. В рамках этого подхода выполнен ряд интересных работ. Остановимся на рассмотрении типичной для данного случая схемы проведения исследований.
1. Пусть нам необходимо построить автомат для решения определенных задач при условии, что применение традиционных методов синтеза и построения моделей поведения либо невозможно, либо неэффективно. Пусть также известно, что люди справляются с решением интересующих нас задач. В соответствии со спецификой этих задач зададим критерии функциональной эквивалентности поведении человека и искомого автомата.
2. Организуем наблюдение за поведением человека, решающего задачу в определенной контролируемой ситуации, и будем фиксировать в протоколах производимые им действия и словесные высказывания. Пусть в нашем распоряжении имеются также некоторые заимствованные из психологии сведения о внутренних информационных процессах, реализуемых мозгом в ходе рассматриваемой нами деятельности.
3. На основе анализа протоколов и имеющихся данных психологии попытаемся описать систему операций по переработке информации человеком.
4. В соответствии с полученным описанием построим некоторое устройство, реализующее соответствующую систему операций. Будем полагать, что такое устройство и является искомым автоматом.
5. Исследуем поведение автомата при решении интересующих нас задач. Если поведение автомата недостаточно полно (по отношению к принятым критериям) соответствует поведению человека пли по каким-либо другим причинам не является удовлетворительным, будем возвращаться к пп.2, 3 или 4, внося необходимые изменения и добиваясь соответствия поведения автомата предъявляемым требованиям.
Нетрудно заметить, что описанная схема имеет много общего со схемой построения моделей поведения. Однако имеются два существенных и связанных друг с другом отличия. Первое состоит в том, что изменена задача: гипотеза п.3 описывает уже не внешние, наблюдаемые, а внутренние, скрытые, процессы и операции. Соответственно возникает и второе различие: описание строится не только на основе сведений о том, что делает человек, но и используются данные о том, почему он поступает так или иначе.
В соответствии с указанными особенностями меняется характер отдельных этапов исследования. Так, на втором этапе в протокол заносятся все комментарии и пояснения испытуемого по поводу применяемых им решений, а также описания ощущений и состояний, возникающих у него в ходе решения задачи. Зачастую инструкции и дополнительные вопросы испытуемому формулируются таким образом, чтобы стимулировать его интроспективные описания и высказывания. Применяются также специальные виды анкет и опросников. Полученный таким образом материал может быть осмыслен и использован исследователем только в контексте какой-либо психологической теории или концепции. Использование психологических теорий является характерной чертой обсуждаемого подхода. Это, однако, не уменьшает роли объективного описания внешних, наблюдаемых, действий испытуемого. Роль такого описания состоит в том, что оно по-прежнему определяет, что именно должен делать конструируемый автомат. Пояснение же испытуемого и психологические сведения должны оказать помощь в ответе на вопрос о том, как такой автомат построить.
Весьма существенным в описываемых условиях является то обстоятельство, что предлагаемые в психологии гипотезы и теоретические обобщения носят, как правило, характер словесных описаний. Это означает, что относительно задачи построения описания (п.3) такие сведения могут дать лишь некоторую общую идею, определить основное направление работы. Что же касается собственно составления описания в конструктивной форме, то оно является в этом случае результатом целого ряда эвристических преобразований исходного материала и носит сугубо гипотетический характер. Так обстоит дело, если объектом автоматизации являются сложные, плохо поддающиеся инструментальному исследованию формы поведения. В тех же случаях, когда изучению подвергаются сравнительно узкие, ограниченные классы реакций, оказывается целесообразным проведение специальных психологических экспериментов, направленных на уточнение тех или иных частных предположений. Однако специфика психических процессов такова, что в организации даже сравнительно простых функций участвуют зачастую весьма сложные и разветвленные процессы, так что возможность экспериментального подтверждения частных предположений представляется исследователю весьма редко. В большинстве случаев это оказывается осуществимым для некоторых видов перцептивных процессов и отдельных "элементарных" психических феноменов (внимания, памяти и др.). В общем же случае результатом работы на третьем этапе исследований является выдвижение гипотезы, обоснованной лишь самым приблизительным образом. Проверка же ее правомерности проводится уже на этапе исследования действующей модели.
Наиболее распространенный способ реализации действующих моделей в настоящее время - это представление в виде программ для ЦВМ. Поэтому конструктивным языком описания гипотез, используемых на практике, является язык "элементарных" информационных процессов, которые естественно реализуются в вычислительных машинах. Машинное представление гипотез оказывается, как уже упоминалось, эффективным методом проверки их правомерности. Поэтому рассматриваемая схема исследований нашла широкое применение в области психологии, где она используется для работы с гипотезами объяснительного характера, т.е. при решении познавательных задач.
Здесь возникает ряд интересных вопросов, связанных с оценкой правомерности и перспективности применения информационного подхода в психологических исследованиях. Отметим, что большинство моделей, созданных для решения психологических проблем, могут быть эффективно использованы при автоматизации соответствующих (большей частью интеллектуальных) функций человека. В самом деле, чтобы приступить к оценке и обсуждению своей гипотезы, психолог вынужден доказать предварительно ее правомерность, т.е. исследовать действующую модель и убедиться в совпадении ее поведения с поведением испытуемых, выполнив тем самым условия, достаточные для отнесения этой модели к классу моделей ИР.
Мы не будем более подробно останавливаться на рассмотрении специфики моделирования информационных процессов мозга. В данном случае оказывается справедливым (с очевидными изменениями) целый ряд замечаний, сделанных нами в предыдущем разделе. Кроме того, обсуждаемый подход широко комментируется в психологической литературе. В качестве примера, характерного для этого подхода, можно привести работу Ньюэлла, Саймона и Шоу, посвященную моделированию человеческого мышления в ходе решения задач. Содержание и результаты этой работы подробно описаны в ряде публикаций.
#3. МОДЕЛИ "МЕХАНИЗМОВ" ПЕРЕРАБОТКИ ИНФОРМАЦИИ
Рассмотрим подход, связанный с построением автоматов, имитирующих человеческую деятельность путем воспроизведения принципов работы отдельных образований коры головного мозга человека. Многие авторы характеризуют этот подход как моделирование "механизмов" мозга и связывают его с модельным представлением отдельных нервных клеток и их совокупностей, а также работы различных отделов мозга и их взаимодействий.
Использовать термин "механизмы" в данном контексте можно, очевидно, только условно. Хорошо известно, что описание любого сложного объекта может быть выполнено на разных уровнях детализации. В иерархической системе таких разноуровневых описаний (каждое из которых может явиться адекватной моделью объекта) термином "механизм" может быть охарактеризовано любое описание, рассматриваемое в отношении к описанию более высокого уровня. Так, например, информационные процессы, протекающие в мозге, можно понимать как механизмы, порождающие внешнее, наблюдаемое, поведение. По отношению же к этим информационным процессам механизмами являются совокупности операций (опять-таки информационных), реализуемых в процессе жизнедеятельности отдельных нервных клеток. Таким образом, закрепляя за рассматриваемым подходом название "моделирование механизмов", мы делаем это условно и фиксируем в таком названии различие, состоящее в том, что в рамках этого подхода рассматриваются не процессы переработки информации, реализуемые мозгом как некоторой целостной системой, а другие по своей природе и структуре информационные процессы - те, которые реализуются отдельными структурными или функциональными единицами мозга. Иными словами, названием "моделирование механизмов" мы фиксируем определенный уровень информационного описания, а именно - нейрофизиологический.
Большое количество работ по моделированию механизмов мозга посвящено построению машинных и физических аналогов нейронных структур. С точки зрения задач искусственного разума упомянутые работы не привели к каким-либо существенным результатам. Несмотря на то что удалось создать устройства, по ряду важных свойств достаточно близкие к естественным нейронам, пока не удается построить из них нервную сеть с достаточно богатым и интересным поведением.
В рамках направления, заложенного работами Мак-Каллоха и Питтса, построены алгоритмы синтеза нейронных сетей, способные надежно реализовывать некоторые задаваемые заранее логические операции. Однако значение этих результатов не следует переоценивать, поскольку, во-первых, объем сетей, синтезируемых с помощью этих алгоритмов, невелик и, во-вторых, описание с помощью логических функций достаточно сложного поведения является трудно разрешимой (если не безнадежной) задачей. В то же время представляют значительный интерес проводимые в этом направлении исследования по построению надежных устройств из ненадежных элементов. Развитые здесь приемы могут быть использованы при конструировании отдельных звеньев устройств автоматизации.
Пороговые элементы Мак-Каллоха и Ппттса весьма упрощенно и схематично отображают свойства реального нейрона. Эта простота, по-видимому, и обеспечила успех в решении задач синтеза сетей из таких элементов. Что касается более сложных и адекватных моделей нервных клеток, то строгие методы решения аналогичных задач для этого случая не найдены. Разработка этих методов связана с существенными трудностями, обусловленными отсутствием подходящих средств формального описания и математического анализа сетевых структур большой сложности. Некоторые надежды в связи с попыткой "обойти" эти трудности возлагались на непосредственное изучение естественных нейронных сетей с целью выявления основных принципов их организации экспериментальным путем. Если бы такие принципы удалось установить, то использование их при конструировании сетей из искусственных нейронов было бы чисто механической задачей. В последнее время стало ясно, что и этот путь не является перспективным, и основным результатом предпринятых в этом направлении попыток было осознание огромной сложности нейронной организации мозга, справиться с которой существующими методами и техническими средствами нейрофизиологии оказалось невозможным.
В связи с таким положением в области ИР, занимающейся моделированием нейронных сетей, создалась кризисная ситуация. Она характеризуется тем, что, с одной стороны, имеется возможность весьма полно отображать в технических устройствах свойства нервных клеток, а с другой - отсутствуют способы использования этих точных моделей для решения технических задач. Можно полагать, что основная причина сложившейся ситуации заключается в том, что уровень нейронного описания мозга оказывается не подходящим для анализа реализуемых им информационных процессов. Иными словами, нейрон не является функциональной единицей мозга как системы, обеспечивающей сложную приспособительную деятельность человека. Именно поэтому и не удается связать процессы, реализуемые отдельными нейронами, с процессами и актами поведения, воспроизведение которых является конечной целью исследований в области ИР. Конкретные трудности, в которых выражается упомянутый разрыв, состоят прежде всего в невозможности систематического (содержательного относительно конечных форм поведения) анализа развивающихся в нейронных сетях процессов, а также в невозможности разумной предварительной организации нейронной сети. Последнее обстоятельство особенно важно, поскольку в настоящее время уже ясно, что наиболее перспективным путем моделирования сложного поведения является создание самообучающихся и самоорганизующихся систем, а успех их использования необходимо связан с некоторой начальной, предварительной, обученностью и организацией.
Необходимо отметить, однако, что в обширной области моделирования мозга существует класс задач, при решении которых использование нейронного уровня описания является целесообразным и эффективным. Эти задачи связаны с представлением в технических системах процессов узнавания образов и их классификации. Речь при этом идет не о моделировании упомянутых процессов в их полном объеме, а лишь о той их части и о тех их звеньях, которые реализуются в мозге работой анализаторных систем, прежде всего - зрительной и слуховой. Специфика анализаторных систем состоит в том, что они представлены жесткими нейронными структурами, обучение в которых практически отсутствует. Кроме того, эти структуры являются в значительной степени регулярными. Все это делает анализаторные системы удобным объектом экспериментального нейрофизиологического исследования, и здесь мы сталкиваемся именно с тем случаем, когда прямое изучение нейронных структур приводит к уяснению хотя бы основных принципов их организации. Использование этих принципов при решении технических задач осуществляется двумя путями. В некоторых случаях предпринимаются попытки применять их для создания искусственных анализаторов, чаще же они играют эвристическую роль. Такого рода исследования составляют в настоящее время основное (по крайней мере, по объему) содержание работ в области нейробионики. Здесь получены интересные результаты прикладного характера. Однако ряд важных задач, связанных с распознаванием и классификацией объектов, описываемых сложными совокупностями признаков, еще не находят своего решения. Трудности здесь связаны с представлением таких процессов, реализация которых в нервной системе человека проходит с участием ее высших отделов и, следовательно, описание которых на нейронном уровне оказывается неэффективным.
Можно сказать, таким образом, что "нейронный" этап в развитии ИР в целом завершен и дальнейшее направление работ по моделированию механизмов мозга связано с переходом на другой, более удобный, уровень описания. Мы полагаем, что такой переход обусловливает рассмотрение в качестве функциональной единицы мозга не отдельную нервную клетку, а их специфическую совокупность - нейронный ансамбль.
Представления о нейронном ансамбле и его роли в функционировании мозга впервые были сформулированы в 1949г. О.Хеббом, а в дальнейшем уточнены и развиты его последователями. В настоящее время проводится исследование функциональных свойств нейронных ансамблей методами нейрофизиологии.
Мы полагаем, что использование представлений о нейронных ансамблях при моделировании механизмов мозга является наиболее перспективным направлением в рассматриваемой области исследований. Кроме работ, выполненных на нейронном уровне, а также основанных на представлении о более крупных функциональных единицах мозга - нейронных ансамблях, к направлению, связанному с моделированием механизмов мозга, должны быть отнесены разработки, эвристической основой для которых служит изучение и анализ процессов организации интегративной деятельности мозга в ходе взаимодействия тех или иных его подсистем (ретикулярной формации, коры больших полушарий, ядер гиппокампа и т.п.).
В самом общем виде схема проведения исследований при построении моделей механизмов мозга весьма близка к описанным ранее схемам построения моделей поведения и моделей процессов. Мы не будем поэтому выписывать ее еще раз, а ограничимся лишь кратким обсуждением возникающих здесь особенностей.
В описываемом случае исходный материал для построения модели составляют: зафиксированные в протоколах наблюдения за поведением человека при решении интересующей нас задачи; заимствованные из психологии сведения о внутренних процессах переработки информации в ходе решения; заимствованные из нейрофизиологии и физиологии мозга сведения о структуре и правилах функционирования механизмов мозга. В общем случае имеющиеся сведения являются неполными, приближенными, и в ходе построения модели могут проводиться экспериментальные исследования, направленные на их дополнение.
Сведения о поведении, процессах и механизмах используются в ходе работы по-разному: данные о внешних, наблюдаемых, реакциях испытуемого и о реализуемых им информационных процессах определяют соответственно, что именно должна делать модель и какие именно внутренние процессы желательно для этого обеспечить; данные же о структуре и функционировании физиологических образований мозга подсказывают ответ на вопрос о том, как, в каком именно виде строить модель. Таким образом, гипотеза, формирование которой составляет содержание третьего этапа исследования, является в данном случае гипотезой относительно работы механизмов мозга. Проверка этой гипотезы осуществляется, как и раньше, сравнением внешнего поведения модели с поведением человека. По возможности полное воспроизведение последнего является, как и в предыдущих случаях, конечной целью исследования.
Нетрудно заметить, что обсуждаемый метод предполагает наибольшее (по сравнению с остальными) "расстояние" между исходной гипотезой и конечной целью: мы должны конструктивно определить такие механизмы, которые обеспечивали бы протекание в модели процессов, приводящих к нужным внешним реакциям.
Преимущество такого подхода заключается в том, что в иерархической системе описаний любого объекта обычно соблюдается своеобразное "правило воронки": чем ниже уровень описания, тем больший объем феноменов может быть получен или объяснен. Так, если бы нам удалось точно воспроизвести физику и химизм (т.е. "механизмы") клеточного аппарата наследственности, то со временем мы, вероятно, воспроизвели бы и весь состоящий из клеток организм. Соответственно, представив в модели механизмы некоторого наблюдаемого поведения, мы скорее всего получим модель, воспроизводящую более широкий круг поведенческих реакций, чем тот, для воспроизведения которого модель строилась. Отсюда следует еще одна особенность обсуждаемого метода: его применение может быть рекомендовано в тех случаях, когда объем автоматизируемых поведенческих реакций достаточно велик и логика этих реакций настолько сложна, что применение первых двух более простых подходов не приводит к успеху.
Описываемая схема проведения исследований широко используется также при решении задач познавательного характера, т.е. задач психологии и нейрофизиологии.
Следует отметить, что при решении некоторых задач частного характера описываемая схема применяется в неполном виде. Это происходит в тех случаях, когда целью исследования является воспроизведение в технических устройствах не тех или иных наблюдаемых форм поведения, а некоторых промежуточных процессов, реализуемых человеческим мозгом. Приведем пример. Известно, что одним из свойств памяти человека является ассоциативность запоминания и выборки. Было бы очень удобно, если бы этим свойством обладали и вычислительные машины. Целесообразно, следовательно, организовать изучение механизмов ассоциативного запоминания с тем, чтобы впоследствии использовать их модели в конструировании ЦВМ. Работы в этом направлении действительно проводятся. Видно, таким образом, что в данном случае целью моделирования механизмов мозга является воспроизведение не конкретных поведенческих актов, а процесса запоминания и выборки информации.
В качестве языка, на котором формулируются гипотезы о механизмах мозга, часто используются языки, ориентированные на последующее применение ЦВМ. Однако при использовании описываемого подхода недостатки машин, связанные с последовательным способом их работы, проявляются в наибольшей мере. Хорошо известно, что эффективность мозга как информационного устройства основана в значительной степени на способности его механизмов производить переработку информации параллельно по множеству каналов. Воспроизведение в ЦВМ этих же процессов требует "вытягивания в цепочку" операций, реализуемых мозгом одновременно, и связано с непроизводительным использованием ресурсов памяти машин и большими затратами машинного времени.
Более адекватными средствами реализации действующих моделей механизмов мозга являются аналоговые вычислительные машины и особенно - специализированные физические устройства. Перспективны также аналого-цифровые комплексы. Использование параллельной техники предъявляет, очевидно, соответствующие специфические требования и к конструктивному языку изложения гипотез.
Для решения некоторых задач автоматизации изучение и имитация внешнего, наблюдаемого, поведения человека недостаточны. В этих случаях может оказаться эффективным подход, основанный на изучении и воспроизведении процессов переработки информации, реализуемых мозгом человека и лежащих в основе различных форм внешнего поведения. В рамках этого подхода выполнен ряд интересных работ. Остановимся на рассмотрении типичной для данного случая схемы проведения исследований.
1. Пусть нам необходимо построить автомат для решения определенных задач при условии, что применение традиционных методов синтеза и построения моделей поведения либо невозможно, либо неэффективно. Пусть также известно, что люди справляются с решением интересующих нас задач. В соответствии со спецификой этих задач зададим критерии функциональной эквивалентности поведении человека и искомого автомата.
2. Организуем наблюдение за поведением человека, решающего задачу в определенной контролируемой ситуации, и будем фиксировать в протоколах производимые им действия и словесные высказывания. Пусть в нашем распоряжении имеются также некоторые заимствованные из психологии сведения о внутренних информационных процессах, реализуемых мозгом в ходе рассматриваемой нами деятельности.
3. На основе анализа протоколов и имеющихся данных психологии попытаемся описать систему операций по переработке информации человеком.
4. В соответствии с полученным описанием построим некоторое устройство, реализующее соответствующую систему операций. Будем полагать, что такое устройство и является искомым автоматом.
5. Исследуем поведение автомата при решении интересующих нас задач. Если поведение автомата недостаточно полно (по отношению к принятым критериям) соответствует поведению человека пли по каким-либо другим причинам не является удовлетворительным, будем возвращаться к пп.2, 3 или 4, внося необходимые изменения и добиваясь соответствия поведения автомата предъявляемым требованиям.
Нетрудно заметить, что описанная схема имеет много общего со схемой построения моделей поведения. Однако имеются два существенных и связанных друг с другом отличия. Первое состоит в том, что изменена задача: гипотеза п.3 описывает уже не внешние, наблюдаемые, а внутренние, скрытые, процессы и операции. Соответственно возникает и второе различие: описание строится не только на основе сведений о том, что делает человек, но и используются данные о том, почему он поступает так или иначе.
В соответствии с указанными особенностями меняется характер отдельных этапов исследования. Так, на втором этапе в протокол заносятся все комментарии и пояснения испытуемого по поводу применяемых им решений, а также описания ощущений и состояний, возникающих у него в ходе решения задачи. Зачастую инструкции и дополнительные вопросы испытуемому формулируются таким образом, чтобы стимулировать его интроспективные описания и высказывания. Применяются также специальные виды анкет и опросников. Полученный таким образом материал может быть осмыслен и использован исследователем только в контексте какой-либо психологической теории или концепции. Использование психологических теорий является характерной чертой обсуждаемого подхода. Это, однако, не уменьшает роли объективного описания внешних, наблюдаемых, действий испытуемого. Роль такого описания состоит в том, что оно по-прежнему определяет, что именно должен делать конструируемый автомат. Пояснение же испытуемого и психологические сведения должны оказать помощь в ответе на вопрос о том, как такой автомат построить.
Весьма существенным в описываемых условиях является то обстоятельство, что предлагаемые в психологии гипотезы и теоретические обобщения носят, как правило, характер словесных описаний. Это означает, что относительно задачи построения описания (п.3) такие сведения могут дать лишь некоторую общую идею, определить основное направление работы. Что же касается собственно составления описания в конструктивной форме, то оно является в этом случае результатом целого ряда эвристических преобразований исходного материала и носит сугубо гипотетический характер. Так обстоит дело, если объектом автоматизации являются сложные, плохо поддающиеся инструментальному исследованию формы поведения. В тех же случаях, когда изучению подвергаются сравнительно узкие, ограниченные классы реакций, оказывается целесообразным проведение специальных психологических экспериментов, направленных на уточнение тех или иных частных предположений. Однако специфика психических процессов такова, что в организации даже сравнительно простых функций участвуют зачастую весьма сложные и разветвленные процессы, так что возможность экспериментального подтверждения частных предположений представляется исследователю весьма редко. В большинстве случаев это оказывается осуществимым для некоторых видов перцептивных процессов и отдельных "элементарных" психических феноменов (внимания, памяти и др.). В общем же случае результатом работы на третьем этапе исследований является выдвижение гипотезы, обоснованной лишь самым приблизительным образом. Проверка же ее правомерности проводится уже на этапе исследования действующей модели.
Наиболее распространенный способ реализации действующих моделей в настоящее время - это представление в виде программ для ЦВМ. Поэтому конструктивным языком описания гипотез, используемых на практике, является язык "элементарных" информационных процессов, которые естественно реализуются в вычислительных машинах. Машинное представление гипотез оказывается, как уже упоминалось, эффективным методом проверки их правомерности. Поэтому рассматриваемая схема исследований нашла широкое применение в области психологии, где она используется для работы с гипотезами объяснительного характера, т.е. при решении познавательных задач.
Здесь возникает ряд интересных вопросов, связанных с оценкой правомерности и перспективности применения информационного подхода в психологических исследованиях. Отметим, что большинство моделей, созданных для решения психологических проблем, могут быть эффективно использованы при автоматизации соответствующих (большей частью интеллектуальных) функций человека. В самом деле, чтобы приступить к оценке и обсуждению своей гипотезы, психолог вынужден доказать предварительно ее правомерность, т.е. исследовать действующую модель и убедиться в совпадении ее поведения с поведением испытуемых, выполнив тем самым условия, достаточные для отнесения этой модели к классу моделей ИР.
Мы не будем более подробно останавливаться на рассмотрении специфики моделирования информационных процессов мозга. В данном случае оказывается справедливым (с очевидными изменениями) целый ряд замечаний, сделанных нами в предыдущем разделе. Кроме того, обсуждаемый подход широко комментируется в психологической литературе. В качестве примера, характерного для этого подхода, можно привести работу Ньюэлла, Саймона и Шоу, посвященную моделированию человеческого мышления в ходе решения задач. Содержание и результаты этой работы подробно описаны в ряде публикаций.
#3. МОДЕЛИ "МЕХАНИЗМОВ" ПЕРЕРАБОТКИ ИНФОРМАЦИИ
Рассмотрим подход, связанный с построением автоматов, имитирующих человеческую деятельность путем воспроизведения принципов работы отдельных образований коры головного мозга человека. Многие авторы характеризуют этот подход как моделирование "механизмов" мозга и связывают его с модельным представлением отдельных нервных клеток и их совокупностей, а также работы различных отделов мозга и их взаимодействий.
Использовать термин "механизмы" в данном контексте можно, очевидно, только условно. Хорошо известно, что описание любого сложного объекта может быть выполнено на разных уровнях детализации. В иерархической системе таких разноуровневых описаний (каждое из которых может явиться адекватной моделью объекта) термином "механизм" может быть охарактеризовано любое описание, рассматриваемое в отношении к описанию более высокого уровня. Так, например, информационные процессы, протекающие в мозге, можно понимать как механизмы, порождающие внешнее, наблюдаемое, поведение. По отношению же к этим информационным процессам механизмами являются совокупности операций (опять-таки информационных), реализуемых в процессе жизнедеятельности отдельных нервных клеток. Таким образом, закрепляя за рассматриваемым подходом название "моделирование механизмов", мы делаем это условно и фиксируем в таком названии различие, состоящее в том, что в рамках этого подхода рассматриваются не процессы переработки информации, реализуемые мозгом как некоторой целостной системой, а другие по своей природе и структуре информационные процессы - те, которые реализуются отдельными структурными или функциональными единицами мозга. Иными словами, названием "моделирование механизмов" мы фиксируем определенный уровень информационного описания, а именно - нейрофизиологический.
Большое количество работ по моделированию механизмов мозга посвящено построению машинных и физических аналогов нейронных структур. С точки зрения задач искусственного разума упомянутые работы не привели к каким-либо существенным результатам. Несмотря на то что удалось создать устройства, по ряду важных свойств достаточно близкие к естественным нейронам, пока не удается построить из них нервную сеть с достаточно богатым и интересным поведением.
В рамках направления, заложенного работами Мак-Каллоха и Питтса, построены алгоритмы синтеза нейронных сетей, способные надежно реализовывать некоторые задаваемые заранее логические операции. Однако значение этих результатов не следует переоценивать, поскольку, во-первых, объем сетей, синтезируемых с помощью этих алгоритмов, невелик и, во-вторых, описание с помощью логических функций достаточно сложного поведения является трудно разрешимой (если не безнадежной) задачей. В то же время представляют значительный интерес проводимые в этом направлении исследования по построению надежных устройств из ненадежных элементов. Развитые здесь приемы могут быть использованы при конструировании отдельных звеньев устройств автоматизации.
Пороговые элементы Мак-Каллоха и Ппттса весьма упрощенно и схематично отображают свойства реального нейрона. Эта простота, по-видимому, и обеспечила успех в решении задач синтеза сетей из таких элементов. Что касается более сложных и адекватных моделей нервных клеток, то строгие методы решения аналогичных задач для этого случая не найдены. Разработка этих методов связана с существенными трудностями, обусловленными отсутствием подходящих средств формального описания и математического анализа сетевых структур большой сложности. Некоторые надежды в связи с попыткой "обойти" эти трудности возлагались на непосредственное изучение естественных нейронных сетей с целью выявления основных принципов их организации экспериментальным путем. Если бы такие принципы удалось установить, то использование их при конструировании сетей из искусственных нейронов было бы чисто механической задачей. В последнее время стало ясно, что и этот путь не является перспективным, и основным результатом предпринятых в этом направлении попыток было осознание огромной сложности нейронной организации мозга, справиться с которой существующими методами и техническими средствами нейрофизиологии оказалось невозможным.
В связи с таким положением в области ИР, занимающейся моделированием нейронных сетей, создалась кризисная ситуация. Она характеризуется тем, что, с одной стороны, имеется возможность весьма полно отображать в технических устройствах свойства нервных клеток, а с другой - отсутствуют способы использования этих точных моделей для решения технических задач. Можно полагать, что основная причина сложившейся ситуации заключается в том, что уровень нейронного описания мозга оказывается не подходящим для анализа реализуемых им информационных процессов. Иными словами, нейрон не является функциональной единицей мозга как системы, обеспечивающей сложную приспособительную деятельность человека. Именно поэтому и не удается связать процессы, реализуемые отдельными нейронами, с процессами и актами поведения, воспроизведение которых является конечной целью исследований в области ИР. Конкретные трудности, в которых выражается упомянутый разрыв, состоят прежде всего в невозможности систематического (содержательного относительно конечных форм поведения) анализа развивающихся в нейронных сетях процессов, а также в невозможности разумной предварительной организации нейронной сети. Последнее обстоятельство особенно важно, поскольку в настоящее время уже ясно, что наиболее перспективным путем моделирования сложного поведения является создание самообучающихся и самоорганизующихся систем, а успех их использования необходимо связан с некоторой начальной, предварительной, обученностью и организацией.
Необходимо отметить, однако, что в обширной области моделирования мозга существует класс задач, при решении которых использование нейронного уровня описания является целесообразным и эффективным. Эти задачи связаны с представлением в технических системах процессов узнавания образов и их классификации. Речь при этом идет не о моделировании упомянутых процессов в их полном объеме, а лишь о той их части и о тех их звеньях, которые реализуются в мозге работой анализаторных систем, прежде всего - зрительной и слуховой. Специфика анализаторных систем состоит в том, что они представлены жесткими нейронными структурами, обучение в которых практически отсутствует. Кроме того, эти структуры являются в значительной степени регулярными. Все это делает анализаторные системы удобным объектом экспериментального нейрофизиологического исследования, и здесь мы сталкиваемся именно с тем случаем, когда прямое изучение нейронных структур приводит к уяснению хотя бы основных принципов их организации. Использование этих принципов при решении технических задач осуществляется двумя путями. В некоторых случаях предпринимаются попытки применять их для создания искусственных анализаторов, чаще же они играют эвристическую роль. Такого рода исследования составляют в настоящее время основное (по крайней мере, по объему) содержание работ в области нейробионики. Здесь получены интересные результаты прикладного характера. Однако ряд важных задач, связанных с распознаванием и классификацией объектов, описываемых сложными совокупностями признаков, еще не находят своего решения. Трудности здесь связаны с представлением таких процессов, реализация которых в нервной системе человека проходит с участием ее высших отделов и, следовательно, описание которых на нейронном уровне оказывается неэффективным.
Можно сказать, таким образом, что "нейронный" этап в развитии ИР в целом завершен и дальнейшее направление работ по моделированию механизмов мозга связано с переходом на другой, более удобный, уровень описания. Мы полагаем, что такой переход обусловливает рассмотрение в качестве функциональной единицы мозга не отдельную нервную клетку, а их специфическую совокупность - нейронный ансамбль.
Представления о нейронном ансамбле и его роли в функционировании мозга впервые были сформулированы в 1949г. О.Хеббом, а в дальнейшем уточнены и развиты его последователями. В настоящее время проводится исследование функциональных свойств нейронных ансамблей методами нейрофизиологии.
Мы полагаем, что использование представлений о нейронных ансамблях при моделировании механизмов мозга является наиболее перспективным направлением в рассматриваемой области исследований. Кроме работ, выполненных на нейронном уровне, а также основанных на представлении о более крупных функциональных единицах мозга - нейронных ансамблях, к направлению, связанному с моделированием механизмов мозга, должны быть отнесены разработки, эвристической основой для которых служит изучение и анализ процессов организации интегративной деятельности мозга в ходе взаимодействия тех или иных его подсистем (ретикулярной формации, коры больших полушарий, ядер гиппокампа и т.п.).
В самом общем виде схема проведения исследований при построении моделей механизмов мозга весьма близка к описанным ранее схемам построения моделей поведения и моделей процессов. Мы не будем поэтому выписывать ее еще раз, а ограничимся лишь кратким обсуждением возникающих здесь особенностей.
В описываемом случае исходный материал для построения модели составляют: зафиксированные в протоколах наблюдения за поведением человека при решении интересующей нас задачи; заимствованные из психологии сведения о внутренних процессах переработки информации в ходе решения; заимствованные из нейрофизиологии и физиологии мозга сведения о структуре и правилах функционирования механизмов мозга. В общем случае имеющиеся сведения являются неполными, приближенными, и в ходе построения модели могут проводиться экспериментальные исследования, направленные на их дополнение.
Сведения о поведении, процессах и механизмах используются в ходе работы по-разному: данные о внешних, наблюдаемых, реакциях испытуемого и о реализуемых им информационных процессах определяют соответственно, что именно должна делать модель и какие именно внутренние процессы желательно для этого обеспечить; данные же о структуре и функционировании физиологических образований мозга подсказывают ответ на вопрос о том, как, в каком именно виде строить модель. Таким образом, гипотеза, формирование которой составляет содержание третьего этапа исследования, является в данном случае гипотезой относительно работы механизмов мозга. Проверка этой гипотезы осуществляется, как и раньше, сравнением внешнего поведения модели с поведением человека. По возможности полное воспроизведение последнего является, как и в предыдущих случаях, конечной целью исследования.
Нетрудно заметить, что обсуждаемый метод предполагает наибольшее (по сравнению с остальными) "расстояние" между исходной гипотезой и конечной целью: мы должны конструктивно определить такие механизмы, которые обеспечивали бы протекание в модели процессов, приводящих к нужным внешним реакциям.
Преимущество такого подхода заключается в том, что в иерархической системе описаний любого объекта обычно соблюдается своеобразное "правило воронки": чем ниже уровень описания, тем больший объем феноменов может быть получен или объяснен. Так, если бы нам удалось точно воспроизвести физику и химизм (т.е. "механизмы") клеточного аппарата наследственности, то со временем мы, вероятно, воспроизвели бы и весь состоящий из клеток организм. Соответственно, представив в модели механизмы некоторого наблюдаемого поведения, мы скорее всего получим модель, воспроизводящую более широкий круг поведенческих реакций, чем тот, для воспроизведения которого модель строилась. Отсюда следует еще одна особенность обсуждаемого метода: его применение может быть рекомендовано в тех случаях, когда объем автоматизируемых поведенческих реакций достаточно велик и логика этих реакций настолько сложна, что применение первых двух более простых подходов не приводит к успеху.
Описываемая схема проведения исследований широко используется также при решении задач познавательного характера, т.е. задач психологии и нейрофизиологии.
Следует отметить, что при решении некоторых задач частного характера описываемая схема применяется в неполном виде. Это происходит в тех случаях, когда целью исследования является воспроизведение в технических устройствах не тех или иных наблюдаемых форм поведения, а некоторых промежуточных процессов, реализуемых человеческим мозгом. Приведем пример. Известно, что одним из свойств памяти человека является ассоциативность запоминания и выборки. Было бы очень удобно, если бы этим свойством обладали и вычислительные машины. Целесообразно, следовательно, организовать изучение механизмов ассоциативного запоминания с тем, чтобы впоследствии использовать их модели в конструировании ЦВМ. Работы в этом направлении действительно проводятся. Видно, таким образом, что в данном случае целью моделирования механизмов мозга является воспроизведение не конкретных поведенческих актов, а процесса запоминания и выборки информации.
В качестве языка, на котором формулируются гипотезы о механизмах мозга, часто используются языки, ориентированные на последующее применение ЦВМ. Однако при использовании описываемого подхода недостатки машин, связанные с последовательным способом их работы, проявляются в наибольшей мере. Хорошо известно, что эффективность мозга как информационного устройства основана в значительной степени на способности его механизмов производить переработку информации параллельно по множеству каналов. Воспроизведение в ЦВМ этих же процессов требует "вытягивания в цепочку" операций, реализуемых мозгом одновременно, и связано с непроизводительным использованием ресурсов памяти машин и большими затратами машинного времени.
Более адекватными средствами реализации действующих моделей механизмов мозга являются аналоговые вычислительные машины и особенно - специализированные физические устройства. Перспективны также аналого-цифровые комплексы. Использование параллельной техники предъявляет, очевидно, соответствующие специфические требования и к конструктивному языку изложения гипотез.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#4. ОБЩАЯ СХЕМА МОДЕЛИРОВАНИЯ
Мы рассмотрели три различных подхода к решению задач автоматизации сложного поведения человека. Каждый из них связан с построением некоторых информационных систем, выступающих в одном случае как модели внешнего, наблюдаемого, поведения; в другом - как модели процессов переработки информации, реализуемых мозгом в ходе его интегративной деятельности; в третьем - как модели "механизмов" мозга. В сущности, модели всех трех типов представляют собой разноуровневые описания единого объекта - человека, решающего задачи.
Все перечисленные подходы связаны с проведением исследований по некоторой схеме. Каждая из схем предусматривает: выдвижение гипотез, описывающих объект на том или ином фиксированном уровне; последующее представление этих гипотез в виде действующих моделей, назначение которых состоит в автоматизации выводов; сравнение этих выводов, т.е. поведения модели, с реально наблюдаемым поведением человека. Предполагается "циклический" характер исследования: после проведения операций сравнения поведения модели с поведением человека и выявления имеющихся различий либо осуществляется повторное обращение к исследованию объекта, либо производится коррекция исходной гипотезы, либо совершенствуется действующая модель - и исследование повторяется начиная с места возврата. Выполнение подобных циклов обеспечивает процесс последовательного приближения модели к такому виду, при котором она удовлетворяет всем предъявляемым к ней требованиям.
Еще раз укажем основные особенности каждого из подходов.
Подход, связанный с разработкой моделей поведения, предполагает использование в качестве исходной информации только тех данных, которые зафиксированы в протоколах наблюдений за действиями испытуемого. Гипотеза в этом случае описывает систему операций по преобразованию исходной ситуации к нужному виду. При построении гипотезы и ее модели, кроме эвристических предположений и приемов, по возможности используются данные из областей, специально исследующих структуру и принципы организации моделируемых видов деятельности. К разрабатываемым моделям предъявляется только одно требование: в ходе решения задачи модель должна делать то же, что и человек, находящийся в аналогичных условиях.
Подход, связанный с разработкой моделей процессов, предполагает использование в качестве исходной информации как протоколов, так и имеющихся в психологии (как правило, неполных) данных относительно структуры внутренних информационных процессов, реализуемых мозгом в ходе решения задач изучаемого типа. Гипотеза здесь описывает именно эти внутренние процессы. Эвристической основой гипотезы служат аналогии с процессами, протекающими в живом мозге. Однако представленные в гипотезе и ее модели принципы и схемы организации информационных процессов не "приписываются" мозгу, т.е. не ставится вопрос относительно их истинности. В данном случае требуется только, чтобы гипотеза удовлетворительно объясняла наблюдаемую феноменологию поведения, т.е. являлась правомерной. Если же в рамках какого-либо исследования предполагается проверка истинности гипотезы, то это накладывает на процесс ее построения целый ряд ограничений, связанных с необходимостью описать тот единственный вариант изучаемых процессов, который на самом деле реализуется в мозге. Такое исследование, очевидно, не принадлежит уже к области ИР, точнее, не является характерным для этой области и с большим основанием должно быть рассмотрено в рамках другой проблемы - моделирования психических функций. Таким образом, модели, разрабатываемые с помощью данного подхода, должны давать в результате один из возможных вариантов ответа на вопрос о том, как формируется поведение человека в ходе решения рассматриваемой задачи.
Подход, связанный с разработкой моделей механизмов, предполагает использование в качестве исходной информации как данных протоколов, так и имеющихся в психологии и нейрофизиологии (как правило, неполных) данных относительно структуры реализуемых мозгом внутренних информационных процессов и относительно тех естественных механизмов, функционированием которых эти процессы порождаются. Здесь гипотеза описывает именно функционирование механизмов мозга, взятое в его информационном аспекте. В связи с недостаточной изученностью механизмов мозга при построении гипотезы имеют большую эвристическую ценность сведения об информационных процессах и структуре внешнего поведения. Так, если из психологии известны, например, некоторые особенности процесса запоминания, то необходимо либо предусмотреть специальные механизмы, реализующие эти особенности в модели, либо убедиться в том, что они будут представлены в работе уже введенных ранее механизмов, обеспечивающих выполнение моделью других функций. Однако при проверке гипотезы нет принципиальной необходимости устанавливать, действительно ли модель реализует те или иные промежуточные процессы. Основным, как обычно, является соответствие поведений человека и модели. Сопоставление же протекающих в модели процессов с внутренними информационными процессами мозга имеет в данном случае вспомогательный характер и может оказаться полезным при поиске причин несоответствий в поведении модели и человека.
Итак, мы рассмотрели подходы, характерные для исследований в области ИР. Следует отметить, что в ходе рассмотрения был использован ряд упрощений и в целом оно носит несколько абстрактный характер. Именно это позволило нам более или менее четко выделить схемы исследований, характерные для различных подходов. Схемы такого рода, хоть и упрощенные, являются тем не менее удобным и эффективным инструментом при анализе практических работ по моделированию разумного поведения, а также при оценке места и значения получаемых в ходе таких работ конкретных результатов. Мы полагаем, кроме того, что ясное понимание особенностей принципиальной структуры исследования необходимо при планировании и организации новых работ в области ИР.
Среди множества конкретных работ по искусственному разуму, описания которых опубликованы за последнее десятилетие, сравнительно немногие выполнены в строгом соответствии с какой-либо одной из описанных выше схем. Однако почти в каждой из работ можно обнаружить отдельные фрагменты той или иной схемы, их разные комбинации и т.п. Таким образом, оказывается, что в рамках одного исследования зачастую используются и определенным образом совмещаются несколько разных подходов. Кроме того, существуют исследования, применяющие тот или иной подход только частично, иногда в неполной или неявной форме. В соответствии со способом использования различных схем практические работы по моделированию сложных функций человека можно разделить на несколько больших групп. Для того чтобы завершить рассмотрение интересующей нас проблемы, кратко опишем основные, наиболее представительные группы работ. Мы выделяем три такие группы, условно названные исследованиями смешанного типа, исследованиями по редуцированной схеме и исследованиями больших гипотез.
#5. ИССЛЕДОВАНИЯ СМЕШАННОГО ТИПА
Для работ, составляющих эту группу, характерно совмещение в рамках одного исследования нескольких разноуровневых подходов к описанию объекта моделирования. Возможность такого совмещения заложена в структуре схем, описывающих каждый из основных подходов. Приведем примеры.
Пусть исследование в целом выполняется по схеме моделирования наблюдаемого поведения. При обсуждении этой схемы мы упоминали, что при анализе протоколов часто возникают трудности, связанные с наличием "скачков" в ходе решения задач испытуемым. При построении описания гипотезы в соответствующих местах появляются логические разрывы, "закрытие" которых всякий раз требует специального рассмотрения и дополнительных исследований. Ясно, что такие дополнительные исследования могут проводиться по схеме моделирования процессов или даже механизмов. Если эти схемы действительно использованы, то в окончательном виде гипотеза будет содержать разноуровневые описания объекта. Иначе говоря, большая часть описания будет отображать структуру наблюдаемых поведенческих актов, а отдельные его фрагменты - структуру, например, внутренних информационных процессов мозга. Возможно и обратное. Пусть в модели внутренних процессов функции некоторых блоков сводятся к выполнению сравнительно простых операций, структура которых легко формализуется. В этом случае удобно заменить такие блоки более простыми описаниями, эквивалентными им уже на более высоком, поведенческом, уровне.
В качестве примера работы смешанного типа можно рассмотреть исследование У.Рейтмана процесса решения человеком задач "на аналогию". Построенная автором модель "Аргус" состоит из двух основных частей. Одна из них выполнена в виде "активной семантической сети", отображающей некоторую гипотезу относительно свойств хеббовских клеточных ансамблей и их взаимосвязанных совокупностей. Эта часть построена как информационная модель механизмов мозга. Другая часть названа исполнительной программой и содержит описание некоторых стратегий решения задач.
Исполнительная программа отображает гипотезу автора относительно общей структуры информационных процессов мышления. Видно, таким образом, что модель содержит два уровня описания человека, занятого решением задач определенного типа. Другим примером модели такого рода являются "неполные М-автоматы", описанные в последующих главах.
#6. ИССЛЕДОВАНИЯ ПО РЕДУЦИРОВАННОЙ СХЕМЕ
Для этой группы работ характерно проведение исследований в соответствии с какой-либо одной из описанных выше схем или их сочетанием, причем некоторые из этапов исследований, предполагаемых этими схемами, либо выполняются в сокращенном виде, либо представлены в неявной форме. Рассмотрим такие возможности подробнее.
Этапы непосредственного изучения объекта и составления описаний (гипотез) в различных работах представлены в разном объеме. Так, существует большое количество работ, где этап непосредственного изучения объекта либо практически не представлен, либо представлен не систематическим экспериментом с четкой организацией процедуры и протоколированием, а лишь некоторой суммой наблюдений за поведением людей в естественных условиях.
СПОСОБЫ ИСПОЛЬЗОВАНИЯ ЭВРИСТИК. Как было отмечено выше, в ходе решения задач человек часто использует правдоподобные заключения, рассуждения, догадки, эмпирические правила, упрощения и т.п. Приемы такого рода не всегда приводят к успеху при решении конкретной задачи, однако в большинстве случаев оказываются полезными. Такие приемы, направленные на ограничение области поиска решений, называют обычно эвристическими приемами и правилами, или эвристиками. Посмотрим, что представляет собой эвристика с точки зрения обсуждаемых нами схем.
Нетрудно обнаружить, что характер использования эвристик при решении задач ИР находится в определенной связи со сложностью последних. При решении сравнительно простых задач обычно используют формульное представление описаний, а их анализ проводят с помощью строгих математических методов. Существуют, однако, такие математические задачи, решение которых требует применения эвристических приемов. Решение, основанное на догадке или аналогии, представляется математику неубедительным и требующим проверки. Такая проверка осуществляется путем строгого обоснования найденного эвристическим путем результата с помощью формального выведения его из исходных посылок. Относительная простота задачи допускает такое выведение, и в окончательной форме доказательство носит характер строгого, корректного построения. Эвристика же оказывается "вытесненной" из решения. Процесс такого рода весьма типичен для решения математических задач и подробно описан многими математиками.
С усложнением задач роль эвристических приемов в их решении повышается. При этом строгий характер решения в целом сохраняется, а использование эвристик имеет эпизодический характер: к нему прибегают в "трудных" местах доказательств, где попытки применения строгих методов не приводят к успеху. Однако случается, что такого рода использование эвристических приемов не удается впоследствии "замаскировать" цепочками дедуктивных выводов. Этому препятствует сложность решаемой задачи. В таких случаях решение и в окончательной форме содержит интуитивные допущения, т.е. эвристика присутствует в нем как необходимое звено. Результаты такого рода, будучи некорректными, часто оказываются тем не менее весьма эффективными при решении важных практических задач.
В качестве примера укажем на разработанную Р.Беллманом процедуру динамического программирования, основанную на использовании ряда эвристик планирования. Эта процедура позволяет находить близкие к оптимальным решения для ряда таких задач, сложность которых исключает применение других, более строгих методов. К сожалению, не все математики быстро оценили целесообразность разработок такого рода. Охраняя чистоту математических методов, такие исследователи отгородились от изучения сложности высказыванием "эвристика - плохая математика", забывая о том, что "хорошая математика" в сложных случаях оказывается плохим инструментом исследования. В настоящее время, однако, имеется уже большое количество работ, основанных на сознательном использовании эвристических приемов.
Для задач максимальной сложности, связанных, как правило, с автоматизацией высших форм мышления и деятельности человека, широкое использование эвристик становится практически неизбежным. Здесь эвристики выступают не в форме приемов преодоления отдельных трудностей, а кладутся в основу решения. Систематизация, выбор и проверка эффективности таких эвристик составляют в данном случае основное содержание исследований. Подробно рассмотренные нами ранее схемы построения моделей поведения, процессов и механизмов мозга характеризуют исследования именно такого рода.
Сейчас для нас представляет интерес рассмотрение второго из перечисленных случаев, т.е. той ситуации, когда применяемая в ходе исследования эвристика играет роль вспомогательного приема для преодоления отдельных трудностей, но, будучи однажды использована, уже не может быть "вытеснена" впоследствии более строгими построениями и остается в решении как его непосредственное и необходимое звено. Посмотрим, каковы особенности эвристик такого рода.
Будем различать специализированные и универсальные эвристики. Специализированные эвристики - это такие приемы и правила, применение которых оказывается полезным при решении какой-либо одной задачи (или узкого класса однотипных задач). Обычно они формулируются в языке этой задачи и следуют из анализа ее особенностей. Таковы многие эвристики шахматной игры.
Универсальные эвристики, напротив, оказываются полезными при решении широкого класса задач; они сформулированы в виде правил и указаний весьма общего характера и следуют из обобщения большого числа наблюдений или специального исследования особенностей и структуры человеческой деятельности. Примерами универсальных эвристик являются правило "обратного пути" при доказательстве теорем, метод анализа целей и средств, эвристики планирования и т.п. Универсальные эвристики широко применяются в различных работах, поэтому именно их мы будем иметь в виду при дальнейшем рассмотрении.
Как уже упоминалось, эвристические приемы и правила возникают в результате обобщения наблюдений за процессами решения задач многими исследователями и - реже - в ходе специально поставленных экспериментов. Таким образом, они формулируют то общее, что имеется в поведении различных людей, и являются, следовательно, статистическими описаниями, моделями этого поведения. В момент, когда исследователь формулирует и решает использовать на практике ту или иную эвристику, он, естественно, не убежден еще в ее эффективности. И даже впоследствии, применив ее, он не может ожидать, что она окажется полезной и в других случаях. Отсюда следует, что эвристике как описанию определенной деятельности человека присущ выраженный гипотетический характер.
Формулирование эвристик происходит в два этапа. На первом осуществляются наблюдения за деятельностью людей, решающих задачи, на втором - осмысливаются и систематизируются результаты этих наблюдений. Второй этап завершается выдвижением гипотезы, описывающей некоторые закономерности поведения. Именно эти гипотезы и выражаются в виде эвристического правила. Нетрудно заметить, таким образом, что этапы формулирования эвристик хорошо соответствуют этапам изучения объекта и выдвижения гипотез, которые упоминались при обсуждении общих схем моделирования. Иногда оба этапа выполняются осознанно и целенаправленно. В некоторых же случаях эти этапы протекают скрыто, без явного осознания их исследователем, и тогда эвристика открывается им неожиданно, в виде догадки или "озарения".
Проверка гипотез в общем случае производится путем построения и исследования действующих моделей. Аналогичные процедуры реализуются и при использовании эвристик. Здесь имеется, правда, определенная специфика. Она состоит в том, что эвристика, принятая на некотором этапе решения, является его неотъемлемой частью. И если решение в целом оказывается успешным, то это свидетельствует об эффективности не эвристики, а данного решения, включающего в себя и эвристику. Таким образом, однократное успешное использование эвристического приема еще ничего не говорит о его пригодности в целом.
Иначе обстоит дело при широком и частом использовании данной эвристики, что как раз и характерно для рассматриваемого класса универсальных эвристик. Если то или иное правило успешно применяется при решении различных задач, то можно полагать, что оно действительно отражает нечто существенное и будет полезным в большом числе случаев. Таким образом, широкое использование эвристики является формой ее проверки. Каждый отдельный акт такой проверки связан с представлением эвристики в той или иной конкретной форме, в определенном языке, отражающем специфику решаемой задачи. Эту операцию можно трактовать как построение модели проверяемой эвристики-гипотезы. Многократная проверка различных моделей одной гипотезы в разных условиях (задачах) и является аналогом последнего этапа общей схемы моделирования - этапа исследования поведения моделей.
Мы убедились, таким образом, что описанные ранее принципиальные схемы моделирования сложного поведения удовлетворительно характеризуют также и особенности применения эвристик в тех случаях, когда они выступают в качестве вспомогательных приемов при решении задач. При этом описываемые схемами процессы формирования и проверки эвристик составляют лишь отдельные фрагменты общей структуры решения. Для таких процессов характерно, что те или иные их этапы выступают в неявной или специфически измененной форме. Имея в виду это обстоятельство, мы и рассматриваем процедуры использования универсальных эвристик как исследования, проводящиеся по редуцированным схемам.
В заключение отметим, что исследования по редуцированным схемам составляют значительную часть работ, выполненных в области искусственного разума.
#7. ИССЛЕДОВАНИЕ БОЛЬШИХ ГИПОТЕЗ
В области работ по искусственному разуму предпринимаются попытки построить максимально общую теорию, объясняющую поведение человека, и создать тем самым единую основу для построения широкого класса моделей сложных видов деятельности, а в конечном счете - и некоторую единую модель, реализующую основные принципы работы мозга. Построение такой действующей модели и явилось бы, собственно, решением проблемы искусственного разума. Ясно, что эта задача относится к числу наиболее сложных задач, какие только можно поставить перед современной наукой. Работы в этой области мы и объединили под общим названием "большие гипотезы". Таких работ немного, и каждая из них представляет огромный интерес, так как может послужить основой для ряда важных разработок более частного характера и для развития целого направления исследований.
В каждой из больших гипотез сконцентрированы в той или иной степени основные достижения наук о человеке, существующие на соответствующем этапе их развития. В качестве примеров больших гипотез, возникших, к сожалению, слишком рано - в период, когда не существовало адекватных технических средств их исследования, можно назвать систему взглядов выдающегося физиолога И.П.Павлова на законы высшей нервной деятельности, теорию поведения О.Хебба и некоторые другие. Многие из выдвигавшихся ранее больших гипотез не потеряли своей актуальности и до настоящего времени, и их исследование методами моделирования может принести интересные и неожиданные результаты.
Мы не будем подробно анализировать процедуры исследования больших гипотез, предлагать в этих случаях какие-либо схемы вряд ли целесообразно. Кратко отметим лишь две из имеющихся здесь особенностей, которые, несмотря на их очевидность, представляются нам весьма важными.
Одна из них связана с тем, что проверка большой гипотезы практически может осуществляться только по частям, т.е. так, что в конечном счете гипотеза должна быть отражена системой взаимосвязанных и согласованных между собой "частных" действующих моделей. При этом каждая из моделей решает задачи проверки отдельных положений и идей гипотезы или некоторых их совокупностей. Необходимость такого подхода объясняется именно сложностью гипотезы, исключающей возможность построения на ее основе некоторой единой модели с помощью существующих технических средств и теоретических аппаратов.
Преимущество системы моделей состоит, очевидно, в том, что ее можно строить постепенно, начиная со сравнительно простых частных моделей, отражающих основные, фундаментальные положения гипотезы, и последовательно усложняя их, добавляя новые и устанавливая связи между уже имеющимися моделями. Выделение в гипотезе отдельных проверяемых фрагментов и разработка стратегии их модельного исследования в каждом конкретном случае является весьма ответственной и тонкой задачей.
Другая особенность больших гипотез связана с языком, на котором они формулируются. Ранее мы ввели представление о конструктивности языка гипотезы и определили его в отношении к средствам реализации действующих моделей. В рассматриваемом случае это определение, очевидно, не является удовлетворительным. В самом деле, большая гипотеза в целом не должна быть ориентирована на использование тех или иных конкретных средств моделирования: ее основной смысл и специфика состоят в содержательном задании принципов воспроизведения объекта. Более того, для модельной реализации большой гипотезы часто оказывается целесообразным не использование имеющихся, а разработка новых средств реализации - создание специальных технических устройств, новых алгоритмических языков программирования и т.п. Таким образом, понятие конструктивности в данном случае имеет несколько иной смысл. Для того чтобы уточнить его, укажем на следующее обстоятельство.
Большая гипотеза, как правило, формулируется в рамках не одной какой-либо конкретной науки, изучающей человека, а должна включать в себя в общем случае данные различных конкретных наук. Для того чтобы решить эту задачу, необходим, очевидно, такой язык, который был бы удобен при описании общих принципов построения разумного поведения, тех принципов, которые изучаются каждой из конкретных наук на своем уровне и своими специфическими методами.
Таким языком в настоящее время является, по-видимому, язык описания процессов переработки информации. Этот язык конструктивен в том отношении, что, с одной стороны, он оказывается адекватным для представления существенных свойств процессов, изучаемых нейрофизиологией и психологией, и, следовательно, удобен для выражения в нем как данных обеих этих наук, так и более общих принципов и схем управления; с другой стороны, сформированные в этом языке описания могут быть естественным образом реализованы в виде действующих моделей с помощью средств аналоговой и цифровой вычислительной техники, хорошо развитой в настоящее время.
Построение действующих моделей гипотез принципиальным образом связано с введением числовой меры в исходное описание. Это обстоятельство должно учитываться и при формировании больших гипотез, а именно: основные параметры, вводимые гипотезой, должны быть представимы в числовой форме. Естественно, что сама гипотеза вряд ли может и должна содержать предположения о конкретном значении вводимых ею параметров. Однако желательно, чтобы она допускала последующее введение числовых мер без существенных изменений в своей структуре, была бы заранее ориентирована на выполнение этого важного этапа моделирования.
Большие гипотезы, как правило, содержат более или менее обобщенные, абстрактные описания объекта. При их моделировании, следовательно, неизбежен процесс конкретизации, уточнения и дополнения отдельных положений. Желательно поэтому, чтобы гипотеза в явном виде включала в себя и некоторые рекомендации для такой "расшифровки", предусматривала ее основные принципы, которые позволяли бы наложить ограничения на множество возможных вариантов интерпретации исходных положений. Гипотеза является конструктивной в тем большей степени, чем меньшее число вариантов своей реализации она допускает.
В заключение можно сказать, что чем полнее та или иная гипотеза удовлетворяет намеченным выше требованиям, тем короче оказывается путь от ее выдвижения до проверки и тем в большей степени действующие модели соответствуют исходным представлениям и идеям автора.
Мы рассмотрели, таким образом, основные направления исследований в области ИР. Предпринимая попытку систематизации в столь сложной и быстро развивающейся области исследований, мы стремились по возможности четко выделить принципиальные схемы и особенности основных направлений, с тем, прежде всего, чтобы подчеркнуть специфику работ по искусственному разуму и показать отличие этих работ от близких к ним с формальной точки зрения модельных исследований в области психологии и нейрофизиологии.
Мы рассмотрели три различных подхода к решению задач автоматизации сложного поведения человека. Каждый из них связан с построением некоторых информационных систем, выступающих в одном случае как модели внешнего, наблюдаемого, поведения; в другом - как модели процессов переработки информации, реализуемых мозгом в ходе его интегративной деятельности; в третьем - как модели "механизмов" мозга. В сущности, модели всех трех типов представляют собой разноуровневые описания единого объекта - человека, решающего задачи.
Все перечисленные подходы связаны с проведением исследований по некоторой схеме. Каждая из схем предусматривает: выдвижение гипотез, описывающих объект на том или ином фиксированном уровне; последующее представление этих гипотез в виде действующих моделей, назначение которых состоит в автоматизации выводов; сравнение этих выводов, т.е. поведения модели, с реально наблюдаемым поведением человека. Предполагается "циклический" характер исследования: после проведения операций сравнения поведения модели с поведением человека и выявления имеющихся различий либо осуществляется повторное обращение к исследованию объекта, либо производится коррекция исходной гипотезы, либо совершенствуется действующая модель - и исследование повторяется начиная с места возврата. Выполнение подобных циклов обеспечивает процесс последовательного приближения модели к такому виду, при котором она удовлетворяет всем предъявляемым к ней требованиям.
Еще раз укажем основные особенности каждого из подходов.
Подход, связанный с разработкой моделей поведения, предполагает использование в качестве исходной информации только тех данных, которые зафиксированы в протоколах наблюдений за действиями испытуемого. Гипотеза в этом случае описывает систему операций по преобразованию исходной ситуации к нужному виду. При построении гипотезы и ее модели, кроме эвристических предположений и приемов, по возможности используются данные из областей, специально исследующих структуру и принципы организации моделируемых видов деятельности. К разрабатываемым моделям предъявляется только одно требование: в ходе решения задачи модель должна делать то же, что и человек, находящийся в аналогичных условиях.
Подход, связанный с разработкой моделей процессов, предполагает использование в качестве исходной информации как протоколов, так и имеющихся в психологии (как правило, неполных) данных относительно структуры внутренних информационных процессов, реализуемых мозгом в ходе решения задач изучаемого типа. Гипотеза здесь описывает именно эти внутренние процессы. Эвристической основой гипотезы служат аналогии с процессами, протекающими в живом мозге. Однако представленные в гипотезе и ее модели принципы и схемы организации информационных процессов не "приписываются" мозгу, т.е. не ставится вопрос относительно их истинности. В данном случае требуется только, чтобы гипотеза удовлетворительно объясняла наблюдаемую феноменологию поведения, т.е. являлась правомерной. Если же в рамках какого-либо исследования предполагается проверка истинности гипотезы, то это накладывает на процесс ее построения целый ряд ограничений, связанных с необходимостью описать тот единственный вариант изучаемых процессов, который на самом деле реализуется в мозге. Такое исследование, очевидно, не принадлежит уже к области ИР, точнее, не является характерным для этой области и с большим основанием должно быть рассмотрено в рамках другой проблемы - моделирования психических функций. Таким образом, модели, разрабатываемые с помощью данного подхода, должны давать в результате один из возможных вариантов ответа на вопрос о том, как формируется поведение человека в ходе решения рассматриваемой задачи.
Подход, связанный с разработкой моделей механизмов, предполагает использование в качестве исходной информации как данных протоколов, так и имеющихся в психологии и нейрофизиологии (как правило, неполных) данных относительно структуры реализуемых мозгом внутренних информационных процессов и относительно тех естественных механизмов, функционированием которых эти процессы порождаются. Здесь гипотеза описывает именно функционирование механизмов мозга, взятое в его информационном аспекте. В связи с недостаточной изученностью механизмов мозга при построении гипотезы имеют большую эвристическую ценность сведения об информационных процессах и структуре внешнего поведения. Так, если из психологии известны, например, некоторые особенности процесса запоминания, то необходимо либо предусмотреть специальные механизмы, реализующие эти особенности в модели, либо убедиться в том, что они будут представлены в работе уже введенных ранее механизмов, обеспечивающих выполнение моделью других функций. Однако при проверке гипотезы нет принципиальной необходимости устанавливать, действительно ли модель реализует те или иные промежуточные процессы. Основным, как обычно, является соответствие поведений человека и модели. Сопоставление же протекающих в модели процессов с внутренними информационными процессами мозга имеет в данном случае вспомогательный характер и может оказаться полезным при поиске причин несоответствий в поведении модели и человека.
Итак, мы рассмотрели подходы, характерные для исследований в области ИР. Следует отметить, что в ходе рассмотрения был использован ряд упрощений и в целом оно носит несколько абстрактный характер. Именно это позволило нам более или менее четко выделить схемы исследований, характерные для различных подходов. Схемы такого рода, хоть и упрощенные, являются тем не менее удобным и эффективным инструментом при анализе практических работ по моделированию разумного поведения, а также при оценке места и значения получаемых в ходе таких работ конкретных результатов. Мы полагаем, кроме того, что ясное понимание особенностей принципиальной структуры исследования необходимо при планировании и организации новых работ в области ИР.
Среди множества конкретных работ по искусственному разуму, описания которых опубликованы за последнее десятилетие, сравнительно немногие выполнены в строгом соответствии с какой-либо одной из описанных выше схем. Однако почти в каждой из работ можно обнаружить отдельные фрагменты той или иной схемы, их разные комбинации и т.п. Таким образом, оказывается, что в рамках одного исследования зачастую используются и определенным образом совмещаются несколько разных подходов. Кроме того, существуют исследования, применяющие тот или иной подход только частично, иногда в неполной или неявной форме. В соответствии со способом использования различных схем практические работы по моделированию сложных функций человека можно разделить на несколько больших групп. Для того чтобы завершить рассмотрение интересующей нас проблемы, кратко опишем основные, наиболее представительные группы работ. Мы выделяем три такие группы, условно названные исследованиями смешанного типа, исследованиями по редуцированной схеме и исследованиями больших гипотез.
#5. ИССЛЕДОВАНИЯ СМЕШАННОГО ТИПА
Для работ, составляющих эту группу, характерно совмещение в рамках одного исследования нескольких разноуровневых подходов к описанию объекта моделирования. Возможность такого совмещения заложена в структуре схем, описывающих каждый из основных подходов. Приведем примеры.
Пусть исследование в целом выполняется по схеме моделирования наблюдаемого поведения. При обсуждении этой схемы мы упоминали, что при анализе протоколов часто возникают трудности, связанные с наличием "скачков" в ходе решения задач испытуемым. При построении описания гипотезы в соответствующих местах появляются логические разрывы, "закрытие" которых всякий раз требует специального рассмотрения и дополнительных исследований. Ясно, что такие дополнительные исследования могут проводиться по схеме моделирования процессов или даже механизмов. Если эти схемы действительно использованы, то в окончательном виде гипотеза будет содержать разноуровневые описания объекта. Иначе говоря, большая часть описания будет отображать структуру наблюдаемых поведенческих актов, а отдельные его фрагменты - структуру, например, внутренних информационных процессов мозга. Возможно и обратное. Пусть в модели внутренних процессов функции некоторых блоков сводятся к выполнению сравнительно простых операций, структура которых легко формализуется. В этом случае удобно заменить такие блоки более простыми описаниями, эквивалентными им уже на более высоком, поведенческом, уровне.
В качестве примера работы смешанного типа можно рассмотреть исследование У.Рейтмана процесса решения человеком задач "на аналогию". Построенная автором модель "Аргус" состоит из двух основных частей. Одна из них выполнена в виде "активной семантической сети", отображающей некоторую гипотезу относительно свойств хеббовских клеточных ансамблей и их взаимосвязанных совокупностей. Эта часть построена как информационная модель механизмов мозга. Другая часть названа исполнительной программой и содержит описание некоторых стратегий решения задач.
Исполнительная программа отображает гипотезу автора относительно общей структуры информационных процессов мышления. Видно, таким образом, что модель содержит два уровня описания человека, занятого решением задач определенного типа. Другим примером модели такого рода являются "неполные М-автоматы", описанные в последующих главах.
#6. ИССЛЕДОВАНИЯ ПО РЕДУЦИРОВАННОЙ СХЕМЕ
Для этой группы работ характерно проведение исследований в соответствии с какой-либо одной из описанных выше схем или их сочетанием, причем некоторые из этапов исследований, предполагаемых этими схемами, либо выполняются в сокращенном виде, либо представлены в неявной форме. Рассмотрим такие возможности подробнее.
Этапы непосредственного изучения объекта и составления описаний (гипотез) в различных работах представлены в разном объеме. Так, существует большое количество работ, где этап непосредственного изучения объекта либо практически не представлен, либо представлен не систематическим экспериментом с четкой организацией процедуры и протоколированием, а лишь некоторой суммой наблюдений за поведением людей в естественных условиях.
СПОСОБЫ ИСПОЛЬЗОВАНИЯ ЭВРИСТИК. Как было отмечено выше, в ходе решения задач человек часто использует правдоподобные заключения, рассуждения, догадки, эмпирические правила, упрощения и т.п. Приемы такого рода не всегда приводят к успеху при решении конкретной задачи, однако в большинстве случаев оказываются полезными. Такие приемы, направленные на ограничение области поиска решений, называют обычно эвристическими приемами и правилами, или эвристиками. Посмотрим, что представляет собой эвристика с точки зрения обсуждаемых нами схем.
Нетрудно обнаружить, что характер использования эвристик при решении задач ИР находится в определенной связи со сложностью последних. При решении сравнительно простых задач обычно используют формульное представление описаний, а их анализ проводят с помощью строгих математических методов. Существуют, однако, такие математические задачи, решение которых требует применения эвристических приемов. Решение, основанное на догадке или аналогии, представляется математику неубедительным и требующим проверки. Такая проверка осуществляется путем строгого обоснования найденного эвристическим путем результата с помощью формального выведения его из исходных посылок. Относительная простота задачи допускает такое выведение, и в окончательной форме доказательство носит характер строгого, корректного построения. Эвристика же оказывается "вытесненной" из решения. Процесс такого рода весьма типичен для решения математических задач и подробно описан многими математиками.
С усложнением задач роль эвристических приемов в их решении повышается. При этом строгий характер решения в целом сохраняется, а использование эвристик имеет эпизодический характер: к нему прибегают в "трудных" местах доказательств, где попытки применения строгих методов не приводят к успеху. Однако случается, что такого рода использование эвристических приемов не удается впоследствии "замаскировать" цепочками дедуктивных выводов. Этому препятствует сложность решаемой задачи. В таких случаях решение и в окончательной форме содержит интуитивные допущения, т.е. эвристика присутствует в нем как необходимое звено. Результаты такого рода, будучи некорректными, часто оказываются тем не менее весьма эффективными при решении важных практических задач.
В качестве примера укажем на разработанную Р.Беллманом процедуру динамического программирования, основанную на использовании ряда эвристик планирования. Эта процедура позволяет находить близкие к оптимальным решения для ряда таких задач, сложность которых исключает применение других, более строгих методов. К сожалению, не все математики быстро оценили целесообразность разработок такого рода. Охраняя чистоту математических методов, такие исследователи отгородились от изучения сложности высказыванием "эвристика - плохая математика", забывая о том, что "хорошая математика" в сложных случаях оказывается плохим инструментом исследования. В настоящее время, однако, имеется уже большое количество работ, основанных на сознательном использовании эвристических приемов.
Для задач максимальной сложности, связанных, как правило, с автоматизацией высших форм мышления и деятельности человека, широкое использование эвристик становится практически неизбежным. Здесь эвристики выступают не в форме приемов преодоления отдельных трудностей, а кладутся в основу решения. Систематизация, выбор и проверка эффективности таких эвристик составляют в данном случае основное содержание исследований. Подробно рассмотренные нами ранее схемы построения моделей поведения, процессов и механизмов мозга характеризуют исследования именно такого рода.
Сейчас для нас представляет интерес рассмотрение второго из перечисленных случаев, т.е. той ситуации, когда применяемая в ходе исследования эвристика играет роль вспомогательного приема для преодоления отдельных трудностей, но, будучи однажды использована, уже не может быть "вытеснена" впоследствии более строгими построениями и остается в решении как его непосредственное и необходимое звено. Посмотрим, каковы особенности эвристик такого рода.
Будем различать специализированные и универсальные эвристики. Специализированные эвристики - это такие приемы и правила, применение которых оказывается полезным при решении какой-либо одной задачи (или узкого класса однотипных задач). Обычно они формулируются в языке этой задачи и следуют из анализа ее особенностей. Таковы многие эвристики шахматной игры.
Универсальные эвристики, напротив, оказываются полезными при решении широкого класса задач; они сформулированы в виде правил и указаний весьма общего характера и следуют из обобщения большого числа наблюдений или специального исследования особенностей и структуры человеческой деятельности. Примерами универсальных эвристик являются правило "обратного пути" при доказательстве теорем, метод анализа целей и средств, эвристики планирования и т.п. Универсальные эвристики широко применяются в различных работах, поэтому именно их мы будем иметь в виду при дальнейшем рассмотрении.
Как уже упоминалось, эвристические приемы и правила возникают в результате обобщения наблюдений за процессами решения задач многими исследователями и - реже - в ходе специально поставленных экспериментов. Таким образом, они формулируют то общее, что имеется в поведении различных людей, и являются, следовательно, статистическими описаниями, моделями этого поведения. В момент, когда исследователь формулирует и решает использовать на практике ту или иную эвристику, он, естественно, не убежден еще в ее эффективности. И даже впоследствии, применив ее, он не может ожидать, что она окажется полезной и в других случаях. Отсюда следует, что эвристике как описанию определенной деятельности человека присущ выраженный гипотетический характер.
Формулирование эвристик происходит в два этапа. На первом осуществляются наблюдения за деятельностью людей, решающих задачи, на втором - осмысливаются и систематизируются результаты этих наблюдений. Второй этап завершается выдвижением гипотезы, описывающей некоторые закономерности поведения. Именно эти гипотезы и выражаются в виде эвристического правила. Нетрудно заметить, таким образом, что этапы формулирования эвристик хорошо соответствуют этапам изучения объекта и выдвижения гипотез, которые упоминались при обсуждении общих схем моделирования. Иногда оба этапа выполняются осознанно и целенаправленно. В некоторых же случаях эти этапы протекают скрыто, без явного осознания их исследователем, и тогда эвристика открывается им неожиданно, в виде догадки или "озарения".
Проверка гипотез в общем случае производится путем построения и исследования действующих моделей. Аналогичные процедуры реализуются и при использовании эвристик. Здесь имеется, правда, определенная специфика. Она состоит в том, что эвристика, принятая на некотором этапе решения, является его неотъемлемой частью. И если решение в целом оказывается успешным, то это свидетельствует об эффективности не эвристики, а данного решения, включающего в себя и эвристику. Таким образом, однократное успешное использование эвристического приема еще ничего не говорит о его пригодности в целом.
Иначе обстоит дело при широком и частом использовании данной эвристики, что как раз и характерно для рассматриваемого класса универсальных эвристик. Если то или иное правило успешно применяется при решении различных задач, то можно полагать, что оно действительно отражает нечто существенное и будет полезным в большом числе случаев. Таким образом, широкое использование эвристики является формой ее проверки. Каждый отдельный акт такой проверки связан с представлением эвристики в той или иной конкретной форме, в определенном языке, отражающем специфику решаемой задачи. Эту операцию можно трактовать как построение модели проверяемой эвристики-гипотезы. Многократная проверка различных моделей одной гипотезы в разных условиях (задачах) и является аналогом последнего этапа общей схемы моделирования - этапа исследования поведения моделей.
Мы убедились, таким образом, что описанные ранее принципиальные схемы моделирования сложного поведения удовлетворительно характеризуют также и особенности применения эвристик в тех случаях, когда они выступают в качестве вспомогательных приемов при решении задач. При этом описываемые схемами процессы формирования и проверки эвристик составляют лишь отдельные фрагменты общей структуры решения. Для таких процессов характерно, что те или иные их этапы выступают в неявной или специфически измененной форме. Имея в виду это обстоятельство, мы и рассматриваем процедуры использования универсальных эвристик как исследования, проводящиеся по редуцированным схемам.
В заключение отметим, что исследования по редуцированным схемам составляют значительную часть работ, выполненных в области искусственного разума.
#7. ИССЛЕДОВАНИЕ БОЛЬШИХ ГИПОТЕЗ
В области работ по искусственному разуму предпринимаются попытки построить максимально общую теорию, объясняющую поведение человека, и создать тем самым единую основу для построения широкого класса моделей сложных видов деятельности, а в конечном счете - и некоторую единую модель, реализующую основные принципы работы мозга. Построение такой действующей модели и явилось бы, собственно, решением проблемы искусственного разума. Ясно, что эта задача относится к числу наиболее сложных задач, какие только можно поставить перед современной наукой. Работы в этой области мы и объединили под общим названием "большие гипотезы". Таких работ немного, и каждая из них представляет огромный интерес, так как может послужить основой для ряда важных разработок более частного характера и для развития целого направления исследований.
В каждой из больших гипотез сконцентрированы в той или иной степени основные достижения наук о человеке, существующие на соответствующем этапе их развития. В качестве примеров больших гипотез, возникших, к сожалению, слишком рано - в период, когда не существовало адекватных технических средств их исследования, можно назвать систему взглядов выдающегося физиолога И.П.Павлова на законы высшей нервной деятельности, теорию поведения О.Хебба и некоторые другие. Многие из выдвигавшихся ранее больших гипотез не потеряли своей актуальности и до настоящего времени, и их исследование методами моделирования может принести интересные и неожиданные результаты.
Мы не будем подробно анализировать процедуры исследования больших гипотез, предлагать в этих случаях какие-либо схемы вряд ли целесообразно. Кратко отметим лишь две из имеющихся здесь особенностей, которые, несмотря на их очевидность, представляются нам весьма важными.
Одна из них связана с тем, что проверка большой гипотезы практически может осуществляться только по частям, т.е. так, что в конечном счете гипотеза должна быть отражена системой взаимосвязанных и согласованных между собой "частных" действующих моделей. При этом каждая из моделей решает задачи проверки отдельных положений и идей гипотезы или некоторых их совокупностей. Необходимость такого подхода объясняется именно сложностью гипотезы, исключающей возможность построения на ее основе некоторой единой модели с помощью существующих технических средств и теоретических аппаратов.
Преимущество системы моделей состоит, очевидно, в том, что ее можно строить постепенно, начиная со сравнительно простых частных моделей, отражающих основные, фундаментальные положения гипотезы, и последовательно усложняя их, добавляя новые и устанавливая связи между уже имеющимися моделями. Выделение в гипотезе отдельных проверяемых фрагментов и разработка стратегии их модельного исследования в каждом конкретном случае является весьма ответственной и тонкой задачей.
Другая особенность больших гипотез связана с языком, на котором они формулируются. Ранее мы ввели представление о конструктивности языка гипотезы и определили его в отношении к средствам реализации действующих моделей. В рассматриваемом случае это определение, очевидно, не является удовлетворительным. В самом деле, большая гипотеза в целом не должна быть ориентирована на использование тех или иных конкретных средств моделирования: ее основной смысл и специфика состоят в содержательном задании принципов воспроизведения объекта. Более того, для модельной реализации большой гипотезы часто оказывается целесообразным не использование имеющихся, а разработка новых средств реализации - создание специальных технических устройств, новых алгоритмических языков программирования и т.п. Таким образом, понятие конструктивности в данном случае имеет несколько иной смысл. Для того чтобы уточнить его, укажем на следующее обстоятельство.
Большая гипотеза, как правило, формулируется в рамках не одной какой-либо конкретной науки, изучающей человека, а должна включать в себя в общем случае данные различных конкретных наук. Для того чтобы решить эту задачу, необходим, очевидно, такой язык, который был бы удобен при описании общих принципов построения разумного поведения, тех принципов, которые изучаются каждой из конкретных наук на своем уровне и своими специфическими методами.
Таким языком в настоящее время является, по-видимому, язык описания процессов переработки информации. Этот язык конструктивен в том отношении, что, с одной стороны, он оказывается адекватным для представления существенных свойств процессов, изучаемых нейрофизиологией и психологией, и, следовательно, удобен для выражения в нем как данных обеих этих наук, так и более общих принципов и схем управления; с другой стороны, сформированные в этом языке описания могут быть естественным образом реализованы в виде действующих моделей с помощью средств аналоговой и цифровой вычислительной техники, хорошо развитой в настоящее время.
Построение действующих моделей гипотез принципиальным образом связано с введением числовой меры в исходное описание. Это обстоятельство должно учитываться и при формировании больших гипотез, а именно: основные параметры, вводимые гипотезой, должны быть представимы в числовой форме. Естественно, что сама гипотеза вряд ли может и должна содержать предположения о конкретном значении вводимых ею параметров. Однако желательно, чтобы она допускала последующее введение числовых мер без существенных изменений в своей структуре, была бы заранее ориентирована на выполнение этого важного этапа моделирования.
Большие гипотезы, как правило, содержат более или менее обобщенные, абстрактные описания объекта. При их моделировании, следовательно, неизбежен процесс конкретизации, уточнения и дополнения отдельных положений. Желательно поэтому, чтобы гипотеза в явном виде включала в себя и некоторые рекомендации для такой "расшифровки", предусматривала ее основные принципы, которые позволяли бы наложить ограничения на множество возможных вариантов интерпретации исходных положений. Гипотеза является конструктивной в тем большей степени, чем меньшее число вариантов своей реализации она допускает.
В заключение можно сказать, что чем полнее та или иная гипотеза удовлетворяет намеченным выше требованиям, тем короче оказывается путь от ее выдвижения до проверки и тем в большей степени действующие модели соответствуют исходным представлениям и идеям автора.
Мы рассмотрели, таким образом, основные направления исследований в области ИР. Предпринимая попытку систематизации в столь сложной и быстро развивающейся области исследований, мы стремились по возможности четко выделить принципиальные схемы и особенности основных направлений, с тем, прежде всего, чтобы подчеркнуть специфику работ по искусственному разуму и показать отличие этих работ от близких к ним с формальной точки зрения модельных исследований в области психологии и нейрофизиологии.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
РАЗДЕЛ II. М-АВТОМАТЫ И ПРОГРАММЫ РАЗУМНОЙ ДЕЯТЕЛЬНОСТИ
Гипотеза о программах и механизмах переработки информации мозгом человека может быть отнесена к классу больших гипотез, особенности которых обсуждались в предыдущей главе. В соответствии с этим гипотеза должна ответить на такие основные вопросы: 1) что именно делает мозг человека как система, управляющая его поведением, в чем состоит принципиальный смысл протекающих в мозге процессов и 2) как реализует мозг свои функции, каковы возможные механизмы такой реализации. Ответ на первый вопрос должен определить те аспекты работы мозга, которые необходимо воспроизвести в моделях, способных к разумному поведению, ответ на второй - основные пути практической реализации действующих моделей.
Мозг, согласно гипотезе,- система, воспринимающая, хранящая и перерабатывающая информацию. С этой точки зрения протекающие в мозге процессы рассматриваются как процессы формирования и функционирования информационных моделей внешнего и внутреннего мира. В качестве информационной системы мозг может быть описан путем перечисления реализуемых им программ. Понятие программы является весьма общим и применимо для описания любой сложной системы. Указание набора и содержания программ какой-либо системы служит своеобразной формой ее определения, а воспроизведение тех же программ другими средствами составляет задачу моделирования. Основной системой искусственного разума является, следовательно, создание таких технических систем, программы которых совпадали бы с программами мозга.
Термин "программа" имеет несколько значений. В кибернетической литературе наиболее часто его употребляют для обозначения последовательности команд для ЦВМ. Отметим, что в данном разделе мы не будем использовать термин "программа" в таком смысле. Если же это окажется необходимым, то всякий раз специально это оговорим.
Многие из вводимых ниже понятий могут быть естественным образом формализованы в терминах, например, теории конечных автоматов. Мы, однако, отказались от такой формализации, так как наша цель - дать читателю содержательное представление об используемом подходе.
Понятие программы является инструментом теоретического анализа поведения систем. Мы не предлагаем рассматривать человека как некоторый программный автомат, поведение которого в каждый момент времени определяется развитием какой-либо одной программы. Такого рода подход, в принципе, может быть, и правомерный, неизбежно окажется неконструктивным из-за огромного разнообразия как поведенческих реакций, так и внешних воздействий, которые человек может воспринять и на которые он в состоянии адекватно реагировать. Напротив, понятие программы используется нами для описания возможных реакций человека в некоторых абстрактных, условных ситуациях, предъявляющих человеку единственное внешнее воздействие (при этом безразлично, будет ли такое воздействие осознано). Что же касается реальных ситуаций, содержащих множество раздражителей, то поведение человека в них рассматривается как результат одновременного развития и взаимодействия между собой множества различных программ.
При построении действующих моделей сложного поведения нам придется решать задачи воспроизведения программ с помощью тех или иных технических средств. Физические и вычислительные устройства, предназначенные для воспроизведения определенных программ, будем называть автоматами. В соответствии с данным определением, автомат - всегда искусственная система, построенная специально для воспроизведения каких-либо программ. Таким образом, действующие модели поведения, процессов переработки информации и механизмов мозга есть автоматы.
Построение действующей модели системы подразумевает построение автомата, реализующего описание системы. Поведение этого автомата должно хорошо совпадать с поведением системы-оригинала, что и является основным требованием, предъявляемым к действующим моделям в области искусственного разума.
ГЛАВА 3. ОСНОВНЫЕ ПОЛОЖЕНИЯ РАБОЧЕЙ ГИПОТЕЗЫ
Гипотеза о программах переработки информации мозгом и механизмах их реализации основана на анализе существующих нейрофизиологических, нейропсихологических и психологических данных. Подробно гипотеза изложена в более ранних работах. В настоящей главе мы ограничимся лишь кратким описанием некоторых ее положений и введем используемую в дальнейшем терминологию.
#1. МОЗГ КАК МОДЕЛИРУЮЩАЯ СИСТЕМА
Высшие отделы центральной нервной системы человека включают в себя иерархически организованные подсистемы. В информационном аспекте отношения между этими подсистемами есть отношения моделирования: каждая высшая подсистема отображает в состояниях некоторых своих элементов состояния низшей подсистемы, т.е. моделирует ее. Вершина этой иерархии - кора головного мозга.
Кора содержит информационные модели состояний нижележащих отделов мозга и постоянно формирует динамические модели процессов, развивающихся в этих отделах. Так, например, известно, что формирование эмоциональных состояний человека связано с функциями определенных подкорковых структур (таламуса, гипоталамуса, лимбической системы). Различные состояния этих структур представлены в коре своими информационными моделями. Поэтому возникновение какого-либо определенного состояния, связанного, к примеру, с потребностью в пище, вызывает активность соответствующей модели в коре. Активирование такой модели сопровождается специфичным субъективным переживанием и осознанием чувства голода. Та же самая модель может быть активирована не только возникновением соответствующего ей состояния подкорковых образований, но и влиянием на нее других моделей, имеющихся в коре. Активированная корковая модель, как правило, поддерживает соответствующее ей состояние подкорковых образований, так что между этими двумя элементами в общем случае могут существовать как прямые, так и обратные связи.
С другой стороны, кора содержит в себе модели объектов, явлений и процессов внешнего по отношению к человеку мира. Эти модели формируются в результате работы анализаторных систем. Если модель какого-либо объекта уже сформирована в коре, то повторное восприятие этого объекта активирует его модель. Активность корковой модели переживается человеком субъективно в виде мысли о соответствующем объекте. В общем случае мысль об определенном объекте вызывает настройку рецепторов и анализаторов на его восприятие, так что и в этом случае можно говорить о наличии механизмов обратной связи. Как и в предыдущем случае, активность модели может быть вызвана не только непосредственным восприятием соответствующего объекта, но и влиянием со стороны других моделей - "по ассоциации".
Поясним смысл уже использованного нами понятия АКТИВНОСТИ, или ВОЗБУЖДЕНИЯ, корковой модели. Это - одно из важнейших понятий гипотезы. Ему не следует приписывать какого-либо физиологического содержания - понятие активности фиксирует исключительно информационные характеристики состояния моделей.
Модель - это некоторый функциональный элемент коры, фиксирующий определенную информацию. Несколько упрощая, будем говорить, что результатом процессов переработки информации в коре является принятие тех или иных решений. Очевидно, что для принятия определенного решения не обязательно использовать весь объем имеющейся информации. Отдельные ее фрагменты при выработке данного решения не имеют ценности, не являются актуальными. Одни фрагменты могут играть в этом случае вспомогательную, другие - ведущую роль. Можно говорить, таким образом, о МЕРЕ использования той или иной информации в формировании решения.
Именно эту меру и характеризует степень активности моделей. Иначе говоря, чем активнее информационная модель в данный момент, тем большую роль в процессе формирования решения играет в этот момент соответствующая этой модели информация. Активность, следовательно, может иметь различные значения; мы будем характеризовать ее специальной числовой переменной, называемой ВОЗБУЖДЕННОСТЬЮ модели. Возбужденность может изменяться от нулевого до некоторого максимального положительного значения. Если возбужденность модели в некоторый момент равна нулю, это означает, что соответствующая информация в данный момент не используется и модель является пассивным элементом системы, осуществляющим функцию хранения информации. Рост возбужденности указывает на включение модели в процесс подготовки решения, а значение возбужденности - на степень участия модели в этом процессе. Можно сказать, что значение возбужденности модели характеризует меру прагматической ценности соответствующей информации.
Введенное таким образом понимание активности является несколько упрощенным, и в дальнейшем мы уточним его в ходе описания аппарата моделирования.
Итак, гипотеза представляет кору в виде некоторой совокупности информационных моделей объектов и явлений внешнего и внутреннего мира человека. Процессы переработки информации в коре трактуются как процессы взаимодействия таких моделей. Сущность этого взаимодействия состоит в том, что в зависимости от степени собственной активности каждая из моделей может изменять состояние, т.е. степень возбуждения, других моделей. При этом чем выше возбужденность модели, тем сильнее ее воздействие. Воздействие одной модели на другую может быть как усиливающим, так и тормозным. Передача воздействий осуществляется по определенным каналам - СВЯЗЯМ, имеющимся между моделями. Гипотеза определяет закономерности возникновения, исчезновения и изменения состояния связей.
Таким образом, процессы переработки информации выражаются в изменении активности информационных моделей. Большую роль в этих процессах играет система усиления - торможения (СУТ), которая изменяет активности различных моделей в зависимости от степени важности соответствующей им информации и дает возможность быстро перераспределять эту активность при изменении внешней обстановки или состояния организма.
Функцией СУТ является выделение и усиление в каждый момент времени модели (или группы моделей) с наибольшей активностью. Все другие при этом автоматически тормозятся. Законы СУТ таковы, что возбужденность выделенной модели в последующие моменты времени резко снижается и СУТ переключается на другую модель (модели), обладающую наибольшей активностью. В результате доминирующую роль в процессе взаимодействия информационных моделей постоянно играют те из них, которые фиксируют наиболее важную в данный момент информацию.
О наличии некоторого механизма, упорядочивающего активность мозга и обеспечивающего единую реакцию организма, свидетельствуют многочисленные работы по исследованию функционирования нервных структур. Так, еще А.А.Ухтомский связывал такой механизм упорядочения с принципом доминанты. Термином "доминанта" он обозначал "господствующий очаг возбуждения, предопределяющий в значительной степени характер текущих реакций центров в данный момент". Принцип доминанты А.А.Ухтомский рассматривал как "физиологическую основу акта внимания".
Выделенную СУТ модель можно понимать как "осознанную доминанту" в отличие от всех остальных, не выделенных в этот момент, лишь "потенциальных доминант". По образным словам А.А.Ухтомского, "в душе могут жить одновременно множество потенциальных доминант - следов от прежней жизнедеятельности. Они поочередно выплывают в поле душевной работы и ясного внимания, живут здесь некоторое время, подводя своп итоги, и затем снова погружаются вглубь, уступая поле товаркам. Но и при погружении из поля ясной работы создания они не замирают и не прекращают своей жизни".
Активность информационных моделей также постоянно изменяется во времени - уменьшается или увеличивается. Они "не замирают и не прекращают своей жизни" еще долгое время после того, как непосредственно вызвавшие их активность раздражения уже перестали действовать. В тот момент, когда модель выделяется СУТ, ее активность увеличивается, она "выплывает в поле душевной работы и ясного внимания", затем активность снижается и модель "погружается вглубь, уступая поле товаркам".
Деятельность СУТ позволяет дать содержательную интерпретацию таким терминам, как сознание и подсознание, мышление, мысль. Подробнее эти вопросы будут рассмотрены ниже.
Итак, кора содержит модели состояний нижележащих отделов мозга и модели внешнего мира. Кроме того, в коре имеются модели эффекторных систем организма (их состояний и программ). В ходе функционирования в коре возникают также модели более высоких уровней - модели моделей, соответствующие абстрактным понятиям и представлениям. Все эти модели могут связываться между собой, образуя в целом некоторую динамическую систему, которая отображает в своих состояниях внутренние побуждения и внешние условия организма, интегрируя их и вырабатывая на этой основе сложные поведенческие реакции.
Понимаемые таким образом интегративные функции коры и должны явиться, согласно гипотезе, основным объектом изучения и моделирования, проводимого как с целью их познания в рамках психологии, так и для создания технических систем, способных к разумному поведению.
В заключение остановимся на рассмотрении некоторых дополнительных аспектов гипотезы. Представление о том, что суть протекающих в мозге процессов (при их рассмотрении в информационном аспекте) состоит в формировании единой внутренней информационной модели внешнего мира, не является новым и высказывалось уже рядом авторов. В рамках предлагаемой гипотезы, по существу, предпринимаются дальнейшие шаги по развитию и конкретизации упомянутого представления. Эти шаги связаны со стремлением в конструктивной форме ответить на вопросы о том, какова принципиальная структура внутренней информационной модели, каковы законы ее функционирования и формирования, как реализуются ее управляющие функции. Предлагаемые гипотезой ответы основаны на представлении о внутренней модели мира как о СОВОКУПНОСТИ корковых информационных моделей его отдельных объектов. Такие модели взаимодействуют не только друг с другом, но и с моделями состояний нижележащих отделов мозга, эффекторных систем и т.д. Все представленные в коре модели рассматриваются как функционирующие по сходным законам функциональные элементы единой информационной системы - внутренней модели мира.
Одним из рабочих положений гипотезы является аналогия, устанавливаемая между законами формирования и характеристиками корковых информационных моделей, с одной стороны, и законами формирования и характеристиками нейронных ансамблей типа хеббовского - с другой.
В настоящее время принято считать, что основной структурный элемент мозга - нейрон. Что же касается определения функциональной единицы мозга, то здесь единого мнения нет. Часть нейрофизиологов полагает, что такой функциональной единицей также является нейрон. Однако объяснение ряда феноменов высшей нервной деятельности при таком понимании оказывается затруднительным. Для того чтобы преодолеть эти трудности, допускается значительное расширение функций нейрона, не вытекающих непосредственно из его физиологических свойств.
Развитие нейрофизиологических исследований показало, что в качестве функциональной единицы мозга имеет смысл рассматривать не отдельный нейрон, а совокупность взаимосвязанных нервных клеток - ансамбль. При определении функциональных свойств ансамбля имеется принципиальная возможность учитывать взаимодействие элементов, различных по своим физиологическим свойствам, например нейронов и глиальных клеток. Это значительно расширяет возможности понимания и модельного представления сложных физиологических механизмов, лежащих в основе процессов хранения и переработки информации корой головного мозга.
Итак, мы пользуемся предположением о том, что ансамбли нервных клеток являются субстратными аналогами корковых информационных моделей. Это предположение, вообще говоря, не является необходимым для наших построений и не определяет сути гипотезы. Однако его использование удобно в том отношении, что создает эвристическую основу для задания функциональных характеристик формальных элементов, сопоставляемых с корковыми информационными моделями.
Гипотеза о программах и механизмах переработки информации мозгом человека может быть отнесена к классу больших гипотез, особенности которых обсуждались в предыдущей главе. В соответствии с этим гипотеза должна ответить на такие основные вопросы: 1) что именно делает мозг человека как система, управляющая его поведением, в чем состоит принципиальный смысл протекающих в мозге процессов и 2) как реализует мозг свои функции, каковы возможные механизмы такой реализации. Ответ на первый вопрос должен определить те аспекты работы мозга, которые необходимо воспроизвести в моделях, способных к разумному поведению, ответ на второй - основные пути практической реализации действующих моделей.
Мозг, согласно гипотезе,- система, воспринимающая, хранящая и перерабатывающая информацию. С этой точки зрения протекающие в мозге процессы рассматриваются как процессы формирования и функционирования информационных моделей внешнего и внутреннего мира. В качестве информационной системы мозг может быть описан путем перечисления реализуемых им программ. Понятие программы является весьма общим и применимо для описания любой сложной системы. Указание набора и содержания программ какой-либо системы служит своеобразной формой ее определения, а воспроизведение тех же программ другими средствами составляет задачу моделирования. Основной системой искусственного разума является, следовательно, создание таких технических систем, программы которых совпадали бы с программами мозга.
Термин "программа" имеет несколько значений. В кибернетической литературе наиболее часто его употребляют для обозначения последовательности команд для ЦВМ. Отметим, что в данном разделе мы не будем использовать термин "программа" в таком смысле. Если же это окажется необходимым, то всякий раз специально это оговорим.
Многие из вводимых ниже понятий могут быть естественным образом формализованы в терминах, например, теории конечных автоматов. Мы, однако, отказались от такой формализации, так как наша цель - дать читателю содержательное представление об используемом подходе.
Понятие программы является инструментом теоретического анализа поведения систем. Мы не предлагаем рассматривать человека как некоторый программный автомат, поведение которого в каждый момент времени определяется развитием какой-либо одной программы. Такого рода подход, в принципе, может быть, и правомерный, неизбежно окажется неконструктивным из-за огромного разнообразия как поведенческих реакций, так и внешних воздействий, которые человек может воспринять и на которые он в состоянии адекватно реагировать. Напротив, понятие программы используется нами для описания возможных реакций человека в некоторых абстрактных, условных ситуациях, предъявляющих человеку единственное внешнее воздействие (при этом безразлично, будет ли такое воздействие осознано). Что же касается реальных ситуаций, содержащих множество раздражителей, то поведение человека в них рассматривается как результат одновременного развития и взаимодействия между собой множества различных программ.
При построении действующих моделей сложного поведения нам придется решать задачи воспроизведения программ с помощью тех или иных технических средств. Физические и вычислительные устройства, предназначенные для воспроизведения определенных программ, будем называть автоматами. В соответствии с данным определением, автомат - всегда искусственная система, построенная специально для воспроизведения каких-либо программ. Таким образом, действующие модели поведения, процессов переработки информации и механизмов мозга есть автоматы.
Построение действующей модели системы подразумевает построение автомата, реализующего описание системы. Поведение этого автомата должно хорошо совпадать с поведением системы-оригинала, что и является основным требованием, предъявляемым к действующим моделям в области искусственного разума.
ГЛАВА 3. ОСНОВНЫЕ ПОЛОЖЕНИЯ РАБОЧЕЙ ГИПОТЕЗЫ
Гипотеза о программах переработки информации мозгом и механизмах их реализации основана на анализе существующих нейрофизиологических, нейропсихологических и психологических данных. Подробно гипотеза изложена в более ранних работах. В настоящей главе мы ограничимся лишь кратким описанием некоторых ее положений и введем используемую в дальнейшем терминологию.
#1. МОЗГ КАК МОДЕЛИРУЮЩАЯ СИСТЕМА
Высшие отделы центральной нервной системы человека включают в себя иерархически организованные подсистемы. В информационном аспекте отношения между этими подсистемами есть отношения моделирования: каждая высшая подсистема отображает в состояниях некоторых своих элементов состояния низшей подсистемы, т.е. моделирует ее. Вершина этой иерархии - кора головного мозга.
Кора содержит информационные модели состояний нижележащих отделов мозга и постоянно формирует динамические модели процессов, развивающихся в этих отделах. Так, например, известно, что формирование эмоциональных состояний человека связано с функциями определенных подкорковых структур (таламуса, гипоталамуса, лимбической системы). Различные состояния этих структур представлены в коре своими информационными моделями. Поэтому возникновение какого-либо определенного состояния, связанного, к примеру, с потребностью в пище, вызывает активность соответствующей модели в коре. Активирование такой модели сопровождается специфичным субъективным переживанием и осознанием чувства голода. Та же самая модель может быть активирована не только возникновением соответствующего ей состояния подкорковых образований, но и влиянием на нее других моделей, имеющихся в коре. Активированная корковая модель, как правило, поддерживает соответствующее ей состояние подкорковых образований, так что между этими двумя элементами в общем случае могут существовать как прямые, так и обратные связи.
С другой стороны, кора содержит в себе модели объектов, явлений и процессов внешнего по отношению к человеку мира. Эти модели формируются в результате работы анализаторных систем. Если модель какого-либо объекта уже сформирована в коре, то повторное восприятие этого объекта активирует его модель. Активность корковой модели переживается человеком субъективно в виде мысли о соответствующем объекте. В общем случае мысль об определенном объекте вызывает настройку рецепторов и анализаторов на его восприятие, так что и в этом случае можно говорить о наличии механизмов обратной связи. Как и в предыдущем случае, активность модели может быть вызвана не только непосредственным восприятием соответствующего объекта, но и влиянием со стороны других моделей - "по ассоциации".
Поясним смысл уже использованного нами понятия АКТИВНОСТИ, или ВОЗБУЖДЕНИЯ, корковой модели. Это - одно из важнейших понятий гипотезы. Ему не следует приписывать какого-либо физиологического содержания - понятие активности фиксирует исключительно информационные характеристики состояния моделей.
Модель - это некоторый функциональный элемент коры, фиксирующий определенную информацию. Несколько упрощая, будем говорить, что результатом процессов переработки информации в коре является принятие тех или иных решений. Очевидно, что для принятия определенного решения не обязательно использовать весь объем имеющейся информации. Отдельные ее фрагменты при выработке данного решения не имеют ценности, не являются актуальными. Одни фрагменты могут играть в этом случае вспомогательную, другие - ведущую роль. Можно говорить, таким образом, о МЕРЕ использования той или иной информации в формировании решения.
Именно эту меру и характеризует степень активности моделей. Иначе говоря, чем активнее информационная модель в данный момент, тем большую роль в процессе формирования решения играет в этот момент соответствующая этой модели информация. Активность, следовательно, может иметь различные значения; мы будем характеризовать ее специальной числовой переменной, называемой ВОЗБУЖДЕННОСТЬЮ модели. Возбужденность может изменяться от нулевого до некоторого максимального положительного значения. Если возбужденность модели в некоторый момент равна нулю, это означает, что соответствующая информация в данный момент не используется и модель является пассивным элементом системы, осуществляющим функцию хранения информации. Рост возбужденности указывает на включение модели в процесс подготовки решения, а значение возбужденности - на степень участия модели в этом процессе. Можно сказать, что значение возбужденности модели характеризует меру прагматической ценности соответствующей информации.
Введенное таким образом понимание активности является несколько упрощенным, и в дальнейшем мы уточним его в ходе описания аппарата моделирования.
Итак, гипотеза представляет кору в виде некоторой совокупности информационных моделей объектов и явлений внешнего и внутреннего мира человека. Процессы переработки информации в коре трактуются как процессы взаимодействия таких моделей. Сущность этого взаимодействия состоит в том, что в зависимости от степени собственной активности каждая из моделей может изменять состояние, т.е. степень возбуждения, других моделей. При этом чем выше возбужденность модели, тем сильнее ее воздействие. Воздействие одной модели на другую может быть как усиливающим, так и тормозным. Передача воздействий осуществляется по определенным каналам - СВЯЗЯМ, имеющимся между моделями. Гипотеза определяет закономерности возникновения, исчезновения и изменения состояния связей.
Таким образом, процессы переработки информации выражаются в изменении активности информационных моделей. Большую роль в этих процессах играет система усиления - торможения (СУТ), которая изменяет активности различных моделей в зависимости от степени важности соответствующей им информации и дает возможность быстро перераспределять эту активность при изменении внешней обстановки или состояния организма.
Функцией СУТ является выделение и усиление в каждый момент времени модели (или группы моделей) с наибольшей активностью. Все другие при этом автоматически тормозятся. Законы СУТ таковы, что возбужденность выделенной модели в последующие моменты времени резко снижается и СУТ переключается на другую модель (модели), обладающую наибольшей активностью. В результате доминирующую роль в процессе взаимодействия информационных моделей постоянно играют те из них, которые фиксируют наиболее важную в данный момент информацию.
О наличии некоторого механизма, упорядочивающего активность мозга и обеспечивающего единую реакцию организма, свидетельствуют многочисленные работы по исследованию функционирования нервных структур. Так, еще А.А.Ухтомский связывал такой механизм упорядочения с принципом доминанты. Термином "доминанта" он обозначал "господствующий очаг возбуждения, предопределяющий в значительной степени характер текущих реакций центров в данный момент". Принцип доминанты А.А.Ухтомский рассматривал как "физиологическую основу акта внимания".
Выделенную СУТ модель можно понимать как "осознанную доминанту" в отличие от всех остальных, не выделенных в этот момент, лишь "потенциальных доминант". По образным словам А.А.Ухтомского, "в душе могут жить одновременно множество потенциальных доминант - следов от прежней жизнедеятельности. Они поочередно выплывают в поле душевной работы и ясного внимания, живут здесь некоторое время, подводя своп итоги, и затем снова погружаются вглубь, уступая поле товаркам. Но и при погружении из поля ясной работы создания они не замирают и не прекращают своей жизни".
Активность информационных моделей также постоянно изменяется во времени - уменьшается или увеличивается. Они "не замирают и не прекращают своей жизни" еще долгое время после того, как непосредственно вызвавшие их активность раздражения уже перестали действовать. В тот момент, когда модель выделяется СУТ, ее активность увеличивается, она "выплывает в поле душевной работы и ясного внимания", затем активность снижается и модель "погружается вглубь, уступая поле товаркам".
Деятельность СУТ позволяет дать содержательную интерпретацию таким терминам, как сознание и подсознание, мышление, мысль. Подробнее эти вопросы будут рассмотрены ниже.
Итак, кора содержит модели состояний нижележащих отделов мозга и модели внешнего мира. Кроме того, в коре имеются модели эффекторных систем организма (их состояний и программ). В ходе функционирования в коре возникают также модели более высоких уровней - модели моделей, соответствующие абстрактным понятиям и представлениям. Все эти модели могут связываться между собой, образуя в целом некоторую динамическую систему, которая отображает в своих состояниях внутренние побуждения и внешние условия организма, интегрируя их и вырабатывая на этой основе сложные поведенческие реакции.
Понимаемые таким образом интегративные функции коры и должны явиться, согласно гипотезе, основным объектом изучения и моделирования, проводимого как с целью их познания в рамках психологии, так и для создания технических систем, способных к разумному поведению.
В заключение остановимся на рассмотрении некоторых дополнительных аспектов гипотезы. Представление о том, что суть протекающих в мозге процессов (при их рассмотрении в информационном аспекте) состоит в формировании единой внутренней информационной модели внешнего мира, не является новым и высказывалось уже рядом авторов. В рамках предлагаемой гипотезы, по существу, предпринимаются дальнейшие шаги по развитию и конкретизации упомянутого представления. Эти шаги связаны со стремлением в конструктивной форме ответить на вопросы о том, какова принципиальная структура внутренней информационной модели, каковы законы ее функционирования и формирования, как реализуются ее управляющие функции. Предлагаемые гипотезой ответы основаны на представлении о внутренней модели мира как о СОВОКУПНОСТИ корковых информационных моделей его отдельных объектов. Такие модели взаимодействуют не только друг с другом, но и с моделями состояний нижележащих отделов мозга, эффекторных систем и т.д. Все представленные в коре модели рассматриваются как функционирующие по сходным законам функциональные элементы единой информационной системы - внутренней модели мира.
Одним из рабочих положений гипотезы является аналогия, устанавливаемая между законами формирования и характеристиками корковых информационных моделей, с одной стороны, и законами формирования и характеристиками нейронных ансамблей типа хеббовского - с другой.
В настоящее время принято считать, что основной структурный элемент мозга - нейрон. Что же касается определения функциональной единицы мозга, то здесь единого мнения нет. Часть нейрофизиологов полагает, что такой функциональной единицей также является нейрон. Однако объяснение ряда феноменов высшей нервной деятельности при таком понимании оказывается затруднительным. Для того чтобы преодолеть эти трудности, допускается значительное расширение функций нейрона, не вытекающих непосредственно из его физиологических свойств.
Развитие нейрофизиологических исследований показало, что в качестве функциональной единицы мозга имеет смысл рассматривать не отдельный нейрон, а совокупность взаимосвязанных нервных клеток - ансамбль. При определении функциональных свойств ансамбля имеется принципиальная возможность учитывать взаимодействие элементов, различных по своим физиологическим свойствам, например нейронов и глиальных клеток. Это значительно расширяет возможности понимания и модельного представления сложных физиологических механизмов, лежащих в основе процессов хранения и переработки информации корой головного мозга.
Итак, мы пользуемся предположением о том, что ансамбли нервных клеток являются субстратными аналогами корковых информационных моделей. Это предположение, вообще говоря, не является необходимым для наших построений и не определяет сути гипотезы. Однако его использование удобно в том отношении, что создает эвристическую основу для задания функциональных характеристик формальных элементов, сопоставляемых с корковыми информационными моделями.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#2. ПОНЯТИЕ О ПРОГРАММАХ
Термин "программа" имеет несколько значений. В кибернетической литературе его употребляют для обозначения последовательности команд для ЦВМ. В данном разделе мы не будем использовать термин "программа" в таком смысле. Если же это окажется необходимым, то всякий раз будем специально оговаривать.
Многие из вводимых ниже понятий могут быть естественным образом представлены в терминах тех или иных формальных языков. Мы, однако, отказались от такой формализации, поскольку в рамках данного изложения стремились дать читателю лишь содержательное представление об используемом нами подходе.
Под ПРОГРАММОЙ следует понимать определенную последовательность изменений системы (или ее подсистем), которая заложена в ее структуре и реализуется при определенном входном воздействии. Совокупность программ системы характеризует, следовательно, совокупность ее возможных изменений во времени, присущих системе потенциально, определяемых ее структурой и реализующихся при поступлении на ее вход тех или иных воздействий.
Понятие программы непременно включает в себя указание на связь любой конкретной программы с определенным внешним воздействием, "запускающим" ее. Пусть имеется некоторая система, множество возможных входных воздействий на нее и множество возможных программ этой системы. Для того чтобы охарактеризовать систему в целом, необходимо установить отношение между множеством воздействий и множеством программ так, чтобы каждому воздействию ставилась в соответствие единственная программа. Множество входных воздействий, множество программ системы и заданное между ними соответствие являются ОПИСАНИЕМ СИСТЕМЫ. Для описания системы может быть, в принципе, использован любой аппарат, пригодный для формального или содержательного задания отношений (отображений) между различными множествами. Весьма удобным является описание программ с помощью блок-схем.
Блок-схемное описание предполагает четкое указание содержательного смысла вводимых в рассмотрение процедур, определение совокупности их входных и выходных параметров, а также фиксацию порядка их выполнения. Этот "метод квадратов и стрелок" удобен, с одной стороны, для представления содержательных, интуитивно понимаемых данных, а с другой - создает основу для конструктивного описания этих данных и последующего моделирования на ЦВМ.
Описание программы, представленное в виде блок-схемы, является статической моделью программы. В этом смысле о блок-схемном описании процессов переработки информации мозгом можно говорить как о блок-схемном моделировании этих процессов.
Отметим, что блок-схемное моделирование является, вообще говоря, промежуточным этапом при построении действующих моделей информационных процессов мозга.
Всякую систему можно изучать и описывать с разной степенью детализации, выделяя в ней большее или меньшее количество отдельных подсистем. Имея в виду это обстоятельство, обычно говорят об УРОВНЯХ ОПИСАНИЯ системы. Чем выше уровень описания, тем более обобщенным оно является, тем меньшее количество подсистем выделяется в данной системе и тем более сложными и многообразными оказываются программы подсистем. При изменении уровня описания изменяются и программы. Таким образом, при обсуждении программ необходимо в каждом конкретном случае иметь в виду их принадлежность определенному уровню описания системы.
При изучении сложных систем с целью построения их действующих моделей часто оказывается целесообразным описывать программы моделируемой системы на нескольких уровнях. Различные описания при этом взаимно дополняют друг друга и могут быть использованы, как это было показано ранее, для построения и проверки адекватности моделей.
Если мы будем изучать и описывать только внешние проявления деятельности человека, то это, очевидно, будет соответствовать изучению и описанию программ нашей системы. Программы в этом случае можно также называть ПРОГРАММАМИ ПОВЕДЕНИЯ.
Возвращаясь к процедуре моделирования поведения, схема которой описана в предыдущей главе, можно заметить, что в ее основе лежит экспериментальное изучение и описание именно программ поведения. Исследуя эти программы, мы фиксируем в протоколах выходные сигналы, доступные нашему наблюдению: двигательную и речевую продукцию человека, решающего задачу. Дальнейшая обработка протокольных записей состоит в их содержательной интерпретации. Здесь мы формулируем программу поведения в содержательных терминах, описывающих непосредственно процесс решения.
При формальном рассмотрении процессов, протекающих в системе, мы можем наблюдать на выходах различных подсистем появление сигналов, несущих определенную информацию и поступающих на входы других подсистем для дальнейшей переработки. При содержательном рассмотрении этих процессов мы можем описать их в терминах некоторой деятельности, в терминах производимых мозгом операций.
Так, состояние всей системы в некоторый момент времени можно описать как совокупность событий такого, например, типа: "на выходе подсистемы узнавания появилось имя воспринятого объекта", "на выходе подсистемы эмоциональных оценок сформулирована обобщенная оценка ситуации" и т.п. Зная структуру связей между подсистемами, можно продолжить содержательное описание дальнейшего развития процессов: "эмоциональная оценка ситуации и имя воспринятого объекта поступают на вход подсистемы принятия решений" и т.п. Аналогичным образом можно продолжать описание сколь угодно долго.
Таким образом, содержательная интерпретация этих программ является по существу описанием процессов переработки информации, протекающих в системе. Будем поэтому такие программы называть ПРОГРАММАМИ ПЕРЕРАБОТКИ ИНФОРМАЦИИ.
В каждом конкретном исследовании выделяется некоторый уровень описания процессов переработки информации, который считается достаточно подробным, так что рассмотрение на более низких уровнях в рамках данного исследования не проводится. Описание системы на этом, наиболее низком, уровне часто называют описанием механизмов системы.
В качестве уровня механизмов обсуждаемая гипотеза предлагает такой уровень описания моделируемой системы - коры головного мозга,- на котором роль ее подсистем играют корковые информационные модели объектов внешнего и внутреннего мира человека. Преимущество такого подхода состоит в том, что программы поведения корковых моделей относительно просты и могут быть заданы с помощью нескольких функциональных характеристик.
#3. АВТОМАТЫ И СРЕДЫ
Основная задача моделирования состоит в синтезе автомата на основе описания моделируемой системы. В области ИР, где речь идет о моделировании сложных систем, задача синтеза до настоящего времени в общем виде не решена. Это объясняется следующими обстоятельствами. Чаще всего сложность объекта моделирования исключает возможность подробного описания всех программ, которые должен воспроизвести автомат. Программы, следовательно, описываются не полностью или их описание дается на сравнительно высоком уровне, т.е. в весьма обобщенном виде. Кроме того, определенные трудности возникают при задании множества допустимых входных воздействий. Как правило, оказывается невозможным в явном виде перечислить все комбинации входных сигналов, которые могут возникнуть при работе будущего автомата. Вследствие этого нельзя конструктивно задать и соответствие между входными воздействиями и программами системы. Таким образом, можно сказать, что описание моделируемой системы в общем случае задается в неполной форме.
В то же время обычно имеются некоторые сведения об устройстве объекта моделирования и структуре операций, реализуемых его механизмами. Эти сведения также не являются полными и дают лишь некоторую дополнительную информацию о программах объекта и о том, как реализовано в нем соответствие между входными воздействиями и программами.
В реальных условиях, таким образом, автомат строится на основании неполного описания моделируемой системы и неполных дополнительных сведений о его структуре и функционировании. В этих условиях и оказывается необходимым выдвижение различного рода гипотез, дополняющих и уточняющих имеющиеся сведения. Конструируя на основе гипотез реальный автомат, реальное физическое или алгоритмическое устройство, мы, следовательно, не можем быть заранее уверены, что программы этого устройства будут хорошо совпадать с программами моделируемого объекта. То же самое относится и к соответствию между входными воздействиями и программами автомата.
Будем говорить, что, создавая реальный автомат, мы тем самым задаем в его структуре и операциях некоторые программы, в той или иной степени не соответствующие желаемым. Обычно заранее определяется допустимая степень такого несоответствия. И если фактическое несоответствие, наблюдаемое при исследовании уже построенного автомата, превышает допустимое, то структура автомата корректируется до тех пор, пока различия не уменьшатся в достаточной мере. Именно это и является содержанием циклических процессов "доводки" модели, рассмотренных в предыдущем разделе. В целом приведенные соображения поясняют смысл тех операций по разработке моделей, принципиальная структура которых описана ранее с помощью упрощенных схем.
Рассмотрим теперь предлагаемые нашей гипотезой конкретные способы задания программ различного типа.
Программы поведения корковых информационных моделей отображают закономерности изменения во времени их выходной активности при определенных воздействиях, поступающих на входы моделей. Входные воздействия на каждую из моделей определяются активностями других моделей, выходы которых связаны со входами данной модели. Предполагается, что количество связей, подходящих к модели, может достигать нескольких десятков. Число возможных входных воздействий на модель оказывается, следовательно, весьма большим и не может быть задано простым перечислением. Соответственно весьма большим может оказаться и число программ модели, так что задать модель, описывая каждую программу отдельно, также невозможно. Поэтому гипотеза предусматривает задание программ корковых информационных моделей путем построения специального алгоритма, на вход которого поступает информация о внешних воздействиях на модель. Алгоритм перерабатывает эту информацию таким образом, что последовательности сигналов на его выходе соответствуют программам поведения i-модели. Этот алгоритм и является автоматом, реализующим описание корковой модели. При построении такого автомата используются содержательные сведения о внутренней структуре корковых моделей и реализуемых ими операциях.
Программы поведения подсистем, соответствующих связям между корковыми информационными моделями, также воспроизводятся с помощью автоматов, разрабатываемых на основе содержательных представлений. Эти представления могут определять совокупность функциональных характеристик подсистемы (связи) и последовательность реализуемых ею операций. То и другое используется при построении алгоритма, задающего программы поведения связи.
Задание программ переработки информации осуществляется путем построения структур, элементами которых являются автоматы-модели и автоматы-связи. Процессы, протекающие в такой структуре, т.е. ее программы переработки информации, определяются программами поведения элементов. Структуры такого рода и являются автоматами, задающими программы переработки информации, или, иначе говоря, действующими моделями процессов переработки информации корой головного мозга.
При разработке автоматов, способных к организации разумного поведения, важным этапом является задание СРЕДЫ, в которой функционирует автомат. Понятие среды описывает совокупность воздействий, которые могут возникнуть на входах автомата при его работе, а также правила и закономерности появления этих воздействий во времени.
В общем случае среда также задается в виде некоторого автомата, выходы которого соединены со входами действующей модели, а входы - с ее выходами. При исследованиях в области искусственного разума широкое применение находят среды специального типа, являющиеся аналогами некоторых классов естественных сред. Обычно это оказывается необходимым при построении систем, моделирующих человеческую деятельность. При построении таких сред используется информация о реально существующих законах внешнего мира и о характере протекающих в нем процессов. Иначе говоря, среды такого типа могут строиться как модели естественных сред. Это позволяет описывать поведение автомата в "естественной" среде с помощью тех же терминов, что и поведение человека. Указанная возможность может быть использована для предварительной оценки "разумности" поведения автоматов.
#4. ОБЩАЯ СТРУКТУРА ГИПОТЕЗЫ
Итак, мы рассмотрели содержание некоторых основных понятий, используемых в гипотезе. В заключение данного раздела кратко остановимся на схематическом описании общей структуры гипотезы, в которой условно выделим три основные части.
ПЕРВАЯ ЧАСТЬ гипотезы включает в себя описание основных программ переработки информации человеком. На самом общем уровне модель человека представлена в виде автомата с тремя типами программ: "для себя", "для рода" и "для вида". Эти программы являются программами формирования поведенческих реакций, направленных соответственно на самосохранение, продолжение рода и поддержание вида - общества.
На более низком уровне рассмотрения выделены шесть основных программ: восприятия и переработки внешней информации, чувств, сознания, речи, действия, труда и творчества. В процессе их уточнения и расшифровки в рассмотрение введен целый ряд элементарных программ, среди которых имеются и программы реакций, и программы формирования.
Для описания программ использован блок-схемный метод. Первая часть гипотезы представляет собой, по существу, многоуровневую блок-схемную модель процессов переработки информации мозгом. Эта модель не является, конечно, полностью завершенной. Дальнейшее ее развитие может быть направлено как на уточнение и дополнение блок-схемных описаний программ, так и на выделение и построение описаний новых программ низших уровней. Однако уже выделенные в гипотезе программы описывают весьма широкий класс информационных процессов и составляют основу для разработки целого ряда действующих моделей.
В связи с вопросами дальнейшего развития и проверки блок-схемную модель можно рассматривать в двух различных аспектах. Одним из них является психологический. Здесь блок-схемная модель информационных процессов мозга выступает как модель сложных психических функций человека, в частности мышления. Дальнейшее развитие модели в этом направлении предполагает, очевидно, проведение специальных исследований, направленных на экспериментальное изучение программ психической деятельности с целью дополнения, уточнения и проверки модели. Правомерность гипотезы может быть также установлена путем построения действующих моделей психических функций на основе их блок-схемных описаний.
В аспекте искусственного разума блок-схемная модель информационных процессов мозга выступает как теоретическая основа для построения автоматов, способных к организации разумного поведения. Именно этот аспект гипотезы и развивается в настоящей книге. При этом совокупность описанных в гипотезе программ может быть рассмотрена как конструктивное определение разума.
В настоящее время четкого определения понятия разумности не существует. Практически единственным способом установления разумности поведения данного объекта является его сравнение с поведением человека, находящегося в аналогичных условиях. Но какого человека? Ясно, что не любого, а только такого, о котором заранее известно, что он разумен. Способ оказывается, таким образом, непригодным. Правда, мы пользуемся им в обыденной жизни, сравнивая подвергаемое оценке поведение со своим собственным и получая соответственно те или иные результаты в зависимости от качества эталона. Можно было бы избежать субъективности, используя для сравнения некоторые обобщенные и усредненные статистические нормы и схемы поведения. Такого рода норм и схем, однако, не существует и вряд ли они могут быть разработаны для огромного количества ситуаций, возникающих в реальных условиях. Ограничиться малым числом ситуаций также нельзя, поскольку одним из основных признаков разумности является способность находить хорошие решения именно в широком классе ситуаций.
Определение разумного поведения путем описания набора формирующих его программ является конструктивным в том отношении, что оно может быть использовано для построения конкретных разумно действующих автоматов. При этом степень разумности автомата может быть определена путем указания количества и типа реализуемых им программ. Кроме того, в принципе может быть разработана совокупность автоматов, каждый из которых реализует различные наборы программ. Упорядоченные по мере возрастания сложности, такие автоматы создадут некоторую "шкалу разумности", по отношению к которой можно будет оценивать разумность поведения объектов любой природы. Пока еще эта возможность является только принципиальной. Для ее практической реализации необходима дальнейшая разработка и совершенствование описаний программ переработки информации мозгом.
ВТОРАЯ ЧАСТЬ гипотезы содержит описание коры головного мозга на уровне ее информационных механизмов. Здесь развиты представления о функциональных единицах коры - информационных моделях объектов внешнего и внутреннего мира, реализуемых ансамблями нервных клеток, а также сформулированы правила (гипотетические) взаимодействия и доминирования моделей. На основе анализа нейрофизиологического материала определен вид статических и динамических характеристик моделей и связей между ними. Описаны программы формирования новых моделей. Развитая в этой части гипотетическая система не претендует на полное сходство с мозгом, однако может быть использована при построении действующих моделей. Дальнейшее развитие этой части гипотезы возможно в двух направлениях. Одно из них связано с уточнением и проверкой исходных положений на основе специально поставленных экспериментальных исследований в области нейро- и психофизиологии. Это направление, следовательно, предполагает исследование гипотезы в физиологическом аспекте. Другое направление связано с проверкой и коррекцией гипотезы в ходе построения ее действующих моделей.
К ТРЕТЬЕЙ ЧАСТИ гипотезы мы условно относим те ее положения, которые посвящены описанию принципов построения автоматов, воспроизводящих те или иные программы. Эти принципы формулируются на основании представлений о том, как именно взаимодействие корковых информационных моделей порождает поведение, или, иначе говоря, каковы должны быть общие принципы организации механизмов, описанных во второй части гипотезы, чтобы их функционирование порождало программы, описанные в первой части.
Здесь развиты, в частности, представления о том, что программы коры осуществляются в ходе взаимодействия моделей, принадлежащих трем условным этажам: жесткому - врожденному; привитому обучением; созданному в процессе самоорганизации-творчества. Соответственно описываются некоторые общие принципы предварительной организации коры, программы обучения и самоорганизации в ней. Представления, развитые в третьей части гипотезы, определяют общие правила синтеза автоматов.
Такова общая структура рабочей гипотезы, составляющей основу для конкретных разработок, описанных в последующих главах книги. Разрабатывая конкретные автоматы, мы реализуем в их структуре представления о механизмах переработки информации мозгом. Целью же разработок является воспроизведение тех или иных программ переработки информации, описанных в гипотезе.
Термин "программа" имеет несколько значений. В кибернетической литературе его употребляют для обозначения последовательности команд для ЦВМ. В данном разделе мы не будем использовать термин "программа" в таком смысле. Если же это окажется необходимым, то всякий раз будем специально оговаривать.
Многие из вводимых ниже понятий могут быть естественным образом представлены в терминах тех или иных формальных языков. Мы, однако, отказались от такой формализации, поскольку в рамках данного изложения стремились дать читателю лишь содержательное представление об используемом нами подходе.
Под ПРОГРАММОЙ следует понимать определенную последовательность изменений системы (или ее подсистем), которая заложена в ее структуре и реализуется при определенном входном воздействии. Совокупность программ системы характеризует, следовательно, совокупность ее возможных изменений во времени, присущих системе потенциально, определяемых ее структурой и реализующихся при поступлении на ее вход тех или иных воздействий.
Понятие программы непременно включает в себя указание на связь любой конкретной программы с определенным внешним воздействием, "запускающим" ее. Пусть имеется некоторая система, множество возможных входных воздействий на нее и множество возможных программ этой системы. Для того чтобы охарактеризовать систему в целом, необходимо установить отношение между множеством воздействий и множеством программ так, чтобы каждому воздействию ставилась в соответствие единственная программа. Множество входных воздействий, множество программ системы и заданное между ними соответствие являются ОПИСАНИЕМ СИСТЕМЫ. Для описания системы может быть, в принципе, использован любой аппарат, пригодный для формального или содержательного задания отношений (отображений) между различными множествами. Весьма удобным является описание программ с помощью блок-схем.
Блок-схемное описание предполагает четкое указание содержательного смысла вводимых в рассмотрение процедур, определение совокупности их входных и выходных параметров, а также фиксацию порядка их выполнения. Этот "метод квадратов и стрелок" удобен, с одной стороны, для представления содержательных, интуитивно понимаемых данных, а с другой - создает основу для конструктивного описания этих данных и последующего моделирования на ЦВМ.
Описание программы, представленное в виде блок-схемы, является статической моделью программы. В этом смысле о блок-схемном описании процессов переработки информации мозгом можно говорить как о блок-схемном моделировании этих процессов.
Отметим, что блок-схемное моделирование является, вообще говоря, промежуточным этапом при построении действующих моделей информационных процессов мозга.
Всякую систему можно изучать и описывать с разной степенью детализации, выделяя в ней большее или меньшее количество отдельных подсистем. Имея в виду это обстоятельство, обычно говорят об УРОВНЯХ ОПИСАНИЯ системы. Чем выше уровень описания, тем более обобщенным оно является, тем меньшее количество подсистем выделяется в данной системе и тем более сложными и многообразными оказываются программы подсистем. При изменении уровня описания изменяются и программы. Таким образом, при обсуждении программ необходимо в каждом конкретном случае иметь в виду их принадлежность определенному уровню описания системы.
При изучении сложных систем с целью построения их действующих моделей часто оказывается целесообразным описывать программы моделируемой системы на нескольких уровнях. Различные описания при этом взаимно дополняют друг друга и могут быть использованы, как это было показано ранее, для построения и проверки адекватности моделей.
Если мы будем изучать и описывать только внешние проявления деятельности человека, то это, очевидно, будет соответствовать изучению и описанию программ нашей системы. Программы в этом случае можно также называть ПРОГРАММАМИ ПОВЕДЕНИЯ.
Возвращаясь к процедуре моделирования поведения, схема которой описана в предыдущей главе, можно заметить, что в ее основе лежит экспериментальное изучение и описание именно программ поведения. Исследуя эти программы, мы фиксируем в протоколах выходные сигналы, доступные нашему наблюдению: двигательную и речевую продукцию человека, решающего задачу. Дальнейшая обработка протокольных записей состоит в их содержательной интерпретации. Здесь мы формулируем программу поведения в содержательных терминах, описывающих непосредственно процесс решения.
При формальном рассмотрении процессов, протекающих в системе, мы можем наблюдать на выходах различных подсистем появление сигналов, несущих определенную информацию и поступающих на входы других подсистем для дальнейшей переработки. При содержательном рассмотрении этих процессов мы можем описать их в терминах некоторой деятельности, в терминах производимых мозгом операций.
Так, состояние всей системы в некоторый момент времени можно описать как совокупность событий такого, например, типа: "на выходе подсистемы узнавания появилось имя воспринятого объекта", "на выходе подсистемы эмоциональных оценок сформулирована обобщенная оценка ситуации" и т.п. Зная структуру связей между подсистемами, можно продолжить содержательное описание дальнейшего развития процессов: "эмоциональная оценка ситуации и имя воспринятого объекта поступают на вход подсистемы принятия решений" и т.п. Аналогичным образом можно продолжать описание сколь угодно долго.
Таким образом, содержательная интерпретация этих программ является по существу описанием процессов переработки информации, протекающих в системе. Будем поэтому такие программы называть ПРОГРАММАМИ ПЕРЕРАБОТКИ ИНФОРМАЦИИ.
В каждом конкретном исследовании выделяется некоторый уровень описания процессов переработки информации, который считается достаточно подробным, так что рассмотрение на более низких уровнях в рамках данного исследования не проводится. Описание системы на этом, наиболее низком, уровне часто называют описанием механизмов системы.
В качестве уровня механизмов обсуждаемая гипотеза предлагает такой уровень описания моделируемой системы - коры головного мозга,- на котором роль ее подсистем играют корковые информационные модели объектов внешнего и внутреннего мира человека. Преимущество такого подхода состоит в том, что программы поведения корковых моделей относительно просты и могут быть заданы с помощью нескольких функциональных характеристик.
#3. АВТОМАТЫ И СРЕДЫ
Основная задача моделирования состоит в синтезе автомата на основе описания моделируемой системы. В области ИР, где речь идет о моделировании сложных систем, задача синтеза до настоящего времени в общем виде не решена. Это объясняется следующими обстоятельствами. Чаще всего сложность объекта моделирования исключает возможность подробного описания всех программ, которые должен воспроизвести автомат. Программы, следовательно, описываются не полностью или их описание дается на сравнительно высоком уровне, т.е. в весьма обобщенном виде. Кроме того, определенные трудности возникают при задании множества допустимых входных воздействий. Как правило, оказывается невозможным в явном виде перечислить все комбинации входных сигналов, которые могут возникнуть при работе будущего автомата. Вследствие этого нельзя конструктивно задать и соответствие между входными воздействиями и программами системы. Таким образом, можно сказать, что описание моделируемой системы в общем случае задается в неполной форме.
В то же время обычно имеются некоторые сведения об устройстве объекта моделирования и структуре операций, реализуемых его механизмами. Эти сведения также не являются полными и дают лишь некоторую дополнительную информацию о программах объекта и о том, как реализовано в нем соответствие между входными воздействиями и программами.
В реальных условиях, таким образом, автомат строится на основании неполного описания моделируемой системы и неполных дополнительных сведений о его структуре и функционировании. В этих условиях и оказывается необходимым выдвижение различного рода гипотез, дополняющих и уточняющих имеющиеся сведения. Конструируя на основе гипотез реальный автомат, реальное физическое или алгоритмическое устройство, мы, следовательно, не можем быть заранее уверены, что программы этого устройства будут хорошо совпадать с программами моделируемого объекта. То же самое относится и к соответствию между входными воздействиями и программами автомата.
Будем говорить, что, создавая реальный автомат, мы тем самым задаем в его структуре и операциях некоторые программы, в той или иной степени не соответствующие желаемым. Обычно заранее определяется допустимая степень такого несоответствия. И если фактическое несоответствие, наблюдаемое при исследовании уже построенного автомата, превышает допустимое, то структура автомата корректируется до тех пор, пока различия не уменьшатся в достаточной мере. Именно это и является содержанием циклических процессов "доводки" модели, рассмотренных в предыдущем разделе. В целом приведенные соображения поясняют смысл тех операций по разработке моделей, принципиальная структура которых описана ранее с помощью упрощенных схем.
Рассмотрим теперь предлагаемые нашей гипотезой конкретные способы задания программ различного типа.
Программы поведения корковых информационных моделей отображают закономерности изменения во времени их выходной активности при определенных воздействиях, поступающих на входы моделей. Входные воздействия на каждую из моделей определяются активностями других моделей, выходы которых связаны со входами данной модели. Предполагается, что количество связей, подходящих к модели, может достигать нескольких десятков. Число возможных входных воздействий на модель оказывается, следовательно, весьма большим и не может быть задано простым перечислением. Соответственно весьма большим может оказаться и число программ модели, так что задать модель, описывая каждую программу отдельно, также невозможно. Поэтому гипотеза предусматривает задание программ корковых информационных моделей путем построения специального алгоритма, на вход которого поступает информация о внешних воздействиях на модель. Алгоритм перерабатывает эту информацию таким образом, что последовательности сигналов на его выходе соответствуют программам поведения i-модели. Этот алгоритм и является автоматом, реализующим описание корковой модели. При построении такого автомата используются содержательные сведения о внутренней структуре корковых моделей и реализуемых ими операциях.
Программы поведения подсистем, соответствующих связям между корковыми информационными моделями, также воспроизводятся с помощью автоматов, разрабатываемых на основе содержательных представлений. Эти представления могут определять совокупность функциональных характеристик подсистемы (связи) и последовательность реализуемых ею операций. То и другое используется при построении алгоритма, задающего программы поведения связи.
Задание программ переработки информации осуществляется путем построения структур, элементами которых являются автоматы-модели и автоматы-связи. Процессы, протекающие в такой структуре, т.е. ее программы переработки информации, определяются программами поведения элементов. Структуры такого рода и являются автоматами, задающими программы переработки информации, или, иначе говоря, действующими моделями процессов переработки информации корой головного мозга.
При разработке автоматов, способных к организации разумного поведения, важным этапом является задание СРЕДЫ, в которой функционирует автомат. Понятие среды описывает совокупность воздействий, которые могут возникнуть на входах автомата при его работе, а также правила и закономерности появления этих воздействий во времени.
В общем случае среда также задается в виде некоторого автомата, выходы которого соединены со входами действующей модели, а входы - с ее выходами. При исследованиях в области искусственного разума широкое применение находят среды специального типа, являющиеся аналогами некоторых классов естественных сред. Обычно это оказывается необходимым при построении систем, моделирующих человеческую деятельность. При построении таких сред используется информация о реально существующих законах внешнего мира и о характере протекающих в нем процессов. Иначе говоря, среды такого типа могут строиться как модели естественных сред. Это позволяет описывать поведение автомата в "естественной" среде с помощью тех же терминов, что и поведение человека. Указанная возможность может быть использована для предварительной оценки "разумности" поведения автоматов.
#4. ОБЩАЯ СТРУКТУРА ГИПОТЕЗЫ
Итак, мы рассмотрели содержание некоторых основных понятий, используемых в гипотезе. В заключение данного раздела кратко остановимся на схематическом описании общей структуры гипотезы, в которой условно выделим три основные части.
ПЕРВАЯ ЧАСТЬ гипотезы включает в себя описание основных программ переработки информации человеком. На самом общем уровне модель человека представлена в виде автомата с тремя типами программ: "для себя", "для рода" и "для вида". Эти программы являются программами формирования поведенческих реакций, направленных соответственно на самосохранение, продолжение рода и поддержание вида - общества.
На более низком уровне рассмотрения выделены шесть основных программ: восприятия и переработки внешней информации, чувств, сознания, речи, действия, труда и творчества. В процессе их уточнения и расшифровки в рассмотрение введен целый ряд элементарных программ, среди которых имеются и программы реакций, и программы формирования.
Для описания программ использован блок-схемный метод. Первая часть гипотезы представляет собой, по существу, многоуровневую блок-схемную модель процессов переработки информации мозгом. Эта модель не является, конечно, полностью завершенной. Дальнейшее ее развитие может быть направлено как на уточнение и дополнение блок-схемных описаний программ, так и на выделение и построение описаний новых программ низших уровней. Однако уже выделенные в гипотезе программы описывают весьма широкий класс информационных процессов и составляют основу для разработки целого ряда действующих моделей.
В связи с вопросами дальнейшего развития и проверки блок-схемную модель можно рассматривать в двух различных аспектах. Одним из них является психологический. Здесь блок-схемная модель информационных процессов мозга выступает как модель сложных психических функций человека, в частности мышления. Дальнейшее развитие модели в этом направлении предполагает, очевидно, проведение специальных исследований, направленных на экспериментальное изучение программ психической деятельности с целью дополнения, уточнения и проверки модели. Правомерность гипотезы может быть также установлена путем построения действующих моделей психических функций на основе их блок-схемных описаний.
В аспекте искусственного разума блок-схемная модель информационных процессов мозга выступает как теоретическая основа для построения автоматов, способных к организации разумного поведения. Именно этот аспект гипотезы и развивается в настоящей книге. При этом совокупность описанных в гипотезе программ может быть рассмотрена как конструктивное определение разума.
В настоящее время четкого определения понятия разумности не существует. Практически единственным способом установления разумности поведения данного объекта является его сравнение с поведением человека, находящегося в аналогичных условиях. Но какого человека? Ясно, что не любого, а только такого, о котором заранее известно, что он разумен. Способ оказывается, таким образом, непригодным. Правда, мы пользуемся им в обыденной жизни, сравнивая подвергаемое оценке поведение со своим собственным и получая соответственно те или иные результаты в зависимости от качества эталона. Можно было бы избежать субъективности, используя для сравнения некоторые обобщенные и усредненные статистические нормы и схемы поведения. Такого рода норм и схем, однако, не существует и вряд ли они могут быть разработаны для огромного количества ситуаций, возникающих в реальных условиях. Ограничиться малым числом ситуаций также нельзя, поскольку одним из основных признаков разумности является способность находить хорошие решения именно в широком классе ситуаций.
Определение разумного поведения путем описания набора формирующих его программ является конструктивным в том отношении, что оно может быть использовано для построения конкретных разумно действующих автоматов. При этом степень разумности автомата может быть определена путем указания количества и типа реализуемых им программ. Кроме того, в принципе может быть разработана совокупность автоматов, каждый из которых реализует различные наборы программ. Упорядоченные по мере возрастания сложности, такие автоматы создадут некоторую "шкалу разумности", по отношению к которой можно будет оценивать разумность поведения объектов любой природы. Пока еще эта возможность является только принципиальной. Для ее практической реализации необходима дальнейшая разработка и совершенствование описаний программ переработки информации мозгом.
ВТОРАЯ ЧАСТЬ гипотезы содержит описание коры головного мозга на уровне ее информационных механизмов. Здесь развиты представления о функциональных единицах коры - информационных моделях объектов внешнего и внутреннего мира, реализуемых ансамблями нервных клеток, а также сформулированы правила (гипотетические) взаимодействия и доминирования моделей. На основе анализа нейрофизиологического материала определен вид статических и динамических характеристик моделей и связей между ними. Описаны программы формирования новых моделей. Развитая в этой части гипотетическая система не претендует на полное сходство с мозгом, однако может быть использована при построении действующих моделей. Дальнейшее развитие этой части гипотезы возможно в двух направлениях. Одно из них связано с уточнением и проверкой исходных положений на основе специально поставленных экспериментальных исследований в области нейро- и психофизиологии. Это направление, следовательно, предполагает исследование гипотезы в физиологическом аспекте. Другое направление связано с проверкой и коррекцией гипотезы в ходе построения ее действующих моделей.
К ТРЕТЬЕЙ ЧАСТИ гипотезы мы условно относим те ее положения, которые посвящены описанию принципов построения автоматов, воспроизводящих те или иные программы. Эти принципы формулируются на основании представлений о том, как именно взаимодействие корковых информационных моделей порождает поведение, или, иначе говоря, каковы должны быть общие принципы организации механизмов, описанных во второй части гипотезы, чтобы их функционирование порождало программы, описанные в первой части.
Здесь развиты, в частности, представления о том, что программы коры осуществляются в ходе взаимодействия моделей, принадлежащих трем условным этажам: жесткому - врожденному; привитому обучением; созданному в процессе самоорганизации-творчества. Соответственно описываются некоторые общие принципы предварительной организации коры, программы обучения и самоорганизации в ней. Представления, развитые в третьей части гипотезы, определяют общие правила синтеза автоматов.
Такова общая структура рабочей гипотезы, составляющей основу для конкретных разработок, описанных в последующих главах книги. Разрабатывая конкретные автоматы, мы реализуем в их структуре представления о механизмах переработки информации мозгом. Целью же разработок является воспроизведение тех или иных программ переработки информации, описанных в гипотезе.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ГЛАВА 4. АППАРАТ МОДЕЛИРОВАНИЯ
При конструировании автоматов, способных к сложному поведению, возникает задача выбора или разработки средств, удобных для их описания. В самом деле, перед тем как приступить к непосредственному построению действующей модели с помощью тех или иных технических средств, необходимо полностью описать структуру будущей модели, свойства ее элементов и т.п. Такое описание играет роль своеобразной "принципиальной схемы" автомата и само является моделью, но моделью статической.
Выбор средств описания или его языка - важная задача. С одной стороны, такой язык должен быть удобен для выражения теоретических представлений разработчика, а также для описания тех конкретных данных, на которых основана модель. С другой стороны, язык должен допускать последующий и, по возможности, однозначный переход от статического описания к действующей модели.
Задача выбора языка описания возникает при любом моделировании и решается всякий раз с учетом целей исследования и специфики моделируемого объекта. При моделировании сложных систем, проводящемся в области искусственного разума, к языку описания предъявляются некоторые специфические требования. Рассмотрим их. Поскольку описание объекта является в то же время и описанием автомата, моделирующего этот объект, будем говорить о языке описания как о ЯЗЫКЕ МОДЕЛИРОВАНИЯ.
Общие требования к языку моделирования определяются особенностями построения действующих моделей сложных систем и работы с большими гипотезами, рассмотрение которых было проведено ранее. Как уже упоминалось, основное требование к языку описания конкретных моделей - КОНСТРУКТИВНОСТЬ. Тесно связано с ним требование ориентированности языка на определенные средства технической реализации действующих моделей. В качестве таковых в области искусственного разума широко используются средства как физического моделирования, так и вычислительной техники.
Часто оказывается целесообразным предварять построение особо сложных и дорогих физических устройств разработкой и исследованием их цифровых аналогов. Иначе говоря, одно и то же описание реализуется вначале в виде действующей вычислительной модели, а затем, после ее исследования и соответствующей коррекции описания,- в виде физической модели. Вычислительная модель оказывается в этом случае как бы действующим макетом будущего физического устройства, на котором производится его предварительная проверка и настройка. Для того чтобы можно было использовать этот прием с максимальной эффективностью, желательно ориентировать язык описания одновременно и на вычислительные средства реализации моделей (т.е. на использование ЦВМ), и на определенные средства физической реализации.
Построение систем искусственного разума связано, как правило, с построением действующих моделей и представлением в них различных качественных данных. Обусловлено это тем обстоятельством, что описания прототипа ИР - человека и его поведения - носят в настоящее время преимущественно качественный характер. В то же время ясно, что при разработке систем ИР использование сведений такого рода весьма желательно или даже необходимо. Важным поэтому является следующее требование: язык моделирования должен ДОПУСКАТЬ представление в нем качественных данных.
Модели, разрабатываемые в области ИР, являются обычно сложными, т.е. содержат большое количество связанных друг с другом переменных. Для того чтобы по возможности облегчить практическую работу с моделями (т.е. их настройку, проверку, коррекцию и т.п.), желательно, чтобы язык их описания позволял представлять всю необходимую информацию в УДОБНОЙ И ЛЕГКООБОЗРИМОЙ ФОРМЕ.
При построении моделей широко используются эвристические приемы и предположения, эффективность которых заранее неизвестна и выясняется только в ходе исследования. Поэтому практическая работа с моделями связана, как правило, с частым внесением в модель исправлений, дополнений и т.п. Следовательно, язык моделирования должен обладать достаточной гибкостью, т.е. допускать внесение в модель частых изменений без перестройки модели в целом.
#1. М-АВТОМАТЫ. ОСНОВНЫЕ ПОНЯТИЯ
Предлагаемый язык моделирования развит на основе представления о мышлении как о направленном процессе взаимодействия множества корковых информационных моделей объектов внешнего и внутреннего мира человека. Искусственные системы, строящиеся на основе этого представления, реализуются в виде специфических сетей, названных М-сетями. Узлы М-сети есть формальные элементы, которые ставятся в соответствие корковым информационным моделям. Будем называть эти узлы i-моделями. Связи между i-моделями отвечают предполагаемым связям между корковыми моделями. С содержательной стороны i-модели могут быть поставлены в соответствие образам и понятиям, которыми оперирует человек. Поэтому с помощью М-сети можно представлять взаимосвязанные системы образов и понятий, предположительно используемые человеком в ходе мышления. М-сеть является, таким образом, сетью с семантикой.
Уточним содержание основных понятий предлагаемого языка.
i-МОДЕЛЬ есть формальный элемент, которому может быть поставлено в соответствие определенное понятие. При проведении нейрофизиологических аналогий i-модель сопоставляется с нейронным ансамблем. Аналог i-модели в психологии - внутренняя (корковая) информационная модель события внешнего или внутреннего мира. В семантическом плане i-модель является знаком понятия. С конструктивной точки зрения i-модель есть элемент некоторой структуры, который может находиться в ряде отличных друг от друга состояний. С функциональной точки зрения i-модель есть набор некоторых операторов или алгоритмов переработки информации. Опишем i-модель как элемент, обладающий следующими свойствами.
1. Каждая i-модель имеет конечное число входов и один выход.
2. Каждая i-модель может находиться в состоянии возбуждения, степень которого характеризуется числовой величиной П, называемой возбужденностью. Будем описывать функционирование i-модели в дискретном времени. Возбужденность некоторой i-модели j в момент времени t будем обозначать Пt.j.
3. i-Модели могут быть соединены направленными связями, по которым возбуждение передается от одних i-моделей к другим.
СВЯЗЬ между i-моделями есть формальный элемент, нейрофизиологическим аналогом которого является феномен взаимозависимости возбуждений различных ансамблей. Аналогом связи в психологии может быть ассоциативная связь. Основные свойства связи таковы.
1. Каждая связь может быть направлена от выхода какой-либо i-модели i к одному из входов другой i-модели j.
2. От выхода i-модели может отходить более чем одна связь, а к одному входу может подходить только одна связь.
3. Между двумя i-моделями может существовать только одна связь.
4. Каждая связь характеризуется упорядоченным набором параметров R, называемым проходимостью связи, или, для краткости, просто связью. Проходимость связи, направленной от i-модели j к i-модели i, в момент дискретного времени t будем обозначать Rt.ij
СЕМАНТИКА i-моделей задается двумя путями: во-первых, ее определяет соответствие, установленное между данной i-моделью и некоторым содержательным понятием, а, во-вторых - совокупность связей, соединяющих данную i-модель с другими.
ХАРАКТЕРИСТИКИ СВЯЗИ. Связь R.ij есть вектор R.ij = <r.ij, ~r.ij, r.(0)ij, ~r.(0)ij>, где параметры r.ij и ~r.ij - усиливающий и тормозной компоненты проходимости связи, а параметры r.(0)ij и ~r.(0)ij - остаточные составляющие этих компонент. Эти параметры могут принимать численные значения, что содержательно означает следующее. Возбуждение, поступающее по связи R.ij, может как увеличивать, так и уменьшать, тормозить возбудимость i-модели i. Численной мерой этих воздействий и являются значения r.ij и ~r.ij. Эти значения могут меняться во времени, так что в случае r.ij >> ~r.ij можно говорить об усиливающем характере связи R.ij, а в обратном случае - об ее тормозном характере. Остаточные составляющие связи всегда удовлетворяют соотношениям
rt.(0)ij<=rt.ij; ~rt.(0)ij<=~rt.ij (4.1)
и составляют долговременную память связей (подробнее об этом см. ниже). Будем полагать, что R.ij=0 в том случае, если равны нулю все ее компоненты. Каждая связь описывается следующими характеристиками.
1. Характеристика проторения есть функция, описывающая зависимость проходимости связи от возбужденностей соединяемых ею i-моделей:
Rt.ij = R(Пt.i, Пt.j, R[t-1].ij, Dt), (4.2)
где D - интегральная оценка качества функционирования М-сети. Эта оценка формируется с помощью специальных i-моделей сети. Она имеет смысл и может быть определена в тех случаях, когда на основе М-сети уже построена некоторая действующая модель - М-автомат, заданы цели его функционирования и определены критерии качества его работы. По отношению к этим критериям и формируется оценка D. Конкретные механизмы и правила вычисления значений D будут, соответственно, определяться при построении той или иной конкретной модели.
Будем называть связь непроторенной в момент t, если для нее Rt.ij=0. Если для некоторой связи R[t-1].ij=0 и Rt.ij!=0, то будем говорить, что в момент t произошло установление связи R.ij. Таким образом, установление является частным случаем проторения. Для связи непроторенной функция (4.2) может иметь иной вид, чем для проторенной, так что в случае установления
Rt.ij = R.1(Пt.i, Пt.j, Dt), (4.3)
Функцию (4.3) будем называть характеристикой установления.
2. Характеристика затухания связи есть набор функций, описывающих уменьшение значений ее параметров во времени. Эта характеристика описывает процесс уменьшения проходимости связи R.ij при условии, что в некоторый начальный момент t.0 значение R[t.0]ij!=0 и во все последующие моменты времени П.i=0 и П.j=0. Для усиливающих и тормозных компонентов связи характеристики затухания имеют вид
rt.ij = r.1(r[t-1].ij, rt.(0)ij,), (4.4а)
~rt.ij = r.2(~r[t-1].ij, ~rt.(0)ij,). (4.4б)
Функции (4.4а) и (4.46б) описывают такой процесс затухания, при котором значения r.ij и ~r.ij, уменьшаясь, стремятся к значениям их остаточных составляющих. Для остаточных составляющих характеристики затухания
rt.(0)ij = r.3(r[t-1](0)ij,), (4.5а)
~rt.(0)ij = r.4(~r[t-1](0)ij,). (4.5б)
таковы, что описывают стремление значений r.(0)ij и ~r.(0)ij к нулю. Усиливающие и тормозные компоненты затухают во времени намного быстрее, чем их остаточные составляющие. Поэтому, начиная с момента t.0, проходимость R.ij уменьшается сравнительно быстро ("кратковременная память связей"). Затем значения r.ij и ~r.ij достигают значений r.(0)ij и ~r(0).ij, и, поскольку условия (4.1) должны всегда сохраняться, дальнейшее уменьшение R.ij происходит в соответствии с характеристиками (4.5а) и (4.5б), т.е. существенно медленнее ("долговременная память связей").
3. Характеристика передачи связи определяет значение воздействия E.i(~E.i) на входе i-модели i в зависимости от проходимости r.ij(~r.ij) связи между i-й и j-й i-моделями и величины возбужденности П.j. В общем случае для i-й i-модели будем рассматривать величину входного воздействия по усиливающим (E.i) и тормозным (~E.i) связям:
Et.i = E(Пt.1, Пt.2, ..., rt.i1, rt.i2, ...), (4.6а)
~Et.i = ~E(Пt.1, Пt.2, ..., ~rt.i1, ~rt.i2, ...), (4.6б).
ХАРАКТЕРИСТИКИ i-МОДЕЛИ. В каждый момент времени каждая i-модель обладает определенной возбудимостью, под которой понимается способность i-модели отвечать собственным возбуждением на входное воздействие по усиливающим связям. Чем выше возбудимость i-модели, тем большей возбудимостью ответит она на постоянное входное воздействие. Возбудимость i-модели может изменяться во времени. Будем характеризовать возбудимость i-й i-модели двумя параметрами. Один из них - порог возбуждения i-модели Ot.i, представляющий собой минимальное значение Et.i, необходимое для возбуждения i-й i-модели в момент t. Другой параметр - условный коэффициент возбудимости K. Будем различать два значения K - текущее (Kt.i), изменяющееся в зависимости от величины тормозных воздействий ~Et.i, и начальное (Kt.нi) Значения параметров Kt.нi и Ot.i - могут изменяться во времени значительно медленнее, чем Kt.i. Перечислим характеристики i-моделей.
1. Характеристика торможения есть функция, определяющая изменение возбудимости i-модели в зависимости от величины суммарного воздействия на нее по тормозным связям:
Kt.i = Ф(Kt.нi, ~Et,i). (4.7)
2. Характеристика затухания есть функция, определяющая изменение возбужденности i-модели во времени:
Пt.i = T(П[t-1].i, Kt.нi). (4.8 )
Функция (4.8 ) описывает процесс уменьшения возбужденности при отсутствии воздействий на входах i-модели и характеризует "временную память возбуждений" i-моделей.
3. Характеристика возбуждения есть функция, определяющая значение возбужденности на выходе i-модели в зависимости от возбудимости i-модели и величины суммарного воздействия на нее по усиливающим связям:
Пt.i = П(Kt.i, Ot.i Et.i). (4.9)
4. Характеристики гипертрофии и адаптации определяют значения Kt.нi и Ot.i в зависимости от возбужденности i-модели:
Ot.i = O(O[t-1].i, Пt.i), (4.10а)
Kt.нi = K(K[t-1].нi, Пt.i). (4.10б)
Функции (4.10а) и (4.10б) таковы, что определяемые ими изменения параметров невелики в каждый момент дискретного времени. Эти функции задаются таким образом, что для i-моделей, которые в течение длительного времени обладают малой возбужденностью, значение порога увеличивается, а значение коэффициента возбудимости уменьшается ("адаптация"). В результате редко или слабо возбуждающиеся i-модели оказываются трудновозбудимыми и мало влияют на процессы в сети. Если i-модель возбуждается часто и сильно, функции (4.10а) и (4.10б) обеспечивают уменьшение значения ее порога и увеличение коэффициента возбудимости ("гипертрофия").
М-СЕТЬ. Назовем М-сетью совокупность i-моделей и связей между ними. Для того чтобы с помощью М-сети построить модель некоторого объекта, необходимо в соответствии со спецификой этого объекта и целями моделирования задать М-сеть: зафиксировать совокупность i-моделей и их содержательных интерпретаций; задать связи между i-моделями, т.е. заранее определить их начальную конфигурацию в сети и начальное распределение C их проходимостей; зафиксировать начальное значение параметров и вид характеристик i-моделей и связей; зафиксировать начальное распределение I значений возбужденностей i-моделей. В ходе функционирования М-сети все первоначально заданные элементы могут изменяться. Этап задания сети является по существу этапом предварительной организации разрабатываемой модели.
Одним из основных принципов предварительной организации М-сетей является принцип иерархичности структуры, обеспечивающий возможность многоуровневой переработки информации. Связи между i-моделями различных уровней отражают родо-видовые отношения соответствующих понятий. Кроме того, между i-моделями сети могут быть установлены "ассоциативные" связи.
Часто в М-сети бывает удобно выделять такие непересекающиеся подмножества i-моделей, каждое из которых удовлетворяет требованию смысловой однородности, близости содержательных интерпретаций входящих в него i-моделей. Будем называть такие подмножества сферами М-сети. Можно говорить, например, об эмоциональной сфере, имея в виду множество таких i-моделей, каждая из которых поставлена в соответствие представлению об определенном эмоциональном состоянии человека. Можно выделять также сферы понятий, двигательных реакций и т.п. Взаимосвязь сфер осуществляется благодаря наличию связей между i-моделями, входящими в разные сферы.
ПРОЦЕССЫ В М-СЕТИ. М-сеть является, по существу, статической моделью, отображающей взаимосвязь определенных образов и понятий, а также степень их участия в процессах формирования воспроизводимой деятельности. Сами эти процессы и собственно деятельность могут быть реально воспроизведены только после того, как будет задан некоторый алгоритм, обеспечивающий функционирование М-сети во времени. Такой алгоритм должен реализовать изменение состояний i-моделей и связей М-сети в соответствии с введенными характеристиками. Для того чтобы дать читателю содержательное представление о том, как "работают" введенные ранее понятия, рассмотрим динамику процессов, которые могут протекать в М-сети, если алгоритм ее функционирования будет задан. Поскольку описание аппарата моделирования еще не завершено, это рассмотрение будет носить приближенный, в значительной степени условный характер. В дальнейшем оно будет уточнено. Пусть на основе М-сети разрабатывается некоторая модель поведения. Будем считать, что М-сеть уже задана. Пусть модель находится в некоторой среде, содержащей "объекты". Будем полагать, что восприятие моделью определенного объекта среды возможно только в том случае, если в М-сети существует i-модель, соответствующая этому объекту. Совокупность i-моделей, соответствующих различным объектам среды, составляет сферу восприятия М-сети. Таким образом, восприятие моделью информации об объектах среды (т.е. восприятие ситуации) заключается в возбуждении соответствующих i-моделей в сфере восприятия М-сети. Отсюда по существующим между i-моделями связям возбуждение распространяется внутрь сети. Уточним это представление.
...
При конструировании автоматов, способных к сложному поведению, возникает задача выбора или разработки средств, удобных для их описания. В самом деле, перед тем как приступить к непосредственному построению действующей модели с помощью тех или иных технических средств, необходимо полностью описать структуру будущей модели, свойства ее элементов и т.п. Такое описание играет роль своеобразной "принципиальной схемы" автомата и само является моделью, но моделью статической.
Выбор средств описания или его языка - важная задача. С одной стороны, такой язык должен быть удобен для выражения теоретических представлений разработчика, а также для описания тех конкретных данных, на которых основана модель. С другой стороны, язык должен допускать последующий и, по возможности, однозначный переход от статического описания к действующей модели.
Задача выбора языка описания возникает при любом моделировании и решается всякий раз с учетом целей исследования и специфики моделируемого объекта. При моделировании сложных систем, проводящемся в области искусственного разума, к языку описания предъявляются некоторые специфические требования. Рассмотрим их. Поскольку описание объекта является в то же время и описанием автомата, моделирующего этот объект, будем говорить о языке описания как о ЯЗЫКЕ МОДЕЛИРОВАНИЯ.
Общие требования к языку моделирования определяются особенностями построения действующих моделей сложных систем и работы с большими гипотезами, рассмотрение которых было проведено ранее. Как уже упоминалось, основное требование к языку описания конкретных моделей - КОНСТРУКТИВНОСТЬ. Тесно связано с ним требование ориентированности языка на определенные средства технической реализации действующих моделей. В качестве таковых в области искусственного разума широко используются средства как физического моделирования, так и вычислительной техники.
Часто оказывается целесообразным предварять построение особо сложных и дорогих физических устройств разработкой и исследованием их цифровых аналогов. Иначе говоря, одно и то же описание реализуется вначале в виде действующей вычислительной модели, а затем, после ее исследования и соответствующей коррекции описания,- в виде физической модели. Вычислительная модель оказывается в этом случае как бы действующим макетом будущего физического устройства, на котором производится его предварительная проверка и настройка. Для того чтобы можно было использовать этот прием с максимальной эффективностью, желательно ориентировать язык описания одновременно и на вычислительные средства реализации моделей (т.е. на использование ЦВМ), и на определенные средства физической реализации.
Построение систем искусственного разума связано, как правило, с построением действующих моделей и представлением в них различных качественных данных. Обусловлено это тем обстоятельством, что описания прототипа ИР - человека и его поведения - носят в настоящее время преимущественно качественный характер. В то же время ясно, что при разработке систем ИР использование сведений такого рода весьма желательно или даже необходимо. Важным поэтому является следующее требование: язык моделирования должен ДОПУСКАТЬ представление в нем качественных данных.
Модели, разрабатываемые в области ИР, являются обычно сложными, т.е. содержат большое количество связанных друг с другом переменных. Для того чтобы по возможности облегчить практическую работу с моделями (т.е. их настройку, проверку, коррекцию и т.п.), желательно, чтобы язык их описания позволял представлять всю необходимую информацию в УДОБНОЙ И ЛЕГКООБОЗРИМОЙ ФОРМЕ.
При построении моделей широко используются эвристические приемы и предположения, эффективность которых заранее неизвестна и выясняется только в ходе исследования. Поэтому практическая работа с моделями связана, как правило, с частым внесением в модель исправлений, дополнений и т.п. Следовательно, язык моделирования должен обладать достаточной гибкостью, т.е. допускать внесение в модель частых изменений без перестройки модели в целом.
#1. М-АВТОМАТЫ. ОСНОВНЫЕ ПОНЯТИЯ
Предлагаемый язык моделирования развит на основе представления о мышлении как о направленном процессе взаимодействия множества корковых информационных моделей объектов внешнего и внутреннего мира человека. Искусственные системы, строящиеся на основе этого представления, реализуются в виде специфических сетей, названных М-сетями. Узлы М-сети есть формальные элементы, которые ставятся в соответствие корковым информационным моделям. Будем называть эти узлы i-моделями. Связи между i-моделями отвечают предполагаемым связям между корковыми моделями. С содержательной стороны i-модели могут быть поставлены в соответствие образам и понятиям, которыми оперирует человек. Поэтому с помощью М-сети можно представлять взаимосвязанные системы образов и понятий, предположительно используемые человеком в ходе мышления. М-сеть является, таким образом, сетью с семантикой.
Уточним содержание основных понятий предлагаемого языка.
i-МОДЕЛЬ есть формальный элемент, которому может быть поставлено в соответствие определенное понятие. При проведении нейрофизиологических аналогий i-модель сопоставляется с нейронным ансамблем. Аналог i-модели в психологии - внутренняя (корковая) информационная модель события внешнего или внутреннего мира. В семантическом плане i-модель является знаком понятия. С конструктивной точки зрения i-модель есть элемент некоторой структуры, который может находиться в ряде отличных друг от друга состояний. С функциональной точки зрения i-модель есть набор некоторых операторов или алгоритмов переработки информации. Опишем i-модель как элемент, обладающий следующими свойствами.
1. Каждая i-модель имеет конечное число входов и один выход.
2. Каждая i-модель может находиться в состоянии возбуждения, степень которого характеризуется числовой величиной П, называемой возбужденностью. Будем описывать функционирование i-модели в дискретном времени. Возбужденность некоторой i-модели j в момент времени t будем обозначать Пt.j.
3. i-Модели могут быть соединены направленными связями, по которым возбуждение передается от одних i-моделей к другим.
СВЯЗЬ между i-моделями есть формальный элемент, нейрофизиологическим аналогом которого является феномен взаимозависимости возбуждений различных ансамблей. Аналогом связи в психологии может быть ассоциативная связь. Основные свойства связи таковы.
1. Каждая связь может быть направлена от выхода какой-либо i-модели i к одному из входов другой i-модели j.
2. От выхода i-модели может отходить более чем одна связь, а к одному входу может подходить только одна связь.
3. Между двумя i-моделями может существовать только одна связь.
4. Каждая связь характеризуется упорядоченным набором параметров R, называемым проходимостью связи, или, для краткости, просто связью. Проходимость связи, направленной от i-модели j к i-модели i, в момент дискретного времени t будем обозначать Rt.ij
СЕМАНТИКА i-моделей задается двумя путями: во-первых, ее определяет соответствие, установленное между данной i-моделью и некоторым содержательным понятием, а, во-вторых - совокупность связей, соединяющих данную i-модель с другими.
ХАРАКТЕРИСТИКИ СВЯЗИ. Связь R.ij есть вектор R.ij = <r.ij, ~r.ij, r.(0)ij, ~r.(0)ij>, где параметры r.ij и ~r.ij - усиливающий и тормозной компоненты проходимости связи, а параметры r.(0)ij и ~r.(0)ij - остаточные составляющие этих компонент. Эти параметры могут принимать численные значения, что содержательно означает следующее. Возбуждение, поступающее по связи R.ij, может как увеличивать, так и уменьшать, тормозить возбудимость i-модели i. Численной мерой этих воздействий и являются значения r.ij и ~r.ij. Эти значения могут меняться во времени, так что в случае r.ij >> ~r.ij можно говорить об усиливающем характере связи R.ij, а в обратном случае - об ее тормозном характере. Остаточные составляющие связи всегда удовлетворяют соотношениям
rt.(0)ij<=rt.ij; ~rt.(0)ij<=~rt.ij (4.1)
и составляют долговременную память связей (подробнее об этом см. ниже). Будем полагать, что R.ij=0 в том случае, если равны нулю все ее компоненты. Каждая связь описывается следующими характеристиками.
1. Характеристика проторения есть функция, описывающая зависимость проходимости связи от возбужденностей соединяемых ею i-моделей:
Rt.ij = R(Пt.i, Пt.j, R[t-1].ij, Dt), (4.2)
где D - интегральная оценка качества функционирования М-сети. Эта оценка формируется с помощью специальных i-моделей сети. Она имеет смысл и может быть определена в тех случаях, когда на основе М-сети уже построена некоторая действующая модель - М-автомат, заданы цели его функционирования и определены критерии качества его работы. По отношению к этим критериям и формируется оценка D. Конкретные механизмы и правила вычисления значений D будут, соответственно, определяться при построении той или иной конкретной модели.
Будем называть связь непроторенной в момент t, если для нее Rt.ij=0. Если для некоторой связи R[t-1].ij=0 и Rt.ij!=0, то будем говорить, что в момент t произошло установление связи R.ij. Таким образом, установление является частным случаем проторения. Для связи непроторенной функция (4.2) может иметь иной вид, чем для проторенной, так что в случае установления
Rt.ij = R.1(Пt.i, Пt.j, Dt), (4.3)
Функцию (4.3) будем называть характеристикой установления.
2. Характеристика затухания связи есть набор функций, описывающих уменьшение значений ее параметров во времени. Эта характеристика описывает процесс уменьшения проходимости связи R.ij при условии, что в некоторый начальный момент t.0 значение R[t.0]ij!=0 и во все последующие моменты времени П.i=0 и П.j=0. Для усиливающих и тормозных компонентов связи характеристики затухания имеют вид
rt.ij = r.1(r[t-1].ij, rt.(0)ij,), (4.4а)
~rt.ij = r.2(~r[t-1].ij, ~rt.(0)ij,). (4.4б)
Функции (4.4а) и (4.46б) описывают такой процесс затухания, при котором значения r.ij и ~r.ij, уменьшаясь, стремятся к значениям их остаточных составляющих. Для остаточных составляющих характеристики затухания
rt.(0)ij = r.3(r[t-1](0)ij,), (4.5а)
~rt.(0)ij = r.4(~r[t-1](0)ij,). (4.5б)
таковы, что описывают стремление значений r.(0)ij и ~r.(0)ij к нулю. Усиливающие и тормозные компоненты затухают во времени намного быстрее, чем их остаточные составляющие. Поэтому, начиная с момента t.0, проходимость R.ij уменьшается сравнительно быстро ("кратковременная память связей"). Затем значения r.ij и ~r.ij достигают значений r.(0)ij и ~r(0).ij, и, поскольку условия (4.1) должны всегда сохраняться, дальнейшее уменьшение R.ij происходит в соответствии с характеристиками (4.5а) и (4.5б), т.е. существенно медленнее ("долговременная память связей").
3. Характеристика передачи связи определяет значение воздействия E.i(~E.i) на входе i-модели i в зависимости от проходимости r.ij(~r.ij) связи между i-й и j-й i-моделями и величины возбужденности П.j. В общем случае для i-й i-модели будем рассматривать величину входного воздействия по усиливающим (E.i) и тормозным (~E.i) связям:
Et.i = E(Пt.1, Пt.2, ..., rt.i1, rt.i2, ...), (4.6а)
~Et.i = ~E(Пt.1, Пt.2, ..., ~rt.i1, ~rt.i2, ...), (4.6б).
ХАРАКТЕРИСТИКИ i-МОДЕЛИ. В каждый момент времени каждая i-модель обладает определенной возбудимостью, под которой понимается способность i-модели отвечать собственным возбуждением на входное воздействие по усиливающим связям. Чем выше возбудимость i-модели, тем большей возбудимостью ответит она на постоянное входное воздействие. Возбудимость i-модели может изменяться во времени. Будем характеризовать возбудимость i-й i-модели двумя параметрами. Один из них - порог возбуждения i-модели Ot.i, представляющий собой минимальное значение Et.i, необходимое для возбуждения i-й i-модели в момент t. Другой параметр - условный коэффициент возбудимости K. Будем различать два значения K - текущее (Kt.i), изменяющееся в зависимости от величины тормозных воздействий ~Et.i, и начальное (Kt.нi) Значения параметров Kt.нi и Ot.i - могут изменяться во времени значительно медленнее, чем Kt.i. Перечислим характеристики i-моделей.
1. Характеристика торможения есть функция, определяющая изменение возбудимости i-модели в зависимости от величины суммарного воздействия на нее по тормозным связям:
Kt.i = Ф(Kt.нi, ~Et,i). (4.7)
2. Характеристика затухания есть функция, определяющая изменение возбужденности i-модели во времени:
Пt.i = T(П[t-1].i, Kt.нi). (4.8 )
Функция (4.8 ) описывает процесс уменьшения возбужденности при отсутствии воздействий на входах i-модели и характеризует "временную память возбуждений" i-моделей.
3. Характеристика возбуждения есть функция, определяющая значение возбужденности на выходе i-модели в зависимости от возбудимости i-модели и величины суммарного воздействия на нее по усиливающим связям:
Пt.i = П(Kt.i, Ot.i Et.i). (4.9)
4. Характеристики гипертрофии и адаптации определяют значения Kt.нi и Ot.i в зависимости от возбужденности i-модели:
Ot.i = O(O[t-1].i, Пt.i), (4.10а)
Kt.нi = K(K[t-1].нi, Пt.i). (4.10б)
Функции (4.10а) и (4.10б) таковы, что определяемые ими изменения параметров невелики в каждый момент дискретного времени. Эти функции задаются таким образом, что для i-моделей, которые в течение длительного времени обладают малой возбужденностью, значение порога увеличивается, а значение коэффициента возбудимости уменьшается ("адаптация"). В результате редко или слабо возбуждающиеся i-модели оказываются трудновозбудимыми и мало влияют на процессы в сети. Если i-модель возбуждается часто и сильно, функции (4.10а) и (4.10б) обеспечивают уменьшение значения ее порога и увеличение коэффициента возбудимости ("гипертрофия").
М-СЕТЬ. Назовем М-сетью совокупность i-моделей и связей между ними. Для того чтобы с помощью М-сети построить модель некоторого объекта, необходимо в соответствии со спецификой этого объекта и целями моделирования задать М-сеть: зафиксировать совокупность i-моделей и их содержательных интерпретаций; задать связи между i-моделями, т.е. заранее определить их начальную конфигурацию в сети и начальное распределение C их проходимостей; зафиксировать начальное значение параметров и вид характеристик i-моделей и связей; зафиксировать начальное распределение I значений возбужденностей i-моделей. В ходе функционирования М-сети все первоначально заданные элементы могут изменяться. Этап задания сети является по существу этапом предварительной организации разрабатываемой модели.
Одним из основных принципов предварительной организации М-сетей является принцип иерархичности структуры, обеспечивающий возможность многоуровневой переработки информации. Связи между i-моделями различных уровней отражают родо-видовые отношения соответствующих понятий. Кроме того, между i-моделями сети могут быть установлены "ассоциативные" связи.
Часто в М-сети бывает удобно выделять такие непересекающиеся подмножества i-моделей, каждое из которых удовлетворяет требованию смысловой однородности, близости содержательных интерпретаций входящих в него i-моделей. Будем называть такие подмножества сферами М-сети. Можно говорить, например, об эмоциональной сфере, имея в виду множество таких i-моделей, каждая из которых поставлена в соответствие представлению об определенном эмоциональном состоянии человека. Можно выделять также сферы понятий, двигательных реакций и т.п. Взаимосвязь сфер осуществляется благодаря наличию связей между i-моделями, входящими в разные сферы.
ПРОЦЕССЫ В М-СЕТИ. М-сеть является, по существу, статической моделью, отображающей взаимосвязь определенных образов и понятий, а также степень их участия в процессах формирования воспроизводимой деятельности. Сами эти процессы и собственно деятельность могут быть реально воспроизведены только после того, как будет задан некоторый алгоритм, обеспечивающий функционирование М-сети во времени. Такой алгоритм должен реализовать изменение состояний i-моделей и связей М-сети в соответствии с введенными характеристиками. Для того чтобы дать читателю содержательное представление о том, как "работают" введенные ранее понятия, рассмотрим динамику процессов, которые могут протекать в М-сети, если алгоритм ее функционирования будет задан. Поскольку описание аппарата моделирования еще не завершено, это рассмотрение будет носить приближенный, в значительной степени условный характер. В дальнейшем оно будет уточнено. Пусть на основе М-сети разрабатывается некоторая модель поведения. Будем считать, что М-сеть уже задана. Пусть модель находится в некоторой среде, содержащей "объекты". Будем полагать, что восприятие моделью определенного объекта среды возможно только в том случае, если в М-сети существует i-модель, соответствующая этому объекту. Совокупность i-моделей, соответствующих различным объектам среды, составляет сферу восприятия М-сети. Таким образом, восприятие моделью информации об объектах среды (т.е. восприятие ситуации) заключается в возбуждении соответствующих i-моделей в сфере восприятия М-сети. Отсюда по существующим между i-моделями связям возбуждение распространяется внутрь сети. Уточним это представление.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Напомним, что функционирование М-сети рассматривается в дискретном времени. Пусть в некоторый момент t-1 каждая из i-моделей сети имела определенную возбужденность. Используя характеристики передачи связей (4.6), можно определить для каждой i-модели суммарные значения поступающих в нее входных воздействий. Далее, по характеристике торможения (4.7) для каждой i-модели можно установить значение коэффициента ее возбудимости, а по характеристике затухания (4.8 ) - степень влияния, или "переноса", ее возбужденности в момент t-1 на ее же возбужденность в момент t. И, наконец, с помощью характеристики возбуждения (4.9) для каждой i-модели можно найти значение того компонента ее возбужденности в момент t, который возникает как ответ на входное воздействие по усиливающим связям. Используя найденные величины, можно определить окончательное значение возбужденности каждой i-модели в момент t с помощью специальной формулы пересчета, которая строится на основе отдельных характеристик (4.6)-(4.9) и в общем виде может быть представлена так:
Пt.i = Ф(Et.i, ~Et.i, П[t-1].i, K[t-1].нi, O[t-1].i). (4.11)
Следует отметить, что формула пересчета характеризует М-сеть в целом: конкретный вид этой формулы определяется один раз при построении модели и не изменяется при ее применении к каждой из i-моделей данной М-сети. Это отличает ее от характеристик торможения, возбуждения и затухания i-моделей, вид которых для различных i-моделей может быть разным.
Итак, применив формулу пересчета к каждой из i-моделей сети, мы определим значения их возбужденностей в момент t. Будем полагать, что расчет возбужденности производится для всех i-моделей сети одновременно. Назовем эту процедуру пересчетом. В результате пересчета, таким образом, вычисляется распределение возбужденностей i-моделей в момент t на основе распределения возбужденностей в момент t-1. Повторяя пересчет, можно определить возбужденности в моменты t+1, t+2, ... Такие последовательные пересчеты и реализуются в любой модели, построенной с помощью М-сети.
Вернемся к рассмотрению процессов в нашей условной модели. После восприятия ситуации возбуждение по имеющимся между i-моделями связям распространяется внутрь сети (в ходе последовательных пересчетов). Через некоторое время оказываются в разной степени возбужденными определенные (может быть, все) i-модели М-сети. При вы полнении специальных условий, которые задаются в соответствии с задачами исследования, модель осуществляет некоторое действие - реакцию на воспринятую ситуацию. (Таким условием может быть, например, возбуждение до наперед заданной степени i-модели некоторого действия). Действие модели изменяет среду, эти изменения фиксируются в сфере восприятия М-сети путем возбуждения новых i-моделей. Возбуждение распространяется по сети до момента выполнения условий действия. Затем выполняется новое действие и т.д. Таким образом модель осуществляет в среде некоторое поведение.
В М-сети существуют i-модели, возбуждение которых можно интерпретировать как интегральную оценку состояния М-сети в каждый момент времени. Эти i-модели соответствуют корковым центрам (гипотетическим) общей оценки состояния организма. Будем называть их i-моделями "приятно" (Пр) и "неприятно" (НПр). В процессе функционирования М-сети возбужденность i-моделей Пр и НПр постоянно изменяется, так что в любой момент времени может быть вычислено значение ОБЩЕЙ ОЦЕНКИ СОСТОЯНИЯ, например в виде Dt=Пt.Пр-Пt.НПр. Следует отметить, что состояние М-сети тесно связано с эффективностью вырабатываемых ею решений. Так, например, если модель должна удовлетворять свой (условный) "голод", добывая "пищу", а вырабатываемые М-сетью действия таковы, что модель "пищу" не находит, то в М-сети будет сильно возбуждена i-модель "голод", соответственно будут возбуждаться i-модели других отрицательных эмоций и в результате возбужденность i-модели НПр будет также велика. Таким образом, оценка D характеризует не только состояние М-сети, но и эффективность поведения модели в целом или, что в нашем случае почти одно и то же, эффективность функционирования М-сети как системы, принимающей решения. Ясно также, что структура оценки и механизмы ее формирования определяются структурой М-сети и задаются ее предварительной организацией.
Из приведенного описания видно, что модель, построенная на основе М-сети, включает в себя ряд вспомогательных устройств, или алгоритмов. Эти вспомогательные системы непосредственно взаимодействуют со средой, выполняя роль рецепторов и эффекторов модели; реализуют специальные вычисления и другие операции, обслуживающие работу М-сети. Последняя же выступает здесь в роли высших отделов "мозга" модели, интегрирующего информацию о ее внешнем и внутреннем состоянии и вырабатывающего решения о выполнении действий.
Рассмотрим основные процессы, протекающие в М-сети при ее функционировании.
1. В зависимости от "истории" возбуждений каждой i-модели и в соответствии с характеристиками гипертрофии и адаптации (4.10) изменяются параметры ее возбудимости O и Kн. Соответственно изменяются и характеристики возбуждения, торможения и затухания i-модели.
2. В зависимости от "истории" совместных возбуждений каждой пары {-моделей и в соответствии с характеристиками проторения (4.2) и затухания (4.4) и (4.5) связей изменяется проходимость связей М-сети.
Естественно, что изменение характеристик i-моделей и проходимостей связей изменяет характер распространения возбуждения в М-сети. Это, в свою очередь, вызывает новые изменения характеристик и связей. Направление и вид этих изменений определяются состоянием "оценивающих" i-моделей Пр и НПр. Процессы, описанные в пп.1 и 2, будем называть процессами самообучения М-сети.
3. В ходе распространения возбуждений в М-сети и в соответствии с характеристикой установления (4.2) начинают функционировать новые, т.е. бывшие ранее непроторенными, связи между i-моделями. Таким образом, изменяется общая конфигурация связей сети.
4. В М-сети имеется некоторое множество i-моделей, в исходном состоянии не связанных ни друг с другом, ни с другими i-моделями сети. Для этих i-моделей не устанавливаются также соответствия с содержательными понятиями. Элементы такого рода, строго говоря, не являются i-моделями. Будем называть их резервными элементами. На множестве резервных элементов задан закон их спонтанного (случайного) возбуждения.
Пусть в некоторый момент времени спонтанно возбуждается один из резервных элементов. В этот же момент оказывается возбужденной некоторая совокупность других i-моделей М-сети. Между i-моделями этой совокупности и возбудившимся резервным элементом в соответствии с характеристикой (4.2) устанавливаются новые связи. Элемент становится, таким образом, "представителем", т.е. i-моделью совокупности i-моделей, и получает некоторое семантическое значение, определяемое семантикой i-моделей, входящих в возбужденную совокупность.
Если и в дальнейшем i-модели той же совокупности часто оказываются возбужденными одновременно, то вновь установившиеся связи проторяются в еще большей степени и новая i-модель закрепляется. В противном же случае она вскоре распадается из-за естественного затухания связей. Аналогичным образом образуются i-модели временных последовательностей. Описанные процессы лежат в основе образования в М-сети новых понятий из понятий, имевшихся в ней ранее.
Процессы, описанные в пп.3 и 4, будем называть процессами самоорганизации в М-сети. Процессы самообучения и самоорганизации могут приводить к образованию i-моделей "второго слоя", т.е. ансамблей из исходных i-моделей, которые, в свою очередь, могут образовывать ансамбли "третьего слоя" и т.д. Ансамбли такого рода можно рассматривать как новые функциональные элементы М-сети, а процесс их образования - как процесс формирования новых сложных понятий на базе имевшихся ранее.
ГРУППЫ ХАРАКТЕРИСТИК. Введенные ранее характеристики элементов М-сети (i-моделей и связей) удобно разделять на несколько основных групп. Группу характеристик пересчета составляют те характеристики элементов сети, которые непосредственно используются при пересчете возбуждений и объединены в формуле пересчета (4.11). Сюда входят характеристики (4.6)-(4.9). Группу характеристик самообучения составляют характеристики (4.3)-(4.5), описывающие процессы изменения проходимости связей и параметров возбудимости i-моделей. Группу характеристик самоорганизации составляют характеристики установления связей (4.2) и законы спонтанного возбуждения резервных элементов М-сети.
Дадим определение М-сети. М-сеть м есть семерка:
м = <P, S, R, L, F, C, I>, (4.12)
где Р - множество i-моделей; S - множество связей между i-моделями; R - группа характеристик пересчета; L - группа характеристик самообучения; F - группа характеристик самоорганизации; С - начальное распределение проходимостей связей; I - начальное распределение возбуждений i-моделей.
СИСТЕМА УСИЛЕНИЯ-ТОРМОЖЕНИЯ (СУТ). Общая идея и функции СУТ уже кратко обсуждались в настоящей главе при изложении основных положений рабочей гипотезы. В связи с принципиальной важностью понимания роли СУТ в функционировании М-сети остановимся на этом вопросе еще раз.
С формальной стороны роль СУТ состоит в организации положительной обратной связи в процессах переработки информации М-сетью. Это обеспечивает на каждом временном промежутке доминирование наиболее важной в приспособительном плане программы переработки информации над другими программами, параллельно развивающимися в М-сети.
СУТ функционирует следующим образом. Пусть задана некоторая М-сеть. В процессе переработки информации возбужденности i-моделей сети изменяются. Величина возбуждения каждой i-модели косвенно свидетельствует о "важности", или ценности, зафиксированной в ней информации. Естественно предположить, что выделение в каждый момент времени наиболее возбужденной i-модели и усиление ее влияния на общий ход переработки информации увеличит эффективность работы сети. Эти задачи и решает СУТ. В каждый момент времени она выбирает наиболее возбужденную i-модель, дополнительно повышает ее возбужденность и уменьшает возбудимость остальных i-моделей (притормаживает их). Если в некоторый момент времени одинаковое наибольшее возбуждение имеют n i-моделей, то дополнительная возбужденность от СУТ для каждой из них будет в n раз уменьшена: СУТ обладает конечным "энергетическим" запасом, величина которого зависит от общего состояния сети (в частности, от состояния i-моделей Пр и НПр).
Алгоритмы СУТ таковы, что возбужденность выделенных ею i-моделей постепенно уменьшается во времени. В то же время пропорционально растормаживаются остальные i-модели. Возбуждение от i-моделей, первоначально выделенных СУТ, распространяется по сети, увеличивая возбужденность связанных с ними i-моделей. В результате одна из них становится максимально возбужденной, СУТ переключается па нее и весь процесс повторяется.
СУТ содержит иерархически организованные подсистемы. Чем ниже уровень подсистемы, тем меньшее количество i-моделей находится под ее влиянием. Подсистемы СУТ более высоких уровней производят сравнение не возбужденностей отдельных i-моделей, а интегральных активностей более или менее обширных зон или сфер сети.
Мы описали только один из возможных вариантов реализации СУТ. Более подробный анализ имеющихся здесь возможностей и задач проведен в предыдущей работе. Там же подробно обсуждается работа СУТ в ее приспособительном и психологическом аспектах.
М-АВТОМАТ. Опишем в общих чертах структуру алгоритма функционирования М-сети. Пусть, согласно определению (4.12), задана некоторая М-сеть м. Совокупность конкретных реализаций каждого из элементов семерки (4.12) есть состояние М-сети. Алгоритм функционирования преобразовывает состояние М-сети в момент t в ее состояние в момент t+1. Алгоритм содержит следующие основные блоки:
1) блок пересчета, выполняющий операции в соответствии с формулой пересчета (4.11); в этом блоке определяются возбужденности всех i-моделей М-сети в момент t+1;
2) блок обучения, в котором в соответствии с характеристиками обучения определяются новые значения проходимостей связей и параметров возбужденности i-моделей;
3) блок дополнения, или "роста", М-сети; здесь в соответствии с характеристиками самоорганизации устанавливаются новые связи между i-моделями и формируются "спонтанные" возбуждения резервных элементов;
4) блок СУТ, в котором производятся операции, реализующие алгоритм работы системы усиления - торможения;
5) блок проверки логических условий; вид этих условий определяется отдельно для каждой конкретной задачи моделирования (см., например, упоминавшиеся выше условия выбора действия моделью, вырабатывающей некоторое поведение, и др.).
Функционирование М-сети обеспечивается многократным применением описанного алгоритма. Порядок выполнения различных блоков строго не фиксируется и может быть частично изменен при построении конкретных моделей. Совокупность операций, выполняемых при однократном применении алгоритма, назовем тактом функционирования М-сети. За один такт, следовательно, осуществляется полное определение состояния М-сети в определенный момент дискретного времени.
Алгоритм функционирования М-сети будем в дальнейшем для краткости называть алгоритмом А. Пару <м, А> назовем М-автоматом. Такой автомат построен на основе М-сети и включает в себя алгоритм ее функционирования А.
Рассмотрим некоторый М-автомат <ц, А>. Если м задана в виде (4.12), будем считать такой М-автомат полным. Иногда оказывается целесообразным строить М-автоматы, в которых реализованы не все функции М-сети. В зависимости от полноты задания М-сети будем различать САМООБУЧАЮЩИЕСЯ М-автоматы:
м = <P, S, R, L, 0, С, I> (4.13)
и НЕОБУЧАЮЩИЕСЯ М-автоматы:
м = <P, S, R, 0, 0, С, I>; (4.14)
знак 0 обозначает, что соответствующий элемент не вводится. Алгоритм А в случае самообучающегося М-автомата не содержит блока 3, а в случае необучающегося - блоков 2 и 3.
Иногда выражение в М-сети отдельных (из множества моделируемых) функций или программ оказывается неэкономичным или связано со значительными техническими трудностями. В этих случаях указанные функции целесообразно описать некоторым специальным алгоритмом (т.е. построить их функциональную модель) и организовать его совместную работу и обмен информацией с алгоритмом А. М-автомат, часть функций которого выражена специальным алгоритмом, работающим сопряженно с алгоритмом А, назовем НЕПОЛНЫМ М-автоматом. Неполный М-автомат является удобной формой сочетания в единой системе функциональных и структурных моделей. В дальнейшем мы будем подробно рассматривать примеры построения неполных М-автоматов.
Для некоторых практических целей представление в моделях системы усиления - торможения не является необходимым. М-автомат, алгоритм А которого не содержит блока СУТ, будем называть ВЫРОЖДЕННЫМ М-автоматом.
ПОСТРОЕНИЕ М-автомата. Пусть поставлена задача построения модели некоторой психической функции ф; и определена цель моделирования. Кратко рассмотрим этапы построения соответствующего М-автомата.
1. Прежде всего собираются и систематизируются сведения из психологии о функции ф. Если необходимо, проводятся новые психологические исследования.
2. Исходя из целей моделирования и сведений п.1 определяется необходимый тип М-автомата. Если принимается решение о разработке неполного М-автомата, конструируется алгоритмическая модель соответствующих функций. Это может явиться самостоятельной и сложной задачей, рассматривать которую здесь мы не будем.
3. Выдвигается гипотеза о составе программ психики, участвующих в формировании моделируемой функции ф?.
4. Исходя из целей моделирования задаются "внешние объекты" и законы их взаимодействия с М-автоматом, т.е. задается среда модели.
5. Определяется "уровень" моделирования. В соответствии с гипотезой п.3 фиксируется набор понятий, необходимый для описания ф на выбранном уровне. Каждому понятию ставится в соответствие i-модель.
6. В соответствии с гипотезой п.3 задается множество связей между i-моделями.
7. Определяются проходимости связей, вид и параметры характеристик i-моделей и связей. Для их уточнения могут понадобиться специальные эксперименты. Однако, как правило, они определяются эвристически.
8. Аналогично определяются (если необходимо) характеристики обучения и самоорганизации. При выполнении пп.6-8 широко используются аналогии, сопоставления, правдоподобные рассуждения и т.п. Направляющим здесь является содержание гипотезы п.3. Следует отметить, что от удачного выбора величин в пп.6 и 7 во многом зависит успех моделирования. Именно здесь прежде всего необходимы дальнейшая систематизация, совершенствование и разработка методов эвристического моделирования.
9. Задается исходное состояние М-сети.
10. Задается алгоритм функционирования А.
11. М-автомат и его среда реализуются в виде действующих устройств или программ для ЦВМ.
Пt.i = Ф(Et.i, ~Et.i, П[t-1].i, K[t-1].нi, O[t-1].i). (4.11)
Следует отметить, что формула пересчета характеризует М-сеть в целом: конкретный вид этой формулы определяется один раз при построении модели и не изменяется при ее применении к каждой из i-моделей данной М-сети. Это отличает ее от характеристик торможения, возбуждения и затухания i-моделей, вид которых для различных i-моделей может быть разным.
Итак, применив формулу пересчета к каждой из i-моделей сети, мы определим значения их возбужденностей в момент t. Будем полагать, что расчет возбужденности производится для всех i-моделей сети одновременно. Назовем эту процедуру пересчетом. В результате пересчета, таким образом, вычисляется распределение возбужденностей i-моделей в момент t на основе распределения возбужденностей в момент t-1. Повторяя пересчет, можно определить возбужденности в моменты t+1, t+2, ... Такие последовательные пересчеты и реализуются в любой модели, построенной с помощью М-сети.
Вернемся к рассмотрению процессов в нашей условной модели. После восприятия ситуации возбуждение по имеющимся между i-моделями связям распространяется внутрь сети (в ходе последовательных пересчетов). Через некоторое время оказываются в разной степени возбужденными определенные (может быть, все) i-модели М-сети. При вы полнении специальных условий, которые задаются в соответствии с задачами исследования, модель осуществляет некоторое действие - реакцию на воспринятую ситуацию. (Таким условием может быть, например, возбуждение до наперед заданной степени i-модели некоторого действия). Действие модели изменяет среду, эти изменения фиксируются в сфере восприятия М-сети путем возбуждения новых i-моделей. Возбуждение распространяется по сети до момента выполнения условий действия. Затем выполняется новое действие и т.д. Таким образом модель осуществляет в среде некоторое поведение.
В М-сети существуют i-модели, возбуждение которых можно интерпретировать как интегральную оценку состояния М-сети в каждый момент времени. Эти i-модели соответствуют корковым центрам (гипотетическим) общей оценки состояния организма. Будем называть их i-моделями "приятно" (Пр) и "неприятно" (НПр). В процессе функционирования М-сети возбужденность i-моделей Пр и НПр постоянно изменяется, так что в любой момент времени может быть вычислено значение ОБЩЕЙ ОЦЕНКИ СОСТОЯНИЯ, например в виде Dt=Пt.Пр-Пt.НПр. Следует отметить, что состояние М-сети тесно связано с эффективностью вырабатываемых ею решений. Так, например, если модель должна удовлетворять свой (условный) "голод", добывая "пищу", а вырабатываемые М-сетью действия таковы, что модель "пищу" не находит, то в М-сети будет сильно возбуждена i-модель "голод", соответственно будут возбуждаться i-модели других отрицательных эмоций и в результате возбужденность i-модели НПр будет также велика. Таким образом, оценка D характеризует не только состояние М-сети, но и эффективность поведения модели в целом или, что в нашем случае почти одно и то же, эффективность функционирования М-сети как системы, принимающей решения. Ясно также, что структура оценки и механизмы ее формирования определяются структурой М-сети и задаются ее предварительной организацией.
Из приведенного описания видно, что модель, построенная на основе М-сети, включает в себя ряд вспомогательных устройств, или алгоритмов. Эти вспомогательные системы непосредственно взаимодействуют со средой, выполняя роль рецепторов и эффекторов модели; реализуют специальные вычисления и другие операции, обслуживающие работу М-сети. Последняя же выступает здесь в роли высших отделов "мозга" модели, интегрирующего информацию о ее внешнем и внутреннем состоянии и вырабатывающего решения о выполнении действий.
Рассмотрим основные процессы, протекающие в М-сети при ее функционировании.
1. В зависимости от "истории" возбуждений каждой i-модели и в соответствии с характеристиками гипертрофии и адаптации (4.10) изменяются параметры ее возбудимости O и Kн. Соответственно изменяются и характеристики возбуждения, торможения и затухания i-модели.
2. В зависимости от "истории" совместных возбуждений каждой пары {-моделей и в соответствии с характеристиками проторения (4.2) и затухания (4.4) и (4.5) связей изменяется проходимость связей М-сети.
Естественно, что изменение характеристик i-моделей и проходимостей связей изменяет характер распространения возбуждения в М-сети. Это, в свою очередь, вызывает новые изменения характеристик и связей. Направление и вид этих изменений определяются состоянием "оценивающих" i-моделей Пр и НПр. Процессы, описанные в пп.1 и 2, будем называть процессами самообучения М-сети.
3. В ходе распространения возбуждений в М-сети и в соответствии с характеристикой установления (4.2) начинают функционировать новые, т.е. бывшие ранее непроторенными, связи между i-моделями. Таким образом, изменяется общая конфигурация связей сети.
4. В М-сети имеется некоторое множество i-моделей, в исходном состоянии не связанных ни друг с другом, ни с другими i-моделями сети. Для этих i-моделей не устанавливаются также соответствия с содержательными понятиями. Элементы такого рода, строго говоря, не являются i-моделями. Будем называть их резервными элементами. На множестве резервных элементов задан закон их спонтанного (случайного) возбуждения.
Пусть в некоторый момент времени спонтанно возбуждается один из резервных элементов. В этот же момент оказывается возбужденной некоторая совокупность других i-моделей М-сети. Между i-моделями этой совокупности и возбудившимся резервным элементом в соответствии с характеристикой (4.2) устанавливаются новые связи. Элемент становится, таким образом, "представителем", т.е. i-моделью совокупности i-моделей, и получает некоторое семантическое значение, определяемое семантикой i-моделей, входящих в возбужденную совокупность.
Если и в дальнейшем i-модели той же совокупности часто оказываются возбужденными одновременно, то вновь установившиеся связи проторяются в еще большей степени и новая i-модель закрепляется. В противном же случае она вскоре распадается из-за естественного затухания связей. Аналогичным образом образуются i-модели временных последовательностей. Описанные процессы лежат в основе образования в М-сети новых понятий из понятий, имевшихся в ней ранее.
Процессы, описанные в пп.3 и 4, будем называть процессами самоорганизации в М-сети. Процессы самообучения и самоорганизации могут приводить к образованию i-моделей "второго слоя", т.е. ансамблей из исходных i-моделей, которые, в свою очередь, могут образовывать ансамбли "третьего слоя" и т.д. Ансамбли такого рода можно рассматривать как новые функциональные элементы М-сети, а процесс их образования - как процесс формирования новых сложных понятий на базе имевшихся ранее.
ГРУППЫ ХАРАКТЕРИСТИК. Введенные ранее характеристики элементов М-сети (i-моделей и связей) удобно разделять на несколько основных групп. Группу характеристик пересчета составляют те характеристики элементов сети, которые непосредственно используются при пересчете возбуждений и объединены в формуле пересчета (4.11). Сюда входят характеристики (4.6)-(4.9). Группу характеристик самообучения составляют характеристики (4.3)-(4.5), описывающие процессы изменения проходимости связей и параметров возбудимости i-моделей. Группу характеристик самоорганизации составляют характеристики установления связей (4.2) и законы спонтанного возбуждения резервных элементов М-сети.
Дадим определение М-сети. М-сеть м есть семерка:
м = <P, S, R, L, F, C, I>, (4.12)
где Р - множество i-моделей; S - множество связей между i-моделями; R - группа характеристик пересчета; L - группа характеристик самообучения; F - группа характеристик самоорганизации; С - начальное распределение проходимостей связей; I - начальное распределение возбуждений i-моделей.
СИСТЕМА УСИЛЕНИЯ-ТОРМОЖЕНИЯ (СУТ). Общая идея и функции СУТ уже кратко обсуждались в настоящей главе при изложении основных положений рабочей гипотезы. В связи с принципиальной важностью понимания роли СУТ в функционировании М-сети остановимся на этом вопросе еще раз.
С формальной стороны роль СУТ состоит в организации положительной обратной связи в процессах переработки информации М-сетью. Это обеспечивает на каждом временном промежутке доминирование наиболее важной в приспособительном плане программы переработки информации над другими программами, параллельно развивающимися в М-сети.
СУТ функционирует следующим образом. Пусть задана некоторая М-сеть. В процессе переработки информации возбужденности i-моделей сети изменяются. Величина возбуждения каждой i-модели косвенно свидетельствует о "важности", или ценности, зафиксированной в ней информации. Естественно предположить, что выделение в каждый момент времени наиболее возбужденной i-модели и усиление ее влияния на общий ход переработки информации увеличит эффективность работы сети. Эти задачи и решает СУТ. В каждый момент времени она выбирает наиболее возбужденную i-модель, дополнительно повышает ее возбужденность и уменьшает возбудимость остальных i-моделей (притормаживает их). Если в некоторый момент времени одинаковое наибольшее возбуждение имеют n i-моделей, то дополнительная возбужденность от СУТ для каждой из них будет в n раз уменьшена: СУТ обладает конечным "энергетическим" запасом, величина которого зависит от общего состояния сети (в частности, от состояния i-моделей Пр и НПр).
Алгоритмы СУТ таковы, что возбужденность выделенных ею i-моделей постепенно уменьшается во времени. В то же время пропорционально растормаживаются остальные i-модели. Возбуждение от i-моделей, первоначально выделенных СУТ, распространяется по сети, увеличивая возбужденность связанных с ними i-моделей. В результате одна из них становится максимально возбужденной, СУТ переключается па нее и весь процесс повторяется.
СУТ содержит иерархически организованные подсистемы. Чем ниже уровень подсистемы, тем меньшее количество i-моделей находится под ее влиянием. Подсистемы СУТ более высоких уровней производят сравнение не возбужденностей отдельных i-моделей, а интегральных активностей более или менее обширных зон или сфер сети.
Мы описали только один из возможных вариантов реализации СУТ. Более подробный анализ имеющихся здесь возможностей и задач проведен в предыдущей работе. Там же подробно обсуждается работа СУТ в ее приспособительном и психологическом аспектах.
М-АВТОМАТ. Опишем в общих чертах структуру алгоритма функционирования М-сети. Пусть, согласно определению (4.12), задана некоторая М-сеть м. Совокупность конкретных реализаций каждого из элементов семерки (4.12) есть состояние М-сети. Алгоритм функционирования преобразовывает состояние М-сети в момент t в ее состояние в момент t+1. Алгоритм содержит следующие основные блоки:
1) блок пересчета, выполняющий операции в соответствии с формулой пересчета (4.11); в этом блоке определяются возбужденности всех i-моделей М-сети в момент t+1;
2) блок обучения, в котором в соответствии с характеристиками обучения определяются новые значения проходимостей связей и параметров возбужденности i-моделей;
3) блок дополнения, или "роста", М-сети; здесь в соответствии с характеристиками самоорганизации устанавливаются новые связи между i-моделями и формируются "спонтанные" возбуждения резервных элементов;
4) блок СУТ, в котором производятся операции, реализующие алгоритм работы системы усиления - торможения;
5) блок проверки логических условий; вид этих условий определяется отдельно для каждой конкретной задачи моделирования (см., например, упоминавшиеся выше условия выбора действия моделью, вырабатывающей некоторое поведение, и др.).
Функционирование М-сети обеспечивается многократным применением описанного алгоритма. Порядок выполнения различных блоков строго не фиксируется и может быть частично изменен при построении конкретных моделей. Совокупность операций, выполняемых при однократном применении алгоритма, назовем тактом функционирования М-сети. За один такт, следовательно, осуществляется полное определение состояния М-сети в определенный момент дискретного времени.
Алгоритм функционирования М-сети будем в дальнейшем для краткости называть алгоритмом А. Пару <м, А> назовем М-автоматом. Такой автомат построен на основе М-сети и включает в себя алгоритм ее функционирования А.
Рассмотрим некоторый М-автомат <ц, А>. Если м задана в виде (4.12), будем считать такой М-автомат полным. Иногда оказывается целесообразным строить М-автоматы, в которых реализованы не все функции М-сети. В зависимости от полноты задания М-сети будем различать САМООБУЧАЮЩИЕСЯ М-автоматы:
м = <P, S, R, L, 0, С, I> (4.13)
и НЕОБУЧАЮЩИЕСЯ М-автоматы:
м = <P, S, R, 0, 0, С, I>; (4.14)
знак 0 обозначает, что соответствующий элемент не вводится. Алгоритм А в случае самообучающегося М-автомата не содержит блока 3, а в случае необучающегося - блоков 2 и 3.
Иногда выражение в М-сети отдельных (из множества моделируемых) функций или программ оказывается неэкономичным или связано со значительными техническими трудностями. В этих случаях указанные функции целесообразно описать некоторым специальным алгоритмом (т.е. построить их функциональную модель) и организовать его совместную работу и обмен информацией с алгоритмом А. М-автомат, часть функций которого выражена специальным алгоритмом, работающим сопряженно с алгоритмом А, назовем НЕПОЛНЫМ М-автоматом. Неполный М-автомат является удобной формой сочетания в единой системе функциональных и структурных моделей. В дальнейшем мы будем подробно рассматривать примеры построения неполных М-автоматов.
Для некоторых практических целей представление в моделях системы усиления - торможения не является необходимым. М-автомат, алгоритм А которого не содержит блока СУТ, будем называть ВЫРОЖДЕННЫМ М-автоматом.
ПОСТРОЕНИЕ М-автомата. Пусть поставлена задача построения модели некоторой психической функции ф; и определена цель моделирования. Кратко рассмотрим этапы построения соответствующего М-автомата.
1. Прежде всего собираются и систематизируются сведения из психологии о функции ф. Если необходимо, проводятся новые психологические исследования.
2. Исходя из целей моделирования и сведений п.1 определяется необходимый тип М-автомата. Если принимается решение о разработке неполного М-автомата, конструируется алгоритмическая модель соответствующих функций. Это может явиться самостоятельной и сложной задачей, рассматривать которую здесь мы не будем.
3. Выдвигается гипотеза о составе программ психики, участвующих в формировании моделируемой функции ф?.
4. Исходя из целей моделирования задаются "внешние объекты" и законы их взаимодействия с М-автоматом, т.е. задается среда модели.
5. Определяется "уровень" моделирования. В соответствии с гипотезой п.3 фиксируется набор понятий, необходимый для описания ф на выбранном уровне. Каждому понятию ставится в соответствие i-модель.
6. В соответствии с гипотезой п.3 задается множество связей между i-моделями.
7. Определяются проходимости связей, вид и параметры характеристик i-моделей и связей. Для их уточнения могут понадобиться специальные эксперименты. Однако, как правило, они определяются эвристически.
8. Аналогично определяются (если необходимо) характеристики обучения и самоорганизации. При выполнении пп.6-8 широко используются аналогии, сопоставления, правдоподобные рассуждения и т.п. Направляющим здесь является содержание гипотезы п.3. Следует отметить, что от удачного выбора величин в пп.6 и 7 во многом зависит успех моделирования. Именно здесь прежде всего необходимы дальнейшая систематизация, совершенствование и разработка методов эвристического моделирования.
9. Задается исходное состояние М-сети.
10. Задается алгоритм функционирования А.
11. М-автомат и его среда реализуются в виде действующих устройств или программ для ЦВМ.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#2. ПРИМЕР ПОСТРОЕНИЯ М-АВТОМАТА
При описании аппарата моделирования мы перечислили ряд последовательных этапов построения М-автомата. Приведем конкретный пример этого процесса.
В качестве прототипа конструируемого М-автомата рассмотрим робота Спиди - героя рассказа А.Азимова "Хоровод". Читатели, интересующиеся проблемой "искусственный разум", вероятно, хорошо знакомы с циклом рассказов А.Азимова "Я, робот" ("Мир", М., 1959), однако, на всякий случай, процитируем "Три Закона роботехники" и напомним кратко содержание рассказа "Хоровод".
"Три Закона роботехники:
1. Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинен вред.
2. Робот должен повиноваться командам, которые ему дает человек, кроме тех случаев, когда эти команды противоречат Первому Закону.
3. Робот должен заботиться о своей безопасности, поскольку это не противоречит Первому и Второму Законам.
Из "Руководства по роботехнике", 56-е издание, 2058 год".
Робот СПД-13 (Спиди) послан к селеновому озеру с приказом: принести селен. Приказ не подчеркивал важность и срочность этого задания, в то время как именно от его выполнения зависел успех экспедиции. Выделяющийся возле озера газ был опасен для робота, поскольку мог привести к нарушению его целостности. В результате, по мере приближения робота к озеру, в его "позитронном мозге" возрастал потенциал Третьего Закона роботехники, призванного не допускать нарушения целостности робота. Поскольку потенциал Второго Закона, обусловленный силой данного Спиди приказа, был невелик, возникло равновесие между стремлением выполнить приказ и стремлением избежать опасности. Это и привело к нарушениям в поведении робота:
"-...Устанавливается равновесие. Третий Закон гонит его назад, а Второй - вперед...
- Он начинает кружить около озера, оставаясь на линии, где существует это равновесие. Если мы ничего не предпримем, он так и будет бегать по этому кругу, как в хороводе..."
Только ценой включения Первого Закона, обязующего робота прежде всего заботиться о человеке, удалось вывести Спиди из "заколдованного круга". Вторично робот получил приказ "достаточной силы" и выполнил его без всяких отклонений от норм поведения.
Построим М-автомат, моделирующий поведение Спиди. Итак, моделируемая функция ф есть поведение робота: цель моделирования - выяснение причин нарушения нормы поведения.
Необходимо иметь в виду, что модель Спиди строится только для демонстрации процесса построения М-автомата. Поведение Спиди будет представлено в предельно упрощенном виде, поскольку для сложного автомата детальный анализ принципов построения весьма затруднителен. Именно поэтому мы, собственно, и рассматриваем условный призер, а не используем разработанные нами М-автоматы, описание которых приводится во второй части книги.
Будем считать, что полученный роботом приказ выполнен в тот момент, когда он подошел к озеру. Процесс возвращения робота после выполнения задания рассматривать не будем. Пусть выполнение приказа считается нормой поведения, а блуждания вокруг озера - нарушением нормы. Сведениями о функции ф будут служить описания поведения робота, приведенные в рассказе. Дополнительные исследования, естественно, мы провести не можем. Поскольку поведение робота ограничено в нашей модели только движением к озеру, можно считать, что имеющиеся в рассказе сведения достаточны для построения полного необучающегося М-автомата.
В построении моделируемой функции участвуют две программы, отражающие действие Второго и Третьего Законов роботехники: программа выполнения приказа и программа сохранения целостности робота. В качестве "внешних" объектов примем: озеро, содержащее селен (автомат должен приблизиться к нему), и газ, выделяющийся вокруг озера и угрожающий целостности автомата. Будем считать, что концентрация газа находится в прямой зависимости от близости автомата к озеру: чем больше концентрация газа, тем больше опасность для автомата. Внешним воздействием (установкой) будем считать также "силу приказа", данного автомату. Поскольку приказ был дан один раз, силу этого внешнего воздействия примем постоянной.
Выберем информационный уровень описания работы мозга робота и определим набор понятий, необходимых для описания функции. Прежде всего зафиксируем отражение в мозге робота внешних воздействий, введя i-модели "близость озера", "концентрация газа" и "приказ". Для того чтобы выполнить приказ и в то же время сохранить себя, автомат должен совершать некоторые действия. Чтобы не усложнять структуру будущего М-автомата, ограничимся двумя действиями - "подойти" и "отойти" и введем соответствующие i-модели. Тот факт, что в среде имеются опасные для целостности автомата элементы, отразим i-моделью "опасность".
"Эмоциональное" состояние робота во время выполнения приказа в самых общих чертах может быть описано следующим образом. Поскольку среда в определенной мере опасна для робота (и, соответственно, для моделирующего его автомата), эмоциональным сигналом о наличии опасности может быть чувство страха. С другой стороны, процесс выполнения полученного приказа должен сопровождаться чувством удовлетворения (сигнал полезности деятельности), а отказ от выполнения - чувством неудовлетворения. Чувство удовлетворения можно интерпретировать и по-другому, понимая его в данном случае как чувство уверенности, возрастающее по мере приближения к цели. Чувством неудовлетворения мы пока пренебрежем. Понимая, что эмоциональная сфера нашего автомата оказывается бедной, ограничимся все же введением в нее не более двух i-моделей: "чувство страха" и "чувство уверенности". На этом закончим формирование набора понятий для описания поведения робота Спиди. При желании читатель может легко расширить структуру автомата, введя новые понятия самостоятельно.
Итак, для описания выбранной функции ф мы собираемся использовать следующие понятия: близость озера, концентрация газа, опасность, страх, уверенность, подойти, отойти. Очевидно, что соответствующие i-модели должны быть в мозге автомата определенным образом взаимосвязаны. Мы говорили, что концентрация газа находится в прямой зависимости от близости озера. Однако отражать эту зависимость связью от i-модели "близость озера" к i-модели "концентрация газа" не следует, поскольку, во-первых, она реализуется вне автомата, его внешней средой, и, во-вторых, "по условиям игры" наш автомат не обучается, никогда раньше к этому озеру не подходил и, следовательно, в его мозге не могла установиться такая связь. Тот факт, что наличие газа и величина его концентрации не безразличны автомату, отразим связью, направленной от i-модели "концентрация газа" к i-модели "опасность". Естественно, что чем больше опасность, тем сильнее должно быть чувство страха и стремление автомата уйти от опасности. Установим поэтому связи от i-модели "опасность" к i-моделям "страх" и "отойти". Увеличение чувства страха, в свою очередь, пусть вызывает стремление уйти от опасности, уменьшение уверенности и стремления подойти к опасному объекту. Отразим эти взаимозависимости связями, направленными от i-модели "страх" к i-модели "отойти" и i-моделям "уверенность" и "подойти". К последним i-моделям должны быть установлены тормозные связи.
При описании аппарата моделирования мы выделяли тормозной и активный компоненты связи. Поскольку здесь мы имеем дело с необучающимся М-автоматом, а также для упрощения его алгоритма будем считать, что связь имеет только один компонент и, следовательно, может быть либо усиливающей (активной), либо тормозной. Говоря, что от одной i-модели к другой установлена связь, будем понимать, что эта связь усиливающая. Наличие тормозной связи будем каждый раз оговаривать отдельно.
Итак, чувство страха тормозит чувство уверенности. Вполне оправдано установление и обратной тормозной связи - от i-модели "уверенность" к i-модели "страх". Установим также связь от i-модели "близость озера" к "уверенность", отразив тем самым потенциальную возможность роста уверенности в выполнении приказа по мере приближения к цели, и связь от i-модели "приказ" к i-модели "подойти", поскольку в рамках нашего, уже ограниченного, сюжета модели именно в выполнении действия "подойти" к озеру заключается смысл приказа. Влияние "уверенности" на процесс выполнения задания отразим связью от i-модели "уверенность" к i-модели "подойти".
На этом закончим формирование структуры автомата, предположив, что в таком виде она должна обеспечивать выполнение функции ф. Структура автомата показана на рис.1. Естественно, у читателя могут возникнуть вопросы относительно правомерности и обоснованности выбора именно этой структуры. Кроме тех оправданий и объяснений, которые мы уже приводили, можно еще добавить, что набор i-моделей и, особенно, связи между ними - это наши "микрогипотезы" относительно структуры моделируемой деятельности. Эксперимент с действующей моделью покажет их правомерность. Не нужно забывать также, что модель строится для получения именно функции ф и возможные психологические несоответствия или отсутствие веских обоснований не должны нас смущать, ибо девиз искусственного разума - "важнее всего результат".
Рис.1. М-сеть автомата "Спиди".
Следующий этап построения М-автомата - определение проходимостей связей и вида характеристик i-моделей. К сожалению, этот этап находится пока на уровне, если можно так выразиться, искусства, ибо ничего более веского и убедительного, чем правдоподобные рассуждения, здесь предложить нельзя. Мы говорим - пока, потому что надеемся, что со временем будет найден более конструктивный способ задания организации М-автоматов, хотя бы в виде четко сформулированных эмпирических правил.
Начнем с определения вида характеристик i-моделей. Напомним, что для каждой i-модели нужно задать характеристики возбуждения, торможения и затухания и, кроме того, порог возбуждения.
В принципе, для различных i-моделей характеристики могут иметь разный вид, например: для характеристики возбуждения может быть принят логарифмический, линейный или любой другой вид. В больших М-сетях i-модели можно разделять на группы, задавая каждой свой вид характеристик или свои параметры характеристик при одинаковом их виде. Выделение таких групп позволяет более полно отразить специфику входящих в сеть i-моделей. Возможности для воспроизведения М-сетью сложных и разнообразных функций, вытекающие из раздельного задания вида и параметров характеристик отдельных i-моделей, весьма велики, поскольку существенно увеличивается "гибкость" модели в целом.
В нашем примере М-сеть невелика и можно ограничиться одинаковым видом характеристик для всех i-моделей сети. Прежде всего рассмотрим происходящий в i-модели процесс трансформации усиливающих входных сигналов в выходной. Рис.2 демонстрирует общий вид зависимости возбужденности П на выходе i-модели от усиливающих входных возбуждений E.a (характеристика возбуждения). Если вернуться к аналогии между i-моделыо и нейронным ансамблем, то такой вид зависимости представляется достаточно естественным. Действительно, при малых входных воздействиях ансамбль не возбуждается, а затем возбужденность на выходе увеличивается пропорционально величине входного воздействия. При достаточно больших входных воздействиях возбужденность на выходе должна изменяться мало, поскольку клетки ансамбля не могут импульсировать с большей, чем это следует из их физиологии, частотой и, кроме того, количество клеток в ансамбле конечно. Поэтому близкий к логарифмическому вид характеристики возбуждения представляется вполне приемлемым. Запишем его следующим образом:
П[t+1] = K.н ln(Et.a - O), (4.15)
где K.н - коэффициент, определяющий крутизну характеристики, или, иначе, возбудимость i-модели.
Рис.2. Характеристика возбуждения i-моделей.
Определение возбужденности i-модели по характеристике, показанной на рис.2, возможно только в том случае, если в предыдущий момент i-модель не была возбуждена и если на вход приходят только усиливающие воздействия, Однако реально чаще всего бывает наоборот, т.е. существуют и собственное (за предыдущий момент) возбуждение, и тормозные воздействия.
Характеристика затухания определяет изменение собственного возбуждения i-модели во времени. Примем следующий вид характеристики:
П[t+1] = Пt а, (4-16)
где а - коэффициент затухания. Посмотрим, каким образом может быть определено выходное возбуждение i-модели при наличии собственного возбуждения и усиливающих входных воздействий. Пусть в момент t i-модель была возбуждена до величины П.1 Если бы входных воздействий не было, то в момент t+1 возбужденность этой i-модели составила бы П[t+'1]=П.1*а. В "пересчете на вход" это соответствует входному воздействию E.1 в момент времени t (см. рис.2). Пусть в этот же момент t на вход i-модели поступило активное воздействие Е.a. Сумма E.1 и Е.а за вычетом величины порога O и определяет возбужденность i-модели в момент t+1. Из приведенных выше рассуждений и логарифмического характера кривой возбуждения следует, что E.1=exp(П.1*а/K.н). Таким образом, при отсутствии тормозных воздействий
П[t+1] = K.н ln(Et.a + exp(Пt*а/K.н) - O). (4.17)
Теперь остается только разобраться с процессом торможения. Как было описано при изложении аппарата моделирования, логичнее всего (разумеется, по нашему мнению) отражать тормозное воздействие изменением возбудимости i-модели, т.е. коэффициента наклона ее характеристики возбуждения. Именно поэтому мы приняли следующий вид характеристики торможения:
Kt = K.н - m Et.T, (4.18 )
где E.T - тормозные входные воздействия, K.н - начальная возбудимость i-модели, m - масштабный коэффициент. На графике рис.2 это соответствует окончательному определению возбужденности рассматриваемой i-модели не по кривой K.н, а по кривой Kt. Итак, общий вид зависимости выходного возбуждения i-модели от всех входных воздействий может быть представлен следующим образом:
П[t+1] = (K.н - m Et.T) ln(Et.a + exp(Пt*а/K.н) - O). (4.19)
Коэффициент m необходим для сохранения нужного масштаба числовых величин.
Несмотря на большую обоснованность выбора логарифмического вида характеристики возбуждения, для рассматриваемого примера, с целью упрощения расчетов, выберем все же линейный вид этой зависимости. Дело в том, что автомат, моделирующий робота Спиди, мы решили полностью просчитать "вручную", чтобы читатель, интересующийся такого типа автоматами, легко мог повторить этот расчет и приобрести тем самым минимальный практический навык, необходимый при создании эвристических моделей. Это обстоятельство сыграло не последнюю роль и в других упрощениях, принятых при конструировании автомата.
Окончательно примем для всех i-моделей рассматриваемой сети характеристики затухания, торможения и возбуждения соответственно в виде:
П[t+1] = Пt*а;
Kt = K.н - m Et.T;
П[t+1] = (Et.a - O) K.н.
Величины активных и тормозных воздействий на i-модель будем подсчитывать следующим образом:
Et.a = СУММА[j=1..n] (Пt.j r.ij),
Et.T = СУММА[j=1..n] (Пt.j ~r.ij). (4.20)
где r.ij и ~r.ij - активные и тормозные связи соответственно. Общая зависимость (формула пересчета) выходного возбуждения i-модели от всех входных воздействий имеет вид
П[t+1] = (K.н - m Et.T) (Et.a + Пt.a/K.н - O). (4.21)
Зададим конкретные значения параметров введенных характеристик, прежде всего - величины внешних воздействий, т.е. возбужденности i-моделей "сферы восприятия". Чтобы не писать каждый раз наименование (содержательную интерпретацию) i-моделей, будем в дальнейшем пользоваться их номерами, приведенными на рис.1. Итак, определим возбужденности i-моделей 1-3.
Будем считать, что сила данного автомату приказа остается для него постоянной до момента достижения цели (в нашем примере - подойти к озеру). Соответственно постоянной и независимой от положения автомата относительно озера будем считать возбужденность i-модели 3. Пусть эта возбужденность будет равна 30усл.ед. Вообще говоря, цифру 30 мы взяли произвольно и в дальнейшем "силу приказа" будем изменять, чтобы продемонстрировать ее влияние на выполнение автоматом задания.
Изменение возбужденностей i-моделей 1 и 2 должно соответствовать состоянию среды и находится в прямой зависимости от положения автомата относительно озера.
На рис.3 приведены принятые числовые величины возбужденностей i-моделей при каждом конкретном положении автомата.
Рис.3. Структура среды М-автомата "Спиди".
Поскольку величины внешних воздействий и, следовательно, возбужденности i-моделей 1-3 уже известны, постараемся задать необходимые параметры так, чтобы возбужденности остальных i-моделей были того же порядка. Это необходимо для обеспечения нормального переключения СУТ с одних i-моделей на другие. Будем ориентироваться на среднюю возбужденность Пi=100усл.ед.
Примем коэффициент затухания для i-моделей 4-6 а=0.5. Тем самым мы задаем "кратковременную память" автомата, достаточную для влияния в течение двух-трех последующих моментов времени. Что же касается "рецепторных" и "эффекторных" i-моделей 1-3, 7, 8, то здесь "забывание" пришедшей от сети информации нецелесообразно. Поэтому примем для них а=1.
Перейдем теперь к определению коэффициентов возбудимости i-моделей K.н. Рассматриваемая нами сеть настолько мала, что нет причин для задания различных значений K.н для разных i-моделей. Определим порядок величины K.н. Входное воздействие по активным связям в среднем составляет в нашей сети для одной i-модели 200усл.ед. Цифра получена следующим образом. Пусть на i-модель приходит 3-5 связей. При средней возбужденности 100усл.ед. и связях r.ij=0.5 средняя величина E.a=СУММА[j=1..4]П.j*r.ij=200. Примем, что значение П.t*a/K.н примерно на порядок меньше E.a, и, следовательно, новая информация (новые воздействия) имеет большее влияние на состояние i-модели, чем память о прошлых воздействиях. Поскольку Пt.a=100*0.5=50усл.ед., величина K.н должна быть близкой к единице. Примем K.н=1.5 для i-моделей 4-8 и K.н=1 для "рецепторных" i-моделей 1-3. Пусть коэффициент пропорциональности обеспечивает превышение K.н относительно m*E.T примерно на порядок. Примем m=0.01. В нашей схеме на i-модель приходит не более одной тормозной связи, следовательно, в среднем E.T=100*0.5=50усл.ед. и m*E.T=0.5, т.е. такая величина m нас устраивает.
Отметим, что если выражение K.н-m*E.T, принимает значение K.н-m*E.T<=O, то считается, что i-модель полностью заторможена и ее возбужденность равна нулю.
Допущения типа "величина А должна быть на порядок больше величины В" носят эвристический характер и могут уточняться в процессе работы с моделью.
Итак, мы задали величины параметров a, K.н, m, и в формуле (4.21) остались не зафиксированными только пороги возбуждений i-моделей и проходимости связей между ними. Что касается порогов возбуждений, то для упрощения расчетов примем для всех i-моделей O=0. Это позволит нам более четко продемонстрировать влияние остальных параметров i-моделей на работу М-сети, поскольку возможность реализации достаточно широких функций пороговыми элементами хорошо известна. Правда, в М-сети наличие порогов возбуждений не превращает i-модели в пороговые элементы, однако по опыту работы с другими М-автоматами мы знаем, что введение порогов может существенно упростить настройку сети. Поэтому нам кажется интересным при построении "учебной" модели показать работу М-сети со значениями O=0.
...
При описании аппарата моделирования мы перечислили ряд последовательных этапов построения М-автомата. Приведем конкретный пример этого процесса.
В качестве прототипа конструируемого М-автомата рассмотрим робота Спиди - героя рассказа А.Азимова "Хоровод". Читатели, интересующиеся проблемой "искусственный разум", вероятно, хорошо знакомы с циклом рассказов А.Азимова "Я, робот" ("Мир", М., 1959), однако, на всякий случай, процитируем "Три Закона роботехники" и напомним кратко содержание рассказа "Хоровод".
"Три Закона роботехники:
1. Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинен вред.
2. Робот должен повиноваться командам, которые ему дает человек, кроме тех случаев, когда эти команды противоречат Первому Закону.
3. Робот должен заботиться о своей безопасности, поскольку это не противоречит Первому и Второму Законам.
Из "Руководства по роботехнике", 56-е издание, 2058 год".
Робот СПД-13 (Спиди) послан к селеновому озеру с приказом: принести селен. Приказ не подчеркивал важность и срочность этого задания, в то время как именно от его выполнения зависел успех экспедиции. Выделяющийся возле озера газ был опасен для робота, поскольку мог привести к нарушению его целостности. В результате, по мере приближения робота к озеру, в его "позитронном мозге" возрастал потенциал Третьего Закона роботехники, призванного не допускать нарушения целостности робота. Поскольку потенциал Второго Закона, обусловленный силой данного Спиди приказа, был невелик, возникло равновесие между стремлением выполнить приказ и стремлением избежать опасности. Это и привело к нарушениям в поведении робота:
"-...Устанавливается равновесие. Третий Закон гонит его назад, а Второй - вперед...
- Он начинает кружить около озера, оставаясь на линии, где существует это равновесие. Если мы ничего не предпримем, он так и будет бегать по этому кругу, как в хороводе..."
Только ценой включения Первого Закона, обязующего робота прежде всего заботиться о человеке, удалось вывести Спиди из "заколдованного круга". Вторично робот получил приказ "достаточной силы" и выполнил его без всяких отклонений от норм поведения.
Построим М-автомат, моделирующий поведение Спиди. Итак, моделируемая функция ф есть поведение робота: цель моделирования - выяснение причин нарушения нормы поведения.
Необходимо иметь в виду, что модель Спиди строится только для демонстрации процесса построения М-автомата. Поведение Спиди будет представлено в предельно упрощенном виде, поскольку для сложного автомата детальный анализ принципов построения весьма затруднителен. Именно поэтому мы, собственно, и рассматриваем условный призер, а не используем разработанные нами М-автоматы, описание которых приводится во второй части книги.
Будем считать, что полученный роботом приказ выполнен в тот момент, когда он подошел к озеру. Процесс возвращения робота после выполнения задания рассматривать не будем. Пусть выполнение приказа считается нормой поведения, а блуждания вокруг озера - нарушением нормы. Сведениями о функции ф будут служить описания поведения робота, приведенные в рассказе. Дополнительные исследования, естественно, мы провести не можем. Поскольку поведение робота ограничено в нашей модели только движением к озеру, можно считать, что имеющиеся в рассказе сведения достаточны для построения полного необучающегося М-автомата.
В построении моделируемой функции участвуют две программы, отражающие действие Второго и Третьего Законов роботехники: программа выполнения приказа и программа сохранения целостности робота. В качестве "внешних" объектов примем: озеро, содержащее селен (автомат должен приблизиться к нему), и газ, выделяющийся вокруг озера и угрожающий целостности автомата. Будем считать, что концентрация газа находится в прямой зависимости от близости автомата к озеру: чем больше концентрация газа, тем больше опасность для автомата. Внешним воздействием (установкой) будем считать также "силу приказа", данного автомату. Поскольку приказ был дан один раз, силу этого внешнего воздействия примем постоянной.
Выберем информационный уровень описания работы мозга робота и определим набор понятий, необходимых для описания функции. Прежде всего зафиксируем отражение в мозге робота внешних воздействий, введя i-модели "близость озера", "концентрация газа" и "приказ". Для того чтобы выполнить приказ и в то же время сохранить себя, автомат должен совершать некоторые действия. Чтобы не усложнять структуру будущего М-автомата, ограничимся двумя действиями - "подойти" и "отойти" и введем соответствующие i-модели. Тот факт, что в среде имеются опасные для целостности автомата элементы, отразим i-моделью "опасность".
"Эмоциональное" состояние робота во время выполнения приказа в самых общих чертах может быть описано следующим образом. Поскольку среда в определенной мере опасна для робота (и, соответственно, для моделирующего его автомата), эмоциональным сигналом о наличии опасности может быть чувство страха. С другой стороны, процесс выполнения полученного приказа должен сопровождаться чувством удовлетворения (сигнал полезности деятельности), а отказ от выполнения - чувством неудовлетворения. Чувство удовлетворения можно интерпретировать и по-другому, понимая его в данном случае как чувство уверенности, возрастающее по мере приближения к цели. Чувством неудовлетворения мы пока пренебрежем. Понимая, что эмоциональная сфера нашего автомата оказывается бедной, ограничимся все же введением в нее не более двух i-моделей: "чувство страха" и "чувство уверенности". На этом закончим формирование набора понятий для описания поведения робота Спиди. При желании читатель может легко расширить структуру автомата, введя новые понятия самостоятельно.
Итак, для описания выбранной функции ф мы собираемся использовать следующие понятия: близость озера, концентрация газа, опасность, страх, уверенность, подойти, отойти. Очевидно, что соответствующие i-модели должны быть в мозге автомата определенным образом взаимосвязаны. Мы говорили, что концентрация газа находится в прямой зависимости от близости озера. Однако отражать эту зависимость связью от i-модели "близость озера" к i-модели "концентрация газа" не следует, поскольку, во-первых, она реализуется вне автомата, его внешней средой, и, во-вторых, "по условиям игры" наш автомат не обучается, никогда раньше к этому озеру не подходил и, следовательно, в его мозге не могла установиться такая связь. Тот факт, что наличие газа и величина его концентрации не безразличны автомату, отразим связью, направленной от i-модели "концентрация газа" к i-модели "опасность". Естественно, что чем больше опасность, тем сильнее должно быть чувство страха и стремление автомата уйти от опасности. Установим поэтому связи от i-модели "опасность" к i-моделям "страх" и "отойти". Увеличение чувства страха, в свою очередь, пусть вызывает стремление уйти от опасности, уменьшение уверенности и стремления подойти к опасному объекту. Отразим эти взаимозависимости связями, направленными от i-модели "страх" к i-модели "отойти" и i-моделям "уверенность" и "подойти". К последним i-моделям должны быть установлены тормозные связи.
При описании аппарата моделирования мы выделяли тормозной и активный компоненты связи. Поскольку здесь мы имеем дело с необучающимся М-автоматом, а также для упрощения его алгоритма будем считать, что связь имеет только один компонент и, следовательно, может быть либо усиливающей (активной), либо тормозной. Говоря, что от одной i-модели к другой установлена связь, будем понимать, что эта связь усиливающая. Наличие тормозной связи будем каждый раз оговаривать отдельно.
Итак, чувство страха тормозит чувство уверенности. Вполне оправдано установление и обратной тормозной связи - от i-модели "уверенность" к i-модели "страх". Установим также связь от i-модели "близость озера" к "уверенность", отразив тем самым потенциальную возможность роста уверенности в выполнении приказа по мере приближения к цели, и связь от i-модели "приказ" к i-модели "подойти", поскольку в рамках нашего, уже ограниченного, сюжета модели именно в выполнении действия "подойти" к озеру заключается смысл приказа. Влияние "уверенности" на процесс выполнения задания отразим связью от i-модели "уверенность" к i-модели "подойти".
На этом закончим формирование структуры автомата, предположив, что в таком виде она должна обеспечивать выполнение функции ф. Структура автомата показана на рис.1. Естественно, у читателя могут возникнуть вопросы относительно правомерности и обоснованности выбора именно этой структуры. Кроме тех оправданий и объяснений, которые мы уже приводили, можно еще добавить, что набор i-моделей и, особенно, связи между ними - это наши "микрогипотезы" относительно структуры моделируемой деятельности. Эксперимент с действующей моделью покажет их правомерность. Не нужно забывать также, что модель строится для получения именно функции ф и возможные психологические несоответствия или отсутствие веских обоснований не должны нас смущать, ибо девиз искусственного разума - "важнее всего результат".
Рис.1. М-сеть автомата "Спиди".
Следующий этап построения М-автомата - определение проходимостей связей и вида характеристик i-моделей. К сожалению, этот этап находится пока на уровне, если можно так выразиться, искусства, ибо ничего более веского и убедительного, чем правдоподобные рассуждения, здесь предложить нельзя. Мы говорим - пока, потому что надеемся, что со временем будет найден более конструктивный способ задания организации М-автоматов, хотя бы в виде четко сформулированных эмпирических правил.
Начнем с определения вида характеристик i-моделей. Напомним, что для каждой i-модели нужно задать характеристики возбуждения, торможения и затухания и, кроме того, порог возбуждения.
В принципе, для различных i-моделей характеристики могут иметь разный вид, например: для характеристики возбуждения может быть принят логарифмический, линейный или любой другой вид. В больших М-сетях i-модели можно разделять на группы, задавая каждой свой вид характеристик или свои параметры характеристик при одинаковом их виде. Выделение таких групп позволяет более полно отразить специфику входящих в сеть i-моделей. Возможности для воспроизведения М-сетью сложных и разнообразных функций, вытекающие из раздельного задания вида и параметров характеристик отдельных i-моделей, весьма велики, поскольку существенно увеличивается "гибкость" модели в целом.
В нашем примере М-сеть невелика и можно ограничиться одинаковым видом характеристик для всех i-моделей сети. Прежде всего рассмотрим происходящий в i-модели процесс трансформации усиливающих входных сигналов в выходной. Рис.2 демонстрирует общий вид зависимости возбужденности П на выходе i-модели от усиливающих входных возбуждений E.a (характеристика возбуждения). Если вернуться к аналогии между i-моделыо и нейронным ансамблем, то такой вид зависимости представляется достаточно естественным. Действительно, при малых входных воздействиях ансамбль не возбуждается, а затем возбужденность на выходе увеличивается пропорционально величине входного воздействия. При достаточно больших входных воздействиях возбужденность на выходе должна изменяться мало, поскольку клетки ансамбля не могут импульсировать с большей, чем это следует из их физиологии, частотой и, кроме того, количество клеток в ансамбле конечно. Поэтому близкий к логарифмическому вид характеристики возбуждения представляется вполне приемлемым. Запишем его следующим образом:
П[t+1] = K.н ln(Et.a - O), (4.15)
где K.н - коэффициент, определяющий крутизну характеристики, или, иначе, возбудимость i-модели.
Рис.2. Характеристика возбуждения i-моделей.
Определение возбужденности i-модели по характеристике, показанной на рис.2, возможно только в том случае, если в предыдущий момент i-модель не была возбуждена и если на вход приходят только усиливающие воздействия, Однако реально чаще всего бывает наоборот, т.е. существуют и собственное (за предыдущий момент) возбуждение, и тормозные воздействия.
Характеристика затухания определяет изменение собственного возбуждения i-модели во времени. Примем следующий вид характеристики:
П[t+1] = Пt а, (4-16)
где а - коэффициент затухания. Посмотрим, каким образом может быть определено выходное возбуждение i-модели при наличии собственного возбуждения и усиливающих входных воздействий. Пусть в момент t i-модель была возбуждена до величины П.1 Если бы входных воздействий не было, то в момент t+1 возбужденность этой i-модели составила бы П[t+'1]=П.1*а. В "пересчете на вход" это соответствует входному воздействию E.1 в момент времени t (см. рис.2). Пусть в этот же момент t на вход i-модели поступило активное воздействие Е.a. Сумма E.1 и Е.а за вычетом величины порога O и определяет возбужденность i-модели в момент t+1. Из приведенных выше рассуждений и логарифмического характера кривой возбуждения следует, что E.1=exp(П.1*а/K.н). Таким образом, при отсутствии тормозных воздействий
П[t+1] = K.н ln(Et.a + exp(Пt*а/K.н) - O). (4.17)
Теперь остается только разобраться с процессом торможения. Как было описано при изложении аппарата моделирования, логичнее всего (разумеется, по нашему мнению) отражать тормозное воздействие изменением возбудимости i-модели, т.е. коэффициента наклона ее характеристики возбуждения. Именно поэтому мы приняли следующий вид характеристики торможения:
Kt = K.н - m Et.T, (4.18 )
где E.T - тормозные входные воздействия, K.н - начальная возбудимость i-модели, m - масштабный коэффициент. На графике рис.2 это соответствует окончательному определению возбужденности рассматриваемой i-модели не по кривой K.н, а по кривой Kt. Итак, общий вид зависимости выходного возбуждения i-модели от всех входных воздействий может быть представлен следующим образом:
П[t+1] = (K.н - m Et.T) ln(Et.a + exp(Пt*а/K.н) - O). (4.19)
Коэффициент m необходим для сохранения нужного масштаба числовых величин.
Несмотря на большую обоснованность выбора логарифмического вида характеристики возбуждения, для рассматриваемого примера, с целью упрощения расчетов, выберем все же линейный вид этой зависимости. Дело в том, что автомат, моделирующий робота Спиди, мы решили полностью просчитать "вручную", чтобы читатель, интересующийся такого типа автоматами, легко мог повторить этот расчет и приобрести тем самым минимальный практический навык, необходимый при создании эвристических моделей. Это обстоятельство сыграло не последнюю роль и в других упрощениях, принятых при конструировании автомата.
Окончательно примем для всех i-моделей рассматриваемой сети характеристики затухания, торможения и возбуждения соответственно в виде:
П[t+1] = Пt*а;
Kt = K.н - m Et.T;
П[t+1] = (Et.a - O) K.н.
Величины активных и тормозных воздействий на i-модель будем подсчитывать следующим образом:
Et.a = СУММА[j=1..n] (Пt.j r.ij),
Et.T = СУММА[j=1..n] (Пt.j ~r.ij). (4.20)
где r.ij и ~r.ij - активные и тормозные связи соответственно. Общая зависимость (формула пересчета) выходного возбуждения i-модели от всех входных воздействий имеет вид
П[t+1] = (K.н - m Et.T) (Et.a + Пt.a/K.н - O). (4.21)
Зададим конкретные значения параметров введенных характеристик, прежде всего - величины внешних воздействий, т.е. возбужденности i-моделей "сферы восприятия". Чтобы не писать каждый раз наименование (содержательную интерпретацию) i-моделей, будем в дальнейшем пользоваться их номерами, приведенными на рис.1. Итак, определим возбужденности i-моделей 1-3.
Будем считать, что сила данного автомату приказа остается для него постоянной до момента достижения цели (в нашем примере - подойти к озеру). Соответственно постоянной и независимой от положения автомата относительно озера будем считать возбужденность i-модели 3. Пусть эта возбужденность будет равна 30усл.ед. Вообще говоря, цифру 30 мы взяли произвольно и в дальнейшем "силу приказа" будем изменять, чтобы продемонстрировать ее влияние на выполнение автоматом задания.
Изменение возбужденностей i-моделей 1 и 2 должно соответствовать состоянию среды и находится в прямой зависимости от положения автомата относительно озера.
На рис.3 приведены принятые числовые величины возбужденностей i-моделей при каждом конкретном положении автомата.
Рис.3. Структура среды М-автомата "Спиди".
Поскольку величины внешних воздействий и, следовательно, возбужденности i-моделей 1-3 уже известны, постараемся задать необходимые параметры так, чтобы возбужденности остальных i-моделей были того же порядка. Это необходимо для обеспечения нормального переключения СУТ с одних i-моделей на другие. Будем ориентироваться на среднюю возбужденность Пi=100усл.ед.
Примем коэффициент затухания для i-моделей 4-6 а=0.5. Тем самым мы задаем "кратковременную память" автомата, достаточную для влияния в течение двух-трех последующих моментов времени. Что же касается "рецепторных" и "эффекторных" i-моделей 1-3, 7, 8, то здесь "забывание" пришедшей от сети информации нецелесообразно. Поэтому примем для них а=1.
Перейдем теперь к определению коэффициентов возбудимости i-моделей K.н. Рассматриваемая нами сеть настолько мала, что нет причин для задания различных значений K.н для разных i-моделей. Определим порядок величины K.н. Входное воздействие по активным связям в среднем составляет в нашей сети для одной i-модели 200усл.ед. Цифра получена следующим образом. Пусть на i-модель приходит 3-5 связей. При средней возбужденности 100усл.ед. и связях r.ij=0.5 средняя величина E.a=СУММА[j=1..4]П.j*r.ij=200. Примем, что значение П.t*a/K.н примерно на порядок меньше E.a, и, следовательно, новая информация (новые воздействия) имеет большее влияние на состояние i-модели, чем память о прошлых воздействиях. Поскольку Пt.a=100*0.5=50усл.ед., величина K.н должна быть близкой к единице. Примем K.н=1.5 для i-моделей 4-8 и K.н=1 для "рецепторных" i-моделей 1-3. Пусть коэффициент пропорциональности обеспечивает превышение K.н относительно m*E.T примерно на порядок. Примем m=0.01. В нашей схеме на i-модель приходит не более одной тормозной связи, следовательно, в среднем E.T=100*0.5=50усл.ед. и m*E.T=0.5, т.е. такая величина m нас устраивает.
Отметим, что если выражение K.н-m*E.T, принимает значение K.н-m*E.T<=O, то считается, что i-модель полностью заторможена и ее возбужденность равна нулю.
Допущения типа "величина А должна быть на порядок больше величины В" носят эвристический характер и могут уточняться в процессе работы с моделью.
Итак, мы задали величины параметров a, K.н, m, и в формуле (4.21) остались не зафиксированными только пороги возбуждений i-моделей и проходимости связей между ними. Что касается порогов возбуждений, то для упрощения расчетов примем для всех i-моделей O=0. Это позволит нам более четко продемонстрировать влияние остальных параметров i-моделей на работу М-сети, поскольку возможность реализации достаточно широких функций пороговыми элементами хорошо известна. Правда, в М-сети наличие порогов возбуждений не превращает i-модели в пороговые элементы, однако по опыту работы с другими М-автоматами мы знаем, что введение порогов может существенно упростить настройку сети. Поэтому нам кажется интересным при построении "учебной" модели показать работу М-сети со значениями O=0.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Успешность работы модели в значительной мере зависит от задания величин проходимостей связей между i-моделями. На рис.4,а показана матрица связей, принятая нами в качестве "начального" варианта. Номера столбцов соответствуют номерам i-моделей, от которых отходят связи - j, номера строк - номерам i-моделей, к которым подходят связи - i. Цифры на пересечении i-й строки и j-го столбца соответствуют проходимостям связей между i-моделями. Тормозные связи показаны со знаком тильды.
Рис.4. Проходимости связей М-сети.
Постараемся теперь пояснить, как и почему была выбрана именно эта матрица связей. Поскольку специальных экспериментов по выявлению "силы" определенных связей мы не проводим, ограничимся разделением всех связей на три группы: сильные, средние и слабые. К сильным отнесем следующие: связь от i-модели "приказ" к i-модели "подойти", связь от i-модели "близость озера" к i-модели "уверенность" и связь от i-модели "концентрация газа" к i-модели "опасность". Зададим величину проходимостей этих связей r.83=r.42=r.61=1. Связи от i-моделей 5 и 6 к i-моделям 7 и 8 соответственно отнесем к "средним" и установим r.86=r.75=0.5. Остальные связи отнесем к группе "слабых", и их проходимости зададим равными 0.3.
Установлением определенных связей, заданием параметров характеристик и величин проходимостей связей мы задаем определенный "характер" модели. Легко видеть, например, что, повысив величину связи от j-модели "опасность" к i-модели "страх", мы сделаем автомат более "пугливым". Аналогичного эффекта можно добиться, повысив коэффициент возбудимости i-модели "страх" или i-модели "опасность". Таким образом, изменяя значения параметров отдельных элементов М-сети, мы можем получить не один, а множество автоматов, по-разному ведущих себя в одной и той же среде. Среди этих автоматов мы должны получить и такой, который в общих чертах воспроизводит поведение Спиди.
Известно, что на поведение моделируемого нами робота Спиди влияла не только внешняя информация, но и сила задания Второго и Третьего Законов роботехники (предорганизация). В М-сети нашей модели Второй Закон отражен параметрами i-моделей 3, 6, 8 и величинами проходимостей связей от i-моделей 3, 5, 6 к i-модели 8. Третий Закон отражен параметрами i-моделей 4, 5, 7 и величинами проходимостей связей от i-моделей 4, 5, 6 к i-модели 7 и от i-модели 4 к i-модели 5. Как видно из матрицы связей, связи Второго и Третьего Законов заданы пока одинаковыми, хотя известно, что у Спиди Третий Закон был задан особенно сильно. Такое начальное "уравнивание" связей в М-сети сделано преднамеренно для того, чтобы исследовать общие свойства модели и проверить совместную работу всех принятых параметров. В дальнейшем, изменяя значения отдельных параметров сети, мы продемонстрируем их влияние на поведение модели.
Следующий этап построения М-автомата - задание исходного состояния сети. В принципе, мы можем задать любое распределение возбуждений на i-моделях сети, исходя из принятого ранее среднего значения возбужденности i-модели П.ср=100усл.ед. Этим мы задали бы "временную память" модели о ее прошлом опыте. Однако, поскольку такая "память" была бы очень произвольна, а в нашей модели элементов произвольности и так достаточно, пусть она "начинает жизнь" с нуля. Собственно, не совсем с нуля, поскольку постоянная память зафиксирована в связях; однако временную память, т.е. возбужденность i-моделей, примем в исходном состоянии нулевой.
Таким образом, наша модель представлена в виде М-сети. Для того чтобы она стала М-автоматом, т.е. действующей моделью, необходимо задать алгоритм функционирования М-сети и правила взаимодействия модели со средой. Основным процессом в М-сети является передача возбуждения между i-моделями. Пусть наша модель работает в дискретном времени, момент которого будем называть тактом. Совокупность операций по определению возбужденностей i-моделей сети в момент t+1 по их возбужденностям в момент t будем называть пересчетом. Зависимость (4.21) примем в качестве формулы пересчета.
Если бы мы строили обучающуюся модель, то в алгоритм функционирования М-сети необходимо было бы включить также правила установления новых связей и изменения их проходимостей. В нашем же случае матрица связей постоянна во время эксперимента с моделью, и, таким образом, нам остается только определить правила работы системы усиления-торможения на М-сети. Примем одноуровневую СУТ, работающую на всех i-моделях сети. Пусть СУТ выбирает наиболее возбужденную i-модель и увеличивает дополнительно ее возбуждение на 30усл.ед. В следующий такт времени для этой i-модели изменим коэффициент затухания (а'=а-0.3) и коэффициент возбудимости (Kt.н=K.н-0.3). Такое уменьшение а и K.н у выбранной i-модели должно происходить каждый такт до того момента, пока СУТ не выберет другую i-модель. Так, например, если i-модель А в момент t.1 имела возбужденность П=150 (а=0.8; K.н=1.5) и была выбрана СУТ, то ее параметры должны изменяться следующим образом. В момент t.1 П=180, а=0.8; K.н=1.5; в момент t.2 П=X.1 (зависит от связей А с остальной сетью), а=0.5, K.н=1.2; в момент t.2 П=X.2, а=0.2, K.н=0.9 и т.д. до тех пор, пока СУТ не выберет i-модель В. Начиная с этого момента а и K.н i-модели А принимают начальное значение а=0.8; K.н=1.5. Если в какой-то момент оказывается, что а<0 или K.н<0, то принимается а=0 и K.н=0. В том случае, если СУТ выбирает более одной i-модели (при равной их возбужденности), дополнительное возбуждение П.д=30усл.ед. распределяется на эти i-модели равномерно.
При выборе СУТ одной из i-моделей действий (7 или 8 ) автомат должен быть перемещен в среде в соответствии с этим действием. Перемещение в среде означает для него изменение возбужденностей "рецепторных" i-моделей 1 и 2 в соответствии с новым положением (см. рис.3). Среду будем представлять в виде совокупности квадратных клеток. Тогда каждый шаг будет перемещать модель в одну из соседних клеток. Поскольку у нас введено только два действия, будем считать, что действие "подойти" перемещает модель на одну клетку "вверх", а действие "отойти" - на одну клетку "вниз". При одновременном выборе СУТ обоих действий будем считать, что решение не принято и автомат остается на месте. После выполнения одного действия считаем, что возбужденность обоих действий снижается до нуля.
Итак, заданы М-сеть и алгоритм ее функционирования. Теперь наша модель представляет собой полный необучающийся М-автомат, помещенный в среду, показанную на рис.3; можно переходить к его экспериментальному исследованию. Поставим себя на место разработчиков робота СПД-13 фирмы "Ю.С.Роботс", получивших рекламацию на свою продукцию. Естественно, прежде всего нужно найти причину, вызвавшую рассогласование в работе Спиди, и попытаться ее устранить. Затем следует проверить, как будет себя вести такой "скорректированный" робот, и внести окончательные исправления в его конструкцию или в инструкции пользования.
Первая рабочая гипотеза относительно причин нарушения нормы поведения Спиди была сформулирована его испытателями "на месте аварии": робот получил приказ "малой силы"; из-за опасности окружающей среды он не мог выполнить приказ, но, в то же время, не мог от него отказаться. Эта гипотеза хорошо объясняет поведение робота, однако, как и всякая гипотеза, должна быть проверена. Необходимо выяснить, может ли в принципе эффективно функционировать робот с усиленным действием Третьего Закона, если в конструкции робота не предусмотрена возможность отказа от выполнения задания задолго до того, как выйдут из строя системы контроля адекватности. Сделаем такую проверку следующим образом. Проведем предварительное исследование автомата, моделирующего Спиди. Настроим автомат так, чтобы его поведение совпадало с поведением робота в аварийной ситуации и, изменяя "силу приказа", посмотрим, как влияет приказ на выполнение задания.
Начнем предварительное исследование автомата. На рис.5 показана блок-схема алгоритма его функционирования. Выпишем еще раз все параметры, необходимые для расчета состояния сети.
Рис.5. Блок-схема алгоритма функционирования М-автомата.
Для i-моделей 1-3 а=1, K.н=1; 4-6 - а=0.5, K.н=1.5; 7,8 - а=1, K.н=1.5.
Для всех i-моделей O=0, П.д=30усл.ед. Напомним также, что после выбора i-модели системой усиления - торможения ее параметры изменяются так: а=а-0.3; K.н=K.н-0.3.
Будем использовать матрицу связей, приведенную на рис.4,а. Обозначим ее через M.1. Результаты расчета состояний М-сети, имеющей приведенные выше значения параметров, представлены в табл.1. Стрелками отмечены моменты выполнения действий-шагов. Графически изменения возбужденностей i-моделей показаны на рис.6 (кривые построены по данным табл.1). Положение стрелок на графике соответствует значениям возбужденностей i-моделей действий и направлению выполненных автоматом шагов.
Таблица 1
Рис.6. Внутренние реакции "Спиди" с матрицей связей М.1.
Ход кривых показывает изменения внутренних реакций автомата в процессе его движения к озеру. Так, в течение первых шести тактов доминирующим было чувство уверенности. За это время автомат сделал четыре шага и оказался на таком расстоянии от озера, что возбужденности i-моделей 1 и 2 стали равными. Теперь уже автомат преимущественно "думает" об "опасности", хотя чувство "уверенности" остается достаточно сильным и "осознается" в моменты t.8 и t.10. В целом приближение к озеру оценивается как опасное, что и выражается в росте возбужденности i-модели "страх".
Рассмотрим более подробно несколько начальных тактов расчета состояний М-сети автомата.
ТАКТ 1. Возбуждена только i-модель "приказ": П.3=30. По формуле пересчета (4.21) считаем воздействие i-модели 3 на i-модель 8:
П8 = (1.5-0.01*0) (0*0.5/1.5+30-0) = 45.
Поскольку от i-модели 3 связь идет только на i-модель 8, остальные i-модели сети возбуждения не получают. Итак, в сети после пересчета П.3=30 ("приказ" имеет постоянное возбуждение) и П.8=45. СУТ выбирает i-модель 8 и выполняет шаг "подойти". Автомат перемещается на одну клетку вверх и воспринимает "озеро" с интенсивностью 20. Концентрация газа равна нулю.
ТАКТ 2. Возбуждены t-модели "близость озера": П.1=20 и "приказ": П.3=30. Напомним еще раз, что после шага возбужденность обоих действий снижается до нуля. Поэтому П.8=0. Производим пересчет по формуле (4.21). В результате получаем: П.1=20, П.3=30, П.6=30, П.8=45. СУТ выбирает i-модель, имеющую наибольшую возбужденность, т.е. опять действие "подойти", и автомат перемещается еще на одну клетку вверх. В новом положении он воспринимает "озеро" с интенсивностью 40 и "концентрацию газа" с интенсивностью 20.
ТАКТ 3. После шага и восприятия внешней информации выполняется следующее распределение возбуждений: П.1=40, П.2=20, П.3=30, П.6=30. Производим пересчет и получаем новое распределение возбуждений: П.1=40, П.2=20, П.3=30, П.4=30, П.6=75, П.8=68. СУТ выбирает i-модель 6 - "уверенность". Ее возбужденность увеличивается на П.д. Новое значение П.6=105. В предыдущих тактах увеличение возбужденности выбранного действия-шага на П.д не имело смысла, поскольку от i-моделей действий не отходит ни одна связь и после выполнения шага, т.е. перед следующим пересчетом возбужденность этих i-моделей все равно "сбрасывается".
ТАКТ 4. В предыдущем такте шаг не произведен. Поэтому возбужденность t-моцелей 1 и 2 не изменяется, и возбужденность i-модели 8 не "сбрасывается". Таким образом, до пересчета имеем следующее распределение возбуждений: П.1=40, П.2=20, П.3=30, П.4=30, П.6=105, П.8=68. После пересчета: П.1=40, П.2=20, П.3=30, П.4=45, П.5=11, П.6=73, П.8 = 190. Напомним, что при определении П.6 необходимо на этот раз уменьшить а и К.н, поскольку в предыдущем такте эта i-модель была выбрана СУТ. На четвертом такте СУТ опять выбирает действие "подойти", и, выполняя его, автомат перемещается вверх.
На этом закончим подробное рассмотрение расчета состояний сети. Из табл.1 и рис.3, иллюстрирующего движение автомата в среде, видно, что автомат доходит до озера, имея приказ П.3=30усл. ед.
Перейдем теперь к настройке автомата на воспроизведение поведения Спиди. Иначе говоря, нам нужно, чтобы при приказе П.3=30усл.ед. автомат делал несколько шагов по направлению к озеру, затем возвращался, опять шел к озеру, опять возвращался и т.д. Вспомним, что у Спиди Третий Закон был задан "особенно сильно". В нашем автомате действие этого закона отражено связями r.54, r.74, r.75, r.76. Увеличим проходимости всех этих связей на 0.2: r.54=0.5; r.74=0.5; r.76=0.7; r.76=0.1. Новая матрица связей - обозначим ее через М.2 - показана на рис.4,б. Посмотрим, как изменится поведение автомата при изменении матрицы связей. Поместим автомат опять в клетку А и проведем расчет изменений состояний сети так же, как и в предыдущем случае. График изменения возбужденностей i-моделей приведен на рис.7. На рис. 8 показана схема движения автомата. Из рисунков видно, что автомат выполнил четыре действия "подойти", затем "осознал опасность" (до этого он чувствовал себя вполне "уверенно" - СУТ выбирала i-модель 6) и пошел вниз, выполняя действие "отойти". Через семь шагов представление об опасности и страх были "забыты", и автомат опять повернул вверх - по направлению к озеру. Таким образом, начав движение из клетки А, автомат достигает клетки С, возвращается, продолжает двигаться вниз до клетки В, затем еще раз поворачивает и идет до клетки С, из нее возвращается в В и т.д. Поскольку наш автомат не обучается, такое движение может окончиться только благодаря вмешательству извне.
Рис.7. Внутренние реакции "Сииди" с матрицей связей М.2.
Рис.8. Схема движения "Спиди" при малой "силе приказа" (30усл.ед.).
Таким образом, автомат с матрицей связей М.2 (с усиленным Третьим Законом) воспроизводит поведение робота Спиди. Теперь мы можем проверить справедливость гипотезы относительно влияния "силы приказа". Увеличим приказ до 90усл.ед. и повторим эксперимент с тем же автоматом. Результат эксперимента показан на рис.9. При П.3=90 автомат сделал шесть шагов "подойти", затем восемь шагов "отойти" и опять вошел в "цикл". До озера он не дошел всего один шаг. График внутренних реакций автомата показан на рис.10.
Рис.9. Схема движения "Спиди" при большой "силе приказа" (90усл.ед.).
Рис.10. Внутренние реакции "Спиди" при движении по схеме рис.9.
Увеличим еще раз силу приказа. Пусть П.3=150. На этот раз автомат делает семь шагов вверх ("подойти") и достигает озера. Эксперимент подтвердил гипотезу относительно влияния "силы приказа" на выполнение задания. Следовательно, в конструкции робота с усиленным стремлением к самосохранению должно быть введено усовершенствование, позволяющее ему отказываться от выполнения приказа, если опасность окружающей среды превышает "силу приказа". В противном случае неизбежны ситуации типа "хоровода". Вообще говоря, при отсутствии в конструкции автомата (робота) блока, позволяющего на основе анализа состояния среды принять решение об отказе от выполнения задания, возможны два результата деятельности. Первый - гибель робота при выполнении задания в условиях, опасность которых превышает допустимые пределы. Второй - ситуация "хоровод". Тот случай, когда опасность в среде невелика, для нас сейчас не представляет интереса. Таким образом, усиленное задание Третьего закона без введения такого "аварийного блока" не имеет смысла.
Посмотрим, однако, нельзя ли ограничиться менее радикальными средствами, т.е. увеличить эффективность данного с "малой силой" приказа путем изменения параметров М-сети автомата. Матрицу связей с усиленным Вторым Законом получим путем изменения матрицы М.2. Такая матрица - М.3 - показана на рис.4,в. Теперь у автомата усилено действие и Второго и Третьего Законов. Проведем эксперименты с таким автоматом при различных "силах приказа". При силе приказа П.3=30 усл. ед. автомат сделал только четыре шага вверх и повернул назад, т.е. при этой силе приказа он ведет себя так же, как и с матрицей М.2. Дадим силу приказа П.3=90. На этот раз автомат достигает озера, сделав необходимые семь шагов. В предыдущем случае (с матрицей М.2) ему это не удалось. Таким образом, у нас получилось усиление действия приказа, "сила" которого уже превышает какое-то минимальное значение. Для "слабых" приказов усиления не произошло. Следовательно, такой способ усовершенствования нельзя признать удовлетворительным. Кроме того, усиливая действие Второго Закона таким путем, мы практически уменьшаем эффективность Третьего Закона во время выполнения роботом какого-либо задания. Наиболее приемлемым в такой ситуации выходом является ввод в конструкцию робота специального "аварийного блока". Для нашего автомата такой блок может быть реализован в виде алгоритма, анализирующего состояние М-сети и среды. Неполный (содержащий и М-сеть, и упомянутый алгоритм) М-автомат будет способен к организации более эффективного поведения.
Подводя итог проведенным экспериментам с моделью робота Спиди, можно сделать следующие выводы:
1) усиление действия Третьего Закона действительно заставляет робота уклоняться от опасных воздействий среды, однако без принятия специальных мер такой робот не может быть эффективно использован в сложных условиях;
2) усиление действия Второго Закона является менее эффективным, чем ослабление действия Третьего Закона;
3) необходимы специальные изменения конструкции робота для согласования действия Второго и Третьего Законов роботехники.
Такие выводы могли бы сделать роботехники фирмы "Ю.С.Роботс", ответственные за модель СПД-13. Мы же только выразим надежду, что, во-первых, пример, а следовательно, и принцип построения М-автомата изложен достаточно понятно и, во-вторых, исследование и использование М-автоматов в качестве вычислительных прототипов будущих роботов позволит нам хоть немного приблизиться к созданию разумных устройств типа робота Спиди.
Рис.4. Проходимости связей М-сети.
Постараемся теперь пояснить, как и почему была выбрана именно эта матрица связей. Поскольку специальных экспериментов по выявлению "силы" определенных связей мы не проводим, ограничимся разделением всех связей на три группы: сильные, средние и слабые. К сильным отнесем следующие: связь от i-модели "приказ" к i-модели "подойти", связь от i-модели "близость озера" к i-модели "уверенность" и связь от i-модели "концентрация газа" к i-модели "опасность". Зададим величину проходимостей этих связей r.83=r.42=r.61=1. Связи от i-моделей 5 и 6 к i-моделям 7 и 8 соответственно отнесем к "средним" и установим r.86=r.75=0.5. Остальные связи отнесем к группе "слабых", и их проходимости зададим равными 0.3.
Установлением определенных связей, заданием параметров характеристик и величин проходимостей связей мы задаем определенный "характер" модели. Легко видеть, например, что, повысив величину связи от j-модели "опасность" к i-модели "страх", мы сделаем автомат более "пугливым". Аналогичного эффекта можно добиться, повысив коэффициент возбудимости i-модели "страх" или i-модели "опасность". Таким образом, изменяя значения параметров отдельных элементов М-сети, мы можем получить не один, а множество автоматов, по-разному ведущих себя в одной и той же среде. Среди этих автоматов мы должны получить и такой, который в общих чертах воспроизводит поведение Спиди.
Известно, что на поведение моделируемого нами робота Спиди влияла не только внешняя информация, но и сила задания Второго и Третьего Законов роботехники (предорганизация). В М-сети нашей модели Второй Закон отражен параметрами i-моделей 3, 6, 8 и величинами проходимостей связей от i-моделей 3, 5, 6 к i-модели 8. Третий Закон отражен параметрами i-моделей 4, 5, 7 и величинами проходимостей связей от i-моделей 4, 5, 6 к i-модели 7 и от i-модели 4 к i-модели 5. Как видно из матрицы связей, связи Второго и Третьего Законов заданы пока одинаковыми, хотя известно, что у Спиди Третий Закон был задан особенно сильно. Такое начальное "уравнивание" связей в М-сети сделано преднамеренно для того, чтобы исследовать общие свойства модели и проверить совместную работу всех принятых параметров. В дальнейшем, изменяя значения отдельных параметров сети, мы продемонстрируем их влияние на поведение модели.
Следующий этап построения М-автомата - задание исходного состояния сети. В принципе, мы можем задать любое распределение возбуждений на i-моделях сети, исходя из принятого ранее среднего значения возбужденности i-модели П.ср=100усл.ед. Этим мы задали бы "временную память" модели о ее прошлом опыте. Однако, поскольку такая "память" была бы очень произвольна, а в нашей модели элементов произвольности и так достаточно, пусть она "начинает жизнь" с нуля. Собственно, не совсем с нуля, поскольку постоянная память зафиксирована в связях; однако временную память, т.е. возбужденность i-моделей, примем в исходном состоянии нулевой.
Таким образом, наша модель представлена в виде М-сети. Для того чтобы она стала М-автоматом, т.е. действующей моделью, необходимо задать алгоритм функционирования М-сети и правила взаимодействия модели со средой. Основным процессом в М-сети является передача возбуждения между i-моделями. Пусть наша модель работает в дискретном времени, момент которого будем называть тактом. Совокупность операций по определению возбужденностей i-моделей сети в момент t+1 по их возбужденностям в момент t будем называть пересчетом. Зависимость (4.21) примем в качестве формулы пересчета.
Если бы мы строили обучающуюся модель, то в алгоритм функционирования М-сети необходимо было бы включить также правила установления новых связей и изменения их проходимостей. В нашем же случае матрица связей постоянна во время эксперимента с моделью, и, таким образом, нам остается только определить правила работы системы усиления-торможения на М-сети. Примем одноуровневую СУТ, работающую на всех i-моделях сети. Пусть СУТ выбирает наиболее возбужденную i-модель и увеличивает дополнительно ее возбуждение на 30усл.ед. В следующий такт времени для этой i-модели изменим коэффициент затухания (а'=а-0.3) и коэффициент возбудимости (Kt.н=K.н-0.3). Такое уменьшение а и K.н у выбранной i-модели должно происходить каждый такт до того момента, пока СУТ не выберет другую i-модель. Так, например, если i-модель А в момент t.1 имела возбужденность П=150 (а=0.8; K.н=1.5) и была выбрана СУТ, то ее параметры должны изменяться следующим образом. В момент t.1 П=180, а=0.8; K.н=1.5; в момент t.2 П=X.1 (зависит от связей А с остальной сетью), а=0.5, K.н=1.2; в момент t.2 П=X.2, а=0.2, K.н=0.9 и т.д. до тех пор, пока СУТ не выберет i-модель В. Начиная с этого момента а и K.н i-модели А принимают начальное значение а=0.8; K.н=1.5. Если в какой-то момент оказывается, что а<0 или K.н<0, то принимается а=0 и K.н=0. В том случае, если СУТ выбирает более одной i-модели (при равной их возбужденности), дополнительное возбуждение П.д=30усл.ед. распределяется на эти i-модели равномерно.
При выборе СУТ одной из i-моделей действий (7 или 8 ) автомат должен быть перемещен в среде в соответствии с этим действием. Перемещение в среде означает для него изменение возбужденностей "рецепторных" i-моделей 1 и 2 в соответствии с новым положением (см. рис.3). Среду будем представлять в виде совокупности квадратных клеток. Тогда каждый шаг будет перемещать модель в одну из соседних клеток. Поскольку у нас введено только два действия, будем считать, что действие "подойти" перемещает модель на одну клетку "вверх", а действие "отойти" - на одну клетку "вниз". При одновременном выборе СУТ обоих действий будем считать, что решение не принято и автомат остается на месте. После выполнения одного действия считаем, что возбужденность обоих действий снижается до нуля.
Итак, заданы М-сеть и алгоритм ее функционирования. Теперь наша модель представляет собой полный необучающийся М-автомат, помещенный в среду, показанную на рис.3; можно переходить к его экспериментальному исследованию. Поставим себя на место разработчиков робота СПД-13 фирмы "Ю.С.Роботс", получивших рекламацию на свою продукцию. Естественно, прежде всего нужно найти причину, вызвавшую рассогласование в работе Спиди, и попытаться ее устранить. Затем следует проверить, как будет себя вести такой "скорректированный" робот, и внести окончательные исправления в его конструкцию или в инструкции пользования.
Первая рабочая гипотеза относительно причин нарушения нормы поведения Спиди была сформулирована его испытателями "на месте аварии": робот получил приказ "малой силы"; из-за опасности окружающей среды он не мог выполнить приказ, но, в то же время, не мог от него отказаться. Эта гипотеза хорошо объясняет поведение робота, однако, как и всякая гипотеза, должна быть проверена. Необходимо выяснить, может ли в принципе эффективно функционировать робот с усиленным действием Третьего Закона, если в конструкции робота не предусмотрена возможность отказа от выполнения задания задолго до того, как выйдут из строя системы контроля адекватности. Сделаем такую проверку следующим образом. Проведем предварительное исследование автомата, моделирующего Спиди. Настроим автомат так, чтобы его поведение совпадало с поведением робота в аварийной ситуации и, изменяя "силу приказа", посмотрим, как влияет приказ на выполнение задания.
Начнем предварительное исследование автомата. На рис.5 показана блок-схема алгоритма его функционирования. Выпишем еще раз все параметры, необходимые для расчета состояния сети.
Рис.5. Блок-схема алгоритма функционирования М-автомата.
Для i-моделей 1-3 а=1, K.н=1; 4-6 - а=0.5, K.н=1.5; 7,8 - а=1, K.н=1.5.
Для всех i-моделей O=0, П.д=30усл.ед. Напомним также, что после выбора i-модели системой усиления - торможения ее параметры изменяются так: а=а-0.3; K.н=K.н-0.3.
Будем использовать матрицу связей, приведенную на рис.4,а. Обозначим ее через M.1. Результаты расчета состояний М-сети, имеющей приведенные выше значения параметров, представлены в табл.1. Стрелками отмечены моменты выполнения действий-шагов. Графически изменения возбужденностей i-моделей показаны на рис.6 (кривые построены по данным табл.1). Положение стрелок на графике соответствует значениям возбужденностей i-моделей действий и направлению выполненных автоматом шагов.
Таблица 1
Рис.6. Внутренние реакции "Спиди" с матрицей связей М.1.
Ход кривых показывает изменения внутренних реакций автомата в процессе его движения к озеру. Так, в течение первых шести тактов доминирующим было чувство уверенности. За это время автомат сделал четыре шага и оказался на таком расстоянии от озера, что возбужденности i-моделей 1 и 2 стали равными. Теперь уже автомат преимущественно "думает" об "опасности", хотя чувство "уверенности" остается достаточно сильным и "осознается" в моменты t.8 и t.10. В целом приближение к озеру оценивается как опасное, что и выражается в росте возбужденности i-модели "страх".
Рассмотрим более подробно несколько начальных тактов расчета состояний М-сети автомата.
ТАКТ 1. Возбуждена только i-модель "приказ": П.3=30. По формуле пересчета (4.21) считаем воздействие i-модели 3 на i-модель 8:
П8 = (1.5-0.01*0) (0*0.5/1.5+30-0) = 45.
Поскольку от i-модели 3 связь идет только на i-модель 8, остальные i-модели сети возбуждения не получают. Итак, в сети после пересчета П.3=30 ("приказ" имеет постоянное возбуждение) и П.8=45. СУТ выбирает i-модель 8 и выполняет шаг "подойти". Автомат перемещается на одну клетку вверх и воспринимает "озеро" с интенсивностью 20. Концентрация газа равна нулю.
ТАКТ 2. Возбуждены t-модели "близость озера": П.1=20 и "приказ": П.3=30. Напомним еще раз, что после шага возбужденность обоих действий снижается до нуля. Поэтому П.8=0. Производим пересчет по формуле (4.21). В результате получаем: П.1=20, П.3=30, П.6=30, П.8=45. СУТ выбирает i-модель, имеющую наибольшую возбужденность, т.е. опять действие "подойти", и автомат перемещается еще на одну клетку вверх. В новом положении он воспринимает "озеро" с интенсивностью 40 и "концентрацию газа" с интенсивностью 20.
ТАКТ 3. После шага и восприятия внешней информации выполняется следующее распределение возбуждений: П.1=40, П.2=20, П.3=30, П.6=30. Производим пересчет и получаем новое распределение возбуждений: П.1=40, П.2=20, П.3=30, П.4=30, П.6=75, П.8=68. СУТ выбирает i-модель 6 - "уверенность". Ее возбужденность увеличивается на П.д. Новое значение П.6=105. В предыдущих тактах увеличение возбужденности выбранного действия-шага на П.д не имело смысла, поскольку от i-моделей действий не отходит ни одна связь и после выполнения шага, т.е. перед следующим пересчетом возбужденность этих i-моделей все равно "сбрасывается".
ТАКТ 4. В предыдущем такте шаг не произведен. Поэтому возбужденность t-моцелей 1 и 2 не изменяется, и возбужденность i-модели 8 не "сбрасывается". Таким образом, до пересчета имеем следующее распределение возбуждений: П.1=40, П.2=20, П.3=30, П.4=30, П.6=105, П.8=68. После пересчета: П.1=40, П.2=20, П.3=30, П.4=45, П.5=11, П.6=73, П.8 = 190. Напомним, что при определении П.6 необходимо на этот раз уменьшить а и К.н, поскольку в предыдущем такте эта i-модель была выбрана СУТ. На четвертом такте СУТ опять выбирает действие "подойти", и, выполняя его, автомат перемещается вверх.
На этом закончим подробное рассмотрение расчета состояний сети. Из табл.1 и рис.3, иллюстрирующего движение автомата в среде, видно, что автомат доходит до озера, имея приказ П.3=30усл. ед.
Перейдем теперь к настройке автомата на воспроизведение поведения Спиди. Иначе говоря, нам нужно, чтобы при приказе П.3=30усл.ед. автомат делал несколько шагов по направлению к озеру, затем возвращался, опять шел к озеру, опять возвращался и т.д. Вспомним, что у Спиди Третий Закон был задан "особенно сильно". В нашем автомате действие этого закона отражено связями r.54, r.74, r.75, r.76. Увеличим проходимости всех этих связей на 0.2: r.54=0.5; r.74=0.5; r.76=0.7; r.76=0.1. Новая матрица связей - обозначим ее через М.2 - показана на рис.4,б. Посмотрим, как изменится поведение автомата при изменении матрицы связей. Поместим автомат опять в клетку А и проведем расчет изменений состояний сети так же, как и в предыдущем случае. График изменения возбужденностей i-моделей приведен на рис.7. На рис. 8 показана схема движения автомата. Из рисунков видно, что автомат выполнил четыре действия "подойти", затем "осознал опасность" (до этого он чувствовал себя вполне "уверенно" - СУТ выбирала i-модель 6) и пошел вниз, выполняя действие "отойти". Через семь шагов представление об опасности и страх были "забыты", и автомат опять повернул вверх - по направлению к озеру. Таким образом, начав движение из клетки А, автомат достигает клетки С, возвращается, продолжает двигаться вниз до клетки В, затем еще раз поворачивает и идет до клетки С, из нее возвращается в В и т.д. Поскольку наш автомат не обучается, такое движение может окончиться только благодаря вмешательству извне.
Рис.7. Внутренние реакции "Сииди" с матрицей связей М.2.
Рис.8. Схема движения "Спиди" при малой "силе приказа" (30усл.ед.).
Таким образом, автомат с матрицей связей М.2 (с усиленным Третьим Законом) воспроизводит поведение робота Спиди. Теперь мы можем проверить справедливость гипотезы относительно влияния "силы приказа". Увеличим приказ до 90усл.ед. и повторим эксперимент с тем же автоматом. Результат эксперимента показан на рис.9. При П.3=90 автомат сделал шесть шагов "подойти", затем восемь шагов "отойти" и опять вошел в "цикл". До озера он не дошел всего один шаг. График внутренних реакций автомата показан на рис.10.
Рис.9. Схема движения "Спиди" при большой "силе приказа" (90усл.ед.).
Рис.10. Внутренние реакции "Спиди" при движении по схеме рис.9.
Увеличим еще раз силу приказа. Пусть П.3=150. На этот раз автомат делает семь шагов вверх ("подойти") и достигает озера. Эксперимент подтвердил гипотезу относительно влияния "силы приказа" на выполнение задания. Следовательно, в конструкции робота с усиленным стремлением к самосохранению должно быть введено усовершенствование, позволяющее ему отказываться от выполнения приказа, если опасность окружающей среды превышает "силу приказа". В противном случае неизбежны ситуации типа "хоровода". Вообще говоря, при отсутствии в конструкции автомата (робота) блока, позволяющего на основе анализа состояния среды принять решение об отказе от выполнения задания, возможны два результата деятельности. Первый - гибель робота при выполнении задания в условиях, опасность которых превышает допустимые пределы. Второй - ситуация "хоровод". Тот случай, когда опасность в среде невелика, для нас сейчас не представляет интереса. Таким образом, усиленное задание Третьего закона без введения такого "аварийного блока" не имеет смысла.
Посмотрим, однако, нельзя ли ограничиться менее радикальными средствами, т.е. увеличить эффективность данного с "малой силой" приказа путем изменения параметров М-сети автомата. Матрицу связей с усиленным Вторым Законом получим путем изменения матрицы М.2. Такая матрица - М.3 - показана на рис.4,в. Теперь у автомата усилено действие и Второго и Третьего Законов. Проведем эксперименты с таким автоматом при различных "силах приказа". При силе приказа П.3=30 усл. ед. автомат сделал только четыре шага вверх и повернул назад, т.е. при этой силе приказа он ведет себя так же, как и с матрицей М.2. Дадим силу приказа П.3=90. На этот раз автомат достигает озера, сделав необходимые семь шагов. В предыдущем случае (с матрицей М.2) ему это не удалось. Таким образом, у нас получилось усиление действия приказа, "сила" которого уже превышает какое-то минимальное значение. Для "слабых" приказов усиления не произошло. Следовательно, такой способ усовершенствования нельзя признать удовлетворительным. Кроме того, усиливая действие Второго Закона таким путем, мы практически уменьшаем эффективность Третьего Закона во время выполнения роботом какого-либо задания. Наиболее приемлемым в такой ситуации выходом является ввод в конструкцию робота специального "аварийного блока". Для нашего автомата такой блок может быть реализован в виде алгоритма, анализирующего состояние М-сети и среды. Неполный (содержащий и М-сеть, и упомянутый алгоритм) М-автомат будет способен к организации более эффективного поведения.
Подводя итог проведенным экспериментам с моделью робота Спиди, можно сделать следующие выводы:
1) усиление действия Третьего Закона действительно заставляет робота уклоняться от опасных воздействий среды, однако без принятия специальных мер такой робот не может быть эффективно использован в сложных условиях;
2) усиление действия Второго Закона является менее эффективным, чем ослабление действия Третьего Закона;
3) необходимы специальные изменения конструкции робота для согласования действия Второго и Третьего Законов роботехники.
Такие выводы могли бы сделать роботехники фирмы "Ю.С.Роботс", ответственные за модель СПД-13. Мы же только выразим надежду, что, во-первых, пример, а следовательно, и принцип построения М-автомата изложен достаточно понятно и, во-вторых, исследование и использование М-автоматов в качестве вычислительных прототипов будущих роботов позволит нам хоть немного приблизиться к созданию разумных устройств типа робота Спиди.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#3. ПРОЦЕССЫ В М-СЕТИ И ПСИХИЧЕСКИЕ ПРОЦЕССЫ. НЕКОТОРЫЕ АНАЛОГИИ
При разработке искусственных систем, способных функционально заменить человека в сложных и неблагоприятных для него условиях, чрезвычайно важно как можно полнее использовать данные психологии - науки, в рамках которой ведутся систематические исследования законов целесообразной деятельности и мышления человека. Эффективность применения психологических данных при построении систем ИР в значительной мере определяется возможностью установления взаимных соответствий между терминами и понятиями описания искусственных систем и терминами и понятиями психологии. Важно при этом, чтобы такая взаимная интерпретируемость существовала не только между элементарными, базовыми понятиями обоих языков, но и между более сложными процессами и феноменами, порождаемыми и моделируемыми психическими процессами и феноменами. Действительно, в большинстве случаев результаты психологических исследований могут быть описаны лишь в таких терминах и понятиях, которые сами являются названиями весьма сложных процессов. Поэтому для конструктивного использования таких описаний при разработке ИР необходимо, чтобы возможность интерпретаций существовала на различных уровнях рассмотрения систем обоих типов.
Подчеркнем еще раз следующую особенность нашего обсуждения. От устанавливаемых в дальнейшем аналогий мы требуем эффективности лишь "в одну сторону": от психологии - к проблеме ИР. Благодаря этому мы можем при построении автоматов применять многочисленные качественные гипотезы и фактические данные психологии. Можно было бы ожидать, конечно, что найденные соответствия будут иметь и "обратную силу", что позволило бы рассматривать действующие модели в качестве "машинных доказательств" тех или иных психологических гипотез. К сожалению, дело таким образом не обстоит. Прежде всего это связано с тем обстоятельством, что при построении систем ИР мы используем не только психологические аналогии и обоснования, но также и чисто искусственные приемы и эвристики. Превращение моделей ИР в "психологические" модели связано с наложением на процесс моделирования ряда специальных требований и ограничений, не являющихся предметом рассмотрения в данной книге. Поэтому и обсуждаемые в дальнейшем соответствия носят в определенной мере условный характер. По отношению к внутренним задачам психологии они, однако, обладают и некоторым положительным значением, демонстрируя то интересное, на наш взгляд, обстоятельство, что предлагаемый язык моделирования может послужить основанием для разработки гибкого и конструктивного языка собственно психологических описании.
При описании М-сети как языка моделирования мы уже зафиксировали ряд интерпретаций его основных понятий. Так, i-модель сопоставлена с корковой информационной моделью, и, следовательно, каждой i-модели соответствует определенный образ пли понятие. Взаимосвязям между различными образами и понятиями в системе образов и понятий человека мы ставим в соответствие связи между i-моделями. Кроме того, мы проводим аналогию между ролью СУТ в процессах функционирования М-сети и ролью внимания в процессах переработки информации мозгом.
В настоящем разделе, основываясь на уже введенных интерпретациях, продемонстрируем возможности соотнесения различных по сложности процессов в М-сети психологическим процессам. При этом остановимся на рассмотрении только тех соответствий, которые могут облегчить понимание и интерпретацию результатов экспериментального исследования М-автоматов, описываемых в последующих разделах книги.
СОЗНАНИЕ И ПОДСОЗНАНИЕ. Законы функционирования М-сети обеспечивают ее постоянную активность: в каждый момент времени возбуждена практически вся сеть. При этом различные i-модели возбуждены по-разному, и возбужденность каждой из них изменяется во времени в зависимости от параметров ее собственных характеристик и воздействий со стороны других i-моделей. Наиболее возбужденные i-модели выделяются СУТ, и их активность временно усиливается. Остальные i-модели сети притормаживаются. Это торможение не прекращает полностью процессов передачи возбуждения между не выделенными СУТ i-моделями, а лишь снижает общий уровень их активности. В целом картина напоминает непрерывно изменяющийся рельеф, в котором горы и долины "воздействуют" друг на друга. В каждый данный момент одна вершина намного выше других и некоторые из них она усиливает. Еще какие-то усиливаются действием извне. Наиболее возбужденная вершина постепенно понижается, а остальные растут. И как только какая-то другая вершина стала выше, она усиливается еще больше и становится доминирующей, чтобы через мгновение снова начать понижаться. И так происходит постоянно.
Таким образом, можно выделить два уровня процессов переработки информации в М-сети. Один из них представлен i-моделями, выделяемыми СУТ. Активность таких i-моделей велика, и они оказывают доминирующее влияние на ход процессов в сети. Каждая из них, однако, выполняет эту роль лишь временно. Другой уровень представлен взаимодействием между приторможенными, не выделенными СУТ, i-моделями. Соотношение между этими уровнями, рассматриваемое со стороны их взаимодействия и функциональной роли в процессе переработки информации, может быть поставлено в соответствие соотношению между осознанным и неосознанным (подсознательным) компонентами мышления человека. В этом случае выделенная СУТ i-модель выступает в качестве аналога осознанной мысли; образ или понятие, соответствующее этой i-модели, характеризует содержание мысли или осознаваемый материал; процесс же последовательных переключений СУТ может быть соотнесен процессу формирования упорядоченной последовательности или "потока" осознаваемых мыслей.
Изменение активностей не выделенных СУТ i-моделей рассматривается как процесс "подсознательной" переработки информации. Существенно, что жесткая граница между "сознанием" и "подсознанием" (здесь и в дальнейшем для удобства изложения термины "сознание" и "подсознание" будем использовать вместо терминов "осознанный компонент мышления" и "неосознанный компонент мышления" соответственно) не фиксируется: "осознанным" может оказаться любой образ или понятие, а время его нахождения в "сознании" зависит от его собственной актуальности (возбужденности i-модели) в соответствующие моменты времени. В каждый момент времени "осознается" только незначительная часть имеющейся в М-сети информации, основная же ее масса перерабатывается в "подсознании".
Возбужденность находящихся в "подсознании" i-моделей постоянно изменяется в ходе функционирования М-сети. Можно выделить три группы факторов, определяющих динамику возбуждения каждой из не выделенных СУТ i-моделей. К первой из них относятся параметры собственных характеристик i-моделей. В каждый момент времени эти параметры определяют степень ее возбудимости, меру "восприимчивости" к тормозным воздействиям, способность поддерживать собственную активность при отсутствии входных воздействий. Вторая группа факторов определяет влияние на данную i-модель других, непосредственно связанных с ней, i-моделей сети. В эту группу входят возбужденности таких i-моделей, а также проходимости усиливающих и тормозных компонент подходящих к данной i-модели связей. Третью группу факторов составляют механизмы и характеристики, влияние которых изменяет режим работы М-сети в целом. Прежде всего в эту группу входит СУТ. Каждая из i-моделей сети "непосредственно" воспринимает тормозные или усиливающие воздействия от различных уровней этой специфичной системы. Кроме того, выделяемые ею в каждый момент времени i-модели по имеющимся связям передают полученное ими дополнительное возбуждение множеству i-моделей, находящихся в "подсознании".
Важным фактором, влияющим на распределение возбуждений, являются также общие оценки состояния, вырабатываемые в "чувственной" сфере М-сети (возбуждение интегральных центров "приятно" и "неприятно"). В зависимости от характера этих оценок изменяется режим работы СУТ и, соответственно, степень усиления и притормаживания всех i-моделей сети. Существенную роль играет также состояние гипотетического "тела" системы. Возбуждение специальных центров "голода", "усталости" и т.п. изменяет состояние i-моделей чувств, и эти изменения по множеству связей, отходящих от i-моделей чувственной сферы, передаются другим i-моделям сети.
В процессе функционирования М-сети каждый из упомянутых факторов изменяет значения остальных и сам изменяется под их воздействием. Пусть, например, на некоторые i-модели сети поступают усиливающие воздействия и активность этих i-моделей велика. Соответственно гипертрофируются их характеристики и повышается возбудимость. Проторяются имеющиеся между ними связи и устанавливаются новые, с другими i-моделями. Процесс возбуждения распространяется в сети. Это вызывает переключения СУТ, и дополнительная активность перераспределяется по проторенным связям. Новая картина возбуждений изменяет состояние чувственной сферы, и i-модели последней, в свою очередь, усиливаются и тормозят активность других. В то же время изменяется режим работы СУТ, увеличивается или уменьшается уровень реализуемого ею усиления и торможения. Возбудимость постоянно активных i-моделей растет, и в результате они усиленно реагируют даже на слабые входные воздействия. Образуется, так сказать, "очаг возбуждения", захватывающий внимание - усиление и самостоятельно поддерживающий свою активность. Однако исходящие от него воздействия постоянно возбуждают другие i-модели, активность которых постепенно нарастает и в какой-то момент становится достаточной для "привлечения" СУТ. Переключение СУТ вызывает торможение ранее активных i-моделей и усиление новых. Происходит перераспределение возбуждений. Становятся активными новые i-модели чувственной сферы. Заторможенные i-модели адаптируются, и возбудимость их уменьшается. В результате сформировавшийся, было, очаг возбуждения распадается и заменяется новым. Однако и он существует лишь некоторое ограниченное время и может быть разрушен как поступлением новых возбуждений извне, так и изменением состояний "тела", характера оценок функционирования и т. п. Постоянное протекание такого рода процессов в функционирующей М-сети с содержательной стороны соответствует "переживанию" М-автоматом различных эмоций, желаний и стремлений, принятию решений, их выполнению, узнаванию внешних ситуаций и т.п.
Развитие описанного процесса сопровождается постоянными переключениями СУТ и, следовательно, осознанием тех или иных фрагментов перерабатываемой информации. Ясно, что появление в какой-либо момент определенной осознанной мысли является результатом взаимодействия множества сложных информационных процессов, протекающих в подсознании.
Отсюда не следует, однако, что М-сеть является аналогом некоторого фрейдовского "id", безраздельно управляющего процессами осознания. Дело в том, что на появление определенной осознанной мысли оказывает существенное влияние "предыстория" переключений СУТ. В самом деле, усиленная СУТ i-модель обеспечивает высокую активность других i-моделей, и прежде всего тех, которые связаны с ней хорошо проторенными связями. Их возбужденность повышается в наибольшей степени, и именно они обретают возможность завладеть вниманием при первом же его переключении. Процесс осознания подчиняется, таким образом, не только массовой "игре возбуждений" в сети, но и определенной логике, обусловленной структурой связей между i-моделями. Последняя же, как уже упоминалось, отражает совокупность родовидовых, ассоциативных и других отношений между соответствующими t-моделями понятий. Кроме того, выделяемая СУТ i-модель повышает свою возбудимость за счет гипертрофии, так что в течение некоторого времени после осознания данного понятия вероятность его повторного выделения СУТ сравнительно велика. Если такие повторные выделения происходят, что случается при отсутствии отвлекающих раздражителей или в процессе целенаправленного обучения, то такая i-модель может сама превратиться в постоянный очаг возбуждения. При этом соответствующее понятие, скажем, привитое социальной средой,- "долг", "стыд" и т.п.- может активно конкурировать за внимание с понятиями и образами, поддерживаемыми чувствами или состоянием "тела". Осознание той или иной мысли является, таким образом, результатом взаимодействия обоих уровней мышления - сознательного и подсознательного. В зависимости от "тренированности" i-моделей и связей, т.е. характера зафиксированной в сети информации, один или другой компонент мышления играет доминирующую роль.
ХОД МЫШЛЕНИЯ [Сделаем оговорку относительно дальнейшего изложения. После того как те или иные из обсуждаемых интерпретаций зафиксированы, оказывается удобным обозначить заимствованными из психологии терминами и понятиями соответствующие процессы в М-сети. Их использование носит, естественно, условный характер, что и подчеркивается в тексте соответствующей расстановкой кавычек. В дальнейшем, однако, чтобы не затруднять чтения, мы будем опускать кавычки в тех случаях, когда "автоматный" характер использования психологической терминологии будет достаточно ясен из контекста]. Каждой i-модели может быть поставлено в соответствие слово (или группа слов) естественного языка, обозначающее в этом языке тот элемент психической реальности, который соотносится с данной i-моделью. Так, например, при построении М-сети в нее может быть введена i-модель, соответствующая определенному чувственному образу. Тот же образ обозначается некоторым словом в естественном языке. При построении и анализе М-сети мы будем пользоваться таким словом для обозначения содержательного значения данной i-модели (в нашем примере содержательное значение i-модели задано ее соотнесением с "определенным чувственным образом"). Можно говорить, следовательно, об i-модели чувственного ОБРАЗА, например предмета "стол", i-модели ПОНЯТИЯ "стол", i-модели СЛОВА "стол" и т. п., имея в виду, что это разные i-модели, их содержательное значение различно и обозначается разными словами.
Последовательность моделей, выделенных СУТ в процессе функционирования М-сети, может быть, таким образом, поставлена в соответствие одновременно двум последовательностям (объектов) различной природы. Одной из них является последовательность мыслей, осознаваемых субъектом в ходе его деятельности. Эту последовательность мы и назвали потоком мыслей субъекта. Соответственно последовательность выделенных СУТ i-моделей может быть названа "потоком мыслей" автомата. Другой последовательностью, соотносимой с "потоком мыслей", является последовательность слов естественного языка, определяемая содержательным значением выделяемых СУТ i-моделей. Такая последовательность слов является содержательной интерпретацией, описанием "потока мыслей" автомата.
Последовательность выделенных СУТ i-моделей в обобщенном виде характеризует ход и направление развития процессов переработки информации в М-сети, или, иначе говоря, "ход мышления" М-автомата. Действительно, феномен выделения СУТ тех или иных i-моделей тесно связан с общим ходом процесса передачи возбуждений в М-сети, является его непосредственным и наиболее доступным для наблюдения следствием. "Поток мыслей" М-автомата можно, следовательно, рассматривать в качестве приближенного содержательного описания его "хода мышления". Имея в виду указанное соответствие, в дальнейшем будем использовать термин "ход мышления" автомата наряду с термином "поток мыслей".
Анализ хода мышления автомата является одним из основных инструментов оценки качества его функционирования. При этом могут быть сконструированы как строгие, формализованные, так и неформальные процедуры оценки. В первом случае критерии качества функционирования можно формулировать в терминах, характеризующих степень соответствия хода мышления автомата его внешнему окружению и внутреннему состоянию. Во втором случае используются интуитивные критерии, и оценка формируется на основе содержательных интерпретаций хода мышления. В дальнейшем оба эти случая будут продемонстрированы на конкретных примерах.
Итак, говоря о ходе мышления автомата и анализируя его, мы будем, по существу, иметь в виду не всю совокупность протекающих в сети процессов передачи возбуждений, а лишь описание "потока мыслей" автомата. Рассмотрим некоторые свойства таких описаний.
В соответствии с семантикой выделяемых СУТ i-моделей содержание осознанных мыслей системы составляют различные компоненты информационного процесса, реализуемого сетью. Это могут быть: зрительные, слуховые, тактильные и многомодальные образы - при восприятии информации из среды и при узнавании объектов внешнего мира; образы, принадлежащие высшим этажам,- при узнавании не отдельных фрагментов, а целостных ситуаций и протяженных во времени сцен: ощущения, чувства, эмоции и желания; понятия, соответствующие различным образам и состояниям чувственной сферы; абстрактные понятия; слова, соответствующие понятиям и образам любого уровня сложности и абстракции; образы, представления и понятия о действиях - от сложных трудовых процессов до простых движений; образы из прошлого - при вспоминании; образы-модели будущего - при предвидении, планировании, воображении. Содержание осознаваемых мыслей, таким образом, полностью определяется разнообразием смысловых характеристик информационных моделей, включенных в систему. Варьируя состав и структуру М-сети, мы, следовательно, имеем возможность с той или иной степенью полноты воспроизводить в моделях феномен содержательного разнообразия потока мыслей.
Пусть какая-либо i-модель выделена СУТ и получила дополнительное возбуждение. Следствием этого является увеличение воздействий от выделенной i-модели прежде всего на те i-модели сети, которые непосредственно связаны с нею. Естественно, что мера этого воздействия тем больше, чем выше проходимость соответствующих связей. В результате активность упомянутых i-моделей увеличивается и возрастает вероятность выделения какой-либо одной из них при следующем переключении СУТ. Именно эти i-модели становятся, таким образом, непосредственными "кандидатами" на осознание. Возбужденность каждой из моделей-кандидатов определяется также множеством других воздействий на нее "из подсознания", так что в целом процесс переключения СУТ детерминируется одновременным влиянием обоих уровней переработки информации. В функционирующей М-сети возникает, таким образом, своеобразный феномен "преемственности" осознания: каждая осознанная i-модель как бы стремится переключить СУТ на одну из непосредственно и наиболее сильно связанных с ней i-моделей-кандидатов. Поскольку структура связей между i-моделями не является случайной (как уже упоминалось ранее, связи между i-моделями отражают определенные взаимосвязи между образами, понятиями и т.п.), описанный феномен внешне выступает как явление связности "потока мыслей" автомата.
В некоторых случаях, однако, связность "потока мыслей" может быть нарушена. Так, например, при поступлении в сеть новой информации СУТ может переключиться на одну из входных i-моделей, возможно, и не связанную непосредственно с i-моделью, которая была выделена в предыдущий момент. Это тем более вероятно, если новая информация является важной, т.е. соответствующие входные i-модели обладают особенно высокой возбужденностью. Еще пример. Пусть СУТ выделила некоторую i-модель, и непосредственно связанные с ней модели-кандидаты получают по связям дополнительные входные воздействия. В течение некоторого времени с момента переключения СУТ фиксирует выделенную i-модель, возбужденность последней постепенно уменьшается, а остальные i-модели растормаживаются. Получая дополнительные входные воздействия, модели-кандидаты возбуждаются, и их возбуждение передается по связям к другим i-моделям. Может случиться так, что связи от моделей-кандидатов конвергируют на какой-либо i-модели, непосредственно не связанной с моделью, выделенной СУТ. Получая дополнительное возбуждение, такая i-модель по мере растормаживания возбуждается все сильнее, так что в некоторый момент ее возбужденность может оказаться большей, чем возбужденности и первично выделенной i-модели, и моделей-кандидатов. В результате СУТ переключится именно на такую i-модель, и связность переключений будет нарушена. Аналогичный эффект может возникнуть и в том случае, если на некоторой "отдаленной" i-модели будут конвергировать связи не от всех, а лишь от некоторых моделей-кандидатов или если возбужденность такой i-модели будет активно поддерживаться от существующих в подсознании "скрытых очагов" возбуждения.
АССОЦИАЦИИ. Можно выделить два основных типа нарушений "связности мышления". Первый из них составляет такие переключения СУТ с одной i-модели на другую, непосредственно с ней не связанную, причиной которых является перераспределение активности в М-сети, обусловленное либо процессами в подсознании (сильное возбуждение какой-либо i-модели вследствие одновременного воздействия на нее множества относительно слабо возбужденных i-моделей, влияние скрытого очага возбуждения и т.п.), либо восприятием новой информации. Нарушения связности второго типа возникают в тех случаях, когда причиной переключения СУТ на "отдаленную" i-модель служит перераспределение по имеющимся связям дополнительного возбуждения от i-модели, выделенной СУТ в предыдущий момент. Нарушения второго типа назовем ассоциативными переходами. Необходимо отметить, что представление об ассоциативном переходе охватывает не только упомянутый случай нарушения "связности мышления", но и такое переключение СУТ, при котором связность не нарушается.
Связи между i-моделями в М-сети в общем случае не являются ассоциативными, т.е. не всегда отражают наши представления об ассоциативных связях между реальными психическими образованиями, которым соответствуют i-модели. С информационной точки зрения в общем случае они обозначают лишь функциональную зависимость связываемых объектов. Так, например, усиливающая связь, направленная от i-модели "образ стола" к i-модели понятия "мебель", отражает взаимную зависимость этих понятий в ходе обработки информации и указывает на то, что актуальность (прагматическая ценность) понятия "мебель" возрастает, если по каким-либо причинам актуализируется "образ стола". Или иначе: если в ходе некоторой деятельности нам приходится иметь дело с объектом "стол", то следует восстановить, подготовить к использованию имеющуюся у нас информацию и относительно "мебели" - класса объектов, к которому "стол" принадлежит.
В то же время совокупность связей обеспечивает феномен ассоциирования в функционирующей М-сети. Ассоциативная связь является, таким образом, более общим понятием, чем связь в М-сети, и может задаваться как одной, так и некоторым набором связей между i-моделями. Актуализация же ассоциативной связи, т.е. собственно ассоциация, выступает в виде переключения СУТ с одной i-модели на другую. Пример ассоциации в М-сети рассмотрен нами несколько ранее, при обсуждении одного из механизмов нарушения связности "потока мыслей" (конвергенция связей от t-моделей-кандидатов на удаленную i-модель).
Наличие в М-сети определенной конфигурации связей между i-моделями может обеспечить регулярную повторяемость тех или иных ассоциативных переходов. При желании М-сеть можно описать, построив некоторую другую, "ассоциативную", сеть, узлы которой будут соответствовать выделяемым СУТ i-моделям (в М-сети СУТ не обязательно выделяет все i-модели в процессе функционирования), а связи - ассоциативным переходам, каждый из которых может быть охарактеризован некоторой мерой вероятности возникновения соответствующей ассоциации.
Законы функционирования М-сети, вообще говоря, обеспечивают установление новых связей между i-моделями, последовательно выделяемыми СУТ (поскольку существует момент, когда возбужденность обеих велика). Эти связи, являющиеся уже собственно ассоциативными, действительно облегчают повторные переключения СУТ на те же i-модели. Если такие переключения будут происходить часто, то новые связи закрепятся. Если же повторных переключений пе произойдет, ассоциативные связи не будут зафиксированы в сети, что, однако, не исключает повторного возникновения тех же ассоциаций на основе "первичной" структуры. Следует также отметить, что не всякое ассоциативное переключение СУТ вызывает установление новой связи, поскольку в реальных М-автоматах, как правило, вводится запрет на связывание i-моделей, принадлежащих некоторым специально выделяемым сферам. Это ограничение вводится, прежде всего, из соображений удобства работы с моделями. Таким образом, в каждый данный момент в М-сети могут существовать связи как ассоциативной природы, так и "не ассоциативные".
Легко видеть, что возникающие в М-сети ассоциации могут быть естественным образом классифицированы по различным основаниям, сходным с теми, по которым классификация ассоциаций производится и в психологии. Так, по временным условиям образования они могут быть разделены на ассоциации по смежности в пространстве (СУТ одновременно выделяет две или более i-моделей, и между ними устанавливаются связи) и на ассоциации по смежности во времени (СУТ выделяет связываемые i-модели последовательно). Основанием для другой классификации может служить семантическая характеристика выделяемых СУТ i-моделей, что соответствует классификации, основанной на различии содержания психических образований, между которыми устанавливается связь.
...
При разработке искусственных систем, способных функционально заменить человека в сложных и неблагоприятных для него условиях, чрезвычайно важно как можно полнее использовать данные психологии - науки, в рамках которой ведутся систематические исследования законов целесообразной деятельности и мышления человека. Эффективность применения психологических данных при построении систем ИР в значительной мере определяется возможностью установления взаимных соответствий между терминами и понятиями описания искусственных систем и терминами и понятиями психологии. Важно при этом, чтобы такая взаимная интерпретируемость существовала не только между элементарными, базовыми понятиями обоих языков, но и между более сложными процессами и феноменами, порождаемыми и моделируемыми психическими процессами и феноменами. Действительно, в большинстве случаев результаты психологических исследований могут быть описаны лишь в таких терминах и понятиях, которые сами являются названиями весьма сложных процессов. Поэтому для конструктивного использования таких описаний при разработке ИР необходимо, чтобы возможность интерпретаций существовала на различных уровнях рассмотрения систем обоих типов.
Подчеркнем еще раз следующую особенность нашего обсуждения. От устанавливаемых в дальнейшем аналогий мы требуем эффективности лишь "в одну сторону": от психологии - к проблеме ИР. Благодаря этому мы можем при построении автоматов применять многочисленные качественные гипотезы и фактические данные психологии. Можно было бы ожидать, конечно, что найденные соответствия будут иметь и "обратную силу", что позволило бы рассматривать действующие модели в качестве "машинных доказательств" тех или иных психологических гипотез. К сожалению, дело таким образом не обстоит. Прежде всего это связано с тем обстоятельством, что при построении систем ИР мы используем не только психологические аналогии и обоснования, но также и чисто искусственные приемы и эвристики. Превращение моделей ИР в "психологические" модели связано с наложением на процесс моделирования ряда специальных требований и ограничений, не являющихся предметом рассмотрения в данной книге. Поэтому и обсуждаемые в дальнейшем соответствия носят в определенной мере условный характер. По отношению к внутренним задачам психологии они, однако, обладают и некоторым положительным значением, демонстрируя то интересное, на наш взгляд, обстоятельство, что предлагаемый язык моделирования может послужить основанием для разработки гибкого и конструктивного языка собственно психологических описании.
При описании М-сети как языка моделирования мы уже зафиксировали ряд интерпретаций его основных понятий. Так, i-модель сопоставлена с корковой информационной моделью, и, следовательно, каждой i-модели соответствует определенный образ пли понятие. Взаимосвязям между различными образами и понятиями в системе образов и понятий человека мы ставим в соответствие связи между i-моделями. Кроме того, мы проводим аналогию между ролью СУТ в процессах функционирования М-сети и ролью внимания в процессах переработки информации мозгом.
В настоящем разделе, основываясь на уже введенных интерпретациях, продемонстрируем возможности соотнесения различных по сложности процессов в М-сети психологическим процессам. При этом остановимся на рассмотрении только тех соответствий, которые могут облегчить понимание и интерпретацию результатов экспериментального исследования М-автоматов, описываемых в последующих разделах книги.
СОЗНАНИЕ И ПОДСОЗНАНИЕ. Законы функционирования М-сети обеспечивают ее постоянную активность: в каждый момент времени возбуждена практически вся сеть. При этом различные i-модели возбуждены по-разному, и возбужденность каждой из них изменяется во времени в зависимости от параметров ее собственных характеристик и воздействий со стороны других i-моделей. Наиболее возбужденные i-модели выделяются СУТ, и их активность временно усиливается. Остальные i-модели сети притормаживаются. Это торможение не прекращает полностью процессов передачи возбуждения между не выделенными СУТ i-моделями, а лишь снижает общий уровень их активности. В целом картина напоминает непрерывно изменяющийся рельеф, в котором горы и долины "воздействуют" друг на друга. В каждый данный момент одна вершина намного выше других и некоторые из них она усиливает. Еще какие-то усиливаются действием извне. Наиболее возбужденная вершина постепенно понижается, а остальные растут. И как только какая-то другая вершина стала выше, она усиливается еще больше и становится доминирующей, чтобы через мгновение снова начать понижаться. И так происходит постоянно.
Таким образом, можно выделить два уровня процессов переработки информации в М-сети. Один из них представлен i-моделями, выделяемыми СУТ. Активность таких i-моделей велика, и они оказывают доминирующее влияние на ход процессов в сети. Каждая из них, однако, выполняет эту роль лишь временно. Другой уровень представлен взаимодействием между приторможенными, не выделенными СУТ, i-моделями. Соотношение между этими уровнями, рассматриваемое со стороны их взаимодействия и функциональной роли в процессе переработки информации, может быть поставлено в соответствие соотношению между осознанным и неосознанным (подсознательным) компонентами мышления человека. В этом случае выделенная СУТ i-модель выступает в качестве аналога осознанной мысли; образ или понятие, соответствующее этой i-модели, характеризует содержание мысли или осознаваемый материал; процесс же последовательных переключений СУТ может быть соотнесен процессу формирования упорядоченной последовательности или "потока" осознаваемых мыслей.
Изменение активностей не выделенных СУТ i-моделей рассматривается как процесс "подсознательной" переработки информации. Существенно, что жесткая граница между "сознанием" и "подсознанием" (здесь и в дальнейшем для удобства изложения термины "сознание" и "подсознание" будем использовать вместо терминов "осознанный компонент мышления" и "неосознанный компонент мышления" соответственно) не фиксируется: "осознанным" может оказаться любой образ или понятие, а время его нахождения в "сознании" зависит от его собственной актуальности (возбужденности i-модели) в соответствующие моменты времени. В каждый момент времени "осознается" только незначительная часть имеющейся в М-сети информации, основная же ее масса перерабатывается в "подсознании".
Возбужденность находящихся в "подсознании" i-моделей постоянно изменяется в ходе функционирования М-сети. Можно выделить три группы факторов, определяющих динамику возбуждения каждой из не выделенных СУТ i-моделей. К первой из них относятся параметры собственных характеристик i-моделей. В каждый момент времени эти параметры определяют степень ее возбудимости, меру "восприимчивости" к тормозным воздействиям, способность поддерживать собственную активность при отсутствии входных воздействий. Вторая группа факторов определяет влияние на данную i-модель других, непосредственно связанных с ней, i-моделей сети. В эту группу входят возбужденности таких i-моделей, а также проходимости усиливающих и тормозных компонент подходящих к данной i-модели связей. Третью группу факторов составляют механизмы и характеристики, влияние которых изменяет режим работы М-сети в целом. Прежде всего в эту группу входит СУТ. Каждая из i-моделей сети "непосредственно" воспринимает тормозные или усиливающие воздействия от различных уровней этой специфичной системы. Кроме того, выделяемые ею в каждый момент времени i-модели по имеющимся связям передают полученное ими дополнительное возбуждение множеству i-моделей, находящихся в "подсознании".
Важным фактором, влияющим на распределение возбуждений, являются также общие оценки состояния, вырабатываемые в "чувственной" сфере М-сети (возбуждение интегральных центров "приятно" и "неприятно"). В зависимости от характера этих оценок изменяется режим работы СУТ и, соответственно, степень усиления и притормаживания всех i-моделей сети. Существенную роль играет также состояние гипотетического "тела" системы. Возбуждение специальных центров "голода", "усталости" и т.п. изменяет состояние i-моделей чувств, и эти изменения по множеству связей, отходящих от i-моделей чувственной сферы, передаются другим i-моделям сети.
В процессе функционирования М-сети каждый из упомянутых факторов изменяет значения остальных и сам изменяется под их воздействием. Пусть, например, на некоторые i-модели сети поступают усиливающие воздействия и активность этих i-моделей велика. Соответственно гипертрофируются их характеристики и повышается возбудимость. Проторяются имеющиеся между ними связи и устанавливаются новые, с другими i-моделями. Процесс возбуждения распространяется в сети. Это вызывает переключения СУТ, и дополнительная активность перераспределяется по проторенным связям. Новая картина возбуждений изменяет состояние чувственной сферы, и i-модели последней, в свою очередь, усиливаются и тормозят активность других. В то же время изменяется режим работы СУТ, увеличивается или уменьшается уровень реализуемого ею усиления и торможения. Возбудимость постоянно активных i-моделей растет, и в результате они усиленно реагируют даже на слабые входные воздействия. Образуется, так сказать, "очаг возбуждения", захватывающий внимание - усиление и самостоятельно поддерживающий свою активность. Однако исходящие от него воздействия постоянно возбуждают другие i-модели, активность которых постепенно нарастает и в какой-то момент становится достаточной для "привлечения" СУТ. Переключение СУТ вызывает торможение ранее активных i-моделей и усиление новых. Происходит перераспределение возбуждений. Становятся активными новые i-модели чувственной сферы. Заторможенные i-модели адаптируются, и возбудимость их уменьшается. В результате сформировавшийся, было, очаг возбуждения распадается и заменяется новым. Однако и он существует лишь некоторое ограниченное время и может быть разрушен как поступлением новых возбуждений извне, так и изменением состояний "тела", характера оценок функционирования и т. п. Постоянное протекание такого рода процессов в функционирующей М-сети с содержательной стороны соответствует "переживанию" М-автоматом различных эмоций, желаний и стремлений, принятию решений, их выполнению, узнаванию внешних ситуаций и т.п.
Развитие описанного процесса сопровождается постоянными переключениями СУТ и, следовательно, осознанием тех или иных фрагментов перерабатываемой информации. Ясно, что появление в какой-либо момент определенной осознанной мысли является результатом взаимодействия множества сложных информационных процессов, протекающих в подсознании.
Отсюда не следует, однако, что М-сеть является аналогом некоторого фрейдовского "id", безраздельно управляющего процессами осознания. Дело в том, что на появление определенной осознанной мысли оказывает существенное влияние "предыстория" переключений СУТ. В самом деле, усиленная СУТ i-модель обеспечивает высокую активность других i-моделей, и прежде всего тех, которые связаны с ней хорошо проторенными связями. Их возбужденность повышается в наибольшей степени, и именно они обретают возможность завладеть вниманием при первом же его переключении. Процесс осознания подчиняется, таким образом, не только массовой "игре возбуждений" в сети, но и определенной логике, обусловленной структурой связей между i-моделями. Последняя же, как уже упоминалось, отражает совокупность родовидовых, ассоциативных и других отношений между соответствующими t-моделями понятий. Кроме того, выделяемая СУТ i-модель повышает свою возбудимость за счет гипертрофии, так что в течение некоторого времени после осознания данного понятия вероятность его повторного выделения СУТ сравнительно велика. Если такие повторные выделения происходят, что случается при отсутствии отвлекающих раздражителей или в процессе целенаправленного обучения, то такая i-модель может сама превратиться в постоянный очаг возбуждения. При этом соответствующее понятие, скажем, привитое социальной средой,- "долг", "стыд" и т.п.- может активно конкурировать за внимание с понятиями и образами, поддерживаемыми чувствами или состоянием "тела". Осознание той или иной мысли является, таким образом, результатом взаимодействия обоих уровней мышления - сознательного и подсознательного. В зависимости от "тренированности" i-моделей и связей, т.е. характера зафиксированной в сети информации, один или другой компонент мышления играет доминирующую роль.
ХОД МЫШЛЕНИЯ [Сделаем оговорку относительно дальнейшего изложения. После того как те или иные из обсуждаемых интерпретаций зафиксированы, оказывается удобным обозначить заимствованными из психологии терминами и понятиями соответствующие процессы в М-сети. Их использование носит, естественно, условный характер, что и подчеркивается в тексте соответствующей расстановкой кавычек. В дальнейшем, однако, чтобы не затруднять чтения, мы будем опускать кавычки в тех случаях, когда "автоматный" характер использования психологической терминологии будет достаточно ясен из контекста]. Каждой i-модели может быть поставлено в соответствие слово (или группа слов) естественного языка, обозначающее в этом языке тот элемент психической реальности, который соотносится с данной i-моделью. Так, например, при построении М-сети в нее может быть введена i-модель, соответствующая определенному чувственному образу. Тот же образ обозначается некоторым словом в естественном языке. При построении и анализе М-сети мы будем пользоваться таким словом для обозначения содержательного значения данной i-модели (в нашем примере содержательное значение i-модели задано ее соотнесением с "определенным чувственным образом"). Можно говорить, следовательно, об i-модели чувственного ОБРАЗА, например предмета "стол", i-модели ПОНЯТИЯ "стол", i-модели СЛОВА "стол" и т. п., имея в виду, что это разные i-модели, их содержательное значение различно и обозначается разными словами.
Последовательность моделей, выделенных СУТ в процессе функционирования М-сети, может быть, таким образом, поставлена в соответствие одновременно двум последовательностям (объектов) различной природы. Одной из них является последовательность мыслей, осознаваемых субъектом в ходе его деятельности. Эту последовательность мы и назвали потоком мыслей субъекта. Соответственно последовательность выделенных СУТ i-моделей может быть названа "потоком мыслей" автомата. Другой последовательностью, соотносимой с "потоком мыслей", является последовательность слов естественного языка, определяемая содержательным значением выделяемых СУТ i-моделей. Такая последовательность слов является содержательной интерпретацией, описанием "потока мыслей" автомата.
Последовательность выделенных СУТ i-моделей в обобщенном виде характеризует ход и направление развития процессов переработки информации в М-сети, или, иначе говоря, "ход мышления" М-автомата. Действительно, феномен выделения СУТ тех или иных i-моделей тесно связан с общим ходом процесса передачи возбуждений в М-сети, является его непосредственным и наиболее доступным для наблюдения следствием. "Поток мыслей" М-автомата можно, следовательно, рассматривать в качестве приближенного содержательного описания его "хода мышления". Имея в виду указанное соответствие, в дальнейшем будем использовать термин "ход мышления" автомата наряду с термином "поток мыслей".
Анализ хода мышления автомата является одним из основных инструментов оценки качества его функционирования. При этом могут быть сконструированы как строгие, формализованные, так и неформальные процедуры оценки. В первом случае критерии качества функционирования можно формулировать в терминах, характеризующих степень соответствия хода мышления автомата его внешнему окружению и внутреннему состоянию. Во втором случае используются интуитивные критерии, и оценка формируется на основе содержательных интерпретаций хода мышления. В дальнейшем оба эти случая будут продемонстрированы на конкретных примерах.
Итак, говоря о ходе мышления автомата и анализируя его, мы будем, по существу, иметь в виду не всю совокупность протекающих в сети процессов передачи возбуждений, а лишь описание "потока мыслей" автомата. Рассмотрим некоторые свойства таких описаний.
В соответствии с семантикой выделяемых СУТ i-моделей содержание осознанных мыслей системы составляют различные компоненты информационного процесса, реализуемого сетью. Это могут быть: зрительные, слуховые, тактильные и многомодальные образы - при восприятии информации из среды и при узнавании объектов внешнего мира; образы, принадлежащие высшим этажам,- при узнавании не отдельных фрагментов, а целостных ситуаций и протяженных во времени сцен: ощущения, чувства, эмоции и желания; понятия, соответствующие различным образам и состояниям чувственной сферы; абстрактные понятия; слова, соответствующие понятиям и образам любого уровня сложности и абстракции; образы, представления и понятия о действиях - от сложных трудовых процессов до простых движений; образы из прошлого - при вспоминании; образы-модели будущего - при предвидении, планировании, воображении. Содержание осознаваемых мыслей, таким образом, полностью определяется разнообразием смысловых характеристик информационных моделей, включенных в систему. Варьируя состав и структуру М-сети, мы, следовательно, имеем возможность с той или иной степенью полноты воспроизводить в моделях феномен содержательного разнообразия потока мыслей.
Пусть какая-либо i-модель выделена СУТ и получила дополнительное возбуждение. Следствием этого является увеличение воздействий от выделенной i-модели прежде всего на те i-модели сети, которые непосредственно связаны с нею. Естественно, что мера этого воздействия тем больше, чем выше проходимость соответствующих связей. В результате активность упомянутых i-моделей увеличивается и возрастает вероятность выделения какой-либо одной из них при следующем переключении СУТ. Именно эти i-модели становятся, таким образом, непосредственными "кандидатами" на осознание. Возбужденность каждой из моделей-кандидатов определяется также множеством других воздействий на нее "из подсознания", так что в целом процесс переключения СУТ детерминируется одновременным влиянием обоих уровней переработки информации. В функционирующей М-сети возникает, таким образом, своеобразный феномен "преемственности" осознания: каждая осознанная i-модель как бы стремится переключить СУТ на одну из непосредственно и наиболее сильно связанных с ней i-моделей-кандидатов. Поскольку структура связей между i-моделями не является случайной (как уже упоминалось ранее, связи между i-моделями отражают определенные взаимосвязи между образами, понятиями и т.п.), описанный феномен внешне выступает как явление связности "потока мыслей" автомата.
В некоторых случаях, однако, связность "потока мыслей" может быть нарушена. Так, например, при поступлении в сеть новой информации СУТ может переключиться на одну из входных i-моделей, возможно, и не связанную непосредственно с i-моделью, которая была выделена в предыдущий момент. Это тем более вероятно, если новая информация является важной, т.е. соответствующие входные i-модели обладают особенно высокой возбужденностью. Еще пример. Пусть СУТ выделила некоторую i-модель, и непосредственно связанные с ней модели-кандидаты получают по связям дополнительные входные воздействия. В течение некоторого времени с момента переключения СУТ фиксирует выделенную i-модель, возбужденность последней постепенно уменьшается, а остальные i-модели растормаживаются. Получая дополнительные входные воздействия, модели-кандидаты возбуждаются, и их возбуждение передается по связям к другим i-моделям. Может случиться так, что связи от моделей-кандидатов конвергируют на какой-либо i-модели, непосредственно не связанной с моделью, выделенной СУТ. Получая дополнительное возбуждение, такая i-модель по мере растормаживания возбуждается все сильнее, так что в некоторый момент ее возбужденность может оказаться большей, чем возбужденности и первично выделенной i-модели, и моделей-кандидатов. В результате СУТ переключится именно на такую i-модель, и связность переключений будет нарушена. Аналогичный эффект может возникнуть и в том случае, если на некоторой "отдаленной" i-модели будут конвергировать связи не от всех, а лишь от некоторых моделей-кандидатов или если возбужденность такой i-модели будет активно поддерживаться от существующих в подсознании "скрытых очагов" возбуждения.
АССОЦИАЦИИ. Можно выделить два основных типа нарушений "связности мышления". Первый из них составляет такие переключения СУТ с одной i-модели на другую, непосредственно с ней не связанную, причиной которых является перераспределение активности в М-сети, обусловленное либо процессами в подсознании (сильное возбуждение какой-либо i-модели вследствие одновременного воздействия на нее множества относительно слабо возбужденных i-моделей, влияние скрытого очага возбуждения и т.п.), либо восприятием новой информации. Нарушения связности второго типа возникают в тех случаях, когда причиной переключения СУТ на "отдаленную" i-модель служит перераспределение по имеющимся связям дополнительного возбуждения от i-модели, выделенной СУТ в предыдущий момент. Нарушения второго типа назовем ассоциативными переходами. Необходимо отметить, что представление об ассоциативном переходе охватывает не только упомянутый случай нарушения "связности мышления", но и такое переключение СУТ, при котором связность не нарушается.
Связи между i-моделями в М-сети в общем случае не являются ассоциативными, т.е. не всегда отражают наши представления об ассоциативных связях между реальными психическими образованиями, которым соответствуют i-модели. С информационной точки зрения в общем случае они обозначают лишь функциональную зависимость связываемых объектов. Так, например, усиливающая связь, направленная от i-модели "образ стола" к i-модели понятия "мебель", отражает взаимную зависимость этих понятий в ходе обработки информации и указывает на то, что актуальность (прагматическая ценность) понятия "мебель" возрастает, если по каким-либо причинам актуализируется "образ стола". Или иначе: если в ходе некоторой деятельности нам приходится иметь дело с объектом "стол", то следует восстановить, подготовить к использованию имеющуюся у нас информацию и относительно "мебели" - класса объектов, к которому "стол" принадлежит.
В то же время совокупность связей обеспечивает феномен ассоциирования в функционирующей М-сети. Ассоциативная связь является, таким образом, более общим понятием, чем связь в М-сети, и может задаваться как одной, так и некоторым набором связей между i-моделями. Актуализация же ассоциативной связи, т.е. собственно ассоциация, выступает в виде переключения СУТ с одной i-модели на другую. Пример ассоциации в М-сети рассмотрен нами несколько ранее, при обсуждении одного из механизмов нарушения связности "потока мыслей" (конвергенция связей от t-моделей-кандидатов на удаленную i-модель).
Наличие в М-сети определенной конфигурации связей между i-моделями может обеспечить регулярную повторяемость тех или иных ассоциативных переходов. При желании М-сеть можно описать, построив некоторую другую, "ассоциативную", сеть, узлы которой будут соответствовать выделяемым СУТ i-моделям (в М-сети СУТ не обязательно выделяет все i-модели в процессе функционирования), а связи - ассоциативным переходам, каждый из которых может быть охарактеризован некоторой мерой вероятности возникновения соответствующей ассоциации.
Законы функционирования М-сети, вообще говоря, обеспечивают установление новых связей между i-моделями, последовательно выделяемыми СУТ (поскольку существует момент, когда возбужденность обеих велика). Эти связи, являющиеся уже собственно ассоциативными, действительно облегчают повторные переключения СУТ на те же i-модели. Если такие переключения будут происходить часто, то новые связи закрепятся. Если же повторных переключений пе произойдет, ассоциативные связи не будут зафиксированы в сети, что, однако, не исключает повторного возникновения тех же ассоциаций на основе "первичной" структуры. Следует также отметить, что не всякое ассоциативное переключение СУТ вызывает установление новой связи, поскольку в реальных М-автоматах, как правило, вводится запрет на связывание i-моделей, принадлежащих некоторым специально выделяемым сферам. Это ограничение вводится, прежде всего, из соображений удобства работы с моделями. Таким образом, в каждый данный момент в М-сети могут существовать связи как ассоциативной природы, так и "не ассоциативные".
Легко видеть, что возникающие в М-сети ассоциации могут быть естественным образом классифицированы по различным основаниям, сходным с теми, по которым классификация ассоциаций производится и в психологии. Так, по временным условиям образования они могут быть разделены на ассоциации по смежности в пространстве (СУТ одновременно выделяет две или более i-моделей, и между ними устанавливаются связи) и на ассоциации по смежности во времени (СУТ выделяет связываемые i-модели последовательно). Основанием для другой классификации может служить семантическая характеристика выделяемых СУТ i-моделей, что соответствует классификации, основанной на различии содержания психических образований, между которыми устанавливается связь.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
В процессе функционирования М-сети переключения СУТ реализуются как по второму, так и по первому из описанных типов. Существенно, однако, что с функциональной точки зрения различия между переключениями первого и второго типов не существует. А это означает, что в результате "перескока" между первоначально "далекими" друг от друга i-моделями, последовательно выделенными СУТ, может установиться новая связь. После ее установления создаются условия для повторных реализаций данной ассоциации, выступающей уже как процесс, протекающий по второму типу переключений. Если в сети существует, например, постоянный очаг возбуждения, "притягивающий" к себе СУТ, то в результате происходящих время от времени переключений СУТ на другие i-модели, не связанные с данным очагом и возбуждающиеся независимо от него, все новые и новые i-модели связываются с этой постоянно доминирующей системой, включаются в нее и поддерживают ее возбуждение. Такого рода процессы могут лежать в основе "навязчивых состояний", когда внешне нейтральные раздражители возвращают мысль к некоторому узкому кругу идей или представлений.
Резюмируя сказанное, отметим, что законы функционирования М-сети обеспечивают определенную связность хода мышления. Последняя выступает при этом не как некоторое постоянное свойство этого процесса, а лишь как его тенденция, которой противостоит противоположная по характеру тенденция к разрушению, забыванию связей. В ходе своего функционирования М-сеть постоянно изменяется, отображая в своей структуре, моделируя в ней не только характер внешних воздействий, но и собственные внутренние реакции на эти воздействия. Таким образом, М-сеть как бы формирует собственную "логику мышления", фиксируемую в связях и отражающую основные свойства как среды, так и самой М-сети.
РЕЖИМЫ СУТ. Посмотрим теперь, как влияют на ход мышления автомата изменения режима работы СУТ. Напомним (подробнее об этом в предыдущей работе), что значения различных параметров СУТ могут изменяться в ходе функционирования М-автомата. Так, величина добавочного возбуждения выделенной i-модели находится в определенной зависимости от величины возбужденностей i-моделей НПр ("неприятно") и Пр ("приятно"). Степень притормаживания не выделенных СУТ i-моделей всегда пропорциональна дополнительному возбуждению выделенных. Чем больше дополнительное возбуждение i-модели в момент ее выделения, тем быстрее оно затухает в последующие моменты.
Предположим, что автомат находится в среде, содержащей опасные для него объекты. В процессе восприятия внешней информации признаки опасности выделяются, возбуждаются соответствующие i-модели сети, их возбуждение передается в понятийную и чувственную сферы - начинается процесс переработки информации и поиска нужных решений. В ходе этого процесса активно возбуждаются i-модели отрицательных эмоций - автомат "переживает" страх, недовольство и т.п. Соответственно увеличивается возбужденность i-модели НПр, и режим работы СУТ изменяется. Это изменение выражается в увеличении дополнительного возбуждения выделяемых СУТ i-моделей и последующем резком снижении их возбуждения. Одновременно происходит пропорционально сильное торможение п затем быстрое растормаживание остальной сети. В результате очередное переключение СУТ осуществляется через более короткий промежуток времени, чем это происходило бы в "нейтральном" режиме. Поэтому характерной особенностью мышления автомата, находящегося в опасной ситуации, является высокий темп смены осознаваемых мыслей.
В первые моменты после осознания опасности переключения СУТ будут иметь в основном характер "перескоков". Значительное усиление выделяемых i-моделей и быстрый темп переключений СУТ создают условия для формирования очага возбуждения - устанавливаются и проторяются связи между сильно возбужденными i-моделями. Естественно, что формирование такого очага существенно зависит от состояния чувственной сферы автомата, т.е. от его "субъективной" оценки опасности и соотношения возбужденностей чувственной и логической сфер М-сети. При преимущественном возбуждении чувственной сферы переключения СУТ будут происходить в основном между i-моделями, непосредственно отражающими опасное внешнее воздействие, и моделями эмоций.
Итак, для мышления М-автомата, находящегося в опасной ситуации, характерны высокий темп переключений внимания, сокращение разнообразия осознаваемых мыслей, возникновение замкнутых кругов при осознании. В целом это близко к картине, наблюдаемой в бытовых ситуациях: в периоды сильных эмоций или напряжения круг мыслей в общем невелик, внимание все время возвращается к вопросам, послужившим причиной этого возбуждения.
Если автомат находится в нейтральной ситуации и возбуждения i-моделей отрицательных и положительных эмоций сбалансированы (это может соответствовать, например, спокойному интересу), то замкнутые круги могут не возникнуть и темп переключения СУТ будет сравнительно невелик. Последнее обстоятельство связано с тем, что уменьшается добавочная возбужденность i-моделей от СУТ и, соответственно, степень заторможенности подсознания. Колебания возбужденности выделяемых СУТ i-моделей медленны, внимание дольше задерживается на каждой мысли. Ход мышления становится более разнообразным, поскольку отсутствуют сильные внешние раздражители, формирующие или поддерживающие очаги возбуждения. Поскольку при этом средняя возбужденность выделяемых СУТ i-моделей оказывается небольшой, увеличивается вероятность "пробиться в сознание" для i-моделей со сравнительно небольшой активностью. Ход мышления становится более "разветвленным", увеличивается влияние на него неосознаваемых процессов.
Можно представить себе существование и таких состояний (сон, глубокий покой), когда активность СУТ минимальна и ее тормозные воздействия на i-модели сети не окапывают существенного влияния на развитие подсознательных процессов. В этом случае роль последних в процессе мышления оказывается доминирующей, и вниманием могут овладевать обычно неосознаваемые образования, активность которых в других состояниях оказывается недостаточной для привлечения внимания.
Подробное рассмотрение процессов, протекающих на уровне подсознания, может оказаться чрезвычайно полезным для уяснения механизмов формирования и выявления основных особенностей "потока мыслей" автомата. Поэтому дополнительно остановимся па некоторых особенностях подсознательных процессов.
СКРЫТЫЕ ОЧАГИ ВОЗБУЖДЕНИЯ. Основным понятием при описании процессов в подсознании является уже использовавшееся выше понятие скрытого очага возбуждения. Таким очагом может быть как отдельная i-модель, так п совокупность взаимосвязанных i-моделей. Будем вначале представлять его себе в виде одной i-модели.
Скрытый очаг возбуждения характеризуется тем, что представляющая его i-модель постоянно возбуждена до определенной степени, однако ее возбужденность, как правило, недостаточна для привлечения внимания.
Функциональная роль скрытого очага возбуждения заключается в том, что, не будучи осознаваем, он активно влияет на процесс перераспределения возбуждений в сети. По имеющимся связям постоянно возбужденная i-модель оказывает воздействие на другие i-модели сети, увеличивая вероятность их выделения СУТ. Происходит как бы сублимация активности такой i-модели в дополнительную активность других. М-сеть может одновременно содержать несколько скрытых очагов возбуждения, тогда их совокупное влияние на процесс осознания явится существенным фактором формирования "потока мыслей" - наряду с другими факторами, не связанными непосредственно с подсознательными процессами.
МЕХАНИЗМ ОБРАЗОВАНИЯ ОЧАГОВ ВОЗБУЖДЕНИЯ. В самых общих чертах механизм образования скрытых очагов возбуждения состоит в следующем. На каждую i-модель функционирующей М-сети постоянно воздействует целый ряд факторов, часть которых обусловливает возрастание, а часть - убывание ее активности. Под влиянием активирующих факторов (усиливающие воздействия по связям, гипертрофия возбудимости, выделение СУТ) формируется тенденция к увеличению возбужденности i-модели; влияние же других факторов (тормозные воздействия по связям, адаптация возбудимости, собственное затухание активности, торможение от СУТ) формирует тенденцию к подавлению активности i-модели, т.е. к уменьшению ее возбужденности. В соответствии с выраженностью той или иной тенденции в данный момент изменяется и текущая активность i-моделн. В тех случаях, когда одна из тенденций выражена сильнее, чем другая, возбужденность i-модели либо весьма велика - и тогда i-модель часто выделяется СУТ, активно влияет на другие i-модели и т.п., либо она весьма мала - и тогда роль i-модели в процессе переработки информации становится второстепенной или даже практически незначимой. В общем случае относительное влияние обепх тенденций для каждой i-модели постоянно изменяется во времени, что сопровождается соответствующими изменениями возбужденностей i-моделей: каждая из них то увеличивает свою активность, "захватывая" СУТ и оказывая решающее влияние на ход мышления автомата, то "погружается в подсознание", уступая доминирующую роль другим, более актуальным в сложившейся ситуации элементам сети.
Опыт работы с М-автоматами показал, что в функционирующей М-сети для некоторых i-моделеи могут складываться такие условия возбуждения и торможения, при которых в течение длительного времени обе противоположные тенденции оказываются выраженными для той или иной i-модели или их совокупности примерно в равной степени. В случае такого динамического равновесия возбужденность соответствующих i-моделей существенно не изменяется, так что длительное время они могут оказывать значительное влияние на развитие процессов в сети. Такие модели или их совокупности мы и называем очагами возбуждения.
В зависимости от условий формирования активность того или иного очага возбуждения может быть относительно велика - и тогда СУТ часто выделяет составляющие его i-модели (i-модель). В этих случаях очаг возбуждения выступает в качестве осознаваемой образно-понятийной структуры, в течение определенного времени удерживающей внимание и, соответственно, определяющей круг "осознаваемых мыслей" автомата. В других случаях активность очага возбуждения может быть невелика. Его существование, следовательно, не будет оказывать заметного влияния на процессы в сети и при анализе последних может не учитываться. В ряде же случаев активность очага возбуждения может быть значительной, однако не превышающей активности других i-моделей. Последние, соответственно, будут постоянно "захватывать" СУТ, так что такой очаг возбуждения выступит в качестве некоторой неосознаваемой образно-понятийной структуры, играющей тем не менее значительную роль в формировании хода мышления автомата. Именно такого рода структуры мы и будем называть скрытыми очагами возбуждения.
Рассмотрим некоторые наиболее характерные случаи образования скрытых очагов возбуждения в функционирующей М-сети. Так, i-модель может превратиться в скрытый очаг возбуждения, если она является представителем некоторого постоянно напряженного стремления или сложного рефлекса, заданного автомату при его построении. Пусть мы хотим, например, чтобы конструируемый М-автомат был способен организовать поведение, направленное на самосохранение. С этой целью мы должны задать ему ряд сложных рефлексов и инстинктов и среди них - защитный. В реализации этого инстинкта у высших животных принимает участие чувство (или эмоция) страха. Соответственно, введем в структуру нашего М-автомата i-модель такого чувства (наряду с набором других i-моделей и связей, которые не являются сейчас предметом нашего рассмотрения).
Если построенный М-автомат окажется впоследствии в среде, содержащей потенциально опасные для него объекты, то i-модель чувства страха будет постоянно возбуждена. В ситуациях, содержащих непосредственную опасность, это чувство может быть осознано. В других же ситуациях оно может оставаться в подсознании, выступая в качестве скрытого очага возбуждения; i-модель чувства страха может быть связана хорошо проторенными связями с другими i-моделями, например, желания спрятаться, понятия опасности и т.п. Активность этих i-моделей будет постоянно поддерживаться возбуждением чувства страха, так что они могут сами превратиться в скрытые очаги возбуждения - каждая в своей сфере. Наличие таких очагов наложит определенный отпечаток на ход мышления и на реакции автомата, поскольку наибольшую вероятность для осознания будут иметь понятия и образы, тесно связанные с отрицательными эмоциями и "системой защиты" автомата. Можно сказать, что такой автомат будет постоянно "напряжен".
Другой механизм формирования скрытых очагов возбуждения связан с гипертрофией характеристик возбуждения часто осознаваемых i-моделей. Так, если в некоторой ситуации одна или несколько i-моделей (понятий, образов, чувств и т.п.) играют ведущую роль в процессе принятия решений, сильно возбуждены и часто осознаются, то их возбудимость со временем увеличивается и они начинают отвечать "взрывами" активности даже на незначительные входные воздействия. В других ситуациях, где роль этих i-моделей уже невелика, они сохраняют свою высокую возбудимость и, следовательно, повышенную активность, превращаясь на некоторое, быть может, значительное, время в скрытые очаги возбуждения. В рассмотренном выше примере М-автомат с гипертрофированной i-моделью чувства страха может сохранить свою "напряженность" и после перехода в благоприятную для него среду, не содержащую опасных объектов.
Скрытые очаги возбуждения могут формироваться также вследствие связывания отдельной i-модели с большим количеством других, часто возбуждаемых моделей. Таковыми зачастую оказываются i-модели чувств и эмоций. В самом деле, возбуждение чувственной сферы является непременным компонентом развития информационных процессов, направленных на принятие решений в самых разнообразных ситуациях. Соответственно, i-модели чувств и эмоций в процессе функционирования М-сети возбуждаются весьма часто, так что в любой момент времени те или иные из них достаточно активны. В некоторых ситуациях процесс возбуждения охватывает практически всю чувственную сферу; при этом многие из ее i-моделей оказываются одновременно возбужденными в значительной степени. Если в период такого "эмоционального подъема" окажется сильно возбужденной (быть может, случайно) i-модель из какой-либо другой сферы, то между ней и i-моделями чувственной сферы установится большое количество связей. Поскольку и в дальнейшем, в других ситуациях, i-модели чувственной сферы возбуждаются, часть активности такой i-модели постоянно поддерживается, и она, в свою очередь, оказывает постоянное влияние и на i-модели чувств, и на другие i-модели, непосредственно связанные с нею.
ПРОЦЕССЫ ВЫТЕСНЕНИЯ. Остановимся на рассмотрении еще одного механизма возникновения скрытых очагов возбуждения, который можно условно назвать механизмом "вытеснения". Пусть в М-сети существует некоторая i-модель А, связанная с другими таким образом, что активность ее часто бывает велика и она часто выделяется СУТ. Это означает, что соответствующие такой i-модели понятие, чувство или образ играют значительную роль в реализуемых автоматом процессах переработки информации. Ситуация такого рода может явиться следствием процессов обучения в сети или особенностей ее предорганизацни, а также совместного влияния этих факторов, проявляющегося при определенных внешних входных воздействиях на автомат.
Часто выделяемая СУТ, т.е. доминирующая, i-модель А передает дополнительное возбуждение другим, непосредственно связанным с ней i-моделям. Те, в свою очередь, перераспределяют его между собой и передают дальше, в более отдаленные от А области сети. В результате складывается определенная картина возбуждений в сети, некоторое характерное ее состояние, постоянно поддерживаемое возбуждением доминирующей i-модели. Различным состояниям М-сети соответствуют определенные действия, т.е. выходные сигналы, формируемые автоматом. Постоянное сильное возбуждение i-модели А создает, таким образом, предрасположенность, тенденцию к выполнению автоматом некоторых действий, i-модели которых могут не быть непосредственно связаны с А, но получают часть ее дополнительного возбуждения, перераспределенного и трансформированного в сети.
Если действия, "провоцируемые" возбуждением i-модели А, приводят к положительному эффекту и подкрепляются возбуждением положительных эмоций, то связи А с другими i-моделями сети усиливаются и ее доминирующее положение закрепляется. Если же эти действия оказываются неудачными и влекут за собой "наказание" со стороны среды или некоторой обучающей системы, то вследствие преимущественного возбуждения интегрального центра НПр в сети происходит переобучение связей. При этом усиливаются тормозные компоненты связей между всеми сильно возбужденными i-моделями и, прежде всего, с i-моделью А, а также устанавливаются новые связи с преимущественным тормозным компонентом. Происходит как бы "блокирование" i-моделей, активность которых приводит к "наказуемым" действиям. При этом активнее всего "блокируется" i-модель А, поскольку ее высокая возбужденность служит теперь своеобразным "обвинительным актом" против нее. В то же время возбуждение i-модели А по-прежнему поддерживается теми же факторами, которые ранее обеспечили ее доминирование. Однако наличие тормозных связей приводит к снижению уровня ее возбужденности. СУТ перестает выделять i-модель А, и она "погружается в подсознание", переходя в разряд скрытых очагов возбуждения. Другие i-модели сети, выполнявшие ранее функции перераспределения дополнительного возбуждения от А и заторможенные в меньшей степени, быстро освобождаются от "блокирования" вследствие естественного затухания связей. Что же касается А, то долговременная память сильно проторенных тормозных связей может надолго удержать ее в состоянии низкой активности. Развивающиеся при этом процессы адаптации дополнительно понизят ее возбужденность, доминирующая роль А в процессе переработки информации будет утеряна, однако, находясь в подсознании, эта i-модель будет оказывать скрытое влияние на ход мышления столь долго, сколь долго будут существовать факторы, поддерживающие ее активность. Со временем блокирующие ее связи могут ослабеть, затухнуть, и тогда весь процесс повторится снова. После каждого из повторений период блокирования будет все удлиняться по мере роста постоянных компонентов тормозных связей. В конце концов, после определенного периода обучения активность i-модели А стабилизируется на некотором постоянном уровне, отражающем интенсивность поддерживающих ее факторов, но не столь высоком, чтобы вызывать дальнейшее "блокирование".
В роли факторов, поддерживающих активность вытесняемой i-модели, могут выступать различные процессы и механизмы, в том числе и те, которые были описаны несколько выше при анализе причин возникновения скрытых очагов возбуждения. К ним относятся гипертрофия характеристик возбуждения i-модели, связь ее с большим количеством часто возбуждающихся i-моделей и т.п. В тех случаях, когда влияние этих факторов не является постоянным, для вытеснения i-модели оказывается достаточным одного-двух "наказаний". Действительно, после "наказания" условия функционирования ранее сильно возбужденной i-модели существенным образом изменяются: увеличиваются тормозные воздействия на нее по связям, уменьшается вследствие адаптации ее возбудимость, она постоянно притормаживается СУТ, из-за низкой активности перестают проторяться ее связи с другими i-моделями и т.п. Поэтому возможность снова "захватить" внимание и усилиться для однажды "заблокированной" i-модели весьма невелика. Дело обстоит иначе только в том случае, если активность вытесненной i-модели поддерживается постоянно и в достаточной степени. Именно такая i-модель может стать скрытым очагом возбуждения. Чаще всего это происходит, если i-модель является представителем инстинкта или сложного рефлекса, заданного автомату при его предорганизации, либо какой-то другой программы, сформированной в процессе самообучения автомата. Если одна из программ такого рода становится неадекватной в сложившихся внешних условиях, то ее активность, несмотря на "подавление" и "блокирование" основных i-моделей, может сохраняться в подсознании длительное время.
Интересно отметить следующее обстоятельство. Любая программа реализуется в М-сети функционированием некоторой совокупности сильно связанных между собой i-моделей. Кроме того, i-модели могут быть связаны также с другими i-моделями сети, которые условно можно называть вторичными элементами данной программы. Через вторичные i-модели осуществляется косвенное влияние программы на ход мышления автомата. Программа, например, может быть представлена лишь небольшим количеством i-моделей понятий и простых чувств. Вторичными же могут быть i-модели эмоций, желаний, действий и т.п. Работа программы может осуществляться на низком уровне активности (т.е. при малой возбужденности непосредственно реализующих ее i-моделей), что обычно и происходит, поскольку в сети одновременно функционирует большое количество программ и СУТ усиливает лишь немногие из них. В то же время активность некоторых из вторичных i-моделей может оказаться весьма высокой, так как на них могут конвергировать возбуждения не только от данной программы, по и от чувств, рецепторов и т.п. В результате складывается следующая ситуация. Если работа какой-либо определенной программы приводит к нежелательным в данной ситуации результатам, то "блокируются" в первую очередь не ее собственные, а вторичные i-модели. Сама же программа, вследствие небольшой активности своих элементов, оказывается при этом незатронутой. Она продолжает функционировать и поддерживает возбужденность других, "неблокированных", вторичных i-моделей. Наиболее активные из этих последних оказываются со временем вытесненными в подсознание, и влияние программы на поведение осуществляется через возбуждение остальных, может быть, весьма косвенно связанных с ее основным содержанием. Так, например, "подавление" защитной программы (осуществляемое, скажем, путем формирования в автомате тормозных систем, эквивалентных понятиям "бояться стыдно", "бежать стыдно" и т.п.) может привести к "блокированию" i-моделей действий "бежать", "скрыться" и т.п. В этом случае функционирование такой программы может быть выражено повышенной активностью i-моделей других действий, так что автомат будет проявлять повышенную тенденцию, например, к нападению. При этом функционирующая по-прежнему (на уровне собственных i-моделей) программа самосохранения будет препятствовать нападению на действительно опасные объекты, и "агрессивность" автомата окажется направленной на объекты, опасные в небольшой степени или даже нейтральные. Описанный пример является, конечно, условным. Не следует полагать, что подсознательные процессы подобного типа играют доминирующую роль в формировании поведения М-автомата. Напротив, они протекают на низком уровне активности и не могут быть актуализированы без участия сознания, ведущая роль которого в процессе "мышления" автомата уже обсуждалась ранее.
До сих пор мы условно полагали, что скрытый очаг возбуждения реализуется в М-сети одной i-моделью. Использование этого предположения позволило упростить рассуждения и рассмотрение примеров. Однако в реальных М-сетях отдельная i-модель выступает в качестве скрытого очага возбуждения весьма редко.
АНСАМБЛИ i-МОДЕЛЕЙ. Как уже упоминалось, порядок переключений СУТ в М-сети детерминируется конфигурацией и проторенностью связей между i-моделями. Обычно разветвленность связей в М-сети весьма велика. Проведенные нами эксперименты показали, что в нормально функционирующей М-сети количество связей с ненулевой проходимостью составляет в среднем 10-15 на одну i-модель. Каждая i-модель, таким образом, является центром некоторой звездообразной структуры, по лучам которой она передает дополнительную активность в тех случаях, когда ее выделяет СУТ. Если СУТ по каким-либо причинам выделяет одну и ту же i-модель несколько раз, то повышается возбудимость не только выделяемой i-моделп, но и ее непосредственных "соседей", их активность увеличивается, связи между ними проторяются и они начинают взаимно поддерживать возбуждение друг друга. В результате повышается вероятность переключения СУТ на одну из них, и, когда это происходит, описанные процессы повторяются. При этом дополнительное возбуждение перераспределяется в основном между теми i-моделями, связи между которыми уже дополнительно проторены в результате предыдущих выборов. Это приводит к тому, что и при следующем переключении СУТ его "захватывает" одна из i-моделей той же группы. В результате формируется более или менее ограниченная совокупность сильно связанных между собой i-моделей, которая может "удерживать" СУТ внутри себя длительное время. Но даже и после переключения СУТ на другие, не связанные с нею, i-модели указанная группа продолжает функционировать в подсознании, поддерживая собственную активность за счет разнообразия внутренних связей. По аналогии с нейронными ансамблями можно назвать такую группу ансамблем i-моделей.
...
Резюмируя сказанное, отметим, что законы функционирования М-сети обеспечивают определенную связность хода мышления. Последняя выступает при этом не как некоторое постоянное свойство этого процесса, а лишь как его тенденция, которой противостоит противоположная по характеру тенденция к разрушению, забыванию связей. В ходе своего функционирования М-сеть постоянно изменяется, отображая в своей структуре, моделируя в ней не только характер внешних воздействий, но и собственные внутренние реакции на эти воздействия. Таким образом, М-сеть как бы формирует собственную "логику мышления", фиксируемую в связях и отражающую основные свойства как среды, так и самой М-сети.
РЕЖИМЫ СУТ. Посмотрим теперь, как влияют на ход мышления автомата изменения режима работы СУТ. Напомним (подробнее об этом в предыдущей работе), что значения различных параметров СУТ могут изменяться в ходе функционирования М-автомата. Так, величина добавочного возбуждения выделенной i-модели находится в определенной зависимости от величины возбужденностей i-моделей НПр ("неприятно") и Пр ("приятно"). Степень притормаживания не выделенных СУТ i-моделей всегда пропорциональна дополнительному возбуждению выделенных. Чем больше дополнительное возбуждение i-модели в момент ее выделения, тем быстрее оно затухает в последующие моменты.
Предположим, что автомат находится в среде, содержащей опасные для него объекты. В процессе восприятия внешней информации признаки опасности выделяются, возбуждаются соответствующие i-модели сети, их возбуждение передается в понятийную и чувственную сферы - начинается процесс переработки информации и поиска нужных решений. В ходе этого процесса активно возбуждаются i-модели отрицательных эмоций - автомат "переживает" страх, недовольство и т.п. Соответственно увеличивается возбужденность i-модели НПр, и режим работы СУТ изменяется. Это изменение выражается в увеличении дополнительного возбуждения выделяемых СУТ i-моделей и последующем резком снижении их возбуждения. Одновременно происходит пропорционально сильное торможение п затем быстрое растормаживание остальной сети. В результате очередное переключение СУТ осуществляется через более короткий промежуток времени, чем это происходило бы в "нейтральном" режиме. Поэтому характерной особенностью мышления автомата, находящегося в опасной ситуации, является высокий темп смены осознаваемых мыслей.
В первые моменты после осознания опасности переключения СУТ будут иметь в основном характер "перескоков". Значительное усиление выделяемых i-моделей и быстрый темп переключений СУТ создают условия для формирования очага возбуждения - устанавливаются и проторяются связи между сильно возбужденными i-моделями. Естественно, что формирование такого очага существенно зависит от состояния чувственной сферы автомата, т.е. от его "субъективной" оценки опасности и соотношения возбужденностей чувственной и логической сфер М-сети. При преимущественном возбуждении чувственной сферы переключения СУТ будут происходить в основном между i-моделями, непосредственно отражающими опасное внешнее воздействие, и моделями эмоций.
Итак, для мышления М-автомата, находящегося в опасной ситуации, характерны высокий темп переключений внимания, сокращение разнообразия осознаваемых мыслей, возникновение замкнутых кругов при осознании. В целом это близко к картине, наблюдаемой в бытовых ситуациях: в периоды сильных эмоций или напряжения круг мыслей в общем невелик, внимание все время возвращается к вопросам, послужившим причиной этого возбуждения.
Если автомат находится в нейтральной ситуации и возбуждения i-моделей отрицательных и положительных эмоций сбалансированы (это может соответствовать, например, спокойному интересу), то замкнутые круги могут не возникнуть и темп переключения СУТ будет сравнительно невелик. Последнее обстоятельство связано с тем, что уменьшается добавочная возбужденность i-моделей от СУТ и, соответственно, степень заторможенности подсознания. Колебания возбужденности выделяемых СУТ i-моделей медленны, внимание дольше задерживается на каждой мысли. Ход мышления становится более разнообразным, поскольку отсутствуют сильные внешние раздражители, формирующие или поддерживающие очаги возбуждения. Поскольку при этом средняя возбужденность выделяемых СУТ i-моделей оказывается небольшой, увеличивается вероятность "пробиться в сознание" для i-моделей со сравнительно небольшой активностью. Ход мышления становится более "разветвленным", увеличивается влияние на него неосознаваемых процессов.
Можно представить себе существование и таких состояний (сон, глубокий покой), когда активность СУТ минимальна и ее тормозные воздействия на i-модели сети не окапывают существенного влияния на развитие подсознательных процессов. В этом случае роль последних в процессе мышления оказывается доминирующей, и вниманием могут овладевать обычно неосознаваемые образования, активность которых в других состояниях оказывается недостаточной для привлечения внимания.
Подробное рассмотрение процессов, протекающих на уровне подсознания, может оказаться чрезвычайно полезным для уяснения механизмов формирования и выявления основных особенностей "потока мыслей" автомата. Поэтому дополнительно остановимся па некоторых особенностях подсознательных процессов.
СКРЫТЫЕ ОЧАГИ ВОЗБУЖДЕНИЯ. Основным понятием при описании процессов в подсознании является уже использовавшееся выше понятие скрытого очага возбуждения. Таким очагом может быть как отдельная i-модель, так п совокупность взаимосвязанных i-моделей. Будем вначале представлять его себе в виде одной i-модели.
Скрытый очаг возбуждения характеризуется тем, что представляющая его i-модель постоянно возбуждена до определенной степени, однако ее возбужденность, как правило, недостаточна для привлечения внимания.
Функциональная роль скрытого очага возбуждения заключается в том, что, не будучи осознаваем, он активно влияет на процесс перераспределения возбуждений в сети. По имеющимся связям постоянно возбужденная i-модель оказывает воздействие на другие i-модели сети, увеличивая вероятность их выделения СУТ. Происходит как бы сублимация активности такой i-модели в дополнительную активность других. М-сеть может одновременно содержать несколько скрытых очагов возбуждения, тогда их совокупное влияние на процесс осознания явится существенным фактором формирования "потока мыслей" - наряду с другими факторами, не связанными непосредственно с подсознательными процессами.
МЕХАНИЗМ ОБРАЗОВАНИЯ ОЧАГОВ ВОЗБУЖДЕНИЯ. В самых общих чертах механизм образования скрытых очагов возбуждения состоит в следующем. На каждую i-модель функционирующей М-сети постоянно воздействует целый ряд факторов, часть которых обусловливает возрастание, а часть - убывание ее активности. Под влиянием активирующих факторов (усиливающие воздействия по связям, гипертрофия возбудимости, выделение СУТ) формируется тенденция к увеличению возбужденности i-модели; влияние же других факторов (тормозные воздействия по связям, адаптация возбудимости, собственное затухание активности, торможение от СУТ) формирует тенденцию к подавлению активности i-модели, т.е. к уменьшению ее возбужденности. В соответствии с выраженностью той или иной тенденции в данный момент изменяется и текущая активность i-моделн. В тех случаях, когда одна из тенденций выражена сильнее, чем другая, возбужденность i-модели либо весьма велика - и тогда i-модель часто выделяется СУТ, активно влияет на другие i-модели и т.п., либо она весьма мала - и тогда роль i-модели в процессе переработки информации становится второстепенной или даже практически незначимой. В общем случае относительное влияние обепх тенденций для каждой i-модели постоянно изменяется во времени, что сопровождается соответствующими изменениями возбужденностей i-моделей: каждая из них то увеличивает свою активность, "захватывая" СУТ и оказывая решающее влияние на ход мышления автомата, то "погружается в подсознание", уступая доминирующую роль другим, более актуальным в сложившейся ситуации элементам сети.
Опыт работы с М-автоматами показал, что в функционирующей М-сети для некоторых i-моделеи могут складываться такие условия возбуждения и торможения, при которых в течение длительного времени обе противоположные тенденции оказываются выраженными для той или иной i-модели или их совокупности примерно в равной степени. В случае такого динамического равновесия возбужденность соответствующих i-моделей существенно не изменяется, так что длительное время они могут оказывать значительное влияние на развитие процессов в сети. Такие модели или их совокупности мы и называем очагами возбуждения.
В зависимости от условий формирования активность того или иного очага возбуждения может быть относительно велика - и тогда СУТ часто выделяет составляющие его i-модели (i-модель). В этих случаях очаг возбуждения выступает в качестве осознаваемой образно-понятийной структуры, в течение определенного времени удерживающей внимание и, соответственно, определяющей круг "осознаваемых мыслей" автомата. В других случаях активность очага возбуждения может быть невелика. Его существование, следовательно, не будет оказывать заметного влияния на процессы в сети и при анализе последних может не учитываться. В ряде же случаев активность очага возбуждения может быть значительной, однако не превышающей активности других i-моделей. Последние, соответственно, будут постоянно "захватывать" СУТ, так что такой очаг возбуждения выступит в качестве некоторой неосознаваемой образно-понятийной структуры, играющей тем не менее значительную роль в формировании хода мышления автомата. Именно такого рода структуры мы и будем называть скрытыми очагами возбуждения.
Рассмотрим некоторые наиболее характерные случаи образования скрытых очагов возбуждения в функционирующей М-сети. Так, i-модель может превратиться в скрытый очаг возбуждения, если она является представителем некоторого постоянно напряженного стремления или сложного рефлекса, заданного автомату при его построении. Пусть мы хотим, например, чтобы конструируемый М-автомат был способен организовать поведение, направленное на самосохранение. С этой целью мы должны задать ему ряд сложных рефлексов и инстинктов и среди них - защитный. В реализации этого инстинкта у высших животных принимает участие чувство (или эмоция) страха. Соответственно, введем в структуру нашего М-автомата i-модель такого чувства (наряду с набором других i-моделей и связей, которые не являются сейчас предметом нашего рассмотрения).
Если построенный М-автомат окажется впоследствии в среде, содержащей потенциально опасные для него объекты, то i-модель чувства страха будет постоянно возбуждена. В ситуациях, содержащих непосредственную опасность, это чувство может быть осознано. В других же ситуациях оно может оставаться в подсознании, выступая в качестве скрытого очага возбуждения; i-модель чувства страха может быть связана хорошо проторенными связями с другими i-моделями, например, желания спрятаться, понятия опасности и т.п. Активность этих i-моделей будет постоянно поддерживаться возбуждением чувства страха, так что они могут сами превратиться в скрытые очаги возбуждения - каждая в своей сфере. Наличие таких очагов наложит определенный отпечаток на ход мышления и на реакции автомата, поскольку наибольшую вероятность для осознания будут иметь понятия и образы, тесно связанные с отрицательными эмоциями и "системой защиты" автомата. Можно сказать, что такой автомат будет постоянно "напряжен".
Другой механизм формирования скрытых очагов возбуждения связан с гипертрофией характеристик возбуждения часто осознаваемых i-моделей. Так, если в некоторой ситуации одна или несколько i-моделей (понятий, образов, чувств и т.п.) играют ведущую роль в процессе принятия решений, сильно возбуждены и часто осознаются, то их возбудимость со временем увеличивается и они начинают отвечать "взрывами" активности даже на незначительные входные воздействия. В других ситуациях, где роль этих i-моделей уже невелика, они сохраняют свою высокую возбудимость и, следовательно, повышенную активность, превращаясь на некоторое, быть может, значительное, время в скрытые очаги возбуждения. В рассмотренном выше примере М-автомат с гипертрофированной i-моделью чувства страха может сохранить свою "напряженность" и после перехода в благоприятную для него среду, не содержащую опасных объектов.
Скрытые очаги возбуждения могут формироваться также вследствие связывания отдельной i-модели с большим количеством других, часто возбуждаемых моделей. Таковыми зачастую оказываются i-модели чувств и эмоций. В самом деле, возбуждение чувственной сферы является непременным компонентом развития информационных процессов, направленных на принятие решений в самых разнообразных ситуациях. Соответственно, i-модели чувств и эмоций в процессе функционирования М-сети возбуждаются весьма часто, так что в любой момент времени те или иные из них достаточно активны. В некоторых ситуациях процесс возбуждения охватывает практически всю чувственную сферу; при этом многие из ее i-моделей оказываются одновременно возбужденными в значительной степени. Если в период такого "эмоционального подъема" окажется сильно возбужденной (быть может, случайно) i-модель из какой-либо другой сферы, то между ней и i-моделями чувственной сферы установится большое количество связей. Поскольку и в дальнейшем, в других ситуациях, i-модели чувственной сферы возбуждаются, часть активности такой i-модели постоянно поддерживается, и она, в свою очередь, оказывает постоянное влияние и на i-модели чувств, и на другие i-модели, непосредственно связанные с нею.
ПРОЦЕССЫ ВЫТЕСНЕНИЯ. Остановимся на рассмотрении еще одного механизма возникновения скрытых очагов возбуждения, который можно условно назвать механизмом "вытеснения". Пусть в М-сети существует некоторая i-модель А, связанная с другими таким образом, что активность ее часто бывает велика и она часто выделяется СУТ. Это означает, что соответствующие такой i-модели понятие, чувство или образ играют значительную роль в реализуемых автоматом процессах переработки информации. Ситуация такого рода может явиться следствием процессов обучения в сети или особенностей ее предорганизацни, а также совместного влияния этих факторов, проявляющегося при определенных внешних входных воздействиях на автомат.
Часто выделяемая СУТ, т.е. доминирующая, i-модель А передает дополнительное возбуждение другим, непосредственно связанным с ней i-моделям. Те, в свою очередь, перераспределяют его между собой и передают дальше, в более отдаленные от А области сети. В результате складывается определенная картина возбуждений в сети, некоторое характерное ее состояние, постоянно поддерживаемое возбуждением доминирующей i-модели. Различным состояниям М-сети соответствуют определенные действия, т.е. выходные сигналы, формируемые автоматом. Постоянное сильное возбуждение i-модели А создает, таким образом, предрасположенность, тенденцию к выполнению автоматом некоторых действий, i-модели которых могут не быть непосредственно связаны с А, но получают часть ее дополнительного возбуждения, перераспределенного и трансформированного в сети.
Если действия, "провоцируемые" возбуждением i-модели А, приводят к положительному эффекту и подкрепляются возбуждением положительных эмоций, то связи А с другими i-моделями сети усиливаются и ее доминирующее положение закрепляется. Если же эти действия оказываются неудачными и влекут за собой "наказание" со стороны среды или некоторой обучающей системы, то вследствие преимущественного возбуждения интегрального центра НПр в сети происходит переобучение связей. При этом усиливаются тормозные компоненты связей между всеми сильно возбужденными i-моделями и, прежде всего, с i-моделью А, а также устанавливаются новые связи с преимущественным тормозным компонентом. Происходит как бы "блокирование" i-моделей, активность которых приводит к "наказуемым" действиям. При этом активнее всего "блокируется" i-модель А, поскольку ее высокая возбужденность служит теперь своеобразным "обвинительным актом" против нее. В то же время возбуждение i-модели А по-прежнему поддерживается теми же факторами, которые ранее обеспечили ее доминирование. Однако наличие тормозных связей приводит к снижению уровня ее возбужденности. СУТ перестает выделять i-модель А, и она "погружается в подсознание", переходя в разряд скрытых очагов возбуждения. Другие i-модели сети, выполнявшие ранее функции перераспределения дополнительного возбуждения от А и заторможенные в меньшей степени, быстро освобождаются от "блокирования" вследствие естественного затухания связей. Что же касается А, то долговременная память сильно проторенных тормозных связей может надолго удержать ее в состоянии низкой активности. Развивающиеся при этом процессы адаптации дополнительно понизят ее возбужденность, доминирующая роль А в процессе переработки информации будет утеряна, однако, находясь в подсознании, эта i-модель будет оказывать скрытое влияние на ход мышления столь долго, сколь долго будут существовать факторы, поддерживающие ее активность. Со временем блокирующие ее связи могут ослабеть, затухнуть, и тогда весь процесс повторится снова. После каждого из повторений период блокирования будет все удлиняться по мере роста постоянных компонентов тормозных связей. В конце концов, после определенного периода обучения активность i-модели А стабилизируется на некотором постоянном уровне, отражающем интенсивность поддерживающих ее факторов, но не столь высоком, чтобы вызывать дальнейшее "блокирование".
В роли факторов, поддерживающих активность вытесняемой i-модели, могут выступать различные процессы и механизмы, в том числе и те, которые были описаны несколько выше при анализе причин возникновения скрытых очагов возбуждения. К ним относятся гипертрофия характеристик возбуждения i-модели, связь ее с большим количеством часто возбуждающихся i-моделей и т.п. В тех случаях, когда влияние этих факторов не является постоянным, для вытеснения i-модели оказывается достаточным одного-двух "наказаний". Действительно, после "наказания" условия функционирования ранее сильно возбужденной i-модели существенным образом изменяются: увеличиваются тормозные воздействия на нее по связям, уменьшается вследствие адаптации ее возбудимость, она постоянно притормаживается СУТ, из-за низкой активности перестают проторяться ее связи с другими i-моделями и т.п. Поэтому возможность снова "захватить" внимание и усилиться для однажды "заблокированной" i-модели весьма невелика. Дело обстоит иначе только в том случае, если активность вытесненной i-модели поддерживается постоянно и в достаточной степени. Именно такая i-модель может стать скрытым очагом возбуждения. Чаще всего это происходит, если i-модель является представителем инстинкта или сложного рефлекса, заданного автомату при его предорганизации, либо какой-то другой программы, сформированной в процессе самообучения автомата. Если одна из программ такого рода становится неадекватной в сложившихся внешних условиях, то ее активность, несмотря на "подавление" и "блокирование" основных i-моделей, может сохраняться в подсознании длительное время.
Интересно отметить следующее обстоятельство. Любая программа реализуется в М-сети функционированием некоторой совокупности сильно связанных между собой i-моделей. Кроме того, i-модели могут быть связаны также с другими i-моделями сети, которые условно можно называть вторичными элементами данной программы. Через вторичные i-модели осуществляется косвенное влияние программы на ход мышления автомата. Программа, например, может быть представлена лишь небольшим количеством i-моделей понятий и простых чувств. Вторичными же могут быть i-модели эмоций, желаний, действий и т.п. Работа программы может осуществляться на низком уровне активности (т.е. при малой возбужденности непосредственно реализующих ее i-моделей), что обычно и происходит, поскольку в сети одновременно функционирует большое количество программ и СУТ усиливает лишь немногие из них. В то же время активность некоторых из вторичных i-моделей может оказаться весьма высокой, так как на них могут конвергировать возбуждения не только от данной программы, по и от чувств, рецепторов и т.п. В результате складывается следующая ситуация. Если работа какой-либо определенной программы приводит к нежелательным в данной ситуации результатам, то "блокируются" в первую очередь не ее собственные, а вторичные i-модели. Сама же программа, вследствие небольшой активности своих элементов, оказывается при этом незатронутой. Она продолжает функционировать и поддерживает возбужденность других, "неблокированных", вторичных i-моделей. Наиболее активные из этих последних оказываются со временем вытесненными в подсознание, и влияние программы на поведение осуществляется через возбуждение остальных, может быть, весьма косвенно связанных с ее основным содержанием. Так, например, "подавление" защитной программы (осуществляемое, скажем, путем формирования в автомате тормозных систем, эквивалентных понятиям "бояться стыдно", "бежать стыдно" и т.п.) может привести к "блокированию" i-моделей действий "бежать", "скрыться" и т.п. В этом случае функционирование такой программы может быть выражено повышенной активностью i-моделей других действий, так что автомат будет проявлять повышенную тенденцию, например, к нападению. При этом функционирующая по-прежнему (на уровне собственных i-моделей) программа самосохранения будет препятствовать нападению на действительно опасные объекты, и "агрессивность" автомата окажется направленной на объекты, опасные в небольшой степени или даже нейтральные. Описанный пример является, конечно, условным. Не следует полагать, что подсознательные процессы подобного типа играют доминирующую роль в формировании поведения М-автомата. Напротив, они протекают на низком уровне активности и не могут быть актуализированы без участия сознания, ведущая роль которого в процессе "мышления" автомата уже обсуждалась ранее.
До сих пор мы условно полагали, что скрытый очаг возбуждения реализуется в М-сети одной i-моделью. Использование этого предположения позволило упростить рассуждения и рассмотрение примеров. Однако в реальных М-сетях отдельная i-модель выступает в качестве скрытого очага возбуждения весьма редко.
АНСАМБЛИ i-МОДЕЛЕЙ. Как уже упоминалось, порядок переключений СУТ в М-сети детерминируется конфигурацией и проторенностью связей между i-моделями. Обычно разветвленность связей в М-сети весьма велика. Проведенные нами эксперименты показали, что в нормально функционирующей М-сети количество связей с ненулевой проходимостью составляет в среднем 10-15 на одну i-модель. Каждая i-модель, таким образом, является центром некоторой звездообразной структуры, по лучам которой она передает дополнительную активность в тех случаях, когда ее выделяет СУТ. Если СУТ по каким-либо причинам выделяет одну и ту же i-модель несколько раз, то повышается возбудимость не только выделяемой i-моделп, но и ее непосредственных "соседей", их активность увеличивается, связи между ними проторяются и они начинают взаимно поддерживать возбуждение друг друга. В результате повышается вероятность переключения СУТ на одну из них, и, когда это происходит, описанные процессы повторяются. При этом дополнительное возбуждение перераспределяется в основном между теми i-моделями, связи между которыми уже дополнительно проторены в результате предыдущих выборов. Это приводит к тому, что и при следующем переключении СУТ его "захватывает" одна из i-моделей той же группы. В результате формируется более или менее ограниченная совокупность сильно связанных между собой i-моделей, которая может "удерживать" СУТ внутри себя длительное время. Но даже и после переключения СУТ на другие, не связанные с нею, i-модели указанная группа продолжает функционировать в подсознании, поддерживая собственную активность за счет разнообразия внутренних связей. По аналогии с нейронными ансамблями можно назвать такую группу ансамблем i-моделей.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Характерным свойством ансамбля i-моделей является то, что он возбуждается весь при возбуждении нескольких его элементов. Соответственно, ансамбль "пытается захватить" СУТ всякий раз, когда последняя выделяет входящую в него i-модель. Между отдельными ансамблями может существовать взаимосвязь, реализуемая связями между i-моделями, которые входят в разные ансамбли. Ансамбли могут и "пересекаться", т.е. некоторые i-модели одновременно входят в несколько разных ансамблей. За счет взаимных связей и пересечений ансамбли также могут образовывать связные группы - ансамбли "второго слоя". "Захватив" СУТ, каждый из отдельных ансамблей стремится или удержать ее, или "передать" другому, связанному с ним,- в пределах системы "второго слоя", в которую он входит. Существование в М-сети системы ансамблей внешне выражается в формировании более пли менее жестких типичных последовательностей или программ переключений СУТ, т.е. в возникновении некоторых стереотипов мышления и действий автомата. В этих случаях может возникнуть впечатление, что, кроме алгоритмов функционирования автомата (описанного ранее алгоритма А), в М-сети реализованы еще некоторые "мета-алгоритмы" принятия решений, достижений целей и т.п.
Однажды сформировавшийся ансамбль i-моделей стремится поддержать свое существование, "захватывая" СУТ и перераспределяя внутри себя поступающую к его i-моделям активность. Однако такой ансамбль может распасться из-за естественного затухания связей, торможения его отдельных i-моделей (по связям) и торможения от СУТ, если последняя достаточно долго не выделяет i-модели данного ансамбля. Таким образом, "ансамблевая" структура М-сети является динамичной и легко изменяемой.
Некоторые ансамбли могут, тем не менее, существовать в М-сети длительное время, даже не привлекая СУТ, если активность отдельных составляющих их i-моделей постоянно поддерживается. Именно такие ансамбли и выступают в качестве скрытых очагов возбуждения. Механизм их формирования, по существу, не отличается от описанных ранее. Во многом сходна и их функциональная роль в информационных процессах, реализуемых М-сетью.
Специфика же ансамблей, выступающих в качестве скрытых очагов возбуждения, состоит в следующем. Зачастую ансамбль i-моделей представляет собой самостоятельную функциональную единицу сети - блок, функционирование которого реализует определенную, иногда весьма сложную совокупность операций по переработке информации. Работа таких блоков может быть описана с помощью специальных алгоритмов. Ансамбли этого типа часто и формируются при обучении автомата решению тех или иных задач. Не всегда, однако, ансамбли фиксируют известные, заученные алгоритмы. В процессе взаимодействия i-моделей ансамбля могут выполняться и такие системы операций, которые не соответствуют ни одному из когда-либо "преподанных" автомату алгоритмов, а отражают его "индивидуальные", сложившиеся в процессе деятельности приемы и методы решения задач. Будучи погруженными в подсознание, т.е. обладая пониженной активностью, такие ансамбли не только оказывают воздействие на другие ансамбли и i-модели, что влияет на общий ход мышления автомата, но и продолжают функционировать в качестве решающих систем. Окончательные результаты их деятельности могут впоследствии осознаваться. Поскольку промежуточные этапы решения находились в подсознании, акт осознания конечных результатов выступает здесь как аналог неожиданной догадки, интуитивного решения и т.п. феноменов, часто имеющих место при решении задач человеком. Следует отметить, что указанные феномены могут быть воспроизведены в М-сети не только за счет функционирования в подсознании отдельных ансамблей, но и систем из них, т.е. ансамблей "второго слоя".
Ансамбли i-моделей могут формироваться вокруг отдельной i-модели, если ее возбужденность в течение некоторого времени велика. Ансамбль может возникнуть также в результате многократного выделения СУТ некоторой фиксированной последовательности i-моделей. На этом, кстати, основывается один из эффективных приемов целенаправленного обучения М-автомата, предполагающий многократное повторение учителем постоянной последовательности входных сигналов, сопровождающейся сигналами "поощрения" и "наказания" ответных реакций автомата. Наконец ансамбль может возникнуть как внутреннее отражение, модель регулярных свойств внешней среды, воспринимаемой автоматом, или как модель определенной совокупности действий, приводящих к успеху в той или иной внешней ситуации. При содержательном анализе функциональной роли и процессов формирования ансамблей последние выступают в качестве аналога ассоциативных систем, формирующихся в процессе взаимодействия человека с внешней средой.
Нами рассмотрены отдельные ситуации, которые могут возникнуть при взаимодействии i-моделей, находящихся на низком уровне активности. При этом мы стремились показать принципиальную возможность соотнесения процессов в М-сетях некоторым психическим процессам. В дальнейшем мы продолжим работу в несколько ином направлении, устанавливая соответствия между функциями отдельных механизмов М-сети и некоторыми психическими функциями.
ВНИМАНИЕ. Для того чтобы продемонстрировать возможности конструктивного использования при построении М-автоматов сведений о качествах и характеристиках функции внимания, которые имеются в литературе по психологии, попытаемся развить установленную ранее аналогию между вниманием и СУТ.
Начнем с рассмотрения одной из наиболее важных характеристик внимания - его объема, который определяется числом объектов, охваченных вниманием в ограниченный отрезок времени. Напомним, что М-сеть работает в дискретном времени и в каждый момент СУТ выделяет одну или несколько наиболее возбужденных i-моделей. Количество одновременно выделяемых СУТ i-моделей сопоставляем с объемом внимания, а сведения о величине объема внимания у человека, в зависимости от различных факторов, используем для определения соответствующих параметров СУТ.
Возбужденность одновременно выделяемых СУТ i-моделей не обязательно должна быть строго одинаковой по величине. Иначе говоря, реализуемая СУТ точность сравнения возбужденностей i-моделей может быть невелика (в проведенных нами экспериментах она изменялась от 1 до 20%). Фактически это выражается в том, что СУТ, кроме максимально возбужденной, выделяет и те i-модели, возбужденность которых в определенных и заранее заданных пределах близка к максимальной. Очевидно, что чем выше требования к точности сравнения возбужденностей, тем меньше вероятность одновременного выделения СУТ нескольких i-моделей. В зависимости от условий конкретных задач, решаемых с помощью М-автомата, "меру близости" возбуждений выделяемых СУТ i-моделей можно изменять путем соответствующего изменения определенных параметров СУТ.
Напомним, что общая величина дополнительного возбуждения не зависит от количества выделяемых i-моделей. Распределение дополнительного возбуждения от СУТ может быть равномерным или зависеть от собственной возбужденности каждой i-модели. Вид распределения может также меняться в зависимости от ряда внешних и внутренних факторов, например от наличия нерешенной задачи или текущего значения интегративной оценки состояния М-сети (разности возбуждений i-моделей Пр и НПр). Суммарная величина дополнительного возбуждения от СУТ также может быть различной в разные моменты времени и зависеть, например, от той же интегративной оценки состояния М-сети. Естественно, что чем больше эта суммарная величина, тем сильнее влияние выделенных СУТ i-моделей на остальную сеть. При этом независимо от вида распределения дополнительного возбуждения будет существовать связь между количеством выделяемых СУТ i-моделей и "долей" дополнительного возбуждения, приходящейся на каждую из них. Среднюю величину дополнительного возбуждения выделяемых СУТ i-моделей можно рассматривать как аналог глубины (интенсивности) внимания. Нетрудно заметить, что чем меньше объем внимания, тем больше его глубина при постоянном дополнительном суммарном возбуждении. Уменьшение последнего связано не только с уменьшением дополнительного возбуждения каждой из выделяемых СУТ i-моделей, но и с пропорциональным уменьшением степени притормаживания остальных i-моделей сети. Соответственно, чем меньше "глубина внимания", тем чаще будут происходить переключения СУТ, что вполне согласуется с психологическими данными о влиянии глубины внимания человека на процесс его мышления.
ИЕРАРХИЧЕСКАЯ ОРГАНИЗАЦИЯ СУТ. При описании этой системы отмечалось, что СУТ может содержать некоторое множество подсистем, принадлежащих различным уровням ее организации. Рассмотрим более подробно работу такой многоуровневой СУТ. Пусть все i-модели сети по какому-либо признаку условно объединены в несколько непересекающихся групп. Назовем их группами первого (низшего) уровня. Эти группы могут, в свою очередь, быть объединены в более крупные группы второго уровня, последние - в группы третьего уровня и т.д. Группа самого верхнего уровня включает в себя все группы предыдущего и, следовательно, все i-модели сети. Общее количество уровней такой "пирамиды" в каждом конкретном случае может быть определено в зависимости от сложности М-сети и сложности задач, для решения которых строится автомат.
Каждой группе i-моделей соответствует одна из подсистем СУТ. Иначе говоря, в М-сети одновременно функционирует столько подсистем СУТ, сколько групп различных уровней в ней выделено. Подсистемы СУТ низшего уровня (уровни подсистем будем выделять в соответствии с уровнями групп, на которых они работают) производят сравнение возбуждений, усиление выделенных и торможение остальных i-моде-лей только в пределах своих групп. Подсистемы СУТ второго уровня, каждая в пределах своей группы, производят сравнение уже средних возбуждений групп i-моделей нижнего уровня. Дополнительно усиливается при этом не отдельная i-модель, а все i-модели выделяемой в данный момент группы; i-модели остальных групп того же уровня пропорционально притормаживаются. Аналогично работают СУТ третьего уровня и т.д., причем каждый раз сравниваются средние возбуждения групп i-моделей предыдущего уровня. Влияние всех подсистем СУТ сказывается на активности i-моделей, составляющих исходное множество, так что каждая конкретная i-модель сети может получать дополнительное возбуждение от подсистем одних уровней и притормаживаться подсистемами других уровней. Одноуровневая СУТ, принцип работы и некоторые интерпретации которой обсуждались выше, является частным случаем многоуровней системы усиления - торможения. Представления и понятия, введенные выше для этого частного случая, могут быть теперь несколько дополнены.
Будем для определенности рассматривать М-сеть, на которой задана двухуровневая СУТ. Посмотрим, как изменяется в этом случае содержание введенных ранее понятий "осознанная мысль", "поток мыслей", "ход мышления" и др. Пусть i-модели сети разделены на группы. Одну из них могут составлять i-модели образов, другую - i-модели понятий, третью - слов, четвертую - действий и т.д. В каждой из этих групп работают подсистемы СУТ первого уровня. Количество их, естественно, совпадает с количеством групп первого уровня. Подсистема СУТ второго уровня (СУТ-2) в данном случае одна.
Пусть в некоторый момент времени наибольшим средним возбуждением обладает одна из групп, например группа i-моделей образов. (Подсчет и сравнение средних возбуждений групп выполняют специальные блоки алгоритма, реализующего в данном автомате функции СУТ. Средние возбуждения групп этот алгоритм может рассчитывать как среднее арифметическое возбуждений входящих в группы i-моделей или каким-либо иным способом). В рассматриваемый момент подсистема СУТ-2 выделит группу i-моделей образов (наиболее возбужденную) и дополнительно увеличит возбужденность, всех входящих в нее i-моделей, пропорционально притормозив остальные i-модели сети. В тот же момент та из подсистем СУТ первого уровня, которая функционирует на группе i-моделей образов, также выделит некоторую наиболее возбужденную i-модель. Эта i-модель образа и будет считаться осознанной в данный момент времени.
Предположим, что в следующий момент подсистема СУТ-2 не изменила своего состояния и по-прежнему выделяет группу образов, а подсистема СУТ первого уровня в этой группе переключилась на другую i-модель. Это означает, что одна осознанная мысль сменилась другой, причем содержанием их обеих являются образы (естественно, разные). Процесс может развиваться и иначе. В следующий момент времени подсистема СУТ первого уровня в группе образов может не изменить своего состояния, а подсистема второго уровня - переключиться, скажем, па группу i-моделей понятий. В этой группе своя "региональная" подсистема СУТ может выделить в этот же момент некоторую i-модель. Последняя выступит как новая осознанная мысль. Теперь изменяется не только конкретное содержание осознанной мысли, но и тип этого содержания - осознается уже не образ, а понятие.
Как и раньше, последовательность осознаваемых мыслей, сменяющих друг друга в процессе функционирования М-сети, будем называть "потоком мыслей". Последний, как уже упоминалось, в некотором грубом приближении можно рассматривать как обобщенную характеристику всей совокупности реализуемых М-сетью процессов переработки информации. Эту совокупность для краткости назовем ходом мышления автомата. При использовании многоуровневой СУТ ход мышления может быть описан более подробно.
В самом деле, фиксируя последовательности переключений всех подсистем СУТ, мы, по сути дела, фиксируем некоторое множество разноуровневых описаний хода мышления. Это становится возможным благодаря тому обстоятельству, что при разделении М-сети на различные группы используются некоторые содержательные критерии, и поэтому различным последовательностям групп, выделяемых подсистемами СУТ разных уровней, могут быть поставлены в соответствие определенные последовательности фиксированных заранее слов естественного языка. Эти последовательности слов, характеризующих содержательные и интуитивно определенные системы представлений, и используются в дальнейшем как основа для содержательного описания и анализа хода мышления.
Описания наиболее высокой степени общности формируются при рассмотрении переключений подсистемы СУТ высшего уровня. Так, если в нашем примере подсистема СУТ-2 последовательно выделяет группы i-моделей образов, понятий, слов и эмоций, то мы можем описать реализуемый М-сетью ход мышления как такой процесс, который на первых этапах своего развития формировался преимущественно в образной сфере мышления, используя, в основном, информацию, полученную путем чувственного восприятия внешней среды. Затем в качестве ведущего компонента этого процесса выступили понятийные и словесные структуры. Соответственно, на этом этапе содержанием мыслительных операций являлись относительно более строгие операции логического характера, конструируемые на основе упорядоченной системы знаний, зафиксированной в структуре сети. Дальнейшее развитие процесса привело к выдвижению на главный план процедур эмоциональной оценки и т.д. В приведенном изложении мы стремились подчеркнуть относительный характер доминирования тех или иных элементов на различных этапах развития целостного процесса переработки информации сетью. В то время как ведущую роль в этом процессе играют, скажем, понятийные структуры, продолжают функционировать и все остальные i-модели сети, представляющие образы, чувства, слова и т.п. Протекающие параллельно и непрерывно взаимодействия этих элементов и формируют, собственно говоря, тот целостный процесс, приближенное описание которого можно построить, интерпретируя изменения состояний высшего уровня СУТ.
Описание хода мышления следует продолжить и детализировать на основе анализа работы подсистем СУТ нижнего уровня. При этом можно будет уточнить, какие именно образы, понятия и т.п. играли основную роль на тех или иных этапах изучаемого процесса, рассмотреть динамику их взаимных влияний, более подробно описать внутреннее содержание реализуемых сетью операций. Однако и здесь описания не будут исчерпывающими, поскольку основанием для них является рассмотрение не всей совокупности протекающих в сети процессов, а лишь хода мышления, реализуемого подсистемами СУТ в каждой из групп i-моделей низшего уровня.
Таким образом, ясно, что полное описание хода мышления может быть построено лишь на основе анализа и одновременного учета изменения активностей всех i-моделей сети. Только на этом уровне описаниям может быть придана та строгость и однозначность, которая отсутствует в содержательных интерпретациях хода мышления. Построение достаточно полных описаний является, к сожалению, весьма трудной задачей, сложность которой неизмеримо возрастает с увеличением объема М-сети. С другой стороны, аппарат М-сетей и развивается именно для моделирования информационных систем большой сложности и объема. До настоящего времени нам не удалось найти и эффективно использовать для формального описания процессов в М-сетях какие-либо математические методы и языки. Именно поэтому построение содержательных описаний хода мышления является необходимым этапом в практической работе по исследованию и настройке М-автоматов. Многоуровневая СУТ позволяет в зависимости от характера конкретных задач исследования использовать описания различных - соответственно решаемым задачам - степеней общности.
Вернемся к рассмотрению нашего условного примера. Пусть подсистема СУТ-2 по-прежнему выделяет группу i-моделей образов. Активность этих i-моделей соответственно велика; группа образов в целом доминирует над другими группами. Будем условно говорить, что группа i-моделей, которая доминирует над другими группами, принадлежащими тому же уровню, выделяется вниманием соответствующего уровня, или, иначе, осознается на этом уровне. Использование многоуровневой СУТ позволяет, таким образом, ввести представление об уровнях осознания.
УРОВНИ ОСОЗНАНИЯ. На каждом из уровней процессы осознания реализуются в ходе параллельного функционирования сразу многих подсистем СУТ (это, конечно, не относится к высшему уровню). Переключения каждой из этих подсистем внутри своей группы подчиняются некоторой "внутренней логике" этой группы, определяемой структурой взаимосвязей и активностью ее элементов (i-моделей или групп более низкого уровня). Анализируя процессы, развивающиеся в какой-либо группе данного уровня, можно выделять процессы ассоциирования отдельных ее элементов, процессы формирования из них ансамблей, процессы вытеснения и т.п. Все они протекают при непосредственном участии "обслуживающей" эту группу подсистемы СУТ.
На различных уровнях одновременно функционирует много подсистем, которые относительно самостоятельно реализуют определенную часть общего многоуровневого процесса осознания. Можно сказать, что работа каждой из подсистем СУТ формирует один из планов осознания, а процесс осознания в целом - не только многоуровневый, но и многоплановый.
Самостоятельность, автономность различных уровней и планов процесса осознания является лишь относительной, о ней можно говорить условно и только в тех случаях, когда тот или иной уровень, тот или иной план специально выделяются для решения частных задач анализа протекающих в сети процессов, например для построения содержательных описаний хода мышления. В действительности же осознание развивается как единый, целостный процесс, различные уровни и планы которого взаимосвязаны.
В самом деле, все подсистемы СУТ функционируют на одном и том же множестве i-моделей, составляющих исходную М-сеть. О связях между различными группами мы говорили ранее лишь условно: они реализуются множеством реально существующих в М-сети связей между i-моделями, входящими в разные группы. Сколько бы уровней ни содержала СУТ, каждая i-модель сети непременно входит в одну из групп каждого уровня. Поэтому любое переключение подсистемы, принадлежащей любому уровню, вызывает перераспределение возбуждений практически всех i-моделей сети. Те из них, которые принадлежат выделяемой данной подсистемой группе, получают дополнительное возбуждение, остальные притормаживаются. Дополнительное возбуждение передается по связям к другим i-моделям, картина возбуждений в сети меняется, и это вызывает очередные переключения не только подсистемы, непосредственно вызвавшей эти изменения, но и всех остальных. Каждая из них, в свою очередь, влияет на активность i-моделей и через них - на переключения других подсистем. Взаимодействия такого рода и объединяют множество отдельных подсистем СУТ в единую функциональную систему.
ГЛУБИНА ПОДСОЗНАНИЯ. Использование мпогоуровневой СУТ позволяет также ввести представление об уровнях, или глубине, подсознания. Для того чтобы пояснить это представление, обратимся опять к нашему условному примеру, где подсистема СУТ-2 все еще выделяет группу i-моделей образов. "Региональная" подсистема этой группы выделяет одну i-модель образа, например, "книга". Другие i-модели образов находятся, следовательно, в подсознании. Пусть среди них имеется i-модель образа "стол". Выделив группу образов, подсистема второго уровня притормозила i-модели остальных групп, в том числе и i-модели понятий. Тем не менее, одна i-модель понятия, пусть это будет i-модель понятия "плод", оказалась по каким-то причинам возбужденной в большей степени, чем другие i-модели группы понятий. Соответственно, она выделена подсистемой СУТ первого уровня, функционирующей на i-моделях этой группы, или, другими словами, она осознана на низшем уровне. Следовательно, эта i-модель получила некоторое добавочное возбуждение, а остальные, неосознанные на этом уровне, i-модели понятий дополнительно приторможены. Среди этих последних имеется, скажем, i-модель понятия "дерево".
В описанной ситуации осознанную мысль представляет i-модель образа "книга", остальные же i-модели "погружены" в подсознание. Однако состояния этих неосознанных образов, понятий и т.п. существенно отличаются друг от друга. Действительно, из общих правил функционирования СУТ следует, что наибольшую активность из находящихся в подсознании i-моделей может иметь i-модель образа "стол". Именно эта i-модель, принадлежащая к группе, осознанной на высшем уровне, и включенная в ту же ассоциативную систему, что и осознанная i-модель, имеет наибольшую возможность "захватить" местную СУТ при следующем ее переключении и, следовательно, стать осознанной мыслью автомата. Наименьшая вероятность занять это место существует для i-модели понятия "дерево", активность которой тормозится двумя подсистемами СУТ - высшей и местной. Некоторое промежуточное положение занимает i-модель понятия "плод", заторможенная высшей, но выделенная местной подсистемой СУТ. Упорядочив эти i-модели по степени убывания их активности и, следовательно, вероятности осознания, мы получим ряд: "стол" - "плод" - "дерево". Будем говорить, что i-модель, занимающая в этом ряду последнее место, наиболее глубоко "погружена" в подсознание, находится на его низшем уровне. Чем ближе i-модель к началу ряда, тем более высоким уровням подсознания она принадлежит.
Максимальную глубину подсознания, таким образом, характеризует разность возбужденностей наиболее активной и наименее активной i-моделей сети. В процессе функционирования М-автомата значение этого параметра может изменяться. Однако наши эксперименты показали, что для каждого конкретного М-автомата такие изменения ограничены определенными пределами, так что средняя глубина подсознания является одной из общих характеристик М-автоматов и ее можно использовать в качестве одного из критериев для классификации последних. Градации активности между минимально и максимально возможными уровнями характеризуют уровни подсознания. Для каждого конкретного М-автомата можно при желании построить некоторую "шкалу" таких уровней; ее использование будет полезным при анализе и описании подсознательных процессов. Такая "шкала", очевидно, не должна быть жесткой и может изменяться с изменением режима работы СУТ (при фиксированных характеристиках элементов М-сети).
...
Однажды сформировавшийся ансамбль i-моделей стремится поддержать свое существование, "захватывая" СУТ и перераспределяя внутри себя поступающую к его i-моделям активность. Однако такой ансамбль может распасться из-за естественного затухания связей, торможения его отдельных i-моделей (по связям) и торможения от СУТ, если последняя достаточно долго не выделяет i-модели данного ансамбля. Таким образом, "ансамблевая" структура М-сети является динамичной и легко изменяемой.
Некоторые ансамбли могут, тем не менее, существовать в М-сети длительное время, даже не привлекая СУТ, если активность отдельных составляющих их i-моделей постоянно поддерживается. Именно такие ансамбли и выступают в качестве скрытых очагов возбуждения. Механизм их формирования, по существу, не отличается от описанных ранее. Во многом сходна и их функциональная роль в информационных процессах, реализуемых М-сетью.
Специфика же ансамблей, выступающих в качестве скрытых очагов возбуждения, состоит в следующем. Зачастую ансамбль i-моделей представляет собой самостоятельную функциональную единицу сети - блок, функционирование которого реализует определенную, иногда весьма сложную совокупность операций по переработке информации. Работа таких блоков может быть описана с помощью специальных алгоритмов. Ансамбли этого типа часто и формируются при обучении автомата решению тех или иных задач. Не всегда, однако, ансамбли фиксируют известные, заученные алгоритмы. В процессе взаимодействия i-моделей ансамбля могут выполняться и такие системы операций, которые не соответствуют ни одному из когда-либо "преподанных" автомату алгоритмов, а отражают его "индивидуальные", сложившиеся в процессе деятельности приемы и методы решения задач. Будучи погруженными в подсознание, т.е. обладая пониженной активностью, такие ансамбли не только оказывают воздействие на другие ансамбли и i-модели, что влияет на общий ход мышления автомата, но и продолжают функционировать в качестве решающих систем. Окончательные результаты их деятельности могут впоследствии осознаваться. Поскольку промежуточные этапы решения находились в подсознании, акт осознания конечных результатов выступает здесь как аналог неожиданной догадки, интуитивного решения и т.п. феноменов, часто имеющих место при решении задач человеком. Следует отметить, что указанные феномены могут быть воспроизведены в М-сети не только за счет функционирования в подсознании отдельных ансамблей, но и систем из них, т.е. ансамблей "второго слоя".
Ансамбли i-моделей могут формироваться вокруг отдельной i-модели, если ее возбужденность в течение некоторого времени велика. Ансамбль может возникнуть также в результате многократного выделения СУТ некоторой фиксированной последовательности i-моделей. На этом, кстати, основывается один из эффективных приемов целенаправленного обучения М-автомата, предполагающий многократное повторение учителем постоянной последовательности входных сигналов, сопровождающейся сигналами "поощрения" и "наказания" ответных реакций автомата. Наконец ансамбль может возникнуть как внутреннее отражение, модель регулярных свойств внешней среды, воспринимаемой автоматом, или как модель определенной совокупности действий, приводящих к успеху в той или иной внешней ситуации. При содержательном анализе функциональной роли и процессов формирования ансамблей последние выступают в качестве аналога ассоциативных систем, формирующихся в процессе взаимодействия человека с внешней средой.
Нами рассмотрены отдельные ситуации, которые могут возникнуть при взаимодействии i-моделей, находящихся на низком уровне активности. При этом мы стремились показать принципиальную возможность соотнесения процессов в М-сетях некоторым психическим процессам. В дальнейшем мы продолжим работу в несколько ином направлении, устанавливая соответствия между функциями отдельных механизмов М-сети и некоторыми психическими функциями.
ВНИМАНИЕ. Для того чтобы продемонстрировать возможности конструктивного использования при построении М-автоматов сведений о качествах и характеристиках функции внимания, которые имеются в литературе по психологии, попытаемся развить установленную ранее аналогию между вниманием и СУТ.
Начнем с рассмотрения одной из наиболее важных характеристик внимания - его объема, который определяется числом объектов, охваченных вниманием в ограниченный отрезок времени. Напомним, что М-сеть работает в дискретном времени и в каждый момент СУТ выделяет одну или несколько наиболее возбужденных i-моделей. Количество одновременно выделяемых СУТ i-моделей сопоставляем с объемом внимания, а сведения о величине объема внимания у человека, в зависимости от различных факторов, используем для определения соответствующих параметров СУТ.
Возбужденность одновременно выделяемых СУТ i-моделей не обязательно должна быть строго одинаковой по величине. Иначе говоря, реализуемая СУТ точность сравнения возбужденностей i-моделей может быть невелика (в проведенных нами экспериментах она изменялась от 1 до 20%). Фактически это выражается в том, что СУТ, кроме максимально возбужденной, выделяет и те i-модели, возбужденность которых в определенных и заранее заданных пределах близка к максимальной. Очевидно, что чем выше требования к точности сравнения возбужденностей, тем меньше вероятность одновременного выделения СУТ нескольких i-моделей. В зависимости от условий конкретных задач, решаемых с помощью М-автомата, "меру близости" возбуждений выделяемых СУТ i-моделей можно изменять путем соответствующего изменения определенных параметров СУТ.
Напомним, что общая величина дополнительного возбуждения не зависит от количества выделяемых i-моделей. Распределение дополнительного возбуждения от СУТ может быть равномерным или зависеть от собственной возбужденности каждой i-модели. Вид распределения может также меняться в зависимости от ряда внешних и внутренних факторов, например от наличия нерешенной задачи или текущего значения интегративной оценки состояния М-сети (разности возбуждений i-моделей Пр и НПр). Суммарная величина дополнительного возбуждения от СУТ также может быть различной в разные моменты времени и зависеть, например, от той же интегративной оценки состояния М-сети. Естественно, что чем больше эта суммарная величина, тем сильнее влияние выделенных СУТ i-моделей на остальную сеть. При этом независимо от вида распределения дополнительного возбуждения будет существовать связь между количеством выделяемых СУТ i-моделей и "долей" дополнительного возбуждения, приходящейся на каждую из них. Среднюю величину дополнительного возбуждения выделяемых СУТ i-моделей можно рассматривать как аналог глубины (интенсивности) внимания. Нетрудно заметить, что чем меньше объем внимания, тем больше его глубина при постоянном дополнительном суммарном возбуждении. Уменьшение последнего связано не только с уменьшением дополнительного возбуждения каждой из выделяемых СУТ i-моделей, но и с пропорциональным уменьшением степени притормаживания остальных i-моделей сети. Соответственно, чем меньше "глубина внимания", тем чаще будут происходить переключения СУТ, что вполне согласуется с психологическими данными о влиянии глубины внимания человека на процесс его мышления.
ИЕРАРХИЧЕСКАЯ ОРГАНИЗАЦИЯ СУТ. При описании этой системы отмечалось, что СУТ может содержать некоторое множество подсистем, принадлежащих различным уровням ее организации. Рассмотрим более подробно работу такой многоуровневой СУТ. Пусть все i-модели сети по какому-либо признаку условно объединены в несколько непересекающихся групп. Назовем их группами первого (низшего) уровня. Эти группы могут, в свою очередь, быть объединены в более крупные группы второго уровня, последние - в группы третьего уровня и т.д. Группа самого верхнего уровня включает в себя все группы предыдущего и, следовательно, все i-модели сети. Общее количество уровней такой "пирамиды" в каждом конкретном случае может быть определено в зависимости от сложности М-сети и сложности задач, для решения которых строится автомат.
Каждой группе i-моделей соответствует одна из подсистем СУТ. Иначе говоря, в М-сети одновременно функционирует столько подсистем СУТ, сколько групп различных уровней в ней выделено. Подсистемы СУТ низшего уровня (уровни подсистем будем выделять в соответствии с уровнями групп, на которых они работают) производят сравнение возбуждений, усиление выделенных и торможение остальных i-моде-лей только в пределах своих групп. Подсистемы СУТ второго уровня, каждая в пределах своей группы, производят сравнение уже средних возбуждений групп i-моделей нижнего уровня. Дополнительно усиливается при этом не отдельная i-модель, а все i-модели выделяемой в данный момент группы; i-модели остальных групп того же уровня пропорционально притормаживаются. Аналогично работают СУТ третьего уровня и т.д., причем каждый раз сравниваются средние возбуждения групп i-моделей предыдущего уровня. Влияние всех подсистем СУТ сказывается на активности i-моделей, составляющих исходное множество, так что каждая конкретная i-модель сети может получать дополнительное возбуждение от подсистем одних уровней и притормаживаться подсистемами других уровней. Одноуровневая СУТ, принцип работы и некоторые интерпретации которой обсуждались выше, является частным случаем многоуровней системы усиления - торможения. Представления и понятия, введенные выше для этого частного случая, могут быть теперь несколько дополнены.
Будем для определенности рассматривать М-сеть, на которой задана двухуровневая СУТ. Посмотрим, как изменяется в этом случае содержание введенных ранее понятий "осознанная мысль", "поток мыслей", "ход мышления" и др. Пусть i-модели сети разделены на группы. Одну из них могут составлять i-модели образов, другую - i-модели понятий, третью - слов, четвертую - действий и т.д. В каждой из этих групп работают подсистемы СУТ первого уровня. Количество их, естественно, совпадает с количеством групп первого уровня. Подсистема СУТ второго уровня (СУТ-2) в данном случае одна.
Пусть в некоторый момент времени наибольшим средним возбуждением обладает одна из групп, например группа i-моделей образов. (Подсчет и сравнение средних возбуждений групп выполняют специальные блоки алгоритма, реализующего в данном автомате функции СУТ. Средние возбуждения групп этот алгоритм может рассчитывать как среднее арифметическое возбуждений входящих в группы i-моделей или каким-либо иным способом). В рассматриваемый момент подсистема СУТ-2 выделит группу i-моделей образов (наиболее возбужденную) и дополнительно увеличит возбужденность, всех входящих в нее i-моделей, пропорционально притормозив остальные i-модели сети. В тот же момент та из подсистем СУТ первого уровня, которая функционирует на группе i-моделей образов, также выделит некоторую наиболее возбужденную i-модель. Эта i-модель образа и будет считаться осознанной в данный момент времени.
Предположим, что в следующий момент подсистема СУТ-2 не изменила своего состояния и по-прежнему выделяет группу образов, а подсистема СУТ первого уровня в этой группе переключилась на другую i-модель. Это означает, что одна осознанная мысль сменилась другой, причем содержанием их обеих являются образы (естественно, разные). Процесс может развиваться и иначе. В следующий момент времени подсистема СУТ первого уровня в группе образов может не изменить своего состояния, а подсистема второго уровня - переключиться, скажем, па группу i-моделей понятий. В этой группе своя "региональная" подсистема СУТ может выделить в этот же момент некоторую i-модель. Последняя выступит как новая осознанная мысль. Теперь изменяется не только конкретное содержание осознанной мысли, но и тип этого содержания - осознается уже не образ, а понятие.
Как и раньше, последовательность осознаваемых мыслей, сменяющих друг друга в процессе функционирования М-сети, будем называть "потоком мыслей". Последний, как уже упоминалось, в некотором грубом приближении можно рассматривать как обобщенную характеристику всей совокупности реализуемых М-сетью процессов переработки информации. Эту совокупность для краткости назовем ходом мышления автомата. При использовании многоуровневой СУТ ход мышления может быть описан более подробно.
В самом деле, фиксируя последовательности переключений всех подсистем СУТ, мы, по сути дела, фиксируем некоторое множество разноуровневых описаний хода мышления. Это становится возможным благодаря тому обстоятельству, что при разделении М-сети на различные группы используются некоторые содержательные критерии, и поэтому различным последовательностям групп, выделяемых подсистемами СУТ разных уровней, могут быть поставлены в соответствие определенные последовательности фиксированных заранее слов естественного языка. Эти последовательности слов, характеризующих содержательные и интуитивно определенные системы представлений, и используются в дальнейшем как основа для содержательного описания и анализа хода мышления.
Описания наиболее высокой степени общности формируются при рассмотрении переключений подсистемы СУТ высшего уровня. Так, если в нашем примере подсистема СУТ-2 последовательно выделяет группы i-моделей образов, понятий, слов и эмоций, то мы можем описать реализуемый М-сетью ход мышления как такой процесс, который на первых этапах своего развития формировался преимущественно в образной сфере мышления, используя, в основном, информацию, полученную путем чувственного восприятия внешней среды. Затем в качестве ведущего компонента этого процесса выступили понятийные и словесные структуры. Соответственно, на этом этапе содержанием мыслительных операций являлись относительно более строгие операции логического характера, конструируемые на основе упорядоченной системы знаний, зафиксированной в структуре сети. Дальнейшее развитие процесса привело к выдвижению на главный план процедур эмоциональной оценки и т.д. В приведенном изложении мы стремились подчеркнуть относительный характер доминирования тех или иных элементов на различных этапах развития целостного процесса переработки информации сетью. В то время как ведущую роль в этом процессе играют, скажем, понятийные структуры, продолжают функционировать и все остальные i-модели сети, представляющие образы, чувства, слова и т.п. Протекающие параллельно и непрерывно взаимодействия этих элементов и формируют, собственно говоря, тот целостный процесс, приближенное описание которого можно построить, интерпретируя изменения состояний высшего уровня СУТ.
Описание хода мышления следует продолжить и детализировать на основе анализа работы подсистем СУТ нижнего уровня. При этом можно будет уточнить, какие именно образы, понятия и т.п. играли основную роль на тех или иных этапах изучаемого процесса, рассмотреть динамику их взаимных влияний, более подробно описать внутреннее содержание реализуемых сетью операций. Однако и здесь описания не будут исчерпывающими, поскольку основанием для них является рассмотрение не всей совокупности протекающих в сети процессов, а лишь хода мышления, реализуемого подсистемами СУТ в каждой из групп i-моделей низшего уровня.
Таким образом, ясно, что полное описание хода мышления может быть построено лишь на основе анализа и одновременного учета изменения активностей всех i-моделей сети. Только на этом уровне описаниям может быть придана та строгость и однозначность, которая отсутствует в содержательных интерпретациях хода мышления. Построение достаточно полных описаний является, к сожалению, весьма трудной задачей, сложность которой неизмеримо возрастает с увеличением объема М-сети. С другой стороны, аппарат М-сетей и развивается именно для моделирования информационных систем большой сложности и объема. До настоящего времени нам не удалось найти и эффективно использовать для формального описания процессов в М-сетях какие-либо математические методы и языки. Именно поэтому построение содержательных описаний хода мышления является необходимым этапом в практической работе по исследованию и настройке М-автоматов. Многоуровневая СУТ позволяет в зависимости от характера конкретных задач исследования использовать описания различных - соответственно решаемым задачам - степеней общности.
Вернемся к рассмотрению нашего условного примера. Пусть подсистема СУТ-2 по-прежнему выделяет группу i-моделей образов. Активность этих i-моделей соответственно велика; группа образов в целом доминирует над другими группами. Будем условно говорить, что группа i-моделей, которая доминирует над другими группами, принадлежащими тому же уровню, выделяется вниманием соответствующего уровня, или, иначе, осознается на этом уровне. Использование многоуровневой СУТ позволяет, таким образом, ввести представление об уровнях осознания.
УРОВНИ ОСОЗНАНИЯ. На каждом из уровней процессы осознания реализуются в ходе параллельного функционирования сразу многих подсистем СУТ (это, конечно, не относится к высшему уровню). Переключения каждой из этих подсистем внутри своей группы подчиняются некоторой "внутренней логике" этой группы, определяемой структурой взаимосвязей и активностью ее элементов (i-моделей или групп более низкого уровня). Анализируя процессы, развивающиеся в какой-либо группе данного уровня, можно выделять процессы ассоциирования отдельных ее элементов, процессы формирования из них ансамблей, процессы вытеснения и т.п. Все они протекают при непосредственном участии "обслуживающей" эту группу подсистемы СУТ.
На различных уровнях одновременно функционирует много подсистем, которые относительно самостоятельно реализуют определенную часть общего многоуровневого процесса осознания. Можно сказать, что работа каждой из подсистем СУТ формирует один из планов осознания, а процесс осознания в целом - не только многоуровневый, но и многоплановый.
Самостоятельность, автономность различных уровней и планов процесса осознания является лишь относительной, о ней можно говорить условно и только в тех случаях, когда тот или иной уровень, тот или иной план специально выделяются для решения частных задач анализа протекающих в сети процессов, например для построения содержательных описаний хода мышления. В действительности же осознание развивается как единый, целостный процесс, различные уровни и планы которого взаимосвязаны.
В самом деле, все подсистемы СУТ функционируют на одном и том же множестве i-моделей, составляющих исходную М-сеть. О связях между различными группами мы говорили ранее лишь условно: они реализуются множеством реально существующих в М-сети связей между i-моделями, входящими в разные группы. Сколько бы уровней ни содержала СУТ, каждая i-модель сети непременно входит в одну из групп каждого уровня. Поэтому любое переключение подсистемы, принадлежащей любому уровню, вызывает перераспределение возбуждений практически всех i-моделей сети. Те из них, которые принадлежат выделяемой данной подсистемой группе, получают дополнительное возбуждение, остальные притормаживаются. Дополнительное возбуждение передается по связям к другим i-моделям, картина возбуждений в сети меняется, и это вызывает очередные переключения не только подсистемы, непосредственно вызвавшей эти изменения, но и всех остальных. Каждая из них, в свою очередь, влияет на активность i-моделей и через них - на переключения других подсистем. Взаимодействия такого рода и объединяют множество отдельных подсистем СУТ в единую функциональную систему.
ГЛУБИНА ПОДСОЗНАНИЯ. Использование мпогоуровневой СУТ позволяет также ввести представление об уровнях, или глубине, подсознания. Для того чтобы пояснить это представление, обратимся опять к нашему условному примеру, где подсистема СУТ-2 все еще выделяет группу i-моделей образов. "Региональная" подсистема этой группы выделяет одну i-модель образа, например, "книга". Другие i-модели образов находятся, следовательно, в подсознании. Пусть среди них имеется i-модель образа "стол". Выделив группу образов, подсистема второго уровня притормозила i-модели остальных групп, в том числе и i-модели понятий. Тем не менее, одна i-модель понятия, пусть это будет i-модель понятия "плод", оказалась по каким-то причинам возбужденной в большей степени, чем другие i-модели группы понятий. Соответственно, она выделена подсистемой СУТ первого уровня, функционирующей на i-моделях этой группы, или, другими словами, она осознана на низшем уровне. Следовательно, эта i-модель получила некоторое добавочное возбуждение, а остальные, неосознанные на этом уровне, i-модели понятий дополнительно приторможены. Среди этих последних имеется, скажем, i-модель понятия "дерево".
В описанной ситуации осознанную мысль представляет i-модель образа "книга", остальные же i-модели "погружены" в подсознание. Однако состояния этих неосознанных образов, понятий и т.п. существенно отличаются друг от друга. Действительно, из общих правил функционирования СУТ следует, что наибольшую активность из находящихся в подсознании i-моделей может иметь i-модель образа "стол". Именно эта i-модель, принадлежащая к группе, осознанной на высшем уровне, и включенная в ту же ассоциативную систему, что и осознанная i-модель, имеет наибольшую возможность "захватить" местную СУТ при следующем ее переключении и, следовательно, стать осознанной мыслью автомата. Наименьшая вероятность занять это место существует для i-модели понятия "дерево", активность которой тормозится двумя подсистемами СУТ - высшей и местной. Некоторое промежуточное положение занимает i-модель понятия "плод", заторможенная высшей, но выделенная местной подсистемой СУТ. Упорядочив эти i-модели по степени убывания их активности и, следовательно, вероятности осознания, мы получим ряд: "стол" - "плод" - "дерево". Будем говорить, что i-модель, занимающая в этом ряду последнее место, наиболее глубоко "погружена" в подсознание, находится на его низшем уровне. Чем ближе i-модель к началу ряда, тем более высоким уровням подсознания она принадлежит.
Максимальную глубину подсознания, таким образом, характеризует разность возбужденностей наиболее активной и наименее активной i-моделей сети. В процессе функционирования М-автомата значение этого параметра может изменяться. Однако наши эксперименты показали, что для каждого конкретного М-автомата такие изменения ограничены определенными пределами, так что средняя глубина подсознания является одной из общих характеристик М-автоматов и ее можно использовать в качестве одного из критериев для классификации последних. Градации активности между минимально и максимально возможными уровнями характеризуют уровни подсознания. Для каждого конкретного М-автомата можно при желании построить некоторую "шкалу" таких уровней; ее использование будет полезным при анализе и описании подсознательных процессов. Такая "шкала", очевидно, не должна быть жесткой и может изменяться с изменением режима работы СУТ (при фиксированных характеристиках элементов М-сети).
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
В ходе функционирования М-сети отдельные i-модели и их группы могут переходить с одного уровня подсознания на другой в зависимости от характера решаемых автоматом задач и воздействий на него со стороны внешней среды. В каждый момент времени структура подсознания, т.е. конкретный вид распределения i-моделей по его уровням, определяется взаимодействием двух факторов. Один из них представлен непосредственными воздействиями i-моделей друг на друга по имеющимся между ними связям. В качестве другого фактора выступают воздействия на М-сеть со стороны подсистем СУТ. Структура подсознания в определенной мере отражает структуру осознаваемых процессов. В самом деле, если подсистема СУТ высшего уровня выделяет некоторую группу i-моделей, то все они получают дополнительную активность, что и может обеспечить их переход на более высокий уровень подсознания. Если в этой группе имеются подгруппы и подсистема более низкого уровня выделяет одну из них, то соответствующее подмножество i-моделей сможет перейти на еще более высокий уровень. Но и эта подгруппа может содержать в себе группы следующего, более низкого, уровня, и в результате работы соответствующей подсистемы СУТ еще какие-то i-модели смогут "подняться" на новый уровень, приблизившись к границе осознания. На вершине такой пирамиды, пределы которой расплывчаты и постоянно изменяются, всегда находится несколько (или одна) наиболее возбужденных i-моделей. Каждая из них выделена одной из "местных" подсистем СУТ и принадлежит к осознанной на следующем уровне группе, которая, в свою очередь, входит в группу, осознанную на более высоком уровне, и т.д. Именно эти несколько или одна i-моделей и являются осознанными мыслями всей системы.
Дальнейший анализ процессов, протекающих в подсознании автомата с многоуровневой СУТ, мы продолжать не будем. Так как все необходимые представления уже введены в предыдущем изложении, то этот анализ может быть продолжен читателем самостоятельно. Отметим только, что на основе подробного рассмотрения процессов, протекающих в подсознании, может быть выявлен и уточнен ряд интересных особенностей динамики взаимодействия различных уровней подсознания, формирования ансамблей i-моделей и их групп (ассоциативных систем), образования скрытых очагов возбуждения и т.п. Возникающие в ходе такого анализа аналогии с процессами и феноменами психической природы могут оказаться весьма интересными и полезными для разработчиков искусственного разума.
Отметим еще, что качественный характер развитых выше представлении отнюдь пе является обязательным как способ описания при анализе процессов в М-сетях. Напротив, при работе с конкретными действующими М-автоматами все использованные нами содержательные понятия неизбежно оказываются выраженными в количественной (числовой) форме. В дальнейшем будем описывать и приводить конкретные результаты экспериментов с действующими моделями, в том числе и с моделью, содержащей многоуровневую СУТ.
Напомним, что основная цель наших разработок состоит в изучении путей построения технических систем автоматизации сложных видов деятельности. Психологические интерпретации таких систем пе входят в число основных задач данной работы, они играют в ней лишь вспомогательную, эвристическую роль. Поэтому при обсуждении конкретных экспериментальных результатов мы не будем прибегать к интерпретациям и обоснованиям "от психологии", хотя достаточный для этого материал будет приведен.
О РЕАЛИЗАЦИИ СУТ В М-АВТОМАТАХ. Вопрос об определении оптимального количества уровней СУТ при построении М-автоматов должен решаться отдельно в каждом конкретном случае. Введение в СУТ каждого нового уровня существенно изменяет характер протекающих в М-сети процессов и, следовательно, определяет особенности поведения автомата. Поэтому "уровневость" СУТ должна быть обусловлена особенностями тех задач, для решения которых предназначен данный М-автомат. Чем более "жесткий" характер протекания реализуемых М-сетью программ переработки информации требуется для решения задач, чем реже должен переходить автомат от одного вида деятельности к другому, чем более "волевым" должно быть его поведение, тем больше уровней СУТ целесообразно реализовать в М-автомате. Современная техника моделирования (например, ЦВМ) не накладывает здесь существенных ограничений, поскольку сложность алгоритмов СУТ сравнительно невелика. Следовательно, ведущая роль в решении этого вопроса обусловлена изучением соответствий между параметрами СУТ и теми особенностями поведения автомата, которыми они управляют. Описание соответствий такого рода и должно послужить основой для синтеза СУТ, оптимальной по отношению к решаемым задачам. Наш практический опыт в этой области невелик, и здесь имеются богатые возможности для проведения дальнейших исследований.
Существует также другой путь определения целесообразного числа уровней СУТ в М-автоматах. Он основан на использовании аналогии, установленной между функциями, реализуемыми СУТ в работе М-автомата, и ролью внимания в мышлении человека. Поскольку М-автомат предназначен для воспроизведения именно человеческой деятельности, представляется оправданной попытка сделать хотя бы приближенные заключения относительно целесообразной "уровневости" СУТ на основе изучения внешних проявлений внимания человека. Разработка и анализ психологических аналогий (некоторые из них приведены в данном разделе) позволили установить, что для удовлетворительного объяснения ряда важных феноменов психики достаточно использовать представление о СУТ как о системе, содержащей сравнительно небольшое число уровней - от двух до четырех (см. об этом также в предыдущей работе). На эти цифры мы и ориентировались при разработке действующих моделей.
Поскольку общепринятого представления об уровнях внимания в психологии не существует, введение многоуровневой СУТ можно считать искусственным, скорее техническим, чем содержательным, приемом моделирования. Тем не менее именно такой искусственный прием позволяет более полно использовать ряд сведений о внимании, имеющихся в литературе по психологии. Дело в том, что при описании различных свойств внимания часто одни и те же термины используются для обозначения процессов, разный уровень общности которых очевиден. Говорят, например, о концентрации внимания на объекте (предмете) и концентрации внимания на определенном виде деятельности, включающем в себя манипулирование множеством отдельных объектов. В М-сети эти, вообще говоря, различные процессы можно реализовать действием различных уровней СУТ.
Для иллюстрации упомянутой возможности приведем следующий пример. Известно, что сосредоточение внимания на восприятии зрительной информации существенно (в десятки раз) уменьшает чувствительность к восприятию звуков. В М-сети аналогичный феномен может быть воспроизведен при помощи двухуровневой СУТ следующим образом. Пусть СУТ верхнего уровня выделяет сферу зрительных восприятий и притормаживает остальные, в том числе и слуховые. Внутри сферы зрительных восприятий соответствующая подсистема СУТ нижнего уровня выделяет наиболее возбужденную t-модель, которая в данный момент времени соответствует наиболее значимому "рассматриваемому" объекту. Образ этого объекта осознается. Затем подсистема СУТ нижнего уровня переключается на i-модели других объектов; но до тех пор, пока не переключится на другую сферу подсистема СУТ верхнего уровня, осознаваться будут только зрительные образы объектов. Может показаться, что мы описали крайний случай, соответствующий не уменьшению чувствительности к восприятию звуков, а полному выключению этого канала поступления информации. Однако полного торможения сфер, ответственных за восприятие внешней информации, обычно не происходит. Напомним еще раз, что восприятие внешней информации по тем каналам, которые не включены в данный момент в сферу внимания, а также переработка информации во всей сети происходят постоянно, хотя и на низком "энергетическом уровне". Так, слуховая информация воспринимается и перерабатывается и в том случае, когда внимание привлечено исключительно, например, к зрительному восприятию. При этом, естественно, i-модели сферы слуховых восприятий приторможены, что соответствует феномену уменьшения чувствительности к восприятию звуков при концентрации внимания на зрительном восприятии. Если, однако, в этот период по слуховому каналу поступит достаточно важная информация, то СУТ верхнего уровня может переключиться на соответствующую сферу, и тогда неосознаваемые ранее слуховые образы будут осознаны.
Процесс, более близкий к реальному протеканию восприятия внешней информации, может быть описан и реализован при помощи трехуровневой СУТ. Пусть на нижнем уровне выделены отдельно сферы восприятия зрительных и слуховых образов. На втором уровне пусть выделена "сфера восприятий", включающая в себя обе предыдущие сферы. Если СУТ верхнего (здесь - третьего) уровня выделяет "сферу восприятий", а внутри этой сферы возбуждения сфер зрительных и слуховых образов примерно равны, то осознаваться будут одновременно и зрительные, и слуховые образы. В зависимости от уровня дополнительного возбуждения обеих нижних сфер можно говорить о равномерности или неравномерности распределения внимания на восприятие соответствующих образов.
Приведенное описание многоуровневой СУТ может послужить основой для интерпретации и других свойств внимания, таких, как переключаемость, устойчивость, интенсивность и т.п.
В заключение отметим, что при построении М-автоматов возможны различные способы реализации СУТ. Не следует считать, что СУТ - это обязательно алгоритм, стоящий в определенном смысле "над сетью" и выполняющий роль некоего "демона", в функции которого входит управление процессами в М-сети. Действительно, при построении М-автоматов в виде программ для ЦВМ удобно описывать функции СУТ алгоритмом. Однако даже в этом случае существует тесная связь между сетью и СУТ. Так, например, величина дополнительного усиления от СУТ находится в прямой зависимости от состояния чувственной сферы М-сети. Распределение дополнительного усиления, параметры затухания выделяемых СУТ i-моделей и другие параметры СУТ также могут определяться возбуждением отдельных i-моделей или их групп в сети. Таким образом, М-сеть и СУТ следует рассматривать как взаимосвязанные части одной системы.
Функции СУТ могут быть реализованы также и непосредственно сетью. При этом необходимы определенные изменения и усложнения характеристик i-моделей. При реализации М-автомата на ЦВМ такие усложнения оказываются нерациональными в связи с ограничением объема оперативной памяти и быстродействия ЦВМ. В тех же случаях, когда М-автомат строится в виде физического устройства, объединение сети и СУТ в единую систему становится не только желательным, но и необходимым в связи с параллельностью и непрерывностью протекания всех процессов. В настоящее время общие принципы такой реализации функций СУТ в "физической" М-сети уже разработаны и проверены экспериментально.
Таким образом, мы описали в общих чертах основные принципы взаимного соотнесения различных свойств внимания и СУТ. Перейдем теперь к рассмотрению других вопросов, связанных с возможностью психологических интерпретаций процессов в М-сети. Кратко остановимся на способах реализации в М-сети различных видов памяти, а также влияния структуры и параметров элементов М-сети на поведение автомата.
ПАМЯТЬ. При описании языка моделирования упоминалось о некоторых возможных способах представления отдельных видов памяти в М-сети. В связи с особо важным местом понятия памяти в работах как психологического, так и кибернетического направлений остановимся на этом вопросе более подробно.
Прежде всего перечислим способы фиксации, хранения и воспроизведения информации, которые реализуются в М-сети.
Однажды возбужденная i-модель, даже при отсутствии активных входных воздействий, сохраняет некоторое время состояние возбужденности, которое можно рассматривать как память о прошлом воздействии. При наличии активных входных воздействий на уже возбужденную i-модель происходит нелинейное суммирование собственной возбужденности i-модели, отражающей предыдущие активные воздействия, и вновь поступивших воздействий. Таким образом, в каждый момент времени в возбужденности i-модели отражена память о целом ряде последовательных входных воздействий. Длительность этой памяти зависит от вида характеристики затухания i-модели.
В процессе функционирования i-модели происходит гипертрофия и адаптация ее характеристик. Если i-модель длительное время имеет достаточно высокую возбужденность, т.е. важность зафиксированной в ней информации постоянно велика, то характеристики i-модели изменяются таким образом, что ее возбуждение со стороны остальных i-моделей сети облегчается - осуществляется гипертрофия характеристик. В противном случае происходит обратный процесс - адаптация, в результате которой возбудимость i-модели уменьшается. Таким образом, изменения возбудимости i-модели, определяемые гипертрофией или адаптацией ее характеристик, реализуют память об "истории" активности данной i-модели. Память такого типа является, естественно, более длительной по сравнению с памятью возбуждений.
Между двумя возбужденными i-моделями устанавливается связь. Впоследствии ее проходимость увеличивается или уменьшается в зависимости от изменения возбужденности обеих i-моделей. Состояние связи как бы отражает "историю" (память) их совместных возбуждений, усредненную во времени. Если связь установлена с достаточно высокой проходимостью или достигла определенного уровня проходимости в процессе последовательных проторений, то значительно увеличивается и постоянный компонент проходимости, что, в свою очередь, увеличивает вероятность длительного сохранения этой связи.
При длительном возбуждении группы i-моделей происходит их объединение в некоторую устойчивую структуру - ансамбль, элементы которого сильно взаимосвязаны друг с другом. Наличие связей с высокой проходимостью между i-моделями ансамбля обеспечивает память об определенном состоянии М-сети даже после затухания возбуждения всех входящих в ансамбль i-моделей. "Вспоминание" этого состояния происходит уже при возбуждении части элементов ансамбля.
В М-сети существует еще один способ длительного запоминания состояний: формирование i-модели - "представителя" ансамбля. Такая i-модель имеет прямые и обратные связи со всеми i-моделями ансамбля. Возбуждение "представителя" ведет к возбуждению всего ансамбля, т.е. к восстановлению, "вспоминанию" состояния сети даже в том случае, когда сам ансамбль уже частично распался из-за затухания связей.
Между i-моделями различных ансамблей могут устанавливаться связи, сила (проходимость) которых зависит от частоты совместных возбуждений входящих в ансамбль i-моделей, состояния интегральных центров оценки Пр и НПр и некоторых других факторов. В результате сильно связанные i-модели имеют большую вероятность последовательного выделения системой усиления - торможения по сравнению с остальными i-моделями сети. Аналогично, при выделении СУТ i-модели, принадлежащей одному из двух сильно связанных ансамблей, велика вероятность того, что через несколько моментов времени произойдет переключение СУТ на одну из i-моделей второго ансамбля. Такие часто повторяющиеся последовательные выделения СУТ определенных i-моделей или элементов определенных групп i-моделей можно сопоставить, как это уже упоминалось ранее, с ассоциативным переключением внимания у человека. Подобные ассоциации могут возникать между i-моделями одного или различных уровней, одной или различных сфер М-сети. При изменении конфигурации связей в ходе функционирования сети могут изменяться и установившиеся системы ассоциаций. Учитывая то обстоятельство, что конфигурация связей в сети существенно зависит от воспринимаемой извне информации, т.е. от характера среды, в которой функционирует автомат, можно говорить, что система ассоциаций в М-сети автомата в определенной мере отражает состояние среды и "отношение" автомата к воспринимаемой извне информации. Развитая система ассоциаций позволяет автомату учитывать прошлый опыт и может рассматриваться как элемент предвидения.
Изменение активности интегральных центров оценки Пр и НПр оказывает влияние практически на все процессы в М-сети. В зависимости от разности возбужденностей i-моделей этих центров изменяется скорость проторения связей и влияние СУТ на процессы в сети. Сами i-модели Пр и НПр могут и не иметь существенно длительной памяти, однако косвенно память о состоянии этих i-моделей может существовать в сети значительное время. Так, например, если в какой-то момент времени возбужденность i-модели НПр намного превышает возбужденность i-модели Пр, то проходимости связей в сети существенно изменяются. Таким образом, путем изменения связей в М-сети осуществляется "память" об оценках ее деятельности.
Из изложенного видно, что память в М-сети реализуется всеми протекающими в ней процессами, а различные виды памяти представляют собой различные свойства и особенности этих процессов. Так, например, изменения возбужденности i-модели можно интерпретировать как кратковременную, а изменения проходимостей связей - как долговременную память. При этом по длительности запоминания фиксируемой связями информации можно различать два вида долговременной памяти, реализуемых временным и постоянным компонентами связи.
Рассмотрение содержательной стороны процессов в М-сети позволяет различать такие виды памяти, как двигательная, эмоциональная, образная и словесно-логическая. Они реализуются связями между i-моделями соответствующих сфер М-сети и, частично, связями между i-моделями, принадлежащими различным сферам. Так, связи внутри двигательной сферы фиксируют последовательности заученных автоматом действий. Чем больше проходимость таких связей, тем точнее выполняется вся последовательность. В то же время, чем быстрее проторяются связи внутри двигательной сферы, тем быстрее автомат запоминает необходимые действия. Таким образом, изменением параметров, определяющих величину проторения связей в двигательной сфере, можно изменять "силу" двигательной памяти автомата. Аналогичные рассуждения могут быть проведены и относительно словесно-логической памяти. Что же касается эмоциальной и образной памяти, то здесь большую роль играют характеристики возбуждения i-моделей этих сфер, а также связи от других сфер М-сети. Так, например, гипертрофироваеность характеристик i-моделей эмоциональной сферы и установленные с последними связи с высокой проходимостью могут обусловить преимущественную выраженность эмоциональной памяти. Аналогично, сильные связи к i-моделям образной сферы обеспечат повышенную образную память.
Запоминание информации в М-сети может происходить как при участии СУТ, так и без нее. Установление и проторение связей зависит в основном от возбужденности соединяемых ею i-моделей. Однако, если одна из них выделена СУТ, то направленная к ней связь будет усилена в большей степени, чем это произошло бы в "обычных" условиях, поскольку i-модель получает дополнительное возбуждение от СУТ. Переключения СУТ могут быть обусловлены определенной задачей, например задачей запоминания какого-либо материала. В этом случае можно говорить, что установление связей с высокой проходимостью между последовательно выделяемыми СУТ i-моделями соответствует произвольному запоминанию. В остальных случаях изменения конфигурации сети и значений параметров i-моделей и связей можно сопоставлять с непроизвольным запоминанием входной информации и результатов ее переработки. Более детальное обсуждение вопросов психологических интерпретаций процессов запоминания в М-сети может быть проведено при использовании М-автоматов в качестве моделей психики. Однако, поскольку нашей задачей является построение систем ИР, ограничимся уже приведенными интерпретациями и перейдем к последнему вопросу этого раздела - влиянию структуры и параметров М-сети на поведение автомата.
ТИПЫ М-АВТОМАТОВ. Конструируя М-автомат, мы задаем его структуру и функциональные характеристики элементов, исходя из имеющихся представлений о моделируемом виде деятельности. Естественно, что выбранная структура не должна и не является единственной, способной обеспечить "эффективное поведение" автомата в среде. Возможен целый класс автоматов с различными структурами и характеристиками ее элементов, который будет удовлетворять общим критериям "разумности" поведения в данной среде. В то же время каждый автомат этого класса будет организовывать свое поведение несколько отлично от других, так что в общем случае "стили" поведения автомата будут различны. Рассмотрим кратко пути преднамеренного задания автомату нужного "стиля" поведения.
Как уже говорилось, сеть М-автомата в соответствии с семантикой i-моделей может быть разделена на сферы. Связь между i-моделями внутри сфер и между сферами, а также распределение возбуждений в сети определяют как внешнюю реакцию автомата на восприятие конкретной ситуации - действия, так и внутренние реакции автомата - "ход мышления", предшествующий выполнению этого действия. Характеристики i-моделей и параметры связей М-сети задают как бы "жизненный опыт" автомата. Естественно, что, изменяя характеристики i-моделей или связей, мы может получить различные внешние и внутренние реакции автомата в ответ на одинаковые воздействия. Так, например, повысив коэффициенты возбуждения всем i-моделям двигательной сферы, можно сделать автомат "импульсивным" - он будет часто выполнять действия и мало "думать". Каждый шаг при этом будет обусловлен не всей воспринятой информацией с ее логическим и эмоциональным анализом, а только частичной, поверхностной оценкой наиболее сильных раздражителей. Автомат можно сделать "смелым" или "трусливым", задав определенным образом связи между i-моделями сферы восприятий и эмоциональной сферы. Аналогичного эффекта можно добиться, повысив коэффициент возбудимости нужных i-моделей эмоциональной сферы автомата.
Таким образом, изменяя параметры элементов М-сети, можно получать автоматы, различным образом реагирующие на сходные внешние воздействия. Это позволяет устанавливать аналогии между типом поведения автомата и характерологическими особенностями поведения человека и говорить (условно), что структура М-сети и значения параметров ее элементов определяют "характер" автомата.
В начале настоящего раздела отмечалось, что все конкретные интерпретации и аналогии мы будем давать только в тех случаях, которые кажутся нам полезными для более полного понимания результатов экспериментального исследования разработанных М-автоматов. Приводя достаточно подробное описание процессов "сознательной" и "подсознательной" переработки информации, мы тем самым стремились создать основу для аналогий, более широких и отвлеченных от конкретной направленности этой книги. Однако детальный анализ этих аналогий, несомненно, выходит за рамки стоящих перед нами задач.
Интерпретируя реализуемые в М-сетях процессы, мы намеренно ограничились рассмотрением психологических аналогий только тех элементов, свойств и функций М-сети, которые уже проверены нами при экспериментальном исследовании разработанных М-автоматов. Это сделано по следующим причинам. Прежде всего, при разработке сложных систем исследователь не может быть заранее уверен в том, что предлагаемые им механизмы или принципы после реализации дадут именно тот эффект, который предполагался теоретически. Кроме того, мы надеемся, что приведенные выше описания процессов в М-сети и указания на их психологические соответствия послужат основой для проведения дальнейших аналогий и, главное, облегчат чтение ряда описаний экспериментов с М-автоматами, в которых мы широко пользовались терминологией, заимствованной из описаний поведения человека.
Дальнейший анализ процессов, протекающих в подсознании автомата с многоуровневой СУТ, мы продолжать не будем. Так как все необходимые представления уже введены в предыдущем изложении, то этот анализ может быть продолжен читателем самостоятельно. Отметим только, что на основе подробного рассмотрения процессов, протекающих в подсознании, может быть выявлен и уточнен ряд интересных особенностей динамики взаимодействия различных уровней подсознания, формирования ансамблей i-моделей и их групп (ассоциативных систем), образования скрытых очагов возбуждения и т.п. Возникающие в ходе такого анализа аналогии с процессами и феноменами психической природы могут оказаться весьма интересными и полезными для разработчиков искусственного разума.
Отметим еще, что качественный характер развитых выше представлении отнюдь пе является обязательным как способ описания при анализе процессов в М-сетях. Напротив, при работе с конкретными действующими М-автоматами все использованные нами содержательные понятия неизбежно оказываются выраженными в количественной (числовой) форме. В дальнейшем будем описывать и приводить конкретные результаты экспериментов с действующими моделями, в том числе и с моделью, содержащей многоуровневую СУТ.
Напомним, что основная цель наших разработок состоит в изучении путей построения технических систем автоматизации сложных видов деятельности. Психологические интерпретации таких систем пе входят в число основных задач данной работы, они играют в ней лишь вспомогательную, эвристическую роль. Поэтому при обсуждении конкретных экспериментальных результатов мы не будем прибегать к интерпретациям и обоснованиям "от психологии", хотя достаточный для этого материал будет приведен.
О РЕАЛИЗАЦИИ СУТ В М-АВТОМАТАХ. Вопрос об определении оптимального количества уровней СУТ при построении М-автоматов должен решаться отдельно в каждом конкретном случае. Введение в СУТ каждого нового уровня существенно изменяет характер протекающих в М-сети процессов и, следовательно, определяет особенности поведения автомата. Поэтому "уровневость" СУТ должна быть обусловлена особенностями тех задач, для решения которых предназначен данный М-автомат. Чем более "жесткий" характер протекания реализуемых М-сетью программ переработки информации требуется для решения задач, чем реже должен переходить автомат от одного вида деятельности к другому, чем более "волевым" должно быть его поведение, тем больше уровней СУТ целесообразно реализовать в М-автомате. Современная техника моделирования (например, ЦВМ) не накладывает здесь существенных ограничений, поскольку сложность алгоритмов СУТ сравнительно невелика. Следовательно, ведущая роль в решении этого вопроса обусловлена изучением соответствий между параметрами СУТ и теми особенностями поведения автомата, которыми они управляют. Описание соответствий такого рода и должно послужить основой для синтеза СУТ, оптимальной по отношению к решаемым задачам. Наш практический опыт в этой области невелик, и здесь имеются богатые возможности для проведения дальнейших исследований.
Существует также другой путь определения целесообразного числа уровней СУТ в М-автоматах. Он основан на использовании аналогии, установленной между функциями, реализуемыми СУТ в работе М-автомата, и ролью внимания в мышлении человека. Поскольку М-автомат предназначен для воспроизведения именно человеческой деятельности, представляется оправданной попытка сделать хотя бы приближенные заключения относительно целесообразной "уровневости" СУТ на основе изучения внешних проявлений внимания человека. Разработка и анализ психологических аналогий (некоторые из них приведены в данном разделе) позволили установить, что для удовлетворительного объяснения ряда важных феноменов психики достаточно использовать представление о СУТ как о системе, содержащей сравнительно небольшое число уровней - от двух до четырех (см. об этом также в предыдущей работе). На эти цифры мы и ориентировались при разработке действующих моделей.
Поскольку общепринятого представления об уровнях внимания в психологии не существует, введение многоуровневой СУТ можно считать искусственным, скорее техническим, чем содержательным, приемом моделирования. Тем не менее именно такой искусственный прием позволяет более полно использовать ряд сведений о внимании, имеющихся в литературе по психологии. Дело в том, что при описании различных свойств внимания часто одни и те же термины используются для обозначения процессов, разный уровень общности которых очевиден. Говорят, например, о концентрации внимания на объекте (предмете) и концентрации внимания на определенном виде деятельности, включающем в себя манипулирование множеством отдельных объектов. В М-сети эти, вообще говоря, различные процессы можно реализовать действием различных уровней СУТ.
Для иллюстрации упомянутой возможности приведем следующий пример. Известно, что сосредоточение внимания на восприятии зрительной информации существенно (в десятки раз) уменьшает чувствительность к восприятию звуков. В М-сети аналогичный феномен может быть воспроизведен при помощи двухуровневой СУТ следующим образом. Пусть СУТ верхнего уровня выделяет сферу зрительных восприятий и притормаживает остальные, в том числе и слуховые. Внутри сферы зрительных восприятий соответствующая подсистема СУТ нижнего уровня выделяет наиболее возбужденную t-модель, которая в данный момент времени соответствует наиболее значимому "рассматриваемому" объекту. Образ этого объекта осознается. Затем подсистема СУТ нижнего уровня переключается на i-модели других объектов; но до тех пор, пока не переключится на другую сферу подсистема СУТ верхнего уровня, осознаваться будут только зрительные образы объектов. Может показаться, что мы описали крайний случай, соответствующий не уменьшению чувствительности к восприятию звуков, а полному выключению этого канала поступления информации. Однако полного торможения сфер, ответственных за восприятие внешней информации, обычно не происходит. Напомним еще раз, что восприятие внешней информации по тем каналам, которые не включены в данный момент в сферу внимания, а также переработка информации во всей сети происходят постоянно, хотя и на низком "энергетическом уровне". Так, слуховая информация воспринимается и перерабатывается и в том случае, когда внимание привлечено исключительно, например, к зрительному восприятию. При этом, естественно, i-модели сферы слуховых восприятий приторможены, что соответствует феномену уменьшения чувствительности к восприятию звуков при концентрации внимания на зрительном восприятии. Если, однако, в этот период по слуховому каналу поступит достаточно важная информация, то СУТ верхнего уровня может переключиться на соответствующую сферу, и тогда неосознаваемые ранее слуховые образы будут осознаны.
Процесс, более близкий к реальному протеканию восприятия внешней информации, может быть описан и реализован при помощи трехуровневой СУТ. Пусть на нижнем уровне выделены отдельно сферы восприятия зрительных и слуховых образов. На втором уровне пусть выделена "сфера восприятий", включающая в себя обе предыдущие сферы. Если СУТ верхнего (здесь - третьего) уровня выделяет "сферу восприятий", а внутри этой сферы возбуждения сфер зрительных и слуховых образов примерно равны, то осознаваться будут одновременно и зрительные, и слуховые образы. В зависимости от уровня дополнительного возбуждения обеих нижних сфер можно говорить о равномерности или неравномерности распределения внимания на восприятие соответствующих образов.
Приведенное описание многоуровневой СУТ может послужить основой для интерпретации и других свойств внимания, таких, как переключаемость, устойчивость, интенсивность и т.п.
В заключение отметим, что при построении М-автоматов возможны различные способы реализации СУТ. Не следует считать, что СУТ - это обязательно алгоритм, стоящий в определенном смысле "над сетью" и выполняющий роль некоего "демона", в функции которого входит управление процессами в М-сети. Действительно, при построении М-автоматов в виде программ для ЦВМ удобно описывать функции СУТ алгоритмом. Однако даже в этом случае существует тесная связь между сетью и СУТ. Так, например, величина дополнительного усиления от СУТ находится в прямой зависимости от состояния чувственной сферы М-сети. Распределение дополнительного усиления, параметры затухания выделяемых СУТ i-моделей и другие параметры СУТ также могут определяться возбуждением отдельных i-моделей или их групп в сети. Таким образом, М-сеть и СУТ следует рассматривать как взаимосвязанные части одной системы.
Функции СУТ могут быть реализованы также и непосредственно сетью. При этом необходимы определенные изменения и усложнения характеристик i-моделей. При реализации М-автомата на ЦВМ такие усложнения оказываются нерациональными в связи с ограничением объема оперативной памяти и быстродействия ЦВМ. В тех же случаях, когда М-автомат строится в виде физического устройства, объединение сети и СУТ в единую систему становится не только желательным, но и необходимым в связи с параллельностью и непрерывностью протекания всех процессов. В настоящее время общие принципы такой реализации функций СУТ в "физической" М-сети уже разработаны и проверены экспериментально.
Таким образом, мы описали в общих чертах основные принципы взаимного соотнесения различных свойств внимания и СУТ. Перейдем теперь к рассмотрению других вопросов, связанных с возможностью психологических интерпретаций процессов в М-сети. Кратко остановимся на способах реализации в М-сети различных видов памяти, а также влияния структуры и параметров элементов М-сети на поведение автомата.
ПАМЯТЬ. При описании языка моделирования упоминалось о некоторых возможных способах представления отдельных видов памяти в М-сети. В связи с особо важным местом понятия памяти в работах как психологического, так и кибернетического направлений остановимся на этом вопросе более подробно.
Прежде всего перечислим способы фиксации, хранения и воспроизведения информации, которые реализуются в М-сети.
Однажды возбужденная i-модель, даже при отсутствии активных входных воздействий, сохраняет некоторое время состояние возбужденности, которое можно рассматривать как память о прошлом воздействии. При наличии активных входных воздействий на уже возбужденную i-модель происходит нелинейное суммирование собственной возбужденности i-модели, отражающей предыдущие активные воздействия, и вновь поступивших воздействий. Таким образом, в каждый момент времени в возбужденности i-модели отражена память о целом ряде последовательных входных воздействий. Длительность этой памяти зависит от вида характеристики затухания i-модели.
В процессе функционирования i-модели происходит гипертрофия и адаптация ее характеристик. Если i-модель длительное время имеет достаточно высокую возбужденность, т.е. важность зафиксированной в ней информации постоянно велика, то характеристики i-модели изменяются таким образом, что ее возбуждение со стороны остальных i-моделей сети облегчается - осуществляется гипертрофия характеристик. В противном случае происходит обратный процесс - адаптация, в результате которой возбудимость i-модели уменьшается. Таким образом, изменения возбудимости i-модели, определяемые гипертрофией или адаптацией ее характеристик, реализуют память об "истории" активности данной i-модели. Память такого типа является, естественно, более длительной по сравнению с памятью возбуждений.
Между двумя возбужденными i-моделями устанавливается связь. Впоследствии ее проходимость увеличивается или уменьшается в зависимости от изменения возбужденности обеих i-моделей. Состояние связи как бы отражает "историю" (память) их совместных возбуждений, усредненную во времени. Если связь установлена с достаточно высокой проходимостью или достигла определенного уровня проходимости в процессе последовательных проторений, то значительно увеличивается и постоянный компонент проходимости, что, в свою очередь, увеличивает вероятность длительного сохранения этой связи.
При длительном возбуждении группы i-моделей происходит их объединение в некоторую устойчивую структуру - ансамбль, элементы которого сильно взаимосвязаны друг с другом. Наличие связей с высокой проходимостью между i-моделями ансамбля обеспечивает память об определенном состоянии М-сети даже после затухания возбуждения всех входящих в ансамбль i-моделей. "Вспоминание" этого состояния происходит уже при возбуждении части элементов ансамбля.
В М-сети существует еще один способ длительного запоминания состояний: формирование i-модели - "представителя" ансамбля. Такая i-модель имеет прямые и обратные связи со всеми i-моделями ансамбля. Возбуждение "представителя" ведет к возбуждению всего ансамбля, т.е. к восстановлению, "вспоминанию" состояния сети даже в том случае, когда сам ансамбль уже частично распался из-за затухания связей.
Между i-моделями различных ансамблей могут устанавливаться связи, сила (проходимость) которых зависит от частоты совместных возбуждений входящих в ансамбль i-моделей, состояния интегральных центров оценки Пр и НПр и некоторых других факторов. В результате сильно связанные i-модели имеют большую вероятность последовательного выделения системой усиления - торможения по сравнению с остальными i-моделями сети. Аналогично, при выделении СУТ i-модели, принадлежащей одному из двух сильно связанных ансамблей, велика вероятность того, что через несколько моментов времени произойдет переключение СУТ на одну из i-моделей второго ансамбля. Такие часто повторяющиеся последовательные выделения СУТ определенных i-моделей или элементов определенных групп i-моделей можно сопоставить, как это уже упоминалось ранее, с ассоциативным переключением внимания у человека. Подобные ассоциации могут возникать между i-моделями одного или различных уровней, одной или различных сфер М-сети. При изменении конфигурации связей в ходе функционирования сети могут изменяться и установившиеся системы ассоциаций. Учитывая то обстоятельство, что конфигурация связей в сети существенно зависит от воспринимаемой извне информации, т.е. от характера среды, в которой функционирует автомат, можно говорить, что система ассоциаций в М-сети автомата в определенной мере отражает состояние среды и "отношение" автомата к воспринимаемой извне информации. Развитая система ассоциаций позволяет автомату учитывать прошлый опыт и может рассматриваться как элемент предвидения.
Изменение активности интегральных центров оценки Пр и НПр оказывает влияние практически на все процессы в М-сети. В зависимости от разности возбужденностей i-моделей этих центров изменяется скорость проторения связей и влияние СУТ на процессы в сети. Сами i-модели Пр и НПр могут и не иметь существенно длительной памяти, однако косвенно память о состоянии этих i-моделей может существовать в сети значительное время. Так, например, если в какой-то момент времени возбужденность i-модели НПр намного превышает возбужденность i-модели Пр, то проходимости связей в сети существенно изменяются. Таким образом, путем изменения связей в М-сети осуществляется "память" об оценках ее деятельности.
Из изложенного видно, что память в М-сети реализуется всеми протекающими в ней процессами, а различные виды памяти представляют собой различные свойства и особенности этих процессов. Так, например, изменения возбужденности i-модели можно интерпретировать как кратковременную, а изменения проходимостей связей - как долговременную память. При этом по длительности запоминания фиксируемой связями информации можно различать два вида долговременной памяти, реализуемых временным и постоянным компонентами связи.
Рассмотрение содержательной стороны процессов в М-сети позволяет различать такие виды памяти, как двигательная, эмоциональная, образная и словесно-логическая. Они реализуются связями между i-моделями соответствующих сфер М-сети и, частично, связями между i-моделями, принадлежащими различным сферам. Так, связи внутри двигательной сферы фиксируют последовательности заученных автоматом действий. Чем больше проходимость таких связей, тем точнее выполняется вся последовательность. В то же время, чем быстрее проторяются связи внутри двигательной сферы, тем быстрее автомат запоминает необходимые действия. Таким образом, изменением параметров, определяющих величину проторения связей в двигательной сфере, можно изменять "силу" двигательной памяти автомата. Аналогичные рассуждения могут быть проведены и относительно словесно-логической памяти. Что же касается эмоциальной и образной памяти, то здесь большую роль играют характеристики возбуждения i-моделей этих сфер, а также связи от других сфер М-сети. Так, например, гипертрофироваеность характеристик i-моделей эмоциональной сферы и установленные с последними связи с высокой проходимостью могут обусловить преимущественную выраженность эмоциональной памяти. Аналогично, сильные связи к i-моделям образной сферы обеспечат повышенную образную память.
Запоминание информации в М-сети может происходить как при участии СУТ, так и без нее. Установление и проторение связей зависит в основном от возбужденности соединяемых ею i-моделей. Однако, если одна из них выделена СУТ, то направленная к ней связь будет усилена в большей степени, чем это произошло бы в "обычных" условиях, поскольку i-модель получает дополнительное возбуждение от СУТ. Переключения СУТ могут быть обусловлены определенной задачей, например задачей запоминания какого-либо материала. В этом случае можно говорить, что установление связей с высокой проходимостью между последовательно выделяемыми СУТ i-моделями соответствует произвольному запоминанию. В остальных случаях изменения конфигурации сети и значений параметров i-моделей и связей можно сопоставлять с непроизвольным запоминанием входной информации и результатов ее переработки. Более детальное обсуждение вопросов психологических интерпретаций процессов запоминания в М-сети может быть проведено при использовании М-автоматов в качестве моделей психики. Однако, поскольку нашей задачей является построение систем ИР, ограничимся уже приведенными интерпретациями и перейдем к последнему вопросу этого раздела - влиянию структуры и параметров М-сети на поведение автомата.
ТИПЫ М-АВТОМАТОВ. Конструируя М-автомат, мы задаем его структуру и функциональные характеристики элементов, исходя из имеющихся представлений о моделируемом виде деятельности. Естественно, что выбранная структура не должна и не является единственной, способной обеспечить "эффективное поведение" автомата в среде. Возможен целый класс автоматов с различными структурами и характеристиками ее элементов, который будет удовлетворять общим критериям "разумности" поведения в данной среде. В то же время каждый автомат этого класса будет организовывать свое поведение несколько отлично от других, так что в общем случае "стили" поведения автомата будут различны. Рассмотрим кратко пути преднамеренного задания автомату нужного "стиля" поведения.
Как уже говорилось, сеть М-автомата в соответствии с семантикой i-моделей может быть разделена на сферы. Связь между i-моделями внутри сфер и между сферами, а также распределение возбуждений в сети определяют как внешнюю реакцию автомата на восприятие конкретной ситуации - действия, так и внутренние реакции автомата - "ход мышления", предшествующий выполнению этого действия. Характеристики i-моделей и параметры связей М-сети задают как бы "жизненный опыт" автомата. Естественно, что, изменяя характеристики i-моделей или связей, мы может получить различные внешние и внутренние реакции автомата в ответ на одинаковые воздействия. Так, например, повысив коэффициенты возбуждения всем i-моделям двигательной сферы, можно сделать автомат "импульсивным" - он будет часто выполнять действия и мало "думать". Каждый шаг при этом будет обусловлен не всей воспринятой информацией с ее логическим и эмоциональным анализом, а только частичной, поверхностной оценкой наиболее сильных раздражителей. Автомат можно сделать "смелым" или "трусливым", задав определенным образом связи между i-моделями сферы восприятий и эмоциональной сферы. Аналогичного эффекта можно добиться, повысив коэффициент возбудимости нужных i-моделей эмоциональной сферы автомата.
Таким образом, изменяя параметры элементов М-сети, можно получать автоматы, различным образом реагирующие на сходные внешние воздействия. Это позволяет устанавливать аналогии между типом поведения автомата и характерологическими особенностями поведения человека и говорить (условно), что структура М-сети и значения параметров ее элементов определяют "характер" автомата.
В начале настоящего раздела отмечалось, что все конкретные интерпретации и аналогии мы будем давать только в тех случаях, которые кажутся нам полезными для более полного понимания результатов экспериментального исследования разработанных М-автоматов. Приводя достаточно подробное описание процессов "сознательной" и "подсознательной" переработки информации, мы тем самым стремились создать основу для аналогий, более широких и отвлеченных от конкретной направленности этой книги. Однако детальный анализ этих аналогий, несомненно, выходит за рамки стоящих перед нами задач.
Интерпретируя реализуемые в М-сетях процессы, мы намеренно ограничились рассмотрением психологических аналогий только тех элементов, свойств и функций М-сети, которые уже проверены нами при экспериментальном исследовании разработанных М-автоматов. Это сделано по следующим причинам. Прежде всего, при разработке сложных систем исследователь не может быть заранее уверен в том, что предлагаемые им механизмы или принципы после реализации дадут именно тот эффект, который предполагался теоретически. Кроме того, мы надеемся, что приведенные выше описания процессов в М-сети и указания на их психологические соответствия послужат основой для проведения дальнейших аналогий и, главное, облегчат чтение ряда описаний экспериментов с М-автоматами, в которых мы широко пользовались терминологией, заимствованной из описаний поведения человека.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#4. ОБСУЖДЕНИЕ
Рассмотрим особенности изложенного выше языка моделирования с точки зрения требований, предъявляемых к языкам такого рода (подробное обсуждение требований проведено в начале данного раздела).
Предлагаемый язык моделирования является конструктивным - в том смысле этого слова, который был определен ранее. Действительно, для того чтобы построить М-автомат, необходимо в явной форме зафиксировать все предположения и допущения, принимаемые при моделировании, а также определить численные значения используемых в модели параметров. Исходные предположения фиксируются в М-автомате заданием начального набора i-моделей и связей между ними (т.е. М-сети); выбором конкретного вида характеристик i-моделей и связей и определением набора операций, составляющих алгоритм функционирования А. Количественная мера вводится в модель при задании численных значений коэффициентов в выражениях, описывающих характеристики i-моделей; связей и СУТ, а также при задании начальных значений проходимостей связей и возбужденностей i-моделей.
Предлагаемый язык моделирования ориентирован на широкий класс технических средств реализации действующих моделей. Так, i-модель может быть представлена в виде ячейки памяти ЦВМ, хранящей некоторое число, характеризующее возбужденность i-модели. Связь также может быть представлена ячейкой (или набором ячеек), в которой зафиксированы адреса соединяемых i-моделей и числа, характеризующие проходимость связи. Алгоритм функционирования А и характеристики элементов М-сети также могут быть естественным образом реализованы средствами вычислительной техники. С другой стороны, i-модель можно представить физическим устройством, например электронной схемой, обладающей соответствующими характеристиками и вырабатывающей на выходе напряжение, интерпретируемое как показатель возбужденности i-модели. Аналогичным образом может быть представлена и связь между i-моделями. Алгоритм А в этом случае можно реализовать процессами в схеме, состоящей из блоков i-моделей и связей, а функцию СУТ - работой специальной схемы.
Вообще говоря, М-автомат является информационной моделью и может быть представлен с помощью элементов самой различной физической природы. Существенным в этом вопросе является то обстоятельство, что предлагаемый язык моделирования удобен для представления описываемых с его помощью систем физическими средствами, поскольку предполагает построение большого числа однотипных устройств (i-моделей и связей). В то же время этот язык ориентирован и на использование средств вычислительной техники, так что построение сложных и дорогих физических моделей, реализующих М-автоматы, может предваряться исследованием их вычислительных аналогов. Предлагаемый язык моделирования удобен для представления в нем сведений и понятий, определенных содержательно. В самом деле, задание в М-сети связей, соединяющих какую-либо i-модель с другими, при содержательной интерпретации соответствует конструктивному определению этого понятия путем указания его отношений с другими понятиями данной системы. Поясним сказанное. Природа человеческих эмоций в настоящее время недостаточно исследована, что зачастую рассматривают как препятствие для моделирования соответствующих сторон психической деятельности. Однако в психологической и художественной литературе существует обширный материал по феноменологии эмоций (например, переживание чувства гнева усиливает двигательную активность, подавляет чувство голода и т.п.). Если ввести в М-сеть i-модель, соответствующую понятию "гнев", то можно установить связи между этой i-моделью и другими, следуя феноменологическому описанию эмоции гнева, например: к i-модели "действовать" - усиливающую связь и т.п. Построенная таким образом система может проявлять признаки "эмоциональности".
Представление содержательных понятий в предлагаемом языке связано с их "конструктивизацией", осуществляемой путем задания связей между i-моделями и характеристик элементов М-сети. Связи и характеристики могут быть заданы эвристически, на основе аналогий и правдоподобных рассуждений. В этом случае эффективность принятых предположений может быть проверена в ходе экспериментального исследования действующей модели. Для задания характеристик и связей могут быть проведены также соответствующие психологические или нейропсихологические исследования. В этом случае язык моделирования определяет конкретные цели и направление таких исследований, поскольку указывает, в какой именно форме и какие именно параметры изучаемого явления должны быть определены. Можно сказать, таким образом, что использование аппарата М-сетей предполагает своеобразную формализацию представляемых в моделях понятий и определяет методы такой формализации.
Предлагаемый язык моделирования позволяет описывать процессы параллельного развития и взаимодействия различных программ переработки информации мозгом. Действительно, задание М-автомата сводится к заданию правил взаимодействия множества формальных элементов, соответствующих корковым информационным моделям, а его функционирование - к реализации этого взаимодействия. Процессы передачи возбуждения между i-моделями М-сети являются, таким образом, модельным представлением процессов изменения активностей корковых информационных моделей, в ходе которых и реализуются программы переработки информации в коре. Указанная возможность представляется весьма важной в связи с тем обстоятельством, что подавляющее большинство сколько-нибудь сложных проявлений психической активности и целенаправленной деятельности человека является результатом именно параллельного развития и взаимодействия тех или иных конкретных программ. Соответственно, при моделировании сложной деятельности наиболее перспективный подход связан не с воспроизведением каких-либо отдельных программ, рассматриваемых изолированно от других (например, построения моделей памяти, восприятия, эмоций и т.п.), а, напротив, с воспроизведением сложного взаимодействия различных программ в ходе их параллельного функционирования. Язык М-сетей является, следовательно, адекватным языком моделирования, поскольку ориентирован на решение задач именно такого рода.
Как уже упоминалось, при построении М-автоматов могут быть использованы содержательные данные об объекте моделирования. Формализация таких данных в процессе построения автомата осуществляется поэтапно: вначале они представляются в виде совокупности i-моделей и связей, затем определяются характеристики i-моделей, проходимости связей и т.д. Понятно, что ошибки и неточности, возникшие при выполнении первого этапа, т.е. при задании М-сети, могут привести в дальнейшем к новым ошибкам и существенно ухудшить качество модели в целом. В ходе проверки модели (оценка поведения, возврат к начальным этапам и их коррекция, см. гл.1) эти ошибки могут быть обнаружены. Для сложных моделей выполнение циклов проверки связано с большими затратами времени и сил. Поэтому желательно, чтобы средства представления содержательных данных, особенно на начальных этапах моделирования, были сравнительно просты, наглядны и представляли информацию в легкообозримой форме. Именно этим требованиям хорошо удовлетворяет М-сеть, представляющая в графической или табличной (матричной) форме большое количество взаимосвязанных понятий. Предлагаемый язык моделирования позволяет широко использовать при построении М-автоматов данные психологии и нейрофизиологии. Эта возможность обеспечивается тем, что язык удобен для модельного представления данных и понятий, определенных содержательно, позволяет описывать процессы параллельного развития и взаимодействия программ, сравнительно прост и нагляден.
При построении М-автоматов данные конкретных наук о мозге и психике могут быть использованы двояким образом. С одной стороны, их можно применить для задания функциональных характеристик i-моделей и связей, для определения правил работы СУТ, для построения специальных алгоритмов, работающих сопряженно с М-сетью (в случае неполных М-автоматов). С другой стороны, эти данные могут быть использованы при задании исходного набора i-моделей в М-сети и связей между ними. В ходе последующего обучения и самоорганизации в М-сети могут появляться новые i-модели и связи, дополняющие и корректирующие первоначально заданную структуру. Речь идет, таким образом, о том, что предлагаемый язык моделирования позволяет использовать данные конкретных наук для задания осмысленной (неслучайной) начальной организации М-автоматов, для их целенаправленного предпрограммирования. Известно, что такая возможность оказывается чрезвычайно важной при построении сложных самообучающихся систем.
Предлагаемый язык моделирования дает возможность содержательно анализировать процессы переработки информации в М-автоматах. Эта возможность обеспечивается тем, что каждой i-модели ставится в соответствие некоторое содержательное понятие, так что в целом М-сеть является сетью с семантикой. Возбужденность i-модели в данный момент указывает степень ее влияния (в этот момент) на процесс принятия решения автоматом, т.е. характеризует меру прагматической ценности соответствующей ей информации. Конфигурация и проходимости связей в М-сети определяют "механизм" влияния каждой i-модели на общий процесс, или, иными словами, указывают на способ реализации текущих ценностей каждой информационной единицы.
Анализ динамики возбуждений i-моделей сети и рассмотрение изменений ее структуры могут быть положены в основу содержательного анализа процессов переработки информации в М-автомате. Существенно, что предлагаемый язык обеспечивает проведение содержательного анализа процессов на разных уровнях общности. Наиболее грубые оценки "хода мышления" М-автомата могут быть получены при рассмотрении работы СУТ. Здесь анализу подвергаются последовательности i-моделей или их совокупностей, выделяемых СУТ в процессе функционирования автомата. Объем используемой для анализа информации в этом случае невелик, что делает его оперативным и доступным даже в случае больших размеров М-сети автомата. Более подробное изучение процессов принятия решений М-автоматом может быть осуществлено путем рассмотрения динамики возбуждений i-моделей сети. Совокупность наиболее возбужденных i-моделей в данный момент определяет "ведущий комплекс" процесса. Его составляют те "субъективные образы и понятия" автомата, которые оказывают в данный момент наибольшее влияние на ход процесса переработки информации и определяют направление его дальнейшего развития. Путем исследования динамики "ведущего комплекса" можно установить структуру реализуемых автоматом программ. Более глубокий их анализ возможен при рассмотрении изменений проходимостей связей, адаптации и гипертрофии характеристик i-моделей и т.п.
Возможность содержательного анализа процессов в М-автомате облегчает также поиск ошибок и неточностей, допущенных при его построении. При использовании предлагаемого языка выявленные ошибки и неточности могут быть исправлены и скорректированы путем внесения частных изменений в структуру М-автомата (изменение проходимостей отдельных связей, параметров характеристик и т.п.), без перестройки модели в целом.
Рассмотрим особенности изложенного выше языка моделирования с точки зрения требований, предъявляемых к языкам такого рода (подробное обсуждение требований проведено в начале данного раздела).
Предлагаемый язык моделирования является конструктивным - в том смысле этого слова, который был определен ранее. Действительно, для того чтобы построить М-автомат, необходимо в явной форме зафиксировать все предположения и допущения, принимаемые при моделировании, а также определить численные значения используемых в модели параметров. Исходные предположения фиксируются в М-автомате заданием начального набора i-моделей и связей между ними (т.е. М-сети); выбором конкретного вида характеристик i-моделей и связей и определением набора операций, составляющих алгоритм функционирования А. Количественная мера вводится в модель при задании численных значений коэффициентов в выражениях, описывающих характеристики i-моделей; связей и СУТ, а также при задании начальных значений проходимостей связей и возбужденностей i-моделей.
Предлагаемый язык моделирования ориентирован на широкий класс технических средств реализации действующих моделей. Так, i-модель может быть представлена в виде ячейки памяти ЦВМ, хранящей некоторое число, характеризующее возбужденность i-модели. Связь также может быть представлена ячейкой (или набором ячеек), в которой зафиксированы адреса соединяемых i-моделей и числа, характеризующие проходимость связи. Алгоритм функционирования А и характеристики элементов М-сети также могут быть естественным образом реализованы средствами вычислительной техники. С другой стороны, i-модель можно представить физическим устройством, например электронной схемой, обладающей соответствующими характеристиками и вырабатывающей на выходе напряжение, интерпретируемое как показатель возбужденности i-модели. Аналогичным образом может быть представлена и связь между i-моделями. Алгоритм А в этом случае можно реализовать процессами в схеме, состоящей из блоков i-моделей и связей, а функцию СУТ - работой специальной схемы.
Вообще говоря, М-автомат является информационной моделью и может быть представлен с помощью элементов самой различной физической природы. Существенным в этом вопросе является то обстоятельство, что предлагаемый язык моделирования удобен для представления описываемых с его помощью систем физическими средствами, поскольку предполагает построение большого числа однотипных устройств (i-моделей и связей). В то же время этот язык ориентирован и на использование средств вычислительной техники, так что построение сложных и дорогих физических моделей, реализующих М-автоматы, может предваряться исследованием их вычислительных аналогов. Предлагаемый язык моделирования удобен для представления в нем сведений и понятий, определенных содержательно. В самом деле, задание в М-сети связей, соединяющих какую-либо i-модель с другими, при содержательной интерпретации соответствует конструктивному определению этого понятия путем указания его отношений с другими понятиями данной системы. Поясним сказанное. Природа человеческих эмоций в настоящее время недостаточно исследована, что зачастую рассматривают как препятствие для моделирования соответствующих сторон психической деятельности. Однако в психологической и художественной литературе существует обширный материал по феноменологии эмоций (например, переживание чувства гнева усиливает двигательную активность, подавляет чувство голода и т.п.). Если ввести в М-сеть i-модель, соответствующую понятию "гнев", то можно установить связи между этой i-моделью и другими, следуя феноменологическому описанию эмоции гнева, например: к i-модели "действовать" - усиливающую связь и т.п. Построенная таким образом система может проявлять признаки "эмоциональности".
Представление содержательных понятий в предлагаемом языке связано с их "конструктивизацией", осуществляемой путем задания связей между i-моделями и характеристик элементов М-сети. Связи и характеристики могут быть заданы эвристически, на основе аналогий и правдоподобных рассуждений. В этом случае эффективность принятых предположений может быть проверена в ходе экспериментального исследования действующей модели. Для задания характеристик и связей могут быть проведены также соответствующие психологические или нейропсихологические исследования. В этом случае язык моделирования определяет конкретные цели и направление таких исследований, поскольку указывает, в какой именно форме и какие именно параметры изучаемого явления должны быть определены. Можно сказать, таким образом, что использование аппарата М-сетей предполагает своеобразную формализацию представляемых в моделях понятий и определяет методы такой формализации.
Предлагаемый язык моделирования позволяет описывать процессы параллельного развития и взаимодействия различных программ переработки информации мозгом. Действительно, задание М-автомата сводится к заданию правил взаимодействия множества формальных элементов, соответствующих корковым информационным моделям, а его функционирование - к реализации этого взаимодействия. Процессы передачи возбуждения между i-моделями М-сети являются, таким образом, модельным представлением процессов изменения активностей корковых информационных моделей, в ходе которых и реализуются программы переработки информации в коре. Указанная возможность представляется весьма важной в связи с тем обстоятельством, что подавляющее большинство сколько-нибудь сложных проявлений психической активности и целенаправленной деятельности человека является результатом именно параллельного развития и взаимодействия тех или иных конкретных программ. Соответственно, при моделировании сложной деятельности наиболее перспективный подход связан не с воспроизведением каких-либо отдельных программ, рассматриваемых изолированно от других (например, построения моделей памяти, восприятия, эмоций и т.п.), а, напротив, с воспроизведением сложного взаимодействия различных программ в ходе их параллельного функционирования. Язык М-сетей является, следовательно, адекватным языком моделирования, поскольку ориентирован на решение задач именно такого рода.
Как уже упоминалось, при построении М-автоматов могут быть использованы содержательные данные об объекте моделирования. Формализация таких данных в процессе построения автомата осуществляется поэтапно: вначале они представляются в виде совокупности i-моделей и связей, затем определяются характеристики i-моделей, проходимости связей и т.д. Понятно, что ошибки и неточности, возникшие при выполнении первого этапа, т.е. при задании М-сети, могут привести в дальнейшем к новым ошибкам и существенно ухудшить качество модели в целом. В ходе проверки модели (оценка поведения, возврат к начальным этапам и их коррекция, см. гл.1) эти ошибки могут быть обнаружены. Для сложных моделей выполнение циклов проверки связано с большими затратами времени и сил. Поэтому желательно, чтобы средства представления содержательных данных, особенно на начальных этапах моделирования, были сравнительно просты, наглядны и представляли информацию в легкообозримой форме. Именно этим требованиям хорошо удовлетворяет М-сеть, представляющая в графической или табличной (матричной) форме большое количество взаимосвязанных понятий. Предлагаемый язык моделирования позволяет широко использовать при построении М-автоматов данные психологии и нейрофизиологии. Эта возможность обеспечивается тем, что язык удобен для модельного представления данных и понятий, определенных содержательно, позволяет описывать процессы параллельного развития и взаимодействия программ, сравнительно прост и нагляден.
При построении М-автоматов данные конкретных наук о мозге и психике могут быть использованы двояким образом. С одной стороны, их можно применить для задания функциональных характеристик i-моделей и связей, для определения правил работы СУТ, для построения специальных алгоритмов, работающих сопряженно с М-сетью (в случае неполных М-автоматов). С другой стороны, эти данные могут быть использованы при задании исходного набора i-моделей в М-сети и связей между ними. В ходе последующего обучения и самоорганизации в М-сети могут появляться новые i-модели и связи, дополняющие и корректирующие первоначально заданную структуру. Речь идет, таким образом, о том, что предлагаемый язык моделирования позволяет использовать данные конкретных наук для задания осмысленной (неслучайной) начальной организации М-автоматов, для их целенаправленного предпрограммирования. Известно, что такая возможность оказывается чрезвычайно важной при построении сложных самообучающихся систем.
Предлагаемый язык моделирования дает возможность содержательно анализировать процессы переработки информации в М-автоматах. Эта возможность обеспечивается тем, что каждой i-модели ставится в соответствие некоторое содержательное понятие, так что в целом М-сеть является сетью с семантикой. Возбужденность i-модели в данный момент указывает степень ее влияния (в этот момент) на процесс принятия решения автоматом, т.е. характеризует меру прагматической ценности соответствующей ей информации. Конфигурация и проходимости связей в М-сети определяют "механизм" влияния каждой i-модели на общий процесс, или, иными словами, указывают на способ реализации текущих ценностей каждой информационной единицы.
Анализ динамики возбуждений i-моделей сети и рассмотрение изменений ее структуры могут быть положены в основу содержательного анализа процессов переработки информации в М-автомате. Существенно, что предлагаемый язык обеспечивает проведение содержательного анализа процессов на разных уровнях общности. Наиболее грубые оценки "хода мышления" М-автомата могут быть получены при рассмотрении работы СУТ. Здесь анализу подвергаются последовательности i-моделей или их совокупностей, выделяемых СУТ в процессе функционирования автомата. Объем используемой для анализа информации в этом случае невелик, что делает его оперативным и доступным даже в случае больших размеров М-сети автомата. Более подробное изучение процессов принятия решений М-автоматом может быть осуществлено путем рассмотрения динамики возбуждений i-моделей сети. Совокупность наиболее возбужденных i-моделей в данный момент определяет "ведущий комплекс" процесса. Его составляют те "субъективные образы и понятия" автомата, которые оказывают в данный момент наибольшее влияние на ход процесса переработки информации и определяют направление его дальнейшего развития. Путем исследования динамики "ведущего комплекса" можно установить структуру реализуемых автоматом программ. Более глубокий их анализ возможен при рассмотрении изменений проходимостей связей, адаптации и гипертрофии характеристик i-моделей и т.п.
Возможность содержательного анализа процессов в М-автомате облегчает также поиск ошибок и неточностей, допущенных при его построении. При использовании предлагаемого языка выявленные ошибки и неточности могут быть исправлены и скорректированы путем внесения частных изменений в структуру М-автомата (изменение проходимостей отдельных связей, параметров характеристик и т.п.), без перестройки модели в целом.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ГЛАВА 5. МОДЕЛИРОВАНИЕ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ
Общие принципы и технические приемы проверки сложных гипотез, в ходе которой осуществляются их уточнение, дополнение и корректирование, обсуждались ранее. В этой главе мы рассмотрим некоторые вопросы, возникающие при модельной проверке используемой нами гипотезы о программах разумной деятельности.
В области искусственного разума проверить гипотезу - значит установить, в какой степени предлагаемые ею принципы построения автоматов пригодны для решения задач автоматизации сложных видов человеческой деятельности. Иначе говоря, проверка гипотезы связана с исследованием ее эффективности.
#I. ОБЩИЕ ТРЕБОВАНИЯ К МОДЕЛЯМ. СТРАТЕГИИ ПРОВЕРКИ БОЛЬШИХ ГИПОТЕЗ
Всякая гипотеза оказывается эффективной лишь при решении задач определенного, более или менее ограниченного класса, составляющего область ее применения. Последняя определяется тем, какие именно конкретные виды человеческой деятельности описывает та или иная гипотеза. Многие гипотезы уже в процессе их построения ориентируются на описания строго ограниченного набора видов деятельности, т.е. на некоторую ограниченную область применения. Что же касается больших гипотез, особенности которых обсуждались в предыдущем разделе и к числу которых принадлежит гипотеза, используемая нами, то они ориентированы на описание весьма разнообразных видов деятельности. Проверка такой гипотезы осуществляется поэтапно, путем построения системы действующих моделей. В процессе построения этой системы, также поэтапно, уточняется и область применения большой гипотезы.
Модельная проверка решения задач практического характера и является, следовательно, теоретическим этапом работ по ИР. На этом этапе, вообще говоря, разрабатываемые модели могут быть предназначены как для решения реальных, практических задач, так и для решения задач, которые носят условный или абстрактный характер. Модель, предназначенная для проверки гипотезы, должна обязательно удовлетворять определенным требованиям.
Для того чтобы исследование эффективности гипотезы оказалось возможным, модель должна воспроизводить ДЕЙСТВИТЕЛЬНО СЛОЖНЫЕ виды деятельности. К сожалению, объективной оценки сложности не существует. Поэтому приходится требовать, чтобы поведение модели могло быть оценено как разумное в некотором интуитивном понимании. Можно надеяться, что в тех случаях, когда разработанная модель является действительно удачной и интересной, разумность ее поведения может быть установлена ad popolo. Конечно, выполнение этой оценки следует по возможности облегчить путем представления информации о модели и ее поведении в удобной форме, введением вспомогательных показателей и т.п. Отметим еще раз, что указанная трудность возникает лишь на этапе сугубо теоретического исследования. Если модель используется для решения реально существующей хорошо определенной задачи, то разумность ее поведения может быть оценена косвенно - по степени оптимальности вырабатываемых ею решений. Зачастую даже и определяют разумность через оптимальность. Трудность здесь заключается в том, что для многих видов человеческой деятельности, а значит, и деятельности "хорошей" модели достаточно строгие критерии оптимальности определить невозможно без существенных качественных упрощений. А такие упрощения выводят и задачу, и решающую систему из рамок проблемы ИР.
Модель должна строиться в таком виде и решать такие задачи, чтобы на основе ее исследования можно было определить ОБЛАСТЬ ПРАКТИЧЕСКОГО ПРИМЕНЕНИЯ проверяемой с помощью данной модели исходной гипотезы. Желательно поэтому, чтобы задачи, решаемые в процессе проверки гипотезы, являлись моделями некоторых практических задач либо были собственно практическими задачами.
Предлагаемая нами гипотеза формулирует ряд общих принципов переработки информации, а также содержит описание набора и структуры основных программ информации. Описывая общие закономерности процессов восприятия, хранения и переработки информации, гипотеза не накладывает каких-либо ограничений па содержательную, смысловую сторону этой информации. Поэтому при построении действующих моделей, предназначенных для проверки гипотезы, необходимо всякий раз задаваться определенной содержательной трактовкой воспроизводимых процессов, реально выполняемых человеком.
Проверка большой гипотезы связана, как это уже упоминалось, с построением некоторой системы действующих моделей. Каждая из таких моделей ориентирована на реализацию и проверку лишь некоторых из основных положений гипотезы. Модели строятся таким образом, чтобы в совокупности они дополняли друг друга, позволяя отобразить в постоянно наращиваемой системе гипотезу в целом. Применение этого принципа "системности" для проверки используемой нами гипотезы предполагает построение действующих моделей, каждая из которых реализует некоторый ограниченный набор программы переработки информации. В соответствии с реализуемым набором каждая модель представляется М-автоматом того или иного типа, использует тот или иной набор характеристик i-моделей и связей, тип СУТ и т.д. Таким образом, самой общей характеристикой каждой из предлагаемых в дальнейшем моделей является перечисление реализуемых ею программ.
В зависимости от типа воспроизводимых программ определяются тип и степень разнообразия используемой среды, а также содержательная интерпретация процессов, протекающих в среде и М-автомате в ходе их взаимодействия. Содержательные описания этих элементов составляют как бы "сюжет" моделирования. Выбор такого "сюжета" и совокупности воспроизводимых программ для каждой конкретной модели является весьма важной задачей. При ее решении необходимо иметь в виду, что модель должна удовлетворять как основным, перечисленным выше, так и следующим дополнительным требованиям.
Сложность модели должна быть согласована с возможностями технических средств ее реализации. Иначе говоря, модель не должна быть слишком сложной, чтобы технические трудности ее реализации, наладки и исследования не явились препятствием на пути к изучению ее свойств и дальнейшему использованию. Опасность такого рода существует всегда при построении моделей сложных видов деятельности и, несмотря на свою очевидность, зачастую не осознается в достаточной мере, что в худших случаях приводит к бесплодным затратам времени и усилий, а в лучших - к появлению запутанных и труднообозримых результатов, толкование которых в значительной мере произвольно. В то же время модель не должна быть слишком простой, чтобы не оказаться безполезной.
Модель должна быть ПЕРСПЕКТИВНОЙ. Это означает следующее. Каждая конкретная модель занимает определенное место в системе моделей, разрабатываемых для проверки гипотезы. Построение данной модели есть лишь один из этапов развития системы. Поэтому нужно, чтобы эта модель или могла быть использована в дальнейшем как основа для построения другой, более сложной и развитой модели, в которую она могла бы войти в качестве составной части (может быть, с некоторыми изменениями), или могла бы дать при исследовании такие результаты, которые непосредственно необходимы для разработки следующих моделей.
Модель должна быть СОДЕРЖАТЕЛЬНО ОПТИМАЛЬНОЙ. Понятие содержательной оптимальности является интуитивным и обозначает следующее. Пусть разрабатываемая модель занимает какое-то место в определенной системе. Это значит, что некоторое множество моделей данной системы уже создано и в них реализован ряд положений проверяемой гипотезы. Если разрабатываемая модель содержит сравнительно мало нового проверяемого материала, то существует опасность, что расходы на ее разработку не окупятся новыми данными о гипотезе. Иными словами, модель будет в другой форме повторять уже известные результаты. Если же разрабатываемая модель содержит слишком много нового проверяемого материала, то опасность заключается в том, что при ее разработке может оказаться невозможным использовать уже имеющиеся данные и результаты и, кроме того, новые результаты, полученные при исследовании этой модели, могут оказаться слабо связанными с уже имеющимися. Такая модель "разрывает" систему и, будучи изолированной, обладает меньшей ценностью.
Указанные требования носят весьма общий характер и могут быть конкретизированы только в процессе модельного исследования определенной гипотезы, требующей для своей проверки построения системы моделей. Для обеспечения соответствия разрабатываемых моделей этим требованиям целесообразно заранее, до начала моделирования, определить общую структуру будущей системы моделей, т.е. построить стратегию проверки данной гипотезы. Следует отметить, что в общем случае проверка сложной гипотезы предполагает построение системы путем одновременной разработки нескольких, вначале, может быть, мало связанных друг с другом моделей, предназначенных для проверки отдельных положений гипотезы. Каждая из таких моделей кладет начало некоторой "линии", формируемой из первоначальной модели путем ее дополнения, развития, включения в более сложные системы и т.п. В дальнейшем отдельные линии могут объединяться, между ними могут устанавливаться различного рода связи, так что совокупность моделей, принадлежащих линиям, образует единую систему. Иногда может производиться развитие лишь одной линии моделей.
В нашем случае разработка стратегии проверки включает в себя выбор программ, модельная реализация которых целесообразна в первую очередь, определение соответствующего сюжета моделирования и выбор направления дальнейшего усложнения и развития первоначальных моделей. Изложим некоторые соображения, положенные в основу принятой нами стратегии.
Задача состоит в том, чтобы определить, с чего начинать разработку системы. Первые модели системы, очевидно, должны удовлетворять всем перечисленным выше требованиям, причем вначале выдвигается требование перспективности. Необходимо, следовательно, определить такой объект моделирования, т.е. такой вид человеческой деятельности пли такую их совокупность, воспроизведение которой в модели было бы практически осуществимо и обеспечило бы возможность дальнейшего развития и усложнения модели не только "вширь", т.е. путем увеличения объема и разнообразия перерабатываемой ею информации, но и "вглубь" - путем дополнения ее новыми блоками и подсистемами, реализующими новые программы и обеспечивающими воспроизведение моделью новых, более сложных видов деятельности.
В качестве объекта моделирования для первых моделей мы выбрали некоторую достаточно сложную и важную область человеческой деятельности, которую назвали условно двигательным поведением. Дальнейшее изложение будет посвящено содержательному описанию выбранной области и постановке задачи моделирования.
Общие принципы и технические приемы проверки сложных гипотез, в ходе которой осуществляются их уточнение, дополнение и корректирование, обсуждались ранее. В этой главе мы рассмотрим некоторые вопросы, возникающие при модельной проверке используемой нами гипотезы о программах разумной деятельности.
В области искусственного разума проверить гипотезу - значит установить, в какой степени предлагаемые ею принципы построения автоматов пригодны для решения задач автоматизации сложных видов человеческой деятельности. Иначе говоря, проверка гипотезы связана с исследованием ее эффективности.
#I. ОБЩИЕ ТРЕБОВАНИЯ К МОДЕЛЯМ. СТРАТЕГИИ ПРОВЕРКИ БОЛЬШИХ ГИПОТЕЗ
Всякая гипотеза оказывается эффективной лишь при решении задач определенного, более или менее ограниченного класса, составляющего область ее применения. Последняя определяется тем, какие именно конкретные виды человеческой деятельности описывает та или иная гипотеза. Многие гипотезы уже в процессе их построения ориентируются на описания строго ограниченного набора видов деятельности, т.е. на некоторую ограниченную область применения. Что же касается больших гипотез, особенности которых обсуждались в предыдущем разделе и к числу которых принадлежит гипотеза, используемая нами, то они ориентированы на описание весьма разнообразных видов деятельности. Проверка такой гипотезы осуществляется поэтапно, путем построения системы действующих моделей. В процессе построения этой системы, также поэтапно, уточняется и область применения большой гипотезы.
Модельная проверка решения задач практического характера и является, следовательно, теоретическим этапом работ по ИР. На этом этапе, вообще говоря, разрабатываемые модели могут быть предназначены как для решения реальных, практических задач, так и для решения задач, которые носят условный или абстрактный характер. Модель, предназначенная для проверки гипотезы, должна обязательно удовлетворять определенным требованиям.
Для того чтобы исследование эффективности гипотезы оказалось возможным, модель должна воспроизводить ДЕЙСТВИТЕЛЬНО СЛОЖНЫЕ виды деятельности. К сожалению, объективной оценки сложности не существует. Поэтому приходится требовать, чтобы поведение модели могло быть оценено как разумное в некотором интуитивном понимании. Можно надеяться, что в тех случаях, когда разработанная модель является действительно удачной и интересной, разумность ее поведения может быть установлена ad popolo. Конечно, выполнение этой оценки следует по возможности облегчить путем представления информации о модели и ее поведении в удобной форме, введением вспомогательных показателей и т.п. Отметим еще раз, что указанная трудность возникает лишь на этапе сугубо теоретического исследования. Если модель используется для решения реально существующей хорошо определенной задачи, то разумность ее поведения может быть оценена косвенно - по степени оптимальности вырабатываемых ею решений. Зачастую даже и определяют разумность через оптимальность. Трудность здесь заключается в том, что для многих видов человеческой деятельности, а значит, и деятельности "хорошей" модели достаточно строгие критерии оптимальности определить невозможно без существенных качественных упрощений. А такие упрощения выводят и задачу, и решающую систему из рамок проблемы ИР.
Модель должна строиться в таком виде и решать такие задачи, чтобы на основе ее исследования можно было определить ОБЛАСТЬ ПРАКТИЧЕСКОГО ПРИМЕНЕНИЯ проверяемой с помощью данной модели исходной гипотезы. Желательно поэтому, чтобы задачи, решаемые в процессе проверки гипотезы, являлись моделями некоторых практических задач либо были собственно практическими задачами.
Предлагаемая нами гипотеза формулирует ряд общих принципов переработки информации, а также содержит описание набора и структуры основных программ информации. Описывая общие закономерности процессов восприятия, хранения и переработки информации, гипотеза не накладывает каких-либо ограничений па содержательную, смысловую сторону этой информации. Поэтому при построении действующих моделей, предназначенных для проверки гипотезы, необходимо всякий раз задаваться определенной содержательной трактовкой воспроизводимых процессов, реально выполняемых человеком.
Проверка большой гипотезы связана, как это уже упоминалось, с построением некоторой системы действующих моделей. Каждая из таких моделей ориентирована на реализацию и проверку лишь некоторых из основных положений гипотезы. Модели строятся таким образом, чтобы в совокупности они дополняли друг друга, позволяя отобразить в постоянно наращиваемой системе гипотезу в целом. Применение этого принципа "системности" для проверки используемой нами гипотезы предполагает построение действующих моделей, каждая из которых реализует некоторый ограниченный набор программы переработки информации. В соответствии с реализуемым набором каждая модель представляется М-автоматом того или иного типа, использует тот или иной набор характеристик i-моделей и связей, тип СУТ и т.д. Таким образом, самой общей характеристикой каждой из предлагаемых в дальнейшем моделей является перечисление реализуемых ею программ.
В зависимости от типа воспроизводимых программ определяются тип и степень разнообразия используемой среды, а также содержательная интерпретация процессов, протекающих в среде и М-автомате в ходе их взаимодействия. Содержательные описания этих элементов составляют как бы "сюжет" моделирования. Выбор такого "сюжета" и совокупности воспроизводимых программ для каждой конкретной модели является весьма важной задачей. При ее решении необходимо иметь в виду, что модель должна удовлетворять как основным, перечисленным выше, так и следующим дополнительным требованиям.
Сложность модели должна быть согласована с возможностями технических средств ее реализации. Иначе говоря, модель не должна быть слишком сложной, чтобы технические трудности ее реализации, наладки и исследования не явились препятствием на пути к изучению ее свойств и дальнейшему использованию. Опасность такого рода существует всегда при построении моделей сложных видов деятельности и, несмотря на свою очевидность, зачастую не осознается в достаточной мере, что в худших случаях приводит к бесплодным затратам времени и усилий, а в лучших - к появлению запутанных и труднообозримых результатов, толкование которых в значительной мере произвольно. В то же время модель не должна быть слишком простой, чтобы не оказаться безполезной.
Модель должна быть ПЕРСПЕКТИВНОЙ. Это означает следующее. Каждая конкретная модель занимает определенное место в системе моделей, разрабатываемых для проверки гипотезы. Построение данной модели есть лишь один из этапов развития системы. Поэтому нужно, чтобы эта модель или могла быть использована в дальнейшем как основа для построения другой, более сложной и развитой модели, в которую она могла бы войти в качестве составной части (может быть, с некоторыми изменениями), или могла бы дать при исследовании такие результаты, которые непосредственно необходимы для разработки следующих моделей.
Модель должна быть СОДЕРЖАТЕЛЬНО ОПТИМАЛЬНОЙ. Понятие содержательной оптимальности является интуитивным и обозначает следующее. Пусть разрабатываемая модель занимает какое-то место в определенной системе. Это значит, что некоторое множество моделей данной системы уже создано и в них реализован ряд положений проверяемой гипотезы. Если разрабатываемая модель содержит сравнительно мало нового проверяемого материала, то существует опасность, что расходы на ее разработку не окупятся новыми данными о гипотезе. Иными словами, модель будет в другой форме повторять уже известные результаты. Если же разрабатываемая модель содержит слишком много нового проверяемого материала, то опасность заключается в том, что при ее разработке может оказаться невозможным использовать уже имеющиеся данные и результаты и, кроме того, новые результаты, полученные при исследовании этой модели, могут оказаться слабо связанными с уже имеющимися. Такая модель "разрывает" систему и, будучи изолированной, обладает меньшей ценностью.
Указанные требования носят весьма общий характер и могут быть конкретизированы только в процессе модельного исследования определенной гипотезы, требующей для своей проверки построения системы моделей. Для обеспечения соответствия разрабатываемых моделей этим требованиям целесообразно заранее, до начала моделирования, определить общую структуру будущей системы моделей, т.е. построить стратегию проверки данной гипотезы. Следует отметить, что в общем случае проверка сложной гипотезы предполагает построение системы путем одновременной разработки нескольких, вначале, может быть, мало связанных друг с другом моделей, предназначенных для проверки отдельных положений гипотезы. Каждая из таких моделей кладет начало некоторой "линии", формируемой из первоначальной модели путем ее дополнения, развития, включения в более сложные системы и т.п. В дальнейшем отдельные линии могут объединяться, между ними могут устанавливаться различного рода связи, так что совокупность моделей, принадлежащих линиям, образует единую систему. Иногда может производиться развитие лишь одной линии моделей.
В нашем случае разработка стратегии проверки включает в себя выбор программ, модельная реализация которых целесообразна в первую очередь, определение соответствующего сюжета моделирования и выбор направления дальнейшего усложнения и развития первоначальных моделей. Изложим некоторые соображения, положенные в основу принятой нами стратегии.
Задача состоит в том, чтобы определить, с чего начинать разработку системы. Первые модели системы, очевидно, должны удовлетворять всем перечисленным выше требованиям, причем вначале выдвигается требование перспективности. Необходимо, следовательно, определить такой объект моделирования, т.е. такой вид человеческой деятельности пли такую их совокупность, воспроизведение которой в модели было бы практически осуществимо и обеспечило бы возможность дальнейшего развития и усложнения модели не только "вширь", т.е. путем увеличения объема и разнообразия перерабатываемой ею информации, но и "вглубь" - путем дополнения ее новыми блоками и подсистемами, реализующими новые программы и обеспечивающими воспроизведение моделью новых, более сложных видов деятельности.
В качестве объекта моделирования для первых моделей мы выбрали некоторую достаточно сложную и важную область человеческой деятельности, которую назвали условно двигательным поведением. Дальнейшее изложение будет посвящено содержательному описанию выбранной области и постановке задачи моделирования.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#2. ДВИГАТЕЛЬНОЕ ПОВЕДЕНИЕ КАК ОБЪЕКТ МОДЕЛИРОВАНИЯ
Целостную разумную деятельность человека в настоящее время трудно представить какой-либо одной действующей моделью. При выборе объекта моделирования для первых моделей системы необходимо, следовательно, прибегать к ограничениям и упрощениям. К чему же мы должны стремиться при этом?
Способность человека к разумному поведению является результатом длительного процесса эволюционного развития вида. В ходе этого процесса последовательно формировались все более сложные уровни (этажи) управления приспособительным поведением. Появление новых управляющих систем, новых программ переработки информации мозгом обеспечивало усложнение и совершенствование форм взаимодействия человека со средой. При этом каждый новый уровень, новый механизм управления формировался на основе уже существующих, дополняя и корректируя их деятельность. В иерархии управляющих систем мозга существуют, следовательно, как сравнительно новые управляющие подсистемы, так и старые, определяющие, по-видимому, общие свойства и структуру "базовых" программ разумного поведения. Мы полагаем, что именно эти, исходные подсистемы и программы целесообразно моделировать в первую очередь. В этом случае дальнейшее развитие системы моделей, реализующей целостную деятельность, можно было бы организовать по аналогии с развитием управляющих систем мозга, опираясь на анализ этого развития и используя его в качестве прототипа. При рассмотрении иерархии управляющих систем необходимо, однако, учитывать следующее важное ограничение: мы не должны "опускаться слишком низко", поскольку разрабатываемые нами модели являются системами ИР и должны, следовательно, удовлетворять первому из сформулированных выше требований к таким системам, т.е. воспроизводить достаточно сложные виды человеческой деятельности.
ПЕРВОЕ ОГРАНИЧЕНИЕ. Руководствуясь приведенным выше рассуждением при выборе объекта моделирования, мы исключили из рассмотрения ряд видов разумной деятельности, воспроизведение которых является традиционной задачей ИР: решение формальных задач, доказательство теорем и т.п. Несмотря на очевидную важность проблемы, мы отказались также от моделирования вербальной деятельности человека, полагая, что решение этой задачи может быть получено в более полном виде и с меньшими затратами уже после модельного исследования более глубоких процессов, лежащих в основе речевого поведения. Соответственно, мы отказываемся от моделирования на первом этапе и социально обусловленных видов деятельности.
Объектом нашего рассмотрения являются, таким образом, процессы формирования поведения, связанного с непосредственным взаимодействием человека и естественной среды (в последнюю не включаются другие люди, общественные институты и т.п.). Именно процессы такого рода являются, по нашему мнению, тем исходным материалом, усложнение и совершенствование которого приводит к развитию высших форм разумной деятельности человека (труда, речи и т.п.). С другой стороны, сложность этих процессов весьма велика, и формируемая ими деятельность интуитивно расценивается как разумная.
ВТОРОЕ ОГРАНИЧЕНИЕ. Разнообразие форм взаимодействия человека с естественной средой огромно, и достаточно полное воспроизведение их в единой модели является слишком трудной задачей на начальных этапах построения системы моделей. Поэтому в дальнейшем мы будем рассматривать только такое поведение, которое связано с передвижением человека в естественной среде. Для того чтобы уточнить, что именно имеется в виду, приведем содержательное описание поведения интересующего нас типа, т.е. опишем "сюжет" моделирования.
Пусть некоторый человек (условный моделируемый субъект) находится в среде, представляющей собой естественную местность (можно представить лес, поле и т.п.), на которой имеются различные объекты. Мы условились уже, что не станем рассматривать взаимодействие человека с другими людьми и искусственно созданными предметами. Предположим, следовательно, что объектов такого рода среда не содержит. В ней находятся, однако, различные объекты естественного происхождения, которые могут вызывать у человека различное отношение к себе. Так, он может пугаться некоторых животных, использовать в пищу различные растения и т.п. Среда содержит, таким образом, как опасные, так и полезные для человека объекты. Человек может осматривать местность, в которой он находится. В зависимости от своего состояния (голод, усталость, эмоциональная напряженность и т.п.) он выбирает на местности конкретную цель, т.е. такую точку или область местности, куда он хотел бы попасть, чтобы удовлетворить те или иные потребности (поесть, отдохнуть). Выбрав цель своего передвижения, субъект планирует деятельность, направленную на ее достижение. Основным элементом плана является маршрут движения к цели. Человек также выбирает и запоминает наиболее удобные ориентиры, с помощью которых он мог бы в дальнейшем контролировать соответствие запланированных и реальных результатов своих действий. Кроме того, он учитывает при планировании изменения собственного состояния, которые могут возникнуть в процессе движения. К ним относятся, например, появление голода, возрастание усталости, изменения эмоциональных состояний при встрече с неприятными ему объектами и др. Таким образом, вырабатываемый человеком план является многокомпонентным. В ходе планирования производится отбор наиболее привлекательных и доступных целей, а также оценка на основе внутренних критериев различных вариантов маршрута и выбор наилучшего из них.
Построив план, человек приступает к его выполнению, осуществляя реальные действия в среде. Действия, которые он может выполнять, направлены как на перемещения в среде (шаги, прыжки), так и на изменения самой среды. Так, человек может переносить с собой различные объекты (например, пищу), уничтожать некоторые из них, создавать себе временные убежища для отдыха или защиты от опасности.
При построении плана человек использует данные о среде, полученные в результате ее осмотра. В процессе осмотра он, однако, воспринимает лишь неполную информацию об окружающей его местности. Так, он может неверно оценивать расстояние до объектов и их взаимное расположение. Кроме того, чем дальше находится объект, тем хуже он виден, так что некоторые из них могут быть распознаны неверно. На точность узнавания объектов влияет также общее состояние человека. Поэтому, приступив к выполнению плана, он может обнаружить, что составил его не лучшим образом.
Отношение к различным объектам, их оценка зависят от общего состояния человека в момент осмотра, а также от отношения этих объектов к его цели и планам. Поэтому при осмотре местности и выборе маршрута движения человек зачастую принимает субъективные и не всегда наилучшие решения. При выполнении плана это также может привести к тому, что выбранный ранее маршрут движения окажется неудовлетворительным.
В результате всех этих обстоятельств реальные действия человека при достижении цели могут не соответствовать запланированным. Обнаружив отклонения от плана, человек может попытаться восстановить намеченную последовательность действий и построить даже вспомогательный план выхода на предусмотренный заранее маршрут. Он может также скорректировать первоначальный план, учитывая сложившуюся ситуацию. Возможен также и полный отказ от первоначального плана и построение его заново. Если оказывается, что трудности при достижении поставленной цели слишком велики или состояние человека существенно изменилось в процессе ее достижения, он может отказаться от данной цели и начать все сначала, выбрав другую цель.
Если некоторая конкретная цель достигнута, то человек выбирает новую цель, строит план ее достижения и вновь начинает выполнять этот план. Обычно человек не ограничивается стремлением к какой-нибудь единственной цели, а намечает некоторую их совокупность, упорядочивает ее и строит весьма сложные комбинированные планы, учитывая привлекательность и важность не только основной в данный момент цели, но и некоторой совокупности промежуточных целей и подцелей. В ходе реальной деятельности иерархия целей также может изменяться.
Таким образом, последовательно формулируя цели, планируя, выполняя и изменяя планы, человек организует в среде некоторое целенаправленное поведение, которое в дальнейшем будет условно называться ДВИГАТЕЛЬНЫМ.
В целостном двигательном поведении можно, опять-таки условно, выделить два основных вида деятельности. Один связан с формированием цели и планированием. Для этого вида деятельности характерно восприятие информации с больших участков среды и принятие решений на основе неполных данных. Важным элементом здесь является организация целенаправленного сбора информации: формирование процедуры осмотра среды, определение момента его окончания и т.п. Другим видом деятельности является выполнение плана.
При выполнении плана, как правило, информация воспринимается с меньших участков среды, чем при планировании (человек "смотрит под ноги"), и, соответственно, она более подробна и надежна. Эта информация используется для принятия решений и выполнения "элементарных" двигательных актов: пройти вперед, обойти опасность и т.п. На процесс принятия решений здесь, таким образом, оказывают влияние три основных фактора: информация о состоянии среды в непосредственной близости от человека, информация о выработанном ранее плане и информация о внутреннем состоянии субъекта действия. Интеграция и учет этих факторов при принятии решения и составляют основное содержание деятельности по выполнению плана.
Непосредственно взаимодействуя с объектами, человек узнает их свойства, изучает законы их поведения, формирует представление об их локализации на местности. Эти сведения он реализует впоследствии при принятии решений, так что в ходе выполнения плана им используется информация не только о той ситуации, в которой он находится в данный момент, но и данные об общих свойствах объектов и среды, полученные им ранее.
В процессе выполнения плана человек формирует также общие оценки как местности и содержащихся в ней объектов, так и качества сформированного им плана. На основе этих оценок он принимает решения и относительно выбора тех или иных конкретных действий, и относительно коррекции плана или отказа от него. Сформированные оценки такого рода используются также при последующем планировании.
Рассматривая двигательное поведение как сюжет моделирования, мы, соответственно, должны выбрать в качестве объекта моделирования ту совокупность процессов переработки информации мозгом человека, которая непосредственно формирует деятельность описанного типа. Тем самым объект моделирования существенно ограничивается. Посмотрим, удовлетворяет ли он после этого предъявляемым к нему требованиям.
Напомним, что основное требование к объекту моделирования сформулировано нами для того, чтобы обеспечить перспективность первых моделей будущей системы. В соответствии с этим требованием при выборе объекта моделирования предпочтение отдается тем информационным механизмам и программам, которые близки к основанию иерархии систем, управляющих человеческим поведением и, следовательно, определяют его наиболее общую структуру п характерные черты. Мы полагаем, что процессы, формирующие двигательное поведение, принадлежат именно такому классу. Основанием для этого мнения служат многие обстоятельства.
Нетрудно заметить, например, что поведение описанного типа присуще целому ряду представителей наиболее высокоорганизованных форм жизни - млекопитающим с хорошо развитой корой головного мозга. Это позволяет полагать, что аналогичными способностями обладали и те из приматов, эволюционное развитие которых привело к появлению вида Homo sapiens. Исследуя двигательное поведение, мы, таким образом, исследуем процессы, лежащие в основе разумного поведения человека. В пользу этого мнения свидетельствует также и то обстоятельство, что поведение описанного типа формируется на сравнительно ранних этапах развития ребенка ("двигательный интеллект" по Пиаже).
Хорошо известно также, что формирование "внутреннего плана" действий протекает путем интериоризации предметной деятельности, т.е. деятельности, связанной с непосредственным оперированием объектами внешнего мира. Именно деятельность такого рода является составной частью поведения описанного выше типа. Моделируя ее, мы, следовательно, создаем базу для построения более сложных моделей, представляющих процессы "внутреннего плана", непосредственно лежащие в основе абстрактного мышления.
Исследуя двигательное поведение, мы исследуем также ряд процессов, составляющих основу формирования речи, и создаем тем самым предпосылки для последующего воспроизведения в моделях вербального поведения человека. Естественно, в этом случае необходимо будет рассматривать коллективные формы деятельности людей. Однако каждый индивид такого коллектива должен обладать способностью к самостоятельной организации взаимодействия со средой - целеполаганию, планированию и т.п., т.е. к организации поведения описанного типа.
Приведенные примеры, число которых можно умножить, подтверждают наше мнение о том, что выбор двигательного поведения в качестве объекта моделирования на начальном этапе построения системы моделей, отображающих разумное поведение, является целесообразным. В то же время ясно, что воспроизведение в одной модели всех процессов, принимающих участие в формировании двигательного поведения (а среди них имеются столь сложные процессы, как распознавание образов, принятие решений, выработка стратегий поведения и т.д.), все еще является слишком трудной задачей. Необходимы, следовательно, дальнейшие упрощения. Выполняя их, мы будем стремиться сохранить соответствие общего характера моделируемой деятельности приведенному описанию.
ТРЕТЬЕ ОГРАНИЧЕНИЕ. Исключим из круга рассматриваемых нами процессов, формирующих двигательное поведение, процессы распознавания образов. Такое ограничение оказывается целесообразным, поскольку, с одной стороны, оно существенно упрощает задачу создания действующей модели, а с другой - не изменяет общую структуру моделируемой деятельности. Остановимся на этом подробнее.
Поясним прежде всего, каким именно образом можно исключить из рассмотрения процессы распознавания. Будем полагать (пока без специальных обоснований), что действующая модель человека, находящегося в определенной среде, реализуется в виде М-автомата. Пусть человек воспринимает некоторый объект среды и узнает его. В результате узнавания оказывается актуализированной, т.е. переходит в активное состояние, корковая информационная модель данного объекта. Этому, естественно, предшествуют некоторые процессы, протекающие в зрительном анализаторе человека и приводящие к активизации одной определенной информационной модели объекта из множества подобных моделей, имеющихся в коре.
Аналогичные процессы в М-автомате должны привести к возбуждению i-модели воспринимаемого объекта. Однако реализовать эти механизмы можно по-разному, в зависимости от имеющихся технических возможностей и целей моделирования. Если в нашу задачу не входит модельное исследование анализаторных процессов - а именно в этом и состоит вводимое ограничение,- то мы можем ограничиться воспроизведением в М-автомате не их самих, а лишь формируемого ими эффекта, т.е. возбуждения соответствующей воспринимаемому объекту i-модели. Для этого оказывается достаточным реализовать в М-автомате некоторый вспомогательный алгоритм, входной информацией для которого служат задаваемая заранее таблица соответствий между объектами среды и i-моделями М-сети, а также данные о наличии объекта в поле зрения автомата. Работа такого алгоритма состоит в увеличении возбужденности i-моделей объектов, находящихся в поле зрения, т.е. в отображении состояний среды в состояния М-сети. Подобный алгоритм, следовательно, позволяет представить в М-автомате эффект узнавания без воспроизведения соответствующих процессов в анализаторе. Ясно, что задача построения такого вспомогательного алгоритма неизмеримо проще, чем задача модельного воспроизведения анализаторных процессов.
Не следует полагать, что, вводя вспомогательный алгоритм, мы полностью отказываемся от воспроизведения процесса узнавания. Этот процесс является многоуровневым, и мы исключаем из рассмотрения только его анализаторный компонент. В поле нашего зрения остаются процессы классификации, предварительной подготовки узнавания (типа установочных), организации осмотра среды и т.п. В одном из вариантов модели нами рассмотрен случай, когда человек, а следовательно, и конструируемый автомат воспринимают объекты среды не как некоторые целостные образования, а как совокупности отдельных признаков. Здесь наше описание процессов узнавания опускается "на этаж ниже", и объектом моделирования в этом случае становятся программы узнавания объекта среды по неполным наборам его признаков. Каждый из таких признаков считается достаточно сложным (геометрическая конфигурация, наличие наперед заданных особенностей строения объекта, отсутствие последних и т.п.), и его распознавание выполняется вспомогательным алгоритмом. Подобному изучению процессов распознавания образов, с точки зрения обсуждаемой в этой книге гипотезы, посвящено специальное исследование. Полученные при этом результаты могут быть использованы при построении действующих моделей, так что вводимое нами ограничение не носит принципиального характера.
Посмотрим теперь, с какими последствиями связан отказ от воспроизведения в модели процессов распознавания образов. Прежде всего следует отметить, что в этом случае оказывается удобным реализовать действующую модель двигательного поведения в виде программы для ЦВМ. При этом нами учитывалось следующее обстоятельство. Теоретическая часть работ по моделированию включает в себя разработку и описание некоторого М-автомата, реализующего интересующие нас программы переработки информации. Разработанный М-автомат является, вообще говоря, абстрактной конструкцией, в которой зафиксированы правила построения и "принципиальная схема" определенной действующей модели. В каком виде будет представлена последняя - вопрос удобства. Если это, например, вычислительная система, то в процессе ее экспериментального исследования по сути дела совершенствуется и корректируется не эта именно система, а М-автомат, который она реализует. После отработки М-автомата в его вычислительном представлении мы можем, следовательно, обратиться к его реализации в виде технического устройства, учитывая при этом уже полученные данные о его свойствах. Вопрос о выборе средств реализации М-автомата является, таким образом, не принципиальным и может по-разному решаться на различных этапах исследования. К помощи ЦВМ мы обращаемся именно на этапе первоначального исследования модели двигательного поведения, руководствуясь соображениями удобства и относительной простоты реализации самой модели, а также учитывая различного рода ограничения, необходимые на этом этапе.
Приведенное рассуждение позволяет рассматривать комплекс программ, реализующих М-автомат, как вычислительную модель или действующий макет соответствующего технического устройства. Само это устройство может быть построено "в металле" при выполнении некоторых условий.
Одним из таких условий является разработка эффективных технических систем распознавания образов. Работы в этом направлении ведутся в настоящее время весьма активно. Полученные здесь результаты позволяют надеяться на успех в течение уже ближайшего десятилетия. Интересно, что, уделяя большое внимание проблеме распознавания образов, большинство исследователей недооценивает, а зачастую просто и не осознает принципиальной важности проблемы дальнейшего использования, проблемы "транспорта образов" в решающих системах "разумных машин". Между тем эта проблема отнюдь не менее сложна, чем собственно распознавание, и включает в себя целый ряд вопросов, требующих для своего решения глубокого изучения и осмысливания данных о принципах функционирования прототипа систем ИР - мозга человека. Целесообразно поэтому, одновременно с дальнейшим развитием работ по распознаванию образов, уделять достаточное внимание проблемам построения устройств, которые были бы в состоянии максимально эффективно использовать информацию, вырабатываемую подсистемами распознавания. Мы полагаем, что к устройствам именно такого типа принадлежат М-автоматы.
Другим условием, при выполнении которого физическая реализация модели двигательного поведения оказывается необходимой, является наличие достаточно важных в практическом отношении задач, решение которых может быть осуществлено с помощью модели. Для того чтобы охарактеризовать эти задачи, рассмотрим проектируемый нами М-автомат в качестве вычислительной модели управляющего устройства ("мозга") робота, предназначенного для сбора информации пли выполнения некоторых работ в естественной среде.
Исследования по созданию нескольких вариантов роботов такого типа в рамках проектов "Искусственный разум" проведены в Массачусетсом технологическом институте и Стенфордском университете (США). Существует также серия уже получивших применение роботов-"телехириков" (от греческого "удаленный" и "руки"), управление которыми осуществляется человеком. Опыт разработки и эксплуатации устройств такого типа показал, что одним из центральных вопросов при построении роботов является вопрос не о том, как выполнить то или иное, пусть даже весьма сложное действие, а о том, какое именно из всех возможных действий следует выполнять в той или иной из сложившихся ситуаций.
Речь идет, таким образом, о создании достаточно компактных и быстродействующих устройств, способных самостоятельно принимать решения в сложной изменяющейся обстановке. Задача построения эффективных устройств такого типа до настоящего времени полностью не решена. Ясно, что чем в большей степени развиты рецепторные устройства (в том числе и распознающие), которыми вооружены роботы, тем более разнообразное и гибкое поведение может формировать М-автомат, используемый в качестве "мозга" робота.
В соответствии с тем, что реализация М-автомата будет осуществляться программным способом, должна быть представлена в ЦВМ и среда, в которой находится автомат. Поскольку нашей основной задачей является моделирование двигательного поведения в естественных средах, представленная в ЦВМ "машинная" среда должна являться моделью (может быть, упрощенной) естественных сред некоторого класса. На вопросах определения такого класса мы остановимся позже.
Уточним теперь смысл некоторых из используемых нами терминов. В дальнейшем, говоря о машинной среде, будем иметь в виду реализованную с помощью ЦВМ модель некоторой естественной среды. Говоря об М-автомате, будем иметь в впду действующую модель субъекта, осуществляющего двигательное поведение. Говоря о модели двигательного поведения, будем иметь в виду систему, состоящую из М-автомата и машинной среды.
Программная реализация модели двигательного поведения накладывает определенные ограничения на ее сложность. Эти ограничения связаны с конечностью объема оперативной памяти ЦВМ. Усложнение модели предполагает увеличение разнообразия среды, в которой действует автомат, т.е. увеличение количества типов и общего числа содержащихся в ней объектов, а также числа i-моделей и связей М-сети автомата. Поскольку представление в ЦВМ объектов среды, их взаимного расположения, i-моделей и связей предполагает определенные затраты ресурсов машинной памяти, то усложнение модели влечет за собой увеличение объемов памяти. Если разрабатываемая модель оказывается настолько сложной, что для ее машинной реализации необходимо широко использовать долговременные запоминающие устройства, время записи и считывания информации с которых сравнительно велико, то оказывается большим в общее время работы ЦВМ, необходимое для исследования модели. Рост затрат машинного времени может сделать затруднительным или даже практически невозможным достаточно полное исследование модели. Поэтому сложность модели в целом ограничивается сверху объемом быстродействующей памяти ЦВМ, используемой при моделировании.
Принимая решение относительно программной реализации модели двигательного поведения, мы учитывали наличие ограничений такого рода. Предварительные расчеты показали, что современные вычислительные машины (были использованы ЦВМ М-220 и БЭСМ-6) обеспечивают возможность исследования моделей, сложность которых достаточна для достижения основных целей предпринимаемой работы.
...
Целостную разумную деятельность человека в настоящее время трудно представить какой-либо одной действующей моделью. При выборе объекта моделирования для первых моделей системы необходимо, следовательно, прибегать к ограничениям и упрощениям. К чему же мы должны стремиться при этом?
Способность человека к разумному поведению является результатом длительного процесса эволюционного развития вида. В ходе этого процесса последовательно формировались все более сложные уровни (этажи) управления приспособительным поведением. Появление новых управляющих систем, новых программ переработки информации мозгом обеспечивало усложнение и совершенствование форм взаимодействия человека со средой. При этом каждый новый уровень, новый механизм управления формировался на основе уже существующих, дополняя и корректируя их деятельность. В иерархии управляющих систем мозга существуют, следовательно, как сравнительно новые управляющие подсистемы, так и старые, определяющие, по-видимому, общие свойства и структуру "базовых" программ разумного поведения. Мы полагаем, что именно эти, исходные подсистемы и программы целесообразно моделировать в первую очередь. В этом случае дальнейшее развитие системы моделей, реализующей целостную деятельность, можно было бы организовать по аналогии с развитием управляющих систем мозга, опираясь на анализ этого развития и используя его в качестве прототипа. При рассмотрении иерархии управляющих систем необходимо, однако, учитывать следующее важное ограничение: мы не должны "опускаться слишком низко", поскольку разрабатываемые нами модели являются системами ИР и должны, следовательно, удовлетворять первому из сформулированных выше требований к таким системам, т.е. воспроизводить достаточно сложные виды человеческой деятельности.
ПЕРВОЕ ОГРАНИЧЕНИЕ. Руководствуясь приведенным выше рассуждением при выборе объекта моделирования, мы исключили из рассмотрения ряд видов разумной деятельности, воспроизведение которых является традиционной задачей ИР: решение формальных задач, доказательство теорем и т.п. Несмотря на очевидную важность проблемы, мы отказались также от моделирования вербальной деятельности человека, полагая, что решение этой задачи может быть получено в более полном виде и с меньшими затратами уже после модельного исследования более глубоких процессов, лежащих в основе речевого поведения. Соответственно, мы отказываемся от моделирования на первом этапе и социально обусловленных видов деятельности.
Объектом нашего рассмотрения являются, таким образом, процессы формирования поведения, связанного с непосредственным взаимодействием человека и естественной среды (в последнюю не включаются другие люди, общественные институты и т.п.). Именно процессы такого рода являются, по нашему мнению, тем исходным материалом, усложнение и совершенствование которого приводит к развитию высших форм разумной деятельности человека (труда, речи и т.п.). С другой стороны, сложность этих процессов весьма велика, и формируемая ими деятельность интуитивно расценивается как разумная.
ВТОРОЕ ОГРАНИЧЕНИЕ. Разнообразие форм взаимодействия человека с естественной средой огромно, и достаточно полное воспроизведение их в единой модели является слишком трудной задачей на начальных этапах построения системы моделей. Поэтому в дальнейшем мы будем рассматривать только такое поведение, которое связано с передвижением человека в естественной среде. Для того чтобы уточнить, что именно имеется в виду, приведем содержательное описание поведения интересующего нас типа, т.е. опишем "сюжет" моделирования.
Пусть некоторый человек (условный моделируемый субъект) находится в среде, представляющей собой естественную местность (можно представить лес, поле и т.п.), на которой имеются различные объекты. Мы условились уже, что не станем рассматривать взаимодействие человека с другими людьми и искусственно созданными предметами. Предположим, следовательно, что объектов такого рода среда не содержит. В ней находятся, однако, различные объекты естественного происхождения, которые могут вызывать у человека различное отношение к себе. Так, он может пугаться некоторых животных, использовать в пищу различные растения и т.п. Среда содержит, таким образом, как опасные, так и полезные для человека объекты. Человек может осматривать местность, в которой он находится. В зависимости от своего состояния (голод, усталость, эмоциональная напряженность и т.п.) он выбирает на местности конкретную цель, т.е. такую точку или область местности, куда он хотел бы попасть, чтобы удовлетворить те или иные потребности (поесть, отдохнуть). Выбрав цель своего передвижения, субъект планирует деятельность, направленную на ее достижение. Основным элементом плана является маршрут движения к цели. Человек также выбирает и запоминает наиболее удобные ориентиры, с помощью которых он мог бы в дальнейшем контролировать соответствие запланированных и реальных результатов своих действий. Кроме того, он учитывает при планировании изменения собственного состояния, которые могут возникнуть в процессе движения. К ним относятся, например, появление голода, возрастание усталости, изменения эмоциональных состояний при встрече с неприятными ему объектами и др. Таким образом, вырабатываемый человеком план является многокомпонентным. В ходе планирования производится отбор наиболее привлекательных и доступных целей, а также оценка на основе внутренних критериев различных вариантов маршрута и выбор наилучшего из них.
Построив план, человек приступает к его выполнению, осуществляя реальные действия в среде. Действия, которые он может выполнять, направлены как на перемещения в среде (шаги, прыжки), так и на изменения самой среды. Так, человек может переносить с собой различные объекты (например, пищу), уничтожать некоторые из них, создавать себе временные убежища для отдыха или защиты от опасности.
При построении плана человек использует данные о среде, полученные в результате ее осмотра. В процессе осмотра он, однако, воспринимает лишь неполную информацию об окружающей его местности. Так, он может неверно оценивать расстояние до объектов и их взаимное расположение. Кроме того, чем дальше находится объект, тем хуже он виден, так что некоторые из них могут быть распознаны неверно. На точность узнавания объектов влияет также общее состояние человека. Поэтому, приступив к выполнению плана, он может обнаружить, что составил его не лучшим образом.
Отношение к различным объектам, их оценка зависят от общего состояния человека в момент осмотра, а также от отношения этих объектов к его цели и планам. Поэтому при осмотре местности и выборе маршрута движения человек зачастую принимает субъективные и не всегда наилучшие решения. При выполнении плана это также может привести к тому, что выбранный ранее маршрут движения окажется неудовлетворительным.
В результате всех этих обстоятельств реальные действия человека при достижении цели могут не соответствовать запланированным. Обнаружив отклонения от плана, человек может попытаться восстановить намеченную последовательность действий и построить даже вспомогательный план выхода на предусмотренный заранее маршрут. Он может также скорректировать первоначальный план, учитывая сложившуюся ситуацию. Возможен также и полный отказ от первоначального плана и построение его заново. Если оказывается, что трудности при достижении поставленной цели слишком велики или состояние человека существенно изменилось в процессе ее достижения, он может отказаться от данной цели и начать все сначала, выбрав другую цель.
Если некоторая конкретная цель достигнута, то человек выбирает новую цель, строит план ее достижения и вновь начинает выполнять этот план. Обычно человек не ограничивается стремлением к какой-нибудь единственной цели, а намечает некоторую их совокупность, упорядочивает ее и строит весьма сложные комбинированные планы, учитывая привлекательность и важность не только основной в данный момент цели, но и некоторой совокупности промежуточных целей и подцелей. В ходе реальной деятельности иерархия целей также может изменяться.
Таким образом, последовательно формулируя цели, планируя, выполняя и изменяя планы, человек организует в среде некоторое целенаправленное поведение, которое в дальнейшем будет условно называться ДВИГАТЕЛЬНЫМ.
В целостном двигательном поведении можно, опять-таки условно, выделить два основных вида деятельности. Один связан с формированием цели и планированием. Для этого вида деятельности характерно восприятие информации с больших участков среды и принятие решений на основе неполных данных. Важным элементом здесь является организация целенаправленного сбора информации: формирование процедуры осмотра среды, определение момента его окончания и т.п. Другим видом деятельности является выполнение плана.
При выполнении плана, как правило, информация воспринимается с меньших участков среды, чем при планировании (человек "смотрит под ноги"), и, соответственно, она более подробна и надежна. Эта информация используется для принятия решений и выполнения "элементарных" двигательных актов: пройти вперед, обойти опасность и т.п. На процесс принятия решений здесь, таким образом, оказывают влияние три основных фактора: информация о состоянии среды в непосредственной близости от человека, информация о выработанном ранее плане и информация о внутреннем состоянии субъекта действия. Интеграция и учет этих факторов при принятии решения и составляют основное содержание деятельности по выполнению плана.
Непосредственно взаимодействуя с объектами, человек узнает их свойства, изучает законы их поведения, формирует представление об их локализации на местности. Эти сведения он реализует впоследствии при принятии решений, так что в ходе выполнения плана им используется информация не только о той ситуации, в которой он находится в данный момент, но и данные об общих свойствах объектов и среды, полученные им ранее.
В процессе выполнения плана человек формирует также общие оценки как местности и содержащихся в ней объектов, так и качества сформированного им плана. На основе этих оценок он принимает решения и относительно выбора тех или иных конкретных действий, и относительно коррекции плана или отказа от него. Сформированные оценки такого рода используются также при последующем планировании.
Рассматривая двигательное поведение как сюжет моделирования, мы, соответственно, должны выбрать в качестве объекта моделирования ту совокупность процессов переработки информации мозгом человека, которая непосредственно формирует деятельность описанного типа. Тем самым объект моделирования существенно ограничивается. Посмотрим, удовлетворяет ли он после этого предъявляемым к нему требованиям.
Напомним, что основное требование к объекту моделирования сформулировано нами для того, чтобы обеспечить перспективность первых моделей будущей системы. В соответствии с этим требованием при выборе объекта моделирования предпочтение отдается тем информационным механизмам и программам, которые близки к основанию иерархии систем, управляющих человеческим поведением и, следовательно, определяют его наиболее общую структуру п характерные черты. Мы полагаем, что процессы, формирующие двигательное поведение, принадлежат именно такому классу. Основанием для этого мнения служат многие обстоятельства.
Нетрудно заметить, например, что поведение описанного типа присуще целому ряду представителей наиболее высокоорганизованных форм жизни - млекопитающим с хорошо развитой корой головного мозга. Это позволяет полагать, что аналогичными способностями обладали и те из приматов, эволюционное развитие которых привело к появлению вида Homo sapiens. Исследуя двигательное поведение, мы, таким образом, исследуем процессы, лежащие в основе разумного поведения человека. В пользу этого мнения свидетельствует также и то обстоятельство, что поведение описанного типа формируется на сравнительно ранних этапах развития ребенка ("двигательный интеллект" по Пиаже).
Хорошо известно также, что формирование "внутреннего плана" действий протекает путем интериоризации предметной деятельности, т.е. деятельности, связанной с непосредственным оперированием объектами внешнего мира. Именно деятельность такого рода является составной частью поведения описанного выше типа. Моделируя ее, мы, следовательно, создаем базу для построения более сложных моделей, представляющих процессы "внутреннего плана", непосредственно лежащие в основе абстрактного мышления.
Исследуя двигательное поведение, мы исследуем также ряд процессов, составляющих основу формирования речи, и создаем тем самым предпосылки для последующего воспроизведения в моделях вербального поведения человека. Естественно, в этом случае необходимо будет рассматривать коллективные формы деятельности людей. Однако каждый индивид такого коллектива должен обладать способностью к самостоятельной организации взаимодействия со средой - целеполаганию, планированию и т.п., т.е. к организации поведения описанного типа.
Приведенные примеры, число которых можно умножить, подтверждают наше мнение о том, что выбор двигательного поведения в качестве объекта моделирования на начальном этапе построения системы моделей, отображающих разумное поведение, является целесообразным. В то же время ясно, что воспроизведение в одной модели всех процессов, принимающих участие в формировании двигательного поведения (а среди них имеются столь сложные процессы, как распознавание образов, принятие решений, выработка стратегий поведения и т.д.), все еще является слишком трудной задачей. Необходимы, следовательно, дальнейшие упрощения. Выполняя их, мы будем стремиться сохранить соответствие общего характера моделируемой деятельности приведенному описанию.
ТРЕТЬЕ ОГРАНИЧЕНИЕ. Исключим из круга рассматриваемых нами процессов, формирующих двигательное поведение, процессы распознавания образов. Такое ограничение оказывается целесообразным, поскольку, с одной стороны, оно существенно упрощает задачу создания действующей модели, а с другой - не изменяет общую структуру моделируемой деятельности. Остановимся на этом подробнее.
Поясним прежде всего, каким именно образом можно исключить из рассмотрения процессы распознавания. Будем полагать (пока без специальных обоснований), что действующая модель человека, находящегося в определенной среде, реализуется в виде М-автомата. Пусть человек воспринимает некоторый объект среды и узнает его. В результате узнавания оказывается актуализированной, т.е. переходит в активное состояние, корковая информационная модель данного объекта. Этому, естественно, предшествуют некоторые процессы, протекающие в зрительном анализаторе человека и приводящие к активизации одной определенной информационной модели объекта из множества подобных моделей, имеющихся в коре.
Аналогичные процессы в М-автомате должны привести к возбуждению i-модели воспринимаемого объекта. Однако реализовать эти механизмы можно по-разному, в зависимости от имеющихся технических возможностей и целей моделирования. Если в нашу задачу не входит модельное исследование анализаторных процессов - а именно в этом и состоит вводимое ограничение,- то мы можем ограничиться воспроизведением в М-автомате не их самих, а лишь формируемого ими эффекта, т.е. возбуждения соответствующей воспринимаемому объекту i-модели. Для этого оказывается достаточным реализовать в М-автомате некоторый вспомогательный алгоритм, входной информацией для которого служат задаваемая заранее таблица соответствий между объектами среды и i-моделями М-сети, а также данные о наличии объекта в поле зрения автомата. Работа такого алгоритма состоит в увеличении возбужденности i-моделей объектов, находящихся в поле зрения, т.е. в отображении состояний среды в состояния М-сети. Подобный алгоритм, следовательно, позволяет представить в М-автомате эффект узнавания без воспроизведения соответствующих процессов в анализаторе. Ясно, что задача построения такого вспомогательного алгоритма неизмеримо проще, чем задача модельного воспроизведения анализаторных процессов.
Не следует полагать, что, вводя вспомогательный алгоритм, мы полностью отказываемся от воспроизведения процесса узнавания. Этот процесс является многоуровневым, и мы исключаем из рассмотрения только его анализаторный компонент. В поле нашего зрения остаются процессы классификации, предварительной подготовки узнавания (типа установочных), организации осмотра среды и т.п. В одном из вариантов модели нами рассмотрен случай, когда человек, а следовательно, и конструируемый автомат воспринимают объекты среды не как некоторые целостные образования, а как совокупности отдельных признаков. Здесь наше описание процессов узнавания опускается "на этаж ниже", и объектом моделирования в этом случае становятся программы узнавания объекта среды по неполным наборам его признаков. Каждый из таких признаков считается достаточно сложным (геометрическая конфигурация, наличие наперед заданных особенностей строения объекта, отсутствие последних и т.п.), и его распознавание выполняется вспомогательным алгоритмом. Подобному изучению процессов распознавания образов, с точки зрения обсуждаемой в этой книге гипотезы, посвящено специальное исследование. Полученные при этом результаты могут быть использованы при построении действующих моделей, так что вводимое нами ограничение не носит принципиального характера.
Посмотрим теперь, с какими последствиями связан отказ от воспроизведения в модели процессов распознавания образов. Прежде всего следует отметить, что в этом случае оказывается удобным реализовать действующую модель двигательного поведения в виде программы для ЦВМ. При этом нами учитывалось следующее обстоятельство. Теоретическая часть работ по моделированию включает в себя разработку и описание некоторого М-автомата, реализующего интересующие нас программы переработки информации. Разработанный М-автомат является, вообще говоря, абстрактной конструкцией, в которой зафиксированы правила построения и "принципиальная схема" определенной действующей модели. В каком виде будет представлена последняя - вопрос удобства. Если это, например, вычислительная система, то в процессе ее экспериментального исследования по сути дела совершенствуется и корректируется не эта именно система, а М-автомат, который она реализует. После отработки М-автомата в его вычислительном представлении мы можем, следовательно, обратиться к его реализации в виде технического устройства, учитывая при этом уже полученные данные о его свойствах. Вопрос о выборе средств реализации М-автомата является, таким образом, не принципиальным и может по-разному решаться на различных этапах исследования. К помощи ЦВМ мы обращаемся именно на этапе первоначального исследования модели двигательного поведения, руководствуясь соображениями удобства и относительной простоты реализации самой модели, а также учитывая различного рода ограничения, необходимые на этом этапе.
Приведенное рассуждение позволяет рассматривать комплекс программ, реализующих М-автомат, как вычислительную модель или действующий макет соответствующего технического устройства. Само это устройство может быть построено "в металле" при выполнении некоторых условий.
Одним из таких условий является разработка эффективных технических систем распознавания образов. Работы в этом направлении ведутся в настоящее время весьма активно. Полученные здесь результаты позволяют надеяться на успех в течение уже ближайшего десятилетия. Интересно, что, уделяя большое внимание проблеме распознавания образов, большинство исследователей недооценивает, а зачастую просто и не осознает принципиальной важности проблемы дальнейшего использования, проблемы "транспорта образов" в решающих системах "разумных машин". Между тем эта проблема отнюдь не менее сложна, чем собственно распознавание, и включает в себя целый ряд вопросов, требующих для своего решения глубокого изучения и осмысливания данных о принципах функционирования прототипа систем ИР - мозга человека. Целесообразно поэтому, одновременно с дальнейшим развитием работ по распознаванию образов, уделять достаточное внимание проблемам построения устройств, которые были бы в состоянии максимально эффективно использовать информацию, вырабатываемую подсистемами распознавания. Мы полагаем, что к устройствам именно такого типа принадлежат М-автоматы.
Другим условием, при выполнении которого физическая реализация модели двигательного поведения оказывается необходимой, является наличие достаточно важных в практическом отношении задач, решение которых может быть осуществлено с помощью модели. Для того чтобы охарактеризовать эти задачи, рассмотрим проектируемый нами М-автомат в качестве вычислительной модели управляющего устройства ("мозга") робота, предназначенного для сбора информации пли выполнения некоторых работ в естественной среде.
Исследования по созданию нескольких вариантов роботов такого типа в рамках проектов "Искусственный разум" проведены в Массачусетсом технологическом институте и Стенфордском университете (США). Существует также серия уже получивших применение роботов-"телехириков" (от греческого "удаленный" и "руки"), управление которыми осуществляется человеком. Опыт разработки и эксплуатации устройств такого типа показал, что одним из центральных вопросов при построении роботов является вопрос не о том, как выполнить то или иное, пусть даже весьма сложное действие, а о том, какое именно из всех возможных действий следует выполнять в той или иной из сложившихся ситуаций.
Речь идет, таким образом, о создании достаточно компактных и быстродействующих устройств, способных самостоятельно принимать решения в сложной изменяющейся обстановке. Задача построения эффективных устройств такого типа до настоящего времени полностью не решена. Ясно, что чем в большей степени развиты рецепторные устройства (в том числе и распознающие), которыми вооружены роботы, тем более разнообразное и гибкое поведение может формировать М-автомат, используемый в качестве "мозга" робота.
В соответствии с тем, что реализация М-автомата будет осуществляться программным способом, должна быть представлена в ЦВМ и среда, в которой находится автомат. Поскольку нашей основной задачей является моделирование двигательного поведения в естественных средах, представленная в ЦВМ "машинная" среда должна являться моделью (может быть, упрощенной) естественных сред некоторого класса. На вопросах определения такого класса мы остановимся позже.
Уточним теперь смысл некоторых из используемых нами терминов. В дальнейшем, говоря о машинной среде, будем иметь в виду реализованную с помощью ЦВМ модель некоторой естественной среды. Говоря об М-автомате, будем иметь в впду действующую модель субъекта, осуществляющего двигательное поведение. Говоря о модели двигательного поведения, будем иметь в виду систему, состоящую из М-автомата и машинной среды.
Программная реализация модели двигательного поведения накладывает определенные ограничения на ее сложность. Эти ограничения связаны с конечностью объема оперативной памяти ЦВМ. Усложнение модели предполагает увеличение разнообразия среды, в которой действует автомат, т.е. увеличение количества типов и общего числа содержащихся в ней объектов, а также числа i-моделей и связей М-сети автомата. Поскольку представление в ЦВМ объектов среды, их взаимного расположения, i-моделей и связей предполагает определенные затраты ресурсов машинной памяти, то усложнение модели влечет за собой увеличение объемов памяти. Если разрабатываемая модель оказывается настолько сложной, что для ее машинной реализации необходимо широко использовать долговременные запоминающие устройства, время записи и считывания информации с которых сравнительно велико, то оказывается большим в общее время работы ЦВМ, необходимое для исследования модели. Рост затрат машинного времени может сделать затруднительным или даже практически невозможным достаточно полное исследование модели. Поэтому сложность модели в целом ограничивается сверху объемом быстродействующей памяти ЦВМ, используемой при моделировании.
Принимая решение относительно программной реализации модели двигательного поведения, мы учитывали наличие ограничений такого рода. Предварительные расчеты показали, что современные вычислительные машины (были использованы ЦВМ М-220 и БЭСМ-6) обеспечивают возможность исследования моделей, сложность которых достаточна для достижения основных целей предпринимаемой работы.
...
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
Использование в модели двигательного поведения вспомогательного "распознающего" алгоритма, для работы которого необходимо заранее установить и зафиксировать на все время исследования определенное соответствие между объектами среды и некоторыми из i-моделей М-сети, накладывает определенные ограничения на допустимое разнообразие среды, представляемой в модели. Действительно, каждому типу объекта ставится в соответствие определенная i-модель. С увеличением разнообразия среды, т.е. с введением новых типов объектов, растет и число соответствующих им i-моделей. При этом, естественно, увеличивается и используемый объем машинной памяти. Рост же последнего, как уже отмечалось, лимитирован. Ограничение может быть существенным образом ослаблено, если объекты среды задаются с помощью конечного набора признаков. В этом случае также каждому из признаков ставится в соответствие своя i-модель, но общее число признаков здесь может быть невелико, в то время как количество задаваемых с их помощью типов объектов может оказаться весьма большим. Использование такого приема задания объектов предполагает, правда, включение в М-сеть некоторого числа дополнительных i-моделей и связей, реализующих операции обработки воспринятых признаков. Этот прием оказывается целесообразным в тех случаях, когда мы стремимся к заданию среды, обладающей весьма значительным разнообразием.
Использование в модели вспомогательного "распознающего" алгоритма приводит также к еще одному существенному ограничению. Оно состоит в том, что М-автомат, применяющий этот алгоритм, не может "воспринять" нового, т.е. не включенного заранее в таблицу соответствий, объекта. Для такого объекта в М-сети просто не существует отдельной i-модели, а следовательно, такой объект не существует для М-автомата. Итак, мы вынуждены отказаться от исследования (в рамках избранного сюжета моделирования) процессов, связанных с формированием человеком образов незнакомых объектов.
Как и в предыдущем случае, указанное ограничение частично снимается, если задавать объекты с помощью наборов отдельных признаков. Здесь автомат "не видит" только новые признаки, но если среди признаков объекта имеются хотя бы некоторые из "известных" автомату, то такой объект может быть воспринят и опознан по неполному набору признаков.
Обсуждаемое ограничение не является, вообще говоря, обязательным или непреодолимым при моделировании с помощью М-сетей. В самом деле, как упоминалось выше, одним из механизмов самоорганизации в М-автоматах является механизм формирования новых i-моделей сети, так что каждая из них может формироваться как отображение нового объекта или признака. Не связано с принципиальными затруднениями и построение специального алгоритма, дополняющего и корректирующего таблицу соответствий, используемую алгоритмом "распознавания". Таким образом, моделирование программ формирования новых образов возможно и в рамках выбранного сюжета. Мы, однако, отказываемся от воспроизведения программ такого типа в нашей модели и делаем это именно с целью упрощения сюжета моделирования. Основанием для такого упрощения служит то обстоятельство, что упомянутые программы, будучи, вообще говоря, весьма важными и интересными, не принимают обязательного и постоянного участия в процессах планирования, принятия решений и т.п. Смысл вводимого ограничения состоит, таким образом, в следующем. Будем полагать, что все объекты среды, в которой организует двигательное поведение наш условный субъект, известны ему и могут быть правильно опознаны им, если будут восприняты.
Программная реализация модели двигательного поведения предполагает, естественно, программную же реализацию и эффекторных систем М-автомата. Под эффекторными здесь следует понимать такие системы, которые непосредственно реализуют воздействия автомата на среду. Если бы М-автомат выполнялся в виде технического устройства, такие системы были бы представлены теми или иными его движителями (колесами, гусеницами и т.п.) и манипуляторами. При программной же реализации будем представлять их некоторыми вспомогательными алгоритмами, которые запускаются при принятии М-автоматом решения о выполнении определенного действия и в ходе своей работы моделируют это действие, производя перемещения автомата в среде или осуществляя в последней соответствующие изменения.
В общем случае управление эффекторными системами является многоуровневым, так что М-сеть автомата должна содержать i-модели "элементарных" действий (соответствующих, например, сокращению различных мышц двигательного аппарата человека), i-модели более сложных двигательных актов и программ, предполагающих упорядоченное выполнение "элементарных" действии (например, сгибание руки), а также i-модели "идей" различных действий и поступков (сделать шаг, взять, напасть и т.п.). В целях упрощения разработки будем включать в М-сеть нашего автомата только i-модели последнего типа, т.е. i-модели достаточно сложных действий, реализуя с помощью вспомогательных "эффекторных" алгоритмов как их конечный результат (изменения положения автомата в среде и самой среды), так и соответствующие им изменения внутреннего состояния автомата.
ЧЕТВЕРТОЕ ОГРАНИЧЕНИЕ. Упрощения, которые мы сейчас рассмотрим, возникают при переходе от описания естественной среды к конструктивному заданию машинной среды.
Для начала представим себе машинную среду в виде карты той местности, на которой находится наш условный субъект. На такую карту могут быть нанесены обозначения различных объектов среды. В зависимости от масштаба карты, т.е. от уровня описания среды, может изменяться и содержание понятия "объект среды". Так, при одном масштабе в качестве целостного, неделимого объекта, внутренняя структура которого нас не интересует, может выступать, к примеру, имеющийся в среде лес. На карте в этом случае могут быть сделаны пометки, обозначающие общие характеристики такого объекта: "лес труднопроходимый", "здесь водятся опасные звери" и т.п. При другом, более крупном масштабе объектом может стать уже отдельное дерево, а пометки будут обозначать его свойства: "дерево высокое", "имеются съедобные плоды" и т.п. Очевидно, использование карт того или иного масштаба зависит от целей описания среды, т.е., в нашем случае, от степени подробности, с которой мы намерены описывать и воспроизводить в моделях феномены двигательного поведения.
В процессе работы с М-автоматом может возникать необходимость использовать различные среды. Особенно часто это происходит при решении всякого рода прикладных задач. Так, одна и та же модель, способная строить планы и принимать решения, может применяться в одном случае для выбора, например, трассы многокилометрового трубопровода, а в другом - для автоматического управления передвижением электрокара по территории заводского цеха. Поэтому желательно разработать такой способ задания машинной среды, который служил бы по мере необходимости в качестве модели разных естественных сред, описанных с разной степенью подробности. Будем представлять машинную среду в виде совокупности одинаковых квадратных клеток, регулярно расположенных на плоскости (как клетки шахматной доски). Такая совокупность клеток составляет "пространство", в котором будет действовать автомат, и является "заготовкой" карты местности. Для того чтобы построить последнюю, необходимо внести в соответствующие клетки знаки тех или иных объектов и их характеристик.
Условимся, что в одну клетку машинной среды может быть внесено не более одного знака объекта. Таким образом, клетка оказывается "элементарной" единицей автоматного пространства. Кроме знака объекта, в клетку среды могут быть внесены некоторые дополнительные знаки, характеризующие уже не отдельный объект, а общее состояние данного участка среды. Знаки такого рода могут указывать, например, высоту данного участка относительно некоторого условного уровня, его температуру, освещенность и т.п.
Таким образом, располагая в клетках определенные знаки, мы задаем среду, в которой предстоит действовать автомату. Совокупность упомянутых знаков содержит информацию, исходную для модели двигательного поведения. Это означает, что при исследовании модели имеется возможность "помещать" ее в среды различной сложности, содержащие различные объекты, т.е. организовывать те или иные условные экспериментальные ситуации в зависимости от целей исследования. С другой стороны, варьируя набор и размещение используемых знаков, можно приводить машинную среду в определенное соответствие с различными естественными средами, т.е. моделировать их.
На этапе наладки и исследования основных свойств модели двигательного поведения разнообразие знаков, используемых для задания различных вариантов машинной среды, может быть ограничено. Такой ограниченный набор знаков определяет конкретную содержательную интерпретацию процессов в модели и будет подробно описан при обсуждении каждого из ее вариантов. В самых общих чертах содержательная характеристика используемых в дальнейшем сред состоит в следующем.
Рассмотрим среды, содержащие условные объекты, "полезные" и "опасные" для автомата. Этим объектам даны определенные названия, например: "пища", "зверь", "убежище". Для того чтобы иметь возможность широко варьировать разнообразие и сложность задач, решаемых автоматом в среде, будем считать, что существуют однотипные объекты, в разной степени полезные или опасные для него. Так, можно различать более или менее опасных "зверей". Каждому объекту приписаны определенные свойства. Столкновение со "зверем", например, вызывает у автомата "боль".
Это, безусловно, не означает, что разрабатываемые модели могут использоваться только для решения условных задач. Выбор относительно простой и интуитивно понятной содержательной интерпретации объектов среды ("зверь", "пища" и т.п.) обусловлен только удобством моделирования. В самом деле, принимая такую интерпретацию, мы получаем возможность использовать при задании внутренней организации автомата богатый индивидуальный опыт людей, а также различного рода наблюдения, правдоподобные рассуждения, аналогии, описания, имеющиеся в художественной и психологической литературе, и т.п. Практическое же использование моделей, как уже упоминалось, обеспечивается возможностью приведения машинных сред к виду, соответствующему различным по составу и сложности естественным средам.
Следует отметить, что представление машинной среды в виде совокупности отдельных клеток является частным случаем задания сред с помощью более общих методов, например графов. Практическое использование этих методов при моделировании двигательного поведения было бы, однако, менее наглядным, так что по соображениям простоты и удобства "клеточное" задание представляется более целесообразным. Что же касается возможностей соотнесения "клеточной" среды с естественной, то они оказываются достаточно гибкими, поскольку каждой отдельной клетке можно поставить в соответствие участки естественной среды различных (в зависимости от целей исследования) размеров, в том числе и весьма малых. В предельных случаях "клеточная" среда может обеспечить практически непрерывное описание естественной.
Дальнейшее упрощение работ связано с введением еще одного ограничения. Оно состоит в следующем. Будем считать, что однажды заданная машинная среда в процессе проведения эксперимента с моделью остается неизменной, если не считать тех изменений, которые вносятся в нее работой автомата (например, при выполнении им действий типа "переместить объект"). Иначе говоря, будем считать среду статической. Это означает, что объекты машинной среды не обладают собственной активностью, т.е. не могут самостоятельно перемещаться в среде, взаимодействовать, выполнять какие-либо действия, направленные на автомат, и т.п. Все особенности того или иного объекта, определяющие характер его "физического" взаимодействия с автоматом, задаются при этом путем предварительного перечисления свойств объекта, вносимых в среду при ее задании в виде набора специальных знаков.
Приведем пример. Одно из свойств объекта "зверь" состоит в том, что он вызывает у автомата "боль", если оба они оказываются в одной клетке среды. Содержательно это может, например, обозначать, что зверь нападает на нашего условного субъекта. Упрощение, по существу, состоит в предположении о том, что зверь нападает на субъекта всегда, если только они оказываются достаточно близко. Следовательно, можно не представлять в модели ни процессы принятия решений зверем, ни его двигательную активность. Достаточно лишь смоделировать конечный результат нападения - возникновение боли у субъекта. А для этого достаточно считать способность вызывать боль постоянным свойством зверя и при задании машинной среды всегда помечать соответствующим знаком клетку, в которой находится объект "зверь". Аналогичным образом определяются и другие свойства объекта "зверь", а также свойства остальных объектов машинной среды.
При соотнесении машинной среды определенной естественной среде обсуждаемое ограничение выступает в виде предположения о том, что объекты естественной среды либо вообще не являются активными, либо их активность ограничена таким участком среды, который соответствует одной клетке машинной модели. Можно считать, например, что тот же зверь способен перемещаться в пределах ограниченного участка местности и встреча его с условным субъектом происходит всегда, если только последний при своих передвижениях по местности пересекает соответствующий ее участок.
Следует подчеркнуть, что свойство статичности среды сохраняется лишь в рамках одного, отдельно взятого, эксперимента. При постановке ряда экспериментов с моделью машинная среда может всякий раз задаваться по-новому.
Использование статических сред позволяет нам не воспроизводить при моделировании тех программ переработки информации, которые непосредственно связаны со способностью человека к решению задач экстраполяции. В полной мере это упрощение относится к программам сознания в той их части, которая обеспечивает ориентировку человека во времени. Соответственно, при реализации модели двигательного поведения с помощью необучающегося М-автомата способности к экстраполяции представлены в ней не будут. Такой автомат может, вообще говоря, организовывать поведение и в динамической среде, однако принимаемые им решения будут основываться лишь на анализе данных одномоментных восприятий ее состояния. Иначе говоря, необучающийся М-автомат будет воспринимать динамическую среду как дискретную последовательность статических сред. При этом он окажется не в состоянии выделить общие закономерности происходящих изменений и, следовательно, не сможет использовать их при планировании и принятии решений. При использовании М-автомата с обучением и самоорганизацией дело обстоит несколько иначе. В этом случае автомат также не содержит специальных i-моделей и функциональных структур, обеспечивающих функцию предсказания. Однако в процессе его самоорганизации элементы такого рода могут быть сформированы. В дальнейшем эта возможность будет проиллюстрирована экспериментальным исследованием процесса повторения последовательностей М-автоматом. Значение этого примера состоит в том, что способность к повторению последовательности предполагает наличие в автомате внутренней информационной модели соответствующего временного процесса. С другой стороны, существование такой модели является необходимым условием также и любого предсказания. Следовательно, определенные возможности воспроизведения программ ориентировки во времени возникают при использовании М-автоматов даже без специальной предорганизации. Можно полагать, таким образом, что поведение обучающихся М-автоматов в динамических средах будет отличаться от поведения необучающихся, являясь более "разумным". Последовательным изучением этого вопроса мы, однако, не занимались, ограничиваясь на начальных этапах моделирования изучением основных свойств М-автоматов, проявляющихся при их функционировании в сравнительно простых статических средах.
ОКОНЧАТЕЛЬНЫЙ ВАРИАНТ МОДЕЛИ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ. Итак, после всех введенных ограничений окончательный вариант модели двигательного поведения может быть кратко описан следующим образом.
Модель выполняется в виде программы для ЦВМ и содержит две подсистемы: машинную среду и М-автомат. Машинная среда является статической и задается в виде упорядоченной совокупности клеток, каждая из которых может быть либо пустой, либо содержать в себе один из объектов, в различной степени "полезных" или "опасных" для автомата. Машинная среда может являться моделью некоторых естественных сред.
М-автомат является моделью некоторого (условного) субъекта, осуществляющего двигательное поведение в естественной среде, соответствующей машинной. М-сеть автомата предварительно организована и содержит i-модели объектов, которые имеются в среде, i-модели действий, которые он может выполнить, а также i-модели, соответствующие различным образам, понятиям, чувствам, эмоциям и желаниям моделируемого субъекта.
В каждый момент дискретного времени автомат находится в одной из клеток среды и может производить ее "осмотр". "Поле зрения" автомата (количество одновременно рассматриваемых клеток среды) ограничено. В процессе осмотра автомат перемещает поле зрения по клеткам среды, причем воспринимает тем меньше признаков объектов, чем они дальше от него.
На основе данных осмотра автомат намечает цель (клетку или совокупность клеток среды), достижение которой позволит удовлетворить его стремление к пище, отдыху, безопасности и т.п. Автомат может формировать также иерархии целей. Затем он строит планы достижения целей и принимает решение о выполнении того из них, который наиболее полно удовлетворяет ряду формируемых автоматом критериев. В качестве критериев могут выступать безопасность маршрута, его длина и т.п.
Построив план, автомат приступает к его выполнению, передвигаясь из одной клетки среды в другую. При этом считается, что поле его зрения ограничено клетками, соседними с той, в которой он находится в каждый данный момент. В процессе передвижения автомат принимает решения о выполнении в каждый момент одного из возможных действий, а также о коррекции или полной перестройке имеющегося плана.
Передвигаясь в среде, автомат стремится избегать опасных объектов, чередует движение и отдых, удовлетворяет голод, преодолевает препятствия и т.п. Автомат способен использовать собственный прошлый опыт. Мотивом его деятельности служит задаваемое ему изначально стремление к самосохранению.
В различных вариантах модели двигательного поведения описанный сюжет представлен с различной степенью полноты.
Из приведенного описания следует, что функции, реализуемые автоматом, могут быть отнесены к таким основным видам проявлений разумной деятельности: направленное восприятие, целеполагание и планирование, принятие решений при организации конкретных действий в среде.
В автомате воспроизводятся следующие из основных программ переработки информации мозгом человека (изложение ведется в соответствии с разработкой этого вопроса, данной в предыдущей работе).
1. Программа восприятия внешней информации. В автомате эта программа представлена такими подпрограммами: настройка анализаторов (при организации осмотра среды), узнавание (возбуждение i-моделей объектов, если восприняты их признаки, а также возбуждение i-моделей понятий более высокого уровня, если восприняты объекты); запоминания (формирование новых i-моделей и связей в М-сети, а также формирование внутренней модели среды); вспоминания (выделение СУТ i-моделей отдельных образов объектов, их совокупностей и последовательностей, а также понятий различных уровней); предвидения (формирование "цепочек" i-моделей, отражающих последовательности воспринимаемых событий, и влияние возбуждения таких "цепочек" на процессы в сети).
2. Программа чувств. Представлена в автомате процессами возбуждения i-моделей чувств "от тела": передачей возбуждения между i-моделями чувств и i-моделями образов, понятий, желаний и действий, что составляет "эмоциональный" компонент процесса переработки информации М-сетью; установлением новых связей между i-моделями чувств и другими i-моделями сети. Основные подпрограммы этой программы связаны с инстинктами и сложными рефлексами. В автомате представлен инстинкт самосохранения с его подпрограммами защиты и питания. Из подпрограмм, соответствующих сложным рефлексам, представлены рефлекс цели, обеспечивающий общую направленность деятельности автомата, рефлекс свободы, организующий деятельность автомата по преодолению имеющихся в среде препятствий и ограничений, и рефлекс любопытства, определяющий структуру процессов осмотра среды.
3. Программа действий. Представлена в автомате совокупностью простых безусловных рефлексов и подпрограмм: связывания (формирование условных рефлексов), предвидения (формирование плана), контроля действий (функционирование во время выполнения плана следящих систем "по чувствам" и "по результатам"), многоуровневого анализа вариантов (наличие в М-сети i-моделей действий различной степени общности - от "идей" до "элементарных" действий и связь этих i-моделей с другими); построение планов разных уровней.
4. Программа сознания. Представлена в автомате подпрограммами внимания (СУТ), ориентирования в пространстве (построение и использование внутренней модели среды), волевого действия (наличие i-моделей желаний, чувств и действий, построение плана и выполнение его с преодолением препятствий, а также автономный выбор цели, построение иерархии целей и последующие изменения их), отделения реального и нереального (при обращении к внутренней модели среды и планировании), моделирования собственных действий (при планировании).
Упомянутые программы имеют следующие общие черты: в исходном состоянии автомата все они задаются введением в М-сеть определенных "врожденных" i-моделей и связей, а для неполных автоматов - специальных алгоритмов. Общим принципом организации всех программ является этажность, или многоуровневость. В процессе работы М-автомата программы могут усложняться и дополняться за счет формирования новых i-моделей и связей. Каждая программа реализуется определенными, "своими" i-моделями и связями. Одни и те же i-модели и связи могут участвовать в реализации различных программ.
Следует отметить, что приведенное перечисление программ и подпрограмм не является полным. С одной стороны, различные подпрограммы представлены в рамках принятого сюжета моделирования в разной степени, причем некоторые - в весьма незначительной. С другой стороны, автомат реализует много других, не отмеченных при перечислении подпрограмм, принадлежащих более низкому (по сравнению с упомянутыми) уровню. Более полное представление об объеме программ можно составить на основе подробного рассмотрения работы его конкретных действующих реализаций, описание которых приводится ниже. Посмотрим теперь, в какой степени предлагаемая модель двигательного поведения соответствует общим требованиям к моделям гипотез (см. выше).
Одно из основных требований состоит в том, что модель должна воспроизводить действительно сложные виды человеческой деятельности. В противном случае она не может быть использована для проверки эффективности исходной гипотезы. Мы полагаем, что перечисление программ переработки информации, реализуемых с помощью предлагаемого автомата, свидетельствует о достаточной сложности решаемых проблем, так что первое требование можно считать выполненным.
Требуется далее, чтобы на основе исследования модели можно было определить область практического применения проверяемых с ее помощью принципов исходной гипотезы. Уже упоминалось, что рассматриваемая нами условная задача организации двигательного поведения М-автоматом по своей структуре и проблематике весьма близка к практической задаче автоматизации управления передвижением в естественной среде различного рода информационных и транспортных средств. Иначе говоря, наша вычислительная модель М-автомата может быть рассмотрена как действующий макет реального устройства управления движением, а полученные результаты могут быть непосредственно использованы при конструировании такого устройства. Можно также отметить, что принципы построения М-автоматов могут быть применены при решении класса практических задач, интерпретируемых как общая задача поиска путей в пространствах параметров произвольной природы. Класс таких задач достаточно широк, и в него входит ряд важных задач автоматического управления. Вопросы практического использования разработанной модели мы еще рассмотрим в дальнейшем. Сказанного, однако, достаточно, чтобы уже теперь считать выполненным обсуждаемое требование.
Следующее важное требование предполагает перспективность модели. Выполнение этого требования обеспечивается тем обстоятельством, что воспроизводимые в предлагаемом автомате программы переработки информации лежат в основе более сложных проявлений разумной деятельности человека (труд, речь). Подробнее этот вопрос обсуждался выше (см. "Второе ограничение"). Задачи воспроизведения более сложных видов деятельности могут, следовательно, решаться путем дальнейшего развития и усложнения предлагаемой модели и с учетом результатов, полученных при ее исследовании.
Основные требования, предъявляемые к предлагаемой модели, оказываются, таким образом, выполненными, что позволяет использовать приведенное выше описание сюжета моделирования в качестве содержательной основы для построения действующей модели двигательного поведения. Формальная постановка задачи моделирования давалась в других работах.
Использование в модели вспомогательного "распознающего" алгоритма приводит также к еще одному существенному ограничению. Оно состоит в том, что М-автомат, применяющий этот алгоритм, не может "воспринять" нового, т.е. не включенного заранее в таблицу соответствий, объекта. Для такого объекта в М-сети просто не существует отдельной i-модели, а следовательно, такой объект не существует для М-автомата. Итак, мы вынуждены отказаться от исследования (в рамках избранного сюжета моделирования) процессов, связанных с формированием человеком образов незнакомых объектов.
Как и в предыдущем случае, указанное ограничение частично снимается, если задавать объекты с помощью наборов отдельных признаков. Здесь автомат "не видит" только новые признаки, но если среди признаков объекта имеются хотя бы некоторые из "известных" автомату, то такой объект может быть воспринят и опознан по неполному набору признаков.
Обсуждаемое ограничение не является, вообще говоря, обязательным или непреодолимым при моделировании с помощью М-сетей. В самом деле, как упоминалось выше, одним из механизмов самоорганизации в М-автоматах является механизм формирования новых i-моделей сети, так что каждая из них может формироваться как отображение нового объекта или признака. Не связано с принципиальными затруднениями и построение специального алгоритма, дополняющего и корректирующего таблицу соответствий, используемую алгоритмом "распознавания". Таким образом, моделирование программ формирования новых образов возможно и в рамках выбранного сюжета. Мы, однако, отказываемся от воспроизведения программ такого типа в нашей модели и делаем это именно с целью упрощения сюжета моделирования. Основанием для такого упрощения служит то обстоятельство, что упомянутые программы, будучи, вообще говоря, весьма важными и интересными, не принимают обязательного и постоянного участия в процессах планирования, принятия решений и т.п. Смысл вводимого ограничения состоит, таким образом, в следующем. Будем полагать, что все объекты среды, в которой организует двигательное поведение наш условный субъект, известны ему и могут быть правильно опознаны им, если будут восприняты.
Программная реализация модели двигательного поведения предполагает, естественно, программную же реализацию и эффекторных систем М-автомата. Под эффекторными здесь следует понимать такие системы, которые непосредственно реализуют воздействия автомата на среду. Если бы М-автомат выполнялся в виде технического устройства, такие системы были бы представлены теми или иными его движителями (колесами, гусеницами и т.п.) и манипуляторами. При программной же реализации будем представлять их некоторыми вспомогательными алгоритмами, которые запускаются при принятии М-автоматом решения о выполнении определенного действия и в ходе своей работы моделируют это действие, производя перемещения автомата в среде или осуществляя в последней соответствующие изменения.
В общем случае управление эффекторными системами является многоуровневым, так что М-сеть автомата должна содержать i-модели "элементарных" действий (соответствующих, например, сокращению различных мышц двигательного аппарата человека), i-модели более сложных двигательных актов и программ, предполагающих упорядоченное выполнение "элементарных" действии (например, сгибание руки), а также i-модели "идей" различных действий и поступков (сделать шаг, взять, напасть и т.п.). В целях упрощения разработки будем включать в М-сеть нашего автомата только i-модели последнего типа, т.е. i-модели достаточно сложных действий, реализуя с помощью вспомогательных "эффекторных" алгоритмов как их конечный результат (изменения положения автомата в среде и самой среды), так и соответствующие им изменения внутреннего состояния автомата.
ЧЕТВЕРТОЕ ОГРАНИЧЕНИЕ. Упрощения, которые мы сейчас рассмотрим, возникают при переходе от описания естественной среды к конструктивному заданию машинной среды.
Для начала представим себе машинную среду в виде карты той местности, на которой находится наш условный субъект. На такую карту могут быть нанесены обозначения различных объектов среды. В зависимости от масштаба карты, т.е. от уровня описания среды, может изменяться и содержание понятия "объект среды". Так, при одном масштабе в качестве целостного, неделимого объекта, внутренняя структура которого нас не интересует, может выступать, к примеру, имеющийся в среде лес. На карте в этом случае могут быть сделаны пометки, обозначающие общие характеристики такого объекта: "лес труднопроходимый", "здесь водятся опасные звери" и т.п. При другом, более крупном масштабе объектом может стать уже отдельное дерево, а пометки будут обозначать его свойства: "дерево высокое", "имеются съедобные плоды" и т.п. Очевидно, использование карт того или иного масштаба зависит от целей описания среды, т.е., в нашем случае, от степени подробности, с которой мы намерены описывать и воспроизводить в моделях феномены двигательного поведения.
В процессе работы с М-автоматом может возникать необходимость использовать различные среды. Особенно часто это происходит при решении всякого рода прикладных задач. Так, одна и та же модель, способная строить планы и принимать решения, может применяться в одном случае для выбора, например, трассы многокилометрового трубопровода, а в другом - для автоматического управления передвижением электрокара по территории заводского цеха. Поэтому желательно разработать такой способ задания машинной среды, который служил бы по мере необходимости в качестве модели разных естественных сред, описанных с разной степенью подробности. Будем представлять машинную среду в виде совокупности одинаковых квадратных клеток, регулярно расположенных на плоскости (как клетки шахматной доски). Такая совокупность клеток составляет "пространство", в котором будет действовать автомат, и является "заготовкой" карты местности. Для того чтобы построить последнюю, необходимо внести в соответствующие клетки знаки тех или иных объектов и их характеристик.
Условимся, что в одну клетку машинной среды может быть внесено не более одного знака объекта. Таким образом, клетка оказывается "элементарной" единицей автоматного пространства. Кроме знака объекта, в клетку среды могут быть внесены некоторые дополнительные знаки, характеризующие уже не отдельный объект, а общее состояние данного участка среды. Знаки такого рода могут указывать, например, высоту данного участка относительно некоторого условного уровня, его температуру, освещенность и т.п.
Таким образом, располагая в клетках определенные знаки, мы задаем среду, в которой предстоит действовать автомату. Совокупность упомянутых знаков содержит информацию, исходную для модели двигательного поведения. Это означает, что при исследовании модели имеется возможность "помещать" ее в среды различной сложности, содержащие различные объекты, т.е. организовывать те или иные условные экспериментальные ситуации в зависимости от целей исследования. С другой стороны, варьируя набор и размещение используемых знаков, можно приводить машинную среду в определенное соответствие с различными естественными средами, т.е. моделировать их.
На этапе наладки и исследования основных свойств модели двигательного поведения разнообразие знаков, используемых для задания различных вариантов машинной среды, может быть ограничено. Такой ограниченный набор знаков определяет конкретную содержательную интерпретацию процессов в модели и будет подробно описан при обсуждении каждого из ее вариантов. В самых общих чертах содержательная характеристика используемых в дальнейшем сред состоит в следующем.
Рассмотрим среды, содержащие условные объекты, "полезные" и "опасные" для автомата. Этим объектам даны определенные названия, например: "пища", "зверь", "убежище". Для того чтобы иметь возможность широко варьировать разнообразие и сложность задач, решаемых автоматом в среде, будем считать, что существуют однотипные объекты, в разной степени полезные или опасные для него. Так, можно различать более или менее опасных "зверей". Каждому объекту приписаны определенные свойства. Столкновение со "зверем", например, вызывает у автомата "боль".
Это, безусловно, не означает, что разрабатываемые модели могут использоваться только для решения условных задач. Выбор относительно простой и интуитивно понятной содержательной интерпретации объектов среды ("зверь", "пища" и т.п.) обусловлен только удобством моделирования. В самом деле, принимая такую интерпретацию, мы получаем возможность использовать при задании внутренней организации автомата богатый индивидуальный опыт людей, а также различного рода наблюдения, правдоподобные рассуждения, аналогии, описания, имеющиеся в художественной и психологической литературе, и т.п. Практическое же использование моделей, как уже упоминалось, обеспечивается возможностью приведения машинных сред к виду, соответствующему различным по составу и сложности естественным средам.
Следует отметить, что представление машинной среды в виде совокупности отдельных клеток является частным случаем задания сред с помощью более общих методов, например графов. Практическое использование этих методов при моделировании двигательного поведения было бы, однако, менее наглядным, так что по соображениям простоты и удобства "клеточное" задание представляется более целесообразным. Что же касается возможностей соотнесения "клеточной" среды с естественной, то они оказываются достаточно гибкими, поскольку каждой отдельной клетке можно поставить в соответствие участки естественной среды различных (в зависимости от целей исследования) размеров, в том числе и весьма малых. В предельных случаях "клеточная" среда может обеспечить практически непрерывное описание естественной.
Дальнейшее упрощение работ связано с введением еще одного ограничения. Оно состоит в следующем. Будем считать, что однажды заданная машинная среда в процессе проведения эксперимента с моделью остается неизменной, если не считать тех изменений, которые вносятся в нее работой автомата (например, при выполнении им действий типа "переместить объект"). Иначе говоря, будем считать среду статической. Это означает, что объекты машинной среды не обладают собственной активностью, т.е. не могут самостоятельно перемещаться в среде, взаимодействовать, выполнять какие-либо действия, направленные на автомат, и т.п. Все особенности того или иного объекта, определяющие характер его "физического" взаимодействия с автоматом, задаются при этом путем предварительного перечисления свойств объекта, вносимых в среду при ее задании в виде набора специальных знаков.
Приведем пример. Одно из свойств объекта "зверь" состоит в том, что он вызывает у автомата "боль", если оба они оказываются в одной клетке среды. Содержательно это может, например, обозначать, что зверь нападает на нашего условного субъекта. Упрощение, по существу, состоит в предположении о том, что зверь нападает на субъекта всегда, если только они оказываются достаточно близко. Следовательно, можно не представлять в модели ни процессы принятия решений зверем, ни его двигательную активность. Достаточно лишь смоделировать конечный результат нападения - возникновение боли у субъекта. А для этого достаточно считать способность вызывать боль постоянным свойством зверя и при задании машинной среды всегда помечать соответствующим знаком клетку, в которой находится объект "зверь". Аналогичным образом определяются и другие свойства объекта "зверь", а также свойства остальных объектов машинной среды.
При соотнесении машинной среды определенной естественной среде обсуждаемое ограничение выступает в виде предположения о том, что объекты естественной среды либо вообще не являются активными, либо их активность ограничена таким участком среды, который соответствует одной клетке машинной модели. Можно считать, например, что тот же зверь способен перемещаться в пределах ограниченного участка местности и встреча его с условным субъектом происходит всегда, если только последний при своих передвижениях по местности пересекает соответствующий ее участок.
Следует подчеркнуть, что свойство статичности среды сохраняется лишь в рамках одного, отдельно взятого, эксперимента. При постановке ряда экспериментов с моделью машинная среда может всякий раз задаваться по-новому.
Использование статических сред позволяет нам не воспроизводить при моделировании тех программ переработки информации, которые непосредственно связаны со способностью человека к решению задач экстраполяции. В полной мере это упрощение относится к программам сознания в той их части, которая обеспечивает ориентировку человека во времени. Соответственно, при реализации модели двигательного поведения с помощью необучающегося М-автомата способности к экстраполяции представлены в ней не будут. Такой автомат может, вообще говоря, организовывать поведение и в динамической среде, однако принимаемые им решения будут основываться лишь на анализе данных одномоментных восприятий ее состояния. Иначе говоря, необучающийся М-автомат будет воспринимать динамическую среду как дискретную последовательность статических сред. При этом он окажется не в состоянии выделить общие закономерности происходящих изменений и, следовательно, не сможет использовать их при планировании и принятии решений. При использовании М-автомата с обучением и самоорганизацией дело обстоит несколько иначе. В этом случае автомат также не содержит специальных i-моделей и функциональных структур, обеспечивающих функцию предсказания. Однако в процессе его самоорганизации элементы такого рода могут быть сформированы. В дальнейшем эта возможность будет проиллюстрирована экспериментальным исследованием процесса повторения последовательностей М-автоматом. Значение этого примера состоит в том, что способность к повторению последовательности предполагает наличие в автомате внутренней информационной модели соответствующего временного процесса. С другой стороны, существование такой модели является необходимым условием также и любого предсказания. Следовательно, определенные возможности воспроизведения программ ориентировки во времени возникают при использовании М-автоматов даже без специальной предорганизации. Можно полагать, таким образом, что поведение обучающихся М-автоматов в динамических средах будет отличаться от поведения необучающихся, являясь более "разумным". Последовательным изучением этого вопроса мы, однако, не занимались, ограничиваясь на начальных этапах моделирования изучением основных свойств М-автоматов, проявляющихся при их функционировании в сравнительно простых статических средах.
ОКОНЧАТЕЛЬНЫЙ ВАРИАНТ МОДЕЛИ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ. Итак, после всех введенных ограничений окончательный вариант модели двигательного поведения может быть кратко описан следующим образом.
Модель выполняется в виде программы для ЦВМ и содержит две подсистемы: машинную среду и М-автомат. Машинная среда является статической и задается в виде упорядоченной совокупности клеток, каждая из которых может быть либо пустой, либо содержать в себе один из объектов, в различной степени "полезных" или "опасных" для автомата. Машинная среда может являться моделью некоторых естественных сред.
М-автомат является моделью некоторого (условного) субъекта, осуществляющего двигательное поведение в естественной среде, соответствующей машинной. М-сеть автомата предварительно организована и содержит i-модели объектов, которые имеются в среде, i-модели действий, которые он может выполнить, а также i-модели, соответствующие различным образам, понятиям, чувствам, эмоциям и желаниям моделируемого субъекта.
В каждый момент дискретного времени автомат находится в одной из клеток среды и может производить ее "осмотр". "Поле зрения" автомата (количество одновременно рассматриваемых клеток среды) ограничено. В процессе осмотра автомат перемещает поле зрения по клеткам среды, причем воспринимает тем меньше признаков объектов, чем они дальше от него.
На основе данных осмотра автомат намечает цель (клетку или совокупность клеток среды), достижение которой позволит удовлетворить его стремление к пище, отдыху, безопасности и т.п. Автомат может формировать также иерархии целей. Затем он строит планы достижения целей и принимает решение о выполнении того из них, который наиболее полно удовлетворяет ряду формируемых автоматом критериев. В качестве критериев могут выступать безопасность маршрута, его длина и т.п.
Построив план, автомат приступает к его выполнению, передвигаясь из одной клетки среды в другую. При этом считается, что поле его зрения ограничено клетками, соседними с той, в которой он находится в каждый данный момент. В процессе передвижения автомат принимает решения о выполнении в каждый момент одного из возможных действий, а также о коррекции или полной перестройке имеющегося плана.
Передвигаясь в среде, автомат стремится избегать опасных объектов, чередует движение и отдых, удовлетворяет голод, преодолевает препятствия и т.п. Автомат способен использовать собственный прошлый опыт. Мотивом его деятельности служит задаваемое ему изначально стремление к самосохранению.
В различных вариантах модели двигательного поведения описанный сюжет представлен с различной степенью полноты.
Из приведенного описания следует, что функции, реализуемые автоматом, могут быть отнесены к таким основным видам проявлений разумной деятельности: направленное восприятие, целеполагание и планирование, принятие решений при организации конкретных действий в среде.
В автомате воспроизводятся следующие из основных программ переработки информации мозгом человека (изложение ведется в соответствии с разработкой этого вопроса, данной в предыдущей работе).
1. Программа восприятия внешней информации. В автомате эта программа представлена такими подпрограммами: настройка анализаторов (при организации осмотра среды), узнавание (возбуждение i-моделей объектов, если восприняты их признаки, а также возбуждение i-моделей понятий более высокого уровня, если восприняты объекты); запоминания (формирование новых i-моделей и связей в М-сети, а также формирование внутренней модели среды); вспоминания (выделение СУТ i-моделей отдельных образов объектов, их совокупностей и последовательностей, а также понятий различных уровней); предвидения (формирование "цепочек" i-моделей, отражающих последовательности воспринимаемых событий, и влияние возбуждения таких "цепочек" на процессы в сети).
2. Программа чувств. Представлена в автомате процессами возбуждения i-моделей чувств "от тела": передачей возбуждения между i-моделями чувств и i-моделями образов, понятий, желаний и действий, что составляет "эмоциональный" компонент процесса переработки информации М-сетью; установлением новых связей между i-моделями чувств и другими i-моделями сети. Основные подпрограммы этой программы связаны с инстинктами и сложными рефлексами. В автомате представлен инстинкт самосохранения с его подпрограммами защиты и питания. Из подпрограмм, соответствующих сложным рефлексам, представлены рефлекс цели, обеспечивающий общую направленность деятельности автомата, рефлекс свободы, организующий деятельность автомата по преодолению имеющихся в среде препятствий и ограничений, и рефлекс любопытства, определяющий структуру процессов осмотра среды.
3. Программа действий. Представлена в автомате совокупностью простых безусловных рефлексов и подпрограмм: связывания (формирование условных рефлексов), предвидения (формирование плана), контроля действий (функционирование во время выполнения плана следящих систем "по чувствам" и "по результатам"), многоуровневого анализа вариантов (наличие в М-сети i-моделей действий различной степени общности - от "идей" до "элементарных" действий и связь этих i-моделей с другими); построение планов разных уровней.
4. Программа сознания. Представлена в автомате подпрограммами внимания (СУТ), ориентирования в пространстве (построение и использование внутренней модели среды), волевого действия (наличие i-моделей желаний, чувств и действий, построение плана и выполнение его с преодолением препятствий, а также автономный выбор цели, построение иерархии целей и последующие изменения их), отделения реального и нереального (при обращении к внутренней модели среды и планировании), моделирования собственных действий (при планировании).
Упомянутые программы имеют следующие общие черты: в исходном состоянии автомата все они задаются введением в М-сеть определенных "врожденных" i-моделей и связей, а для неполных автоматов - специальных алгоритмов. Общим принципом организации всех программ является этажность, или многоуровневость. В процессе работы М-автомата программы могут усложняться и дополняться за счет формирования новых i-моделей и связей. Каждая программа реализуется определенными, "своими" i-моделями и связями. Одни и те же i-модели и связи могут участвовать в реализации различных программ.
Следует отметить, что приведенное перечисление программ и подпрограмм не является полным. С одной стороны, различные подпрограммы представлены в рамках принятого сюжета моделирования в разной степени, причем некоторые - в весьма незначительной. С другой стороны, автомат реализует много других, не отмеченных при перечислении подпрограмм, принадлежащих более низкому (по сравнению с упомянутыми) уровню. Более полное представление об объеме программ можно составить на основе подробного рассмотрения работы его конкретных действующих реализаций, описание которых приводится ниже. Посмотрим теперь, в какой степени предлагаемая модель двигательного поведения соответствует общим требованиям к моделям гипотез (см. выше).
Одно из основных требований состоит в том, что модель должна воспроизводить действительно сложные виды человеческой деятельности. В противном случае она не может быть использована для проверки эффективности исходной гипотезы. Мы полагаем, что перечисление программ переработки информации, реализуемых с помощью предлагаемого автомата, свидетельствует о достаточной сложности решаемых проблем, так что первое требование можно считать выполненным.
Требуется далее, чтобы на основе исследования модели можно было определить область практического применения проверяемых с ее помощью принципов исходной гипотезы. Уже упоминалось, что рассматриваемая нами условная задача организации двигательного поведения М-автоматом по своей структуре и проблематике весьма близка к практической задаче автоматизации управления передвижением в естественной среде различного рода информационных и транспортных средств. Иначе говоря, наша вычислительная модель М-автомата может быть рассмотрена как действующий макет реального устройства управления движением, а полученные результаты могут быть непосредственно использованы при конструировании такого устройства. Можно также отметить, что принципы построения М-автоматов могут быть применены при решении класса практических задач, интерпретируемых как общая задача поиска путей в пространствах параметров произвольной природы. Класс таких задач достаточно широк, и в него входит ряд важных задач автоматического управления. Вопросы практического использования разработанной модели мы еще рассмотрим в дальнейшем. Сказанного, однако, достаточно, чтобы уже теперь считать выполненным обсуждаемое требование.
Следующее важное требование предполагает перспективность модели. Выполнение этого требования обеспечивается тем обстоятельством, что воспроизводимые в предлагаемом автомате программы переработки информации лежат в основе более сложных проявлений разумной деятельности человека (труд, речь). Подробнее этот вопрос обсуждался выше (см. "Второе ограничение"). Задачи воспроизведения более сложных видов деятельности могут, следовательно, решаться путем дальнейшего развития и усложнения предлагаемой модели и с учетом результатов, полученных при ее исследовании.
Основные требования, предъявляемые к предлагаемой модели, оказываются, таким образом, выполненными, что позволяет использовать приведенное выше описание сюжета моделирования в качестве содержательной основы для построения действующей модели двигательного поведения. Формальная постановка задачи моделирования давалась в других работах.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
ЧАСТЬ ВТОРАЯ. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ПОВЕДЕНИЯ М-АВТОМАТОВ
РАЗДЕЛ III. М-АВТОМАТ РЭМ. ФОРМИРОВАНИЕ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ
Нами разработаны два варианта действующей модели двигательного поведения. Первый из них - М-автомат РЭМ. С помощью этой модели необходимо было экспериментально проверить наиболее важные представления исходной гипотезы: принципы организации М-сети как устройства, осуществляющего параллельную переработку информации; принципы работы СУТ и ее роль в функционировании М-автомата; способы организации взаимодействия между М-сетью и алгоритмическими (функциональными) моделями, т.е. методы построения неполных М-автоматов; многоуровневую структуру информационных систем, реализующих процессы принятия решений, и др.
Экспериментальное исследование РЭМа должно было ответить на вопрос о том, в какой мере эффективен предлагаемый подход к построению систем искусственного разума, а также определить пути дальнейшего усовершенствования модели.
При разработке РЭМа были введены дополнительные ограничения на сюжет моделирования и набор воспроизводимых автоматом программ переработки информации. В частности, РЭМ реализован как необучающийся и неполный М-автомат. Одна его часть, воспроизводящая процессы восприятия и планирования, выполнена в виде алгоритмической модели, а другая, воспроизводящая процессы принятия решений в ходе выполнения плана,- в виде полного М-автомата. Обе части относительно самостоятельны и могут быть названы моделями планирования и выполнения плана соответственно.
Функционирование РЭМа как целостной модели двигательного поведения организуется в ходе последовательного (поочередного) функционирования моделей планирования и выполнения плана. Автомат представляет собой упрощенный вариант модели двигательного поведения, ее, так сказать, первое приближение.
Название автомата - РЭМ - относится к целому классу автоматов, задаваемых одним и тем же описанием (программой).
ГЛАВА 6. МОДЕЛЬ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ РЭМ
Разработка этой модели рассматривалась нами как первый этап создания "разумного" автомата. В связи с этим мы существенно ограничили функции РЭМа и отразили в нем только наиболее важные, с нашей точки зрения, программы переработки информации, необходимые для организации целенаправленного двигательного поведения в средах, близких к естественным.
#1. БЛОК-СХЕМА МОДЕЛИ
Общая блок-схема модели РЭМ показана на рис.11. Автомат помещен в среду, каждая клетка которой может содержать не более одного объекта. Количество различных типов объектов фиксировано. В среде РЭМ может совершать только действия по перемещению из одной клетки в другую - соседнюю. При этом он может "ходить" как по пустым, т.е. не содержащим объекты, клеткам, так и по тем клеткам, в которых уже находится какой-либо объект. Однако это только принципиальная возможность "свободы действий". Задачей РЭМа является выбор такого пути передвижения, который обеспечил бы ему сохранение целостности и минимум отрицательных "эмоциональных переживаний". Иначе говоря, ему не безразлично, какие действия-шаги выполнять в тех или иных ситуациях.
Рис.11. Блок-схема модели РЭМ.
В М-сети РЭМа имеются i-модели всех типов объектов внешней среды, и восприятие одного из них отражается в возбуждении соответствующей i-модели. Блок восприятия организован таким образом, что для каждого пространственного положения объекта относительно автомата существует своя i-модель. Это позволяет автомату не только "узнавать" объекты, но и учитывать их пространственную ориентацию при выборе определенных действий. Процесс восприятия РЭМом информации из внешней среды назовем "осмотром".
В поведении РЭМа можно выделить два основных этапа - выбор плана передвижения и выполнение этого плана. В соответствии со спецификой каждого этапа существуют и два режима работы блока восприятия, т.е. два различных режима осмотра внешней среды. Общая цель движения задается РЭМу экспериментатором в виде координат определенной клетки среды. В процессе планирования автомат производит осмотр достаточно большого участка среды и в том случае, если конечная цель движения находится за пределами этого участка, намечает себе промежуточную цель и строит план ее достижения. При выполнении плана, т.е. при непосредственном передвижении в среде, РЭМ после каждого шага осматривает только окружающие его клетки среды. На основе воспринятой при осмотре информации и ранее выработанного плана он принимает решение о выполнении следующего действия-шага.
Как видно из блок-схемы РЭМа, информация о результате осмотра (в случае планирования) или о плане и осмотре (в случае выполнения плана) не является единственной, на основе которой автомат принимает решения о действиях в среде. Прежде чем принимается какое-либо решение, воспринятая информация подвергается "логической" и "эмоциональной" оценкам в блоках эмоциональной оценки и понятийных обобщений. Это обеспечивает автомату, во-первых, возможность учитывать свой предыдущий опыт, выраженный в структуре М-сети и определенном распределении возбуждений составляющих ее i-моделей, и, во-вторых, возможность самостоятельно оценивать значимость воспринятой информации. Таким образом, каждое принимаемое автоматом решение о выборе определенного этапа плана или конкретного действия-шага является результатом сложных и взаимосвязанных процессов, протекающих в его М-сети.
При разработке РЭМа намеренно были исключены из рассмотрения такие важные аспекты разумного поведения, как обучение, самоорганизация, ориентирование во времени и т.п. Это позволило создать сравнительно простую модель, разработка и исследование которой могли быть проведены без больших затрат времени. В то же время представленные в РЭМе программы переработки информации достаточно полно отражают основные положения исходной гипотезы, и экспериментальное исследование автомата позволило оценить эффективность их использования в более сложных вариантах моделей разумного поведения.
Построение РЭМа в виде необучающегося М-автомата обусловило необходимость ряда ограничений в его структуре и функциях. Так, например, мы вынуждены были отказаться от введения в автомат программ, связанных с активной деятельностью в среде, существенно ограничили количество i-моделей в М-сети, упростили характеристики i-моделей и связей. Кроме того, некоторые функции РЭМа оказалось более удобным представлять в виде алгоритмических описаний. Прежде всего это относится к функции планирования. Предварительные исследования показали, что реализация процесса планирования в М-сети принципиально осуществима, однако требует значительных затрат времени, больших объемов оперативной памяти ЦВМ и, самое главное, неперспективна без реализации функций обучения и самоорганизации. Поэтому блок планирования РЭМа выполнен в виде функционального описания соответствующего процесса.
Таким образом, РЭМ является неполным необучающимся М-автоматом, в котором блоки восприятия, понятийных обобщений, эмоциональной оценки и принятия решений представлены в виде взаимосвязанных сфер М-сети, а блок планирования - в виде взаимодействукщего с сетью алгоритма. Использование принципиально отличного от сетевого способа реализации функций планирования в автомате позволило оценить возможность и эффективность построения неполных М-автоматов. Оказалось, что организация оперативного взаимодействия алгоритмических и сетевых блоков автомата может быть осуществлена сравнительно простыми средствами. Этот вывод был использован нами в дальнейших работах по созданию систем, способных к разумному поведению.
Несмотря на то что РЭМ выполнен в виде неполного М-автомата, его основой все же является М-сеть. Именно в результате протекающих в сети процессов производится оценка воспринимаемой извне информации, учет плана и опыта предыдущей деятельности и выработка новых решений о выполнении конкретных действий или выборе нового плана поведения. То обстоятельство, что одна и та же М-сеть используется и при планировании, и при выполнении плана, позволяет автомату строить такие планы поведения, которые соответствуют его "субъективному" восприятию среды. В процессе движения "эмоциональная" оценка тех или иных объектов среды может измениться, что приведет к необходимости коррекции или перестройки плана. В этом случае новый план будет построен уже с учетом изменившихся "эмоциональных" оценок объектов.
Эффективность различных действий автомата в значительной мере зависит от того, каким образом организована его М-сеть, т.е. насколько обоснованно и согласованно с общей задачей автомата выбраны i-модели и связи сети, их характеристики и законы взаимодействия. Для необучающегося М-автомата этап задания организации М-сети является наиболее важным, поскольку в процессе функционирования структура сети автомата остается неизменной. Именно поэтому подробное описание автомата РЭМ мы начнем с рассмотрения принципиальной схемы структуры и динамики его М-сети. Конкретные содержательные интерпретации объектов среды, в которой функционирует РЭМ, и содержательное описание структуры сети автомата будут приведены несколько позже. На этом этапе, т.е. при описании принципиальной схемы М-сети, будем пользоваться пока только теми сведениями, которые уже изложены относительно блок-схемы автомата. Будем также считать, что существует М-сеть, соответствующая этой блок-схеме, а также тем общим задачам, для решения которых строится автомат.
#2. СТРУКТУРА М-СЕТИ АВТОМАТА
Структура М-сети автомата может быть сопоставлена с плоским связным, ориентированным графом, узлы которого соответствуют элементам структуры - i-моделям, а ребра - функциональным связям между ними. В соответствии с блок-схемой произведем условное разделение М-сети автомата на три сферы - логическую (блоки восприятия и понятийных обобщений), эмоциональную (блок эмоциональных оценок) и двигательную (блок принятия решений).
СФЕРА ЛОГИКИ. Логическая сфера представляет собой иерархически организованную структуру, первый уровень которой составляет множество i-моделей R={r.1,r.2,...,r.n}, изоморфное множеству объектов внешней среды А={a.1,a.2,...,a.n}.
Восприятие человеком некоторого объекта из естественной среды сопровождается осознанием пространственного положения последнего. Поскольку информация о пространственном положении объекта необходима для организации адекватного поведения, элементы множества R выбраны таким образом, что каждый элемент r.i из R соответствует объекту a.i имеющему определенный пространственный признак (например, a.i слева и т.п.). Зафиксируем в среде определенную систему координат: верх, низ, левая сторона, правая сторона и пронумеруем все клетки среды слева направо и снизу вверх. В пространственном представлении такая среда имеет вид цилиндра с винтовым расположением клеток. Положение любой клетки окрестности автомата может быть определено относительно последнего однозначным образом. Пусть автомат расположен в клетке gi. Среда организована так, что окрестность автомата всегда составляет девять клеток - в одной из них расположен автомат, а восемь остальных непосредственно к ней примыкают. Обозначим клетку, в которой расположен автомат, через g9, a примыкающие к ней клетки начиная с нижней последовательно, по часовой стрелке,- g1, g2, ..., g8. Тогда произвольный объект a.i, расположенный в окрестности автомата, можно записать в виде aj.i где j (j=1,2,...,9) означает пространственное положение объекта относительно автомата (например, a5.i - объект a.i сверху). Восприятию объекта a.i в клетке gj соответствует возбуждение элемента rj.i в М-сети автомата (например, возбуждение r3.i свидетельствует о том, что автоматом воспринят объект a.i слева).
Каждая клетка среды может также характеризоваться двумя дополнительными признаками (например, наличие запаха и звука). "Интенсивность" этих признаков может быть различной в разных клетках среды. Соответственно пространственным положениям клеток окрестности автомата в М-сети выделены две группы по девять i-моделей, содержательно интерпретируемых как признаки клеток среды. Восприятию признака из окрестности М-автомата соответствует возбуждение определенной i-модели, причем "интенсивность" признака отражена величиной возбужденности этой" i-модели.
i-Модели объектов и признаков среды, а также алгоритм, реализующий функцию их восприятия из окрестности автомата, составляют БЛОК ВОСПРИЯТИЯ М-автомата.
При опознании человеком воспринятого объекта последний относится им к определенному классу, причем в зависимости от признаков один и тот же объект может быть отнесен к разным классам. Наличие в системе понятий человека абстракций различного уровня свидетельствует о том, что существует и соответствующая иерархия внутренних (корковых) информационных моделей, т.е. классы объектов естественной среды объединяются в классы классов и т.д. Отнесение объекта к тому или иному классу и обусловливает реакцию человека на данный объект.
В самообучающемся и самоорганизующемся М-автомате i-модели высших уровней иерархии образуются вследствие процессов самоорганизации; их семантика определяется наличием связей с теми или иными i-моделями первого уровня, семантика которых предполагается известной. Однако, поскольку здесь процесс самоорганизации не рассматривается, то существование в ЛОГИЧЕСКОЙ СФЕРЕ автомата некоторого множества i-моделей, совокупность связей между которыми задана, постулируется. Сведения о взаимосвязи различных понятий, используемых человеком, позволяют организовать множество i-моделей логической сферы в определенного вида многоуровневую структуру.
Элементы блока восприятия, составляющие первый уровень логической сферы, объединяются по различным признакам (пространственная близость, понятийное обобщение и т.п.) в классы, представленные i-моделями второго уровня. Устанавливаемые при этом связи от i-моделей первого к i-моделям второго уровня логической сферы отражают родо-видовую взаимосвязь соответствующих этим i-моделям понятий. Естественно, что по различным признакам одни и то же i-модели первого уровня могут быть включены в различные классы, т.е. одна и та же i-модель первого уровня может иметь связи с несколькими i-моделями второго уровня. Аналогично i-модели второго уровня объединяются в классы, представленные i-моделями третьего уровня, и т.д. Класс высшего уровня может включать в себя не только элементы предыдущего уровня, но также - частично - и элементы более низких уровней. Так, например, к i-моделям третьего уровня могут подходить связи, направленные от i-моделей и второго и первого уровней. Это позволяет в ряде случаев более полно отразить родо-видовую взаимосвязь объектов и понятий, соответствующих i-моделям сети.
Кроме родо-видовых связей, между различными i-моделями логической сферы установлены также связи, отражающие ассоциативные отношения, существующие между используемыми понятиями в системе понятий человека. "Ассоциативные" связи могут устанавливаться между i-моделями как одного, так и различных уровней. Количество уровней иерархии и общее количество связей в М-сети автомата может быть сколь угодно велико и ограничивается в основном возможностями практической реализации автомата.
Классификация и оценка воспринятой человеком ситуации, а также реакция на эту ситуацию часто определяются не только наличием каких-либо определенных объектов, но и их отсутствием. Этот факт воспроизведен в сети РЭМа введением i-моделей "отсутствие i-ro объекта", возбуждение которых существенным образом влияет на поведение автомата.
Благодаря наличию связей между i-моделями логической сферы возбуждение от i-моделей воспринятых объектов и признаков распространяется по сети. Образующееся распределение возбуждений в сети интерпретируется как логическая оценка М-автоматом воспринятой ситуации.
СФЕРА ЭМОЦИЙ. Воспринятая М-автоматом информация подвергается не только "логической", но и "эмоциональной" оценке. В структуре автомата выделена эмоциональная сфера, включающая множество i-моделей эмоций. Последнее соответствует множеству корковых i-моделей эмоций, возбуждающихся (предположительно) в коре головного мозга человека при осуществлении поведенческих актов в условиях, близких к тем, в которые поставлен автомат. Связи между i-моделями эмоциональной сферы отражают взаимоотношение соответствующих эмоций у человека. Так, например, если в М-сети автомата имеются i-модели эмоций "страх" и "радость", то, очевидно, между ними должны быть установлены взаимотормозящие связи.
Все многообразие испытываемых человеком эмоций может быть условно разбито на два класса - эмоции положительные и отрицательные. В соответствии с этим в эмоциональную сферу автомата введены i-модели "приятно" (Пр) и "неприятно" (НПр), связанные с остальными i-моделями эмоциональной сферы таким образом, что возбуждение i-моделей Пр и НПр в каждый момент времени отражает обобщенное "эмоциональное" состояние автомата. Между i-моделями Пр и НПр установлены взаимотормозящие связи. Соотношение возбуждений Пр и НПр используется для общей, интегральной оценки состояния автомата.
i-Модели эмоциональной сферы связываются с определенными i-моделями логической сферы. Связи от элементов логической сферы к элементам эмоциональной обеспечивают возможность "эмоционально" оценивать воспринятую ситуацию. Однако, как известно из психологии, существует и обратная связь - влияние состояния эмоциональной сферы на восприятие и переработку информации. Этот факт в М-автомате отражается установлением связей от i-моделей эмоциональной сферы к i-моделям логической. Наличие того или иного распределения возбуждений в эмоциональной сфере автомата может существенно влиять на распределение возбуждений в логической сфере и, следовательно, на поведение автомата. Можно говорить, что взаимосвязь логической и эмоциональной сфер обеспечивает "субъективность" восприятия и переработки информации автоматом.
Влияние эмоциональной сферы на двигательные реакции автомата осуществляется двумя путями: через логическую и через некоторую промежуточную сферу, включающую i-модели "желаний", которые можно рассматривать как "побуждения к действиям". Согласно исходной гипотезе каждому элементу эмоциональной сферы может быть поставлено в соответствие желание, которое определяет характер предполагаемого действия. В структуре М-автомата связи от i-моделей эмоций к i-моделям желаний и от последних - к действиям устанавливаются в соответствии с содержательной интерпретацией соединяемых i-моделей.
ДВИГАТЕЛЬНАЯ СФЕРА. Как уже говорилось, автомат может совершать действия-шаги, переводящие его из одной клетки среды в другую, соседнюю. Такие шаги будем называть ПРОСТЫМИ ДЕЙСТВИЯМИ. Пусть в результате ряда простых действий автомат перешел из клетки g.k в клетку g.n, не принадлежащую окрестности g.k. В этом случае можно сказать, что автомат совершил действие, переводящее его из клетки g.k в клетку g.n. Такое действие, состоящее из ряда простых, будем называть СЛОЖНЫМ. Последовательность сложных действий также можно рассматривать как одно действие - движение в общем направлении. Такое действие назовем СОСТАВНЫМ.
Подобное представление о действиях автомата позволило построить его двигательную сферу в виде иерархической структуры, содержащей множество i-моделей действий. Первый уровень двигательной сферы составляют простые действия, второй - сложные и третий - составные.
Составные, сложные и простые действия имеют различную степень общности. Более общее действие может состоять из ряда менее общих. Это отношение зафиксировано в автомате наличием связей между i-моделями действий разных уровней.
ВЗАИМОДЕЙСТВИЕ СФЕР М-СЕТИ АВТОМАТА. По связям, установленным между i-моделями логической сферы и i-моделями "желаний", возбуждение в М-сети, вызванное восприятием определенной ситуации, распространяется на двигательную сферу. При этом различным уровням обобщения воспринятой информации соответствуют различные по степени обобщения действия. Связи между первыми (нижними) уровнями логической и двигательной сфер обеспечивают наиболее прямую передачу возбуждения и, следовательно, наиболее быструю ответную реакцию автомата. Связи устанавливаются таким образом, что i-модель каждого объекта внешней среды оказывается связанной с i-моделью того действия, выполнение которого наиболее целесообразно при восприятии данного объекта. Эти связи можно сопоставить с безусловнорефлекторными, поскольку они определяют ответ автомата на основе только воспринятой информации, без учета "индивидуального" прошлого опыта. Наличие и характер прошлого опыта автомата отражаются связями между высшими уровнями логической и двигательной сфер. Эти связи можно сопоставить с условнорефлекторными. Тогда каждая реакция автомата может быть представлена как взаимодействие цепочек условных и безусловных рефлексов.
Принцип взаимосвязи i-моделей различных сфер показан на рис.12. Пусть rj.i - i-модель некоторого воспринятого объекта внешней среды aj.i. "Безусловнорефлекторно" rj.i связана с i-моделями первого уровня двигательной сферы d.1, d.3, d.3. Пусть восприятие aj.i вызывает возбуждение элемента e.k. эмоциональной сферы, которому соответствует желание j.m. В свою очередь, возбуждение j.m свидетельствует о "желании" автомата выполнять действие d.3 или d.4. Как видно из схемы, действие d.3 наиболее полно соответствует как воспринятому объекту, так и возникшему "желанию" и, следовательно, в данном случае является наиболее целесообразным для автомата.
Рис.12. Пример взаимосвязи i-моделей различных сфер М-сети.
Взаимосвязь i-моделей, принадлежащих различным сферам М-сети автомата, является существенно важной для реализации ряда программ переработки информации, участвующих в организации целесообразного поведения. Выбранная структура автомата отражает представления исходной гипотезы относительно способов реализации таких программ, как взаимодействие эмоциональной и логической программ переработки информации, иерархичности этой переработки, иерархичности двигательных программ и связи действий различного уровня с "эмоциями" и "логикой". Поэтому можно полагать, что экспериментальное исследование автомата позволит оценить эффективность использования сделанных в гипотезе предположений при создании устройств, способных к организации разумного поведения.
#3. ДИНАМИКА М-АВТОМАТА
Пусть в некоторый момент i M-автомат находится в клетке среды g.i. Объекты, находящиеся в окрестности g.i, воспринимаются автоматом, т.е. возбуждаются соответствующие i-модели в структуре первого уровня логической сферы. В момент t+1 распределение возбуждений в М-сети автомата определяется состоянием сети в момент t, характеристиками i-моделей и законом распространения возбуждений в сети.
Конкретный вид формулы пересчета для М-сети РЭМа будет приведен несколько позже - при описании программной реализации автомата. Тогда же будет обсужден и конкретный вид выбранных характеристик i-моделей сети. Сейчас отметим только, что задание характеристик производилось в основном эвристически, с учетом некоторых нейропсихологических аналогий и предположений относительно качественных различий между характеристиками элементов, относящихся к различным сферам и уровням.
Одним из наиболее существенных отличий М-автоматов от разработанных до настоящего времени моделей с сетевой нейроноподобной структурой является наличие механизма СУТ. Однако, поскольку РЭМ был первым из действующих М-автоматов, было решено представить в нем функции СУТ в несколько упрощенном виде. Вначале мы ограничились одноуровневой СУТ. Кроме того, не были реализованы функции торможения и зависимость величины дополнительного возбуждения выделяемых СУТ i-моделей от интегральной оценки состояния эмоциональной сферы М-сети.
В каждый момент времени СУТ РЭМа выбирает одну или несколько наиболее возбужденных i-моделей сети. Эти i-модели получают дополнительное возбуждение, равномерно распределяемое на все элементы выделенной группы. Одновременно для всех выделенных СУТ i-моделей характеристика затухания изменяется таким образом, чтобы обеспечить последующее быстрое снижение их возбуждения. "Нормальное" затухание возбуждения i-моделей восстанавливается только тогда, когда они оказываются вне выделенной СУТ группы. При повторных выделениях СУТ одной и той же i-модели (в последовательные моменты времени) дополнительное возбуждение этой i-модели не производится.
Если в некоторый момент времени в группу i-моделей, выделяемых СУТ, входит i-модель первого уровня двигательной сферы, то считается, что автоматом принято "осознанное" решение осуществить определенное действие. При этом специальный алгоритм переводит М-автомат, в соответствии с выбранным действием, в одну из клеток окрестности.
Если в группу i-моделей, выделенных СУТ, входит несколько i-моделей действий первого уровня, то выполняется действие, i-модель которого имеет наибольшую возбужденность. Автомат может выполнить действие и в том случае, если ни одно из простых действий не выделено СУТ, но возбуждение какой-либо i-модели первого уровня двигательной сферы превышает определенную, заранее установленную величину. В этом случае можно говорить, что выполняется "автоматический", "неосознаваемый" шаг.
Действие, планируемое или выполняемое автоматом в определенной ситуации, будем называть его внешней реакцией на данную ситуацию. Последовательность таких реакций составляет план или двигательное поведение автомата соответственно.
Возбуждения i-моделей М-сети автомата будем называть его внутренней реакцией. При рассмотрении психологических аналогий и интерпретаций протекающих в М-сети процессов мы уже обсуждали возможность использования таких терминов, как внимание, осознание, подсознание, мышление и т.п., применительно к М-автоматам. Поэтому в дальнейшем, при описании работы автомата РЭМ, будем пользоваться этой терминологией и, в частности, различать "осознанные" и "неосознанные" внутренние реакции автомата. Последовательность "осознанных" внутренних реакций, т.е. понятий, соответствующих выделяемым СУТ i-моделям, будем называть "ходом мышления" автомата. Можно полагать, что анализ "мышления", наряду с анализом плана и двигательного поведения автомата, позволит судить о разумности его действий.
Передвигаясь в среде, РЭМ осуществляет определенный план, и его "ход мышления" должен адекватно (с точки зрения человека) пояснять каждое конкретное действие. В принципе, поведение РЭМа должно быть целесообразным и при отсутствии плана поведения, поскольку в каждой ситуации автомат способен выбирать и выполнять действие, наиболее соответствующее его внутреннему состоянию. Кроме того, поскольку информация о новых воздействиях среды поступает всегда в уже возбужденную М-сеть, происходит учет прошлых воздействий, определивших такое состояние сети. В результате последовательные действия РЭМа оказываются взаимосвязанными и взаимообусловленными.
Однако нашей задачей, как уже отмечалось в начале настоящего раздела, являлась не только демонстрация возможности организации целесообразного поведения М-автоматами, но и создание такого автомата, который можно было бы рассматривать в качестве модели робота, способного выполнять определенные направленные действия. Именно поэтому мы сочли необходимым включить в автомат блок планирования. Общая ориентация автомата на формирование именно двигательного поведения, а также то обстоятельство, что вся необходимая для процесса планирования информация подготавливается М-сетью, обусловили некоторую специфику организации этого блока.
Прежде всего, напомним, что при разработке РЭМа было решено отказаться от реализации процесса планирования в М-сети и представить блок планирования в виде соответствующего алгоритмического описания. В связи с этим нам пришлось обратиться к существующим в литературе по психологии описаниям процесса планирования и провести некоторые дополнительные исследования. Обсуждение общих теоретических положений и проведенного нами экспериментального исследования построения планов двигательного поведения человека мы и предпошлем более подробному описанию блока планирования разработанного нами М-автомата.
РАЗДЕЛ III. М-АВТОМАТ РЭМ. ФОРМИРОВАНИЕ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ
Нами разработаны два варианта действующей модели двигательного поведения. Первый из них - М-автомат РЭМ. С помощью этой модели необходимо было экспериментально проверить наиболее важные представления исходной гипотезы: принципы организации М-сети как устройства, осуществляющего параллельную переработку информации; принципы работы СУТ и ее роль в функционировании М-автомата; способы организации взаимодействия между М-сетью и алгоритмическими (функциональными) моделями, т.е. методы построения неполных М-автоматов; многоуровневую структуру информационных систем, реализующих процессы принятия решений, и др.
Экспериментальное исследование РЭМа должно было ответить на вопрос о том, в какой мере эффективен предлагаемый подход к построению систем искусственного разума, а также определить пути дальнейшего усовершенствования модели.
При разработке РЭМа были введены дополнительные ограничения на сюжет моделирования и набор воспроизводимых автоматом программ переработки информации. В частности, РЭМ реализован как необучающийся и неполный М-автомат. Одна его часть, воспроизводящая процессы восприятия и планирования, выполнена в виде алгоритмической модели, а другая, воспроизводящая процессы принятия решений в ходе выполнения плана,- в виде полного М-автомата. Обе части относительно самостоятельны и могут быть названы моделями планирования и выполнения плана соответственно.
Функционирование РЭМа как целостной модели двигательного поведения организуется в ходе последовательного (поочередного) функционирования моделей планирования и выполнения плана. Автомат представляет собой упрощенный вариант модели двигательного поведения, ее, так сказать, первое приближение.
Название автомата - РЭМ - относится к целому классу автоматов, задаваемых одним и тем же описанием (программой).
ГЛАВА 6. МОДЕЛЬ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ РЭМ
Разработка этой модели рассматривалась нами как первый этап создания "разумного" автомата. В связи с этим мы существенно ограничили функции РЭМа и отразили в нем только наиболее важные, с нашей точки зрения, программы переработки информации, необходимые для организации целенаправленного двигательного поведения в средах, близких к естественным.
#1. БЛОК-СХЕМА МОДЕЛИ
Общая блок-схема модели РЭМ показана на рис.11. Автомат помещен в среду, каждая клетка которой может содержать не более одного объекта. Количество различных типов объектов фиксировано. В среде РЭМ может совершать только действия по перемещению из одной клетки в другую - соседнюю. При этом он может "ходить" как по пустым, т.е. не содержащим объекты, клеткам, так и по тем клеткам, в которых уже находится какой-либо объект. Однако это только принципиальная возможность "свободы действий". Задачей РЭМа является выбор такого пути передвижения, который обеспечил бы ему сохранение целостности и минимум отрицательных "эмоциональных переживаний". Иначе говоря, ему не безразлично, какие действия-шаги выполнять в тех или иных ситуациях.
Рис.11. Блок-схема модели РЭМ.
В М-сети РЭМа имеются i-модели всех типов объектов внешней среды, и восприятие одного из них отражается в возбуждении соответствующей i-модели. Блок восприятия организован таким образом, что для каждого пространственного положения объекта относительно автомата существует своя i-модель. Это позволяет автомату не только "узнавать" объекты, но и учитывать их пространственную ориентацию при выборе определенных действий. Процесс восприятия РЭМом информации из внешней среды назовем "осмотром".
В поведении РЭМа можно выделить два основных этапа - выбор плана передвижения и выполнение этого плана. В соответствии со спецификой каждого этапа существуют и два режима работы блока восприятия, т.е. два различных режима осмотра внешней среды. Общая цель движения задается РЭМу экспериментатором в виде координат определенной клетки среды. В процессе планирования автомат производит осмотр достаточно большого участка среды и в том случае, если конечная цель движения находится за пределами этого участка, намечает себе промежуточную цель и строит план ее достижения. При выполнении плана, т.е. при непосредственном передвижении в среде, РЭМ после каждого шага осматривает только окружающие его клетки среды. На основе воспринятой при осмотре информации и ранее выработанного плана он принимает решение о выполнении следующего действия-шага.
Как видно из блок-схемы РЭМа, информация о результате осмотра (в случае планирования) или о плане и осмотре (в случае выполнения плана) не является единственной, на основе которой автомат принимает решения о действиях в среде. Прежде чем принимается какое-либо решение, воспринятая информация подвергается "логической" и "эмоциональной" оценкам в блоках эмоциональной оценки и понятийных обобщений. Это обеспечивает автомату, во-первых, возможность учитывать свой предыдущий опыт, выраженный в структуре М-сети и определенном распределении возбуждений составляющих ее i-моделей, и, во-вторых, возможность самостоятельно оценивать значимость воспринятой информации. Таким образом, каждое принимаемое автоматом решение о выборе определенного этапа плана или конкретного действия-шага является результатом сложных и взаимосвязанных процессов, протекающих в его М-сети.
При разработке РЭМа намеренно были исключены из рассмотрения такие важные аспекты разумного поведения, как обучение, самоорганизация, ориентирование во времени и т.п. Это позволило создать сравнительно простую модель, разработка и исследование которой могли быть проведены без больших затрат времени. В то же время представленные в РЭМе программы переработки информации достаточно полно отражают основные положения исходной гипотезы, и экспериментальное исследование автомата позволило оценить эффективность их использования в более сложных вариантах моделей разумного поведения.
Построение РЭМа в виде необучающегося М-автомата обусловило необходимость ряда ограничений в его структуре и функциях. Так, например, мы вынуждены были отказаться от введения в автомат программ, связанных с активной деятельностью в среде, существенно ограничили количество i-моделей в М-сети, упростили характеристики i-моделей и связей. Кроме того, некоторые функции РЭМа оказалось более удобным представлять в виде алгоритмических описаний. Прежде всего это относится к функции планирования. Предварительные исследования показали, что реализация процесса планирования в М-сети принципиально осуществима, однако требует значительных затрат времени, больших объемов оперативной памяти ЦВМ и, самое главное, неперспективна без реализации функций обучения и самоорганизации. Поэтому блок планирования РЭМа выполнен в виде функционального описания соответствующего процесса.
Таким образом, РЭМ является неполным необучающимся М-автоматом, в котором блоки восприятия, понятийных обобщений, эмоциональной оценки и принятия решений представлены в виде взаимосвязанных сфер М-сети, а блок планирования - в виде взаимодействукщего с сетью алгоритма. Использование принципиально отличного от сетевого способа реализации функций планирования в автомате позволило оценить возможность и эффективность построения неполных М-автоматов. Оказалось, что организация оперативного взаимодействия алгоритмических и сетевых блоков автомата может быть осуществлена сравнительно простыми средствами. Этот вывод был использован нами в дальнейших работах по созданию систем, способных к разумному поведению.
Несмотря на то что РЭМ выполнен в виде неполного М-автомата, его основой все же является М-сеть. Именно в результате протекающих в сети процессов производится оценка воспринимаемой извне информации, учет плана и опыта предыдущей деятельности и выработка новых решений о выполнении конкретных действий или выборе нового плана поведения. То обстоятельство, что одна и та же М-сеть используется и при планировании, и при выполнении плана, позволяет автомату строить такие планы поведения, которые соответствуют его "субъективному" восприятию среды. В процессе движения "эмоциональная" оценка тех или иных объектов среды может измениться, что приведет к необходимости коррекции или перестройки плана. В этом случае новый план будет построен уже с учетом изменившихся "эмоциональных" оценок объектов.
Эффективность различных действий автомата в значительной мере зависит от того, каким образом организована его М-сеть, т.е. насколько обоснованно и согласованно с общей задачей автомата выбраны i-модели и связи сети, их характеристики и законы взаимодействия. Для необучающегося М-автомата этап задания организации М-сети является наиболее важным, поскольку в процессе функционирования структура сети автомата остается неизменной. Именно поэтому подробное описание автомата РЭМ мы начнем с рассмотрения принципиальной схемы структуры и динамики его М-сети. Конкретные содержательные интерпретации объектов среды, в которой функционирует РЭМ, и содержательное описание структуры сети автомата будут приведены несколько позже. На этом этапе, т.е. при описании принципиальной схемы М-сети, будем пользоваться пока только теми сведениями, которые уже изложены относительно блок-схемы автомата. Будем также считать, что существует М-сеть, соответствующая этой блок-схеме, а также тем общим задачам, для решения которых строится автомат.
#2. СТРУКТУРА М-СЕТИ АВТОМАТА
Структура М-сети автомата может быть сопоставлена с плоским связным, ориентированным графом, узлы которого соответствуют элементам структуры - i-моделям, а ребра - функциональным связям между ними. В соответствии с блок-схемой произведем условное разделение М-сети автомата на три сферы - логическую (блоки восприятия и понятийных обобщений), эмоциональную (блок эмоциональных оценок) и двигательную (блок принятия решений).
СФЕРА ЛОГИКИ. Логическая сфера представляет собой иерархически организованную структуру, первый уровень которой составляет множество i-моделей R={r.1,r.2,...,r.n}, изоморфное множеству объектов внешней среды А={a.1,a.2,...,a.n}.
Восприятие человеком некоторого объекта из естественной среды сопровождается осознанием пространственного положения последнего. Поскольку информация о пространственном положении объекта необходима для организации адекватного поведения, элементы множества R выбраны таким образом, что каждый элемент r.i из R соответствует объекту a.i имеющему определенный пространственный признак (например, a.i слева и т.п.). Зафиксируем в среде определенную систему координат: верх, низ, левая сторона, правая сторона и пронумеруем все клетки среды слева направо и снизу вверх. В пространственном представлении такая среда имеет вид цилиндра с винтовым расположением клеток. Положение любой клетки окрестности автомата может быть определено относительно последнего однозначным образом. Пусть автомат расположен в клетке gi. Среда организована так, что окрестность автомата всегда составляет девять клеток - в одной из них расположен автомат, а восемь остальных непосредственно к ней примыкают. Обозначим клетку, в которой расположен автомат, через g9, a примыкающие к ней клетки начиная с нижней последовательно, по часовой стрелке,- g1, g2, ..., g8. Тогда произвольный объект a.i, расположенный в окрестности автомата, можно записать в виде aj.i где j (j=1,2,...,9) означает пространственное положение объекта относительно автомата (например, a5.i - объект a.i сверху). Восприятию объекта a.i в клетке gj соответствует возбуждение элемента rj.i в М-сети автомата (например, возбуждение r3.i свидетельствует о том, что автоматом воспринят объект a.i слева).
Каждая клетка среды может также характеризоваться двумя дополнительными признаками (например, наличие запаха и звука). "Интенсивность" этих признаков может быть различной в разных клетках среды. Соответственно пространственным положениям клеток окрестности автомата в М-сети выделены две группы по девять i-моделей, содержательно интерпретируемых как признаки клеток среды. Восприятию признака из окрестности М-автомата соответствует возбуждение определенной i-модели, причем "интенсивность" признака отражена величиной возбужденности этой" i-модели.
i-Модели объектов и признаков среды, а также алгоритм, реализующий функцию их восприятия из окрестности автомата, составляют БЛОК ВОСПРИЯТИЯ М-автомата.
При опознании человеком воспринятого объекта последний относится им к определенному классу, причем в зависимости от признаков один и тот же объект может быть отнесен к разным классам. Наличие в системе понятий человека абстракций различного уровня свидетельствует о том, что существует и соответствующая иерархия внутренних (корковых) информационных моделей, т.е. классы объектов естественной среды объединяются в классы классов и т.д. Отнесение объекта к тому или иному классу и обусловливает реакцию человека на данный объект.
В самообучающемся и самоорганизующемся М-автомате i-модели высших уровней иерархии образуются вследствие процессов самоорганизации; их семантика определяется наличием связей с теми или иными i-моделями первого уровня, семантика которых предполагается известной. Однако, поскольку здесь процесс самоорганизации не рассматривается, то существование в ЛОГИЧЕСКОЙ СФЕРЕ автомата некоторого множества i-моделей, совокупность связей между которыми задана, постулируется. Сведения о взаимосвязи различных понятий, используемых человеком, позволяют организовать множество i-моделей логической сферы в определенного вида многоуровневую структуру.
Элементы блока восприятия, составляющие первый уровень логической сферы, объединяются по различным признакам (пространственная близость, понятийное обобщение и т.п.) в классы, представленные i-моделями второго уровня. Устанавливаемые при этом связи от i-моделей первого к i-моделям второго уровня логической сферы отражают родо-видовую взаимосвязь соответствующих этим i-моделям понятий. Естественно, что по различным признакам одни и то же i-модели первого уровня могут быть включены в различные классы, т.е. одна и та же i-модель первого уровня может иметь связи с несколькими i-моделями второго уровня. Аналогично i-модели второго уровня объединяются в классы, представленные i-моделями третьего уровня, и т.д. Класс высшего уровня может включать в себя не только элементы предыдущего уровня, но также - частично - и элементы более низких уровней. Так, например, к i-моделям третьего уровня могут подходить связи, направленные от i-моделей и второго и первого уровней. Это позволяет в ряде случаев более полно отразить родо-видовую взаимосвязь объектов и понятий, соответствующих i-моделям сети.
Кроме родо-видовых связей, между различными i-моделями логической сферы установлены также связи, отражающие ассоциативные отношения, существующие между используемыми понятиями в системе понятий человека. "Ассоциативные" связи могут устанавливаться между i-моделями как одного, так и различных уровней. Количество уровней иерархии и общее количество связей в М-сети автомата может быть сколь угодно велико и ограничивается в основном возможностями практической реализации автомата.
Классификация и оценка воспринятой человеком ситуации, а также реакция на эту ситуацию часто определяются не только наличием каких-либо определенных объектов, но и их отсутствием. Этот факт воспроизведен в сети РЭМа введением i-моделей "отсутствие i-ro объекта", возбуждение которых существенным образом влияет на поведение автомата.
Благодаря наличию связей между i-моделями логической сферы возбуждение от i-моделей воспринятых объектов и признаков распространяется по сети. Образующееся распределение возбуждений в сети интерпретируется как логическая оценка М-автоматом воспринятой ситуации.
СФЕРА ЭМОЦИЙ. Воспринятая М-автоматом информация подвергается не только "логической", но и "эмоциональной" оценке. В структуре автомата выделена эмоциональная сфера, включающая множество i-моделей эмоций. Последнее соответствует множеству корковых i-моделей эмоций, возбуждающихся (предположительно) в коре головного мозга человека при осуществлении поведенческих актов в условиях, близких к тем, в которые поставлен автомат. Связи между i-моделями эмоциональной сферы отражают взаимоотношение соответствующих эмоций у человека. Так, например, если в М-сети автомата имеются i-модели эмоций "страх" и "радость", то, очевидно, между ними должны быть установлены взаимотормозящие связи.
Все многообразие испытываемых человеком эмоций может быть условно разбито на два класса - эмоции положительные и отрицательные. В соответствии с этим в эмоциональную сферу автомата введены i-модели "приятно" (Пр) и "неприятно" (НПр), связанные с остальными i-моделями эмоциональной сферы таким образом, что возбуждение i-моделей Пр и НПр в каждый момент времени отражает обобщенное "эмоциональное" состояние автомата. Между i-моделями Пр и НПр установлены взаимотормозящие связи. Соотношение возбуждений Пр и НПр используется для общей, интегральной оценки состояния автомата.
i-Модели эмоциональной сферы связываются с определенными i-моделями логической сферы. Связи от элементов логической сферы к элементам эмоциональной обеспечивают возможность "эмоционально" оценивать воспринятую ситуацию. Однако, как известно из психологии, существует и обратная связь - влияние состояния эмоциональной сферы на восприятие и переработку информации. Этот факт в М-автомате отражается установлением связей от i-моделей эмоциональной сферы к i-моделям логической. Наличие того или иного распределения возбуждений в эмоциональной сфере автомата может существенно влиять на распределение возбуждений в логической сфере и, следовательно, на поведение автомата. Можно говорить, что взаимосвязь логической и эмоциональной сфер обеспечивает "субъективность" восприятия и переработки информации автоматом.
Влияние эмоциональной сферы на двигательные реакции автомата осуществляется двумя путями: через логическую и через некоторую промежуточную сферу, включающую i-модели "желаний", которые можно рассматривать как "побуждения к действиям". Согласно исходной гипотезе каждому элементу эмоциональной сферы может быть поставлено в соответствие желание, которое определяет характер предполагаемого действия. В структуре М-автомата связи от i-моделей эмоций к i-моделям желаний и от последних - к действиям устанавливаются в соответствии с содержательной интерпретацией соединяемых i-моделей.
ДВИГАТЕЛЬНАЯ СФЕРА. Как уже говорилось, автомат может совершать действия-шаги, переводящие его из одной клетки среды в другую, соседнюю. Такие шаги будем называть ПРОСТЫМИ ДЕЙСТВИЯМИ. Пусть в результате ряда простых действий автомат перешел из клетки g.k в клетку g.n, не принадлежащую окрестности g.k. В этом случае можно сказать, что автомат совершил действие, переводящее его из клетки g.k в клетку g.n. Такое действие, состоящее из ряда простых, будем называть СЛОЖНЫМ. Последовательность сложных действий также можно рассматривать как одно действие - движение в общем направлении. Такое действие назовем СОСТАВНЫМ.
Подобное представление о действиях автомата позволило построить его двигательную сферу в виде иерархической структуры, содержащей множество i-моделей действий. Первый уровень двигательной сферы составляют простые действия, второй - сложные и третий - составные.
Составные, сложные и простые действия имеют различную степень общности. Более общее действие может состоять из ряда менее общих. Это отношение зафиксировано в автомате наличием связей между i-моделями действий разных уровней.
ВЗАИМОДЕЙСТВИЕ СФЕР М-СЕТИ АВТОМАТА. По связям, установленным между i-моделями логической сферы и i-моделями "желаний", возбуждение в М-сети, вызванное восприятием определенной ситуации, распространяется на двигательную сферу. При этом различным уровням обобщения воспринятой информации соответствуют различные по степени обобщения действия. Связи между первыми (нижними) уровнями логической и двигательной сфер обеспечивают наиболее прямую передачу возбуждения и, следовательно, наиболее быструю ответную реакцию автомата. Связи устанавливаются таким образом, что i-модель каждого объекта внешней среды оказывается связанной с i-моделью того действия, выполнение которого наиболее целесообразно при восприятии данного объекта. Эти связи можно сопоставить с безусловнорефлекторными, поскольку они определяют ответ автомата на основе только воспринятой информации, без учета "индивидуального" прошлого опыта. Наличие и характер прошлого опыта автомата отражаются связями между высшими уровнями логической и двигательной сфер. Эти связи можно сопоставить с условнорефлекторными. Тогда каждая реакция автомата может быть представлена как взаимодействие цепочек условных и безусловных рефлексов.
Принцип взаимосвязи i-моделей различных сфер показан на рис.12. Пусть rj.i - i-модель некоторого воспринятого объекта внешней среды aj.i. "Безусловнорефлекторно" rj.i связана с i-моделями первого уровня двигательной сферы d.1, d.3, d.3. Пусть восприятие aj.i вызывает возбуждение элемента e.k. эмоциональной сферы, которому соответствует желание j.m. В свою очередь, возбуждение j.m свидетельствует о "желании" автомата выполнять действие d.3 или d.4. Как видно из схемы, действие d.3 наиболее полно соответствует как воспринятому объекту, так и возникшему "желанию" и, следовательно, в данном случае является наиболее целесообразным для автомата.
Рис.12. Пример взаимосвязи i-моделей различных сфер М-сети.
Взаимосвязь i-моделей, принадлежащих различным сферам М-сети автомата, является существенно важной для реализации ряда программ переработки информации, участвующих в организации целесообразного поведения. Выбранная структура автомата отражает представления исходной гипотезы относительно способов реализации таких программ, как взаимодействие эмоциональной и логической программ переработки информации, иерархичности этой переработки, иерархичности двигательных программ и связи действий различного уровня с "эмоциями" и "логикой". Поэтому можно полагать, что экспериментальное исследование автомата позволит оценить эффективность использования сделанных в гипотезе предположений при создании устройств, способных к организации разумного поведения.
#3. ДИНАМИКА М-АВТОМАТА
Пусть в некоторый момент i M-автомат находится в клетке среды g.i. Объекты, находящиеся в окрестности g.i, воспринимаются автоматом, т.е. возбуждаются соответствующие i-модели в структуре первого уровня логической сферы. В момент t+1 распределение возбуждений в М-сети автомата определяется состоянием сети в момент t, характеристиками i-моделей и законом распространения возбуждений в сети.
Конкретный вид формулы пересчета для М-сети РЭМа будет приведен несколько позже - при описании программной реализации автомата. Тогда же будет обсужден и конкретный вид выбранных характеристик i-моделей сети. Сейчас отметим только, что задание характеристик производилось в основном эвристически, с учетом некоторых нейропсихологических аналогий и предположений относительно качественных различий между характеристиками элементов, относящихся к различным сферам и уровням.
Одним из наиболее существенных отличий М-автоматов от разработанных до настоящего времени моделей с сетевой нейроноподобной структурой является наличие механизма СУТ. Однако, поскольку РЭМ был первым из действующих М-автоматов, было решено представить в нем функции СУТ в несколько упрощенном виде. Вначале мы ограничились одноуровневой СУТ. Кроме того, не были реализованы функции торможения и зависимость величины дополнительного возбуждения выделяемых СУТ i-моделей от интегральной оценки состояния эмоциональной сферы М-сети.
В каждый момент времени СУТ РЭМа выбирает одну или несколько наиболее возбужденных i-моделей сети. Эти i-модели получают дополнительное возбуждение, равномерно распределяемое на все элементы выделенной группы. Одновременно для всех выделенных СУТ i-моделей характеристика затухания изменяется таким образом, чтобы обеспечить последующее быстрое снижение их возбуждения. "Нормальное" затухание возбуждения i-моделей восстанавливается только тогда, когда они оказываются вне выделенной СУТ группы. При повторных выделениях СУТ одной и той же i-модели (в последовательные моменты времени) дополнительное возбуждение этой i-модели не производится.
Если в некоторый момент времени в группу i-моделей, выделяемых СУТ, входит i-модель первого уровня двигательной сферы, то считается, что автоматом принято "осознанное" решение осуществить определенное действие. При этом специальный алгоритм переводит М-автомат, в соответствии с выбранным действием, в одну из клеток окрестности.
Если в группу i-моделей, выделенных СУТ, входит несколько i-моделей действий первого уровня, то выполняется действие, i-модель которого имеет наибольшую возбужденность. Автомат может выполнить действие и в том случае, если ни одно из простых действий не выделено СУТ, но возбуждение какой-либо i-модели первого уровня двигательной сферы превышает определенную, заранее установленную величину. В этом случае можно говорить, что выполняется "автоматический", "неосознаваемый" шаг.
Действие, планируемое или выполняемое автоматом в определенной ситуации, будем называть его внешней реакцией на данную ситуацию. Последовательность таких реакций составляет план или двигательное поведение автомата соответственно.
Возбуждения i-моделей М-сети автомата будем называть его внутренней реакцией. При рассмотрении психологических аналогий и интерпретаций протекающих в М-сети процессов мы уже обсуждали возможность использования таких терминов, как внимание, осознание, подсознание, мышление и т.п., применительно к М-автоматам. Поэтому в дальнейшем, при описании работы автомата РЭМ, будем пользоваться этой терминологией и, в частности, различать "осознанные" и "неосознанные" внутренние реакции автомата. Последовательность "осознанных" внутренних реакций, т.е. понятий, соответствующих выделяемым СУТ i-моделям, будем называть "ходом мышления" автомата. Можно полагать, что анализ "мышления", наряду с анализом плана и двигательного поведения автомата, позволит судить о разумности его действий.
Передвигаясь в среде, РЭМ осуществляет определенный план, и его "ход мышления" должен адекватно (с точки зрения человека) пояснять каждое конкретное действие. В принципе, поведение РЭМа должно быть целесообразным и при отсутствии плана поведения, поскольку в каждой ситуации автомат способен выбирать и выполнять действие, наиболее соответствующее его внутреннему состоянию. Кроме того, поскольку информация о новых воздействиях среды поступает всегда в уже возбужденную М-сеть, происходит учет прошлых воздействий, определивших такое состояние сети. В результате последовательные действия РЭМа оказываются взаимосвязанными и взаимообусловленными.
Однако нашей задачей, как уже отмечалось в начале настоящего раздела, являлась не только демонстрация возможности организации целесообразного поведения М-автоматами, но и создание такого автомата, который можно было бы рассматривать в качестве модели робота, способного выполнять определенные направленные действия. Именно поэтому мы сочли необходимым включить в автомат блок планирования. Общая ориентация автомата на формирование именно двигательного поведения, а также то обстоятельство, что вся необходимая для процесса планирования информация подготавливается М-сетью, обусловили некоторую специфику организации этого блока.
Прежде всего, напомним, что при разработке РЭМа было решено отказаться от реализации процесса планирования в М-сети и представить блок планирования в виде соответствующего алгоритмического описания. В связи с этим нам пришлось обратиться к существующим в литературе по психологии описаниям процесса планирования и провести некоторые дополнительные исследования. Обсуждение общих теоретических положений и проведенного нами экспериментального исследования построения планов двигательного поведения человека мы и предпошлем более подробному описанию блока планирования разработанного нами М-автомата.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#4. ПЛАНИРОВАНИЕ ПОВЕДЕНИЯ
ПОСТРОЕНИЕ ПЛАНОВ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ ЧЕЛОВЕКОМ. Двигательному поведению человека, как правило, предшествует акт планирования определенных действий на более или менее длительный промежуток времени. Планирование может производиться на различных уровнях - от выбора общей цели и приближенного анализа пути ее достижения до выбора конкретных действий в определенных ситуациях. При этом фиксация общей цели оказывает существенное влияние на выработку планов более низких уровней.
"План - это всякий иерархически построенный процесс в организме, способный контролировать порядок, в котором должна совершаться какая-либо последовательность операции".
Для выявления правил и приемов, применяемых человеком в процессе планирования, были изучены литературные данные по этому вопросу, а также проведено экспериментальное исследование деятельности человека-испытуемого по построению планов поведения в некоторой условной среде. Основная задача эксперимента состояла в том, чтобы установить специфические особенности изучаемой деятельности в тех конкретных условиях, в которых предстоит действовать конструируемому М-автомату РЭМ. Иначе говоря, необходимо было "привязать" сформулированные в общем виде литературные данные относительно процесса планирования к особенностям определенного ранее "сюжета" моделирования. Поэтому мы стремились построить психологический эксперимент как модель упомянутого сюжета, т.е. поставить человека-испытуемого примерно в те же условия, в которых должен действовать РЭМ. Одна из целей психологического эксперимента состояла, кроме того, в получении материала, пригодного для последующей оценки адекватности работы блока планирования, т.е. для сравнения планов поведения РЭМа с планами поведения человека в аналогичных условиях.
Методика эксперимента была построена таким образом, чтобы обеспечить наблюдение и фиксацию основных особенностей протекания взаимосвязанных процессов формирования планов испытуемыми в выбранной условной среде.
Предварительно, в специальном эксперименте исследовались индивидуальные особенности памяти испытуемых, связанные со скоростью запоминания зрительного материала. Для этого каждому испытуемому предъявлялся следующий тест. На листе бумаги в случайном порядке были написаны буквы русского алфавита. Перед испытуемым ставилась задача - в кратчайшее время прочесть буквы в алфавитном порядке. Время, затрачиваемое испытуемым на прочтение алфавита, измерялось. Эксперимент повторялся до тех пор, пока время воспроизведения не стабилизировалось. На основании анализа кривой запоминания делался вывод о необходимом времени предъявления материала в основном эксперименте для данного испытуемого. При этом применялось следующее эмпирическое правило: время предъявления принималось равным разности между стабилизировавшимся временем воспроизведения алфавита по тесту и временем, затрачиваемым испытуемым без теста.
Эксперимент по построению планов двигательного поведения был проведен с 20 испытуемыми.
Перед испытуемыми ставилась следующая задача: на предъявляемой условной схеме местности (среде) выбрать путь от исходной точки к целевой. Исходная и целевая точки задавались экспериментатором и отмечались на схеме местности специальным образом. Схема местности представляла собой разделенную на клетки плоскость. Каждая клетка была окрашена в один из четырех цветов - белый, зеленый, красный или синий (рис.13). Испытуемому сообщалось, что при выборе пути он должен исходить из следующих соображений: чем большее количество красных клеток пересекает маршрут и чем ближе он к этим клеткам, тем лучше выбранный путь; чем большее количество синих клеток пересекает маршрут и чем ближе он к этим клеткам, тем хуже выбранный путь; белые клетки нейтральны; зеленые клетки "немного хуже" белых; выбираемый путь должен быть по возможности коротким. С учетом этих условий испытуемому предлагалось выбрать оптимальный (с его точки зрения) план передвижения в среде.
Рис.13. Схема среды, предъявляемая испытуемым:
o - красные клетки: * -зеленые; x - синие.
Эксперимент проводился в следующем порядке.
1. Испытуемому объяснялась задача эксперимента и условия. Проводилось предварительное ознакомление с местностью. При этом показываемая испытуемому местность отличалась от той, на которой проводился основной эксперимент, расположением окрашенных клеток и их количеством.
2. На время t, которое выбиралось индивидуально в зависимости от результатов предварительного эксперимента с испытуемым, ему предъявлялась местность с обозначенными исходной и целевой клетками.
3. Испытуемому предлагалось воспроизвести на чистом листе бумаги все, что он запомнил на местности за время предъявления. (Предварительно давалась установка на выбор маршрута, а не на запоминание местности).
4. Испытуемому предлагалось уточнить маршрут и повторно на время t предъявлялась местность.
5. Испытуемому предлагалось нарисовать выбранный путь (или пути).
6. Повторение п.4.
7. Повторение п.5.
8. Повторение п.4.
9. Повторение п.3.
10. Изменялась поставленная задача. Испытуемому предлагалось на верхней границе местности самостоятельно выбрать целевую клетку и построить план ее достижения с учетом предыдущих условий. Предъявлялась местность.
11. Предлагалось нарисовать выбранный путь (или пути).
Все действия испытуемые сопровождали словесным отчетом. Последний этап эксперимента состоял в анализе и оценке испытуемым построенных им планов поведения. Проводилась также имитация изменения условий выбора маршрута передвижения. Испытуемому предлагалось выбрать путь "при наличии большого количества времени на передвижение", "при ограниченном времени", "при дефиците времени". Выбранные маршруты и их варианты фиксировались. В качестве примера ниже приведен протокол эксперимента с испытуемым Г.
ПРОТОКОЛ ЭКСПЕРИМЕНТА ПО ПОСТРОЕНИЮ ПЛАНА ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ
Испытуемый Г., 27 лет.
1. Минимальное время прочтения алфавита по тесту - 17сек. Время прочтения алфавита без теста - 14сек. Время предъявления основного материала выбрано равным 3сек.
2. Воспроизведение запомненного расположения клеток на местности.
Рисует местность (рис.14). "Хорошо запомнил область красных клеток. Синие помню плохо. Зеленые образуют поля, охватывающие красные клетки".
Рис.14. Схематическое воспроизведение среды испытуемым (первое предъявление).
3. Выбор плана передвижения.
Рисует план (рис.15). "Видел квадраты белого поля. Зеленое тоже образует квадраты. Где-то в центре есть синее поле. Не помню точно, где какие клетки, но если путь проведу так, то, по-моему, пройду через зеленое, белое и красное. Сколько будет красных - не знаю, но должен пройти или через них или совсем рядом. Путь, конечно, должен идти вправо. Вообще, вся правая часть мне кажется как-то лучше, больше привлекает внимание".
Рис.15. План передвижения, выбранный испытуемым (второе предъявление среды).
4. Выбор плана передвижения.
Рисует план (рис.16). "Теперь я смотрел только на правую часть. Вначале пошел вправо до красной клетки и от нее - дальше по прямой. Но там синие. Вернулся в красную клетку и пошел опять вправо, обходя синюю снизу, но так будет очень далеко. Нужно обходить сверху. Опять вернулся в красную и пошел вверх на белую поляну с красной клеткой, а оттуда прямо на цель. Еще раз просмотрел весь путь и решил "срезать" его немного. В самую нижнюю краевую клетку заходить не буду. Так, пожалуй, лучше".
Рис. 16. План передвижения, выбранный испытуемым (третье предъявление среды).
Пунктиром показаны просмотренные варианты, сплошной линией - окончательно выбранный план передвижения.
5. Воспроизведение расположения клеток на местности. Рисует местность (рис.17). "Теперь я постарался запомнить и левую часть, но все-таки правая мне как-то больше нравится. Четко выделяются зоны, явно плохие для маршрута. Например, в центре. Правда, слева много красных клеток и белого, по они очень далеко. А вот справа внизу очень хорошая область. Там и красных достаточно, и к цели по ним быстро пройти можно. И выше, там. где белая поляна, тоже хорошая область".
Рис. 17. Схематическое воспроизведение среды испытуемым (четвертое предъявление).
6. Выбор плана передвижения к произвольной клетке на верхней границе местности.
Рисует план (рис.18 ). "Теперь, конечно, можно пойти по-другому Можно было бы вообще обойти зеленое и по красным выйти наверх, но так очень далеко. Наверное, будет лучше идти через левую белую поляну".
Рис.18. План передвижения к произвольной клетке.
7. Имитация изменения условий выбора плана передвижения. "Если у меня много времени, то я пойду, пожалуй, влево. Там есть несколько красных. Зайду в белую поляну. Из нее - вверх, а там по красным клеткам дойду до цели. Если времени достаточно, но не слишком много, пойду так, как шел раньше - вправо через правую белую поляну. Ну, а если совсем мало времени, тогда даже не стану заходить на поляну, обойду только справа синий массив и - прямо к цели".
Выбранные испытуемым планы передвижения показаны на рис.19.
Рис. 19. Планы передвижения, выбранные испытуемым при изменении условий планирования:
-..-, --- избыток времени; -.- дефицит времени; - - - нейтральные условия.
В результате анализа словесных отчетов испытуемых были сделаны некоторые предположения о содержании и последовательности этапов построения человеком планов двигательного поведения. Одним из основных нам кажется предположение о формировании особого рода "внутренней модели", представляющей собой некоторый набор оценок участков среды, производимых в соответствии с особенностями среды и конечной целью планирования. Испытуемые, как правило, выделяли в предъявляемой им схеме местности "хорошие" и "плохие" участки. Характер оценки тех или иных участков обусловливался двумя причинами - наличием определенным образом окрашенных клеток (здесь было замечено разделение испытуемых на две группы: одни производили оценку в основном по синим клеткам, другие - по красным) и близостью клеток к кратчайшему пути - от исходной клетки к целевой.
На основе таких оценок участков среды производился выбор планов передвижения, их сравнение и окончательный выбор одного из них (варианта). Необходимо отметить, что различные испытуемые по-разному оценивали одни и те же участки среды. Так, например, испытуемый Г. при проведении анализа выбранных им планов отметил, что ему "с самого начала вся правая часть казалась лучше; она как-то приятнее, может быть даже гармоничнее". В то же время испытуемый Т. считал, что "левая часть гораздо интереснее, она больше привлекает внимание". Ряд испытуемых, первоначально фиксировавших внимание на одной из частей схемы местности (обычно, это была левая часть), в последующем изменяли свои оценки (испытуемый М.: "Сначала я строил обход синего поля слева, но теперь мне кажется, что путь справа будет лучше. Здесь достаточно много красного, от синих можно пройти далеко, и путь, по-моему, будет короче").
Таким образом, можно предположить, что произведенная оценка среды корректируется при получении дополнительной информации (повторных предъявлениях схемы среды) или изменении цели планирования (например, в условиях описанного эксперимента - при изменении целевой клетки). Различия в оценках среды можно, по-видимому, объяснить различным прошлым опытом и индивидуальными особенностями личности испытуемых.
При проведении экспериментального исследования были замечены следующие характерные особенности процесса планирования.
1. Производилась субъективная оценка среды, основанная на определенных интерпретациях ее элементов (например, синие - опасность).
2. Строилась иерархия планов. Выбор общего направления движения влиял на выбор конкретных этапов плана.
3. Просматривалось два-три варианта плана, проводилась их сравнительная оценка и на ее основе выбирался окончательный план поведения.
4. Запоминались в качестве ориентиров определенные элементы (клетки) среды, расположенные на каждом этапе выбранного плана.
Выявлено два механизма влияния высшего уровня плана двигательного поведения на выбор конкретных этапов плана. Первый механизм - влияние общего направления движения - обусловливает концентрацию внимания испытуемого на тех участках местности, которые расположены в "зоне главного направления". Второй механизм связан с коррекцией направления общего движения на каждом выбираемом этапе плана.
Сделанные в результате анализа экспериментов предположения, а также сведения о процессе планирования, имеющиеся в литературе, были положены в основу алгоритма блока планирования М-автомата РЭМ.
ОПИСАНИЕ БЛОКА ПЛАНИРОВАНИЯ ПОВЕДЕНИЯ. Особенности построения человеком планов двигательного поведения, замеченные при экспериментальном исследовании этого процесса, позволили построить модель, поведение которой в определенном отношении близко к поведению человека. Модель представляет собой неполный М-автомат и является одним из блоков автомата РЭМ, воспроизводящего процессы переработки информации, связанные с формированием двигательного поведения.
Поскольку планирование поведения обусловлено наличием определенной информации о среде, в модели предусмотрен осмотр участков среды, больших, чем окрестность автомата. В отличие от "ситуативного" осмотра среды в пределах окрестности автомата будем называть этот осмотр "стратегическим".
Стратегический осмотр заключается в последовательном восприятии содержимого клеток определенного участка среды и является первым этапом построения "внутренней модели" этого участка.
Цель движения автомата задается экспериментатором в виде координат клетки среды, которую в дальнейшем будем называть просто целью. Находясь в одной из клеток, автомат определяет направление движения на цель и, в соответствии с этим, производит выбор участка среды, необходимого для стратегического осмотра. Предполагается, что автомат всегда осматривает участок одного размера ("поле зрения" автомата) и располагает его "впереди" себя; кроме того, количество возможных поворотов автомата ограничено четырьмя (в принятой системе координат - вниз, вправо, вверх, влево). Выбор конкретного расположения участка определяется взаимным расположением в среде автомата и цели.
ПРЕДСТАВЛЕНИЕ ВНУТРЕННЕЙ МОДЕЛИ СРЕДЫ. Ограничение, связанное с фиксацией размеров осматриваемого участка среды, не является принципиальным. В то же время такое допущение позволяет считать, что в структуре автомата сформирована внутренняя модель соответствующего участка пространства среды. Исходя из этого предположения, мы задаем иерархию внутренних моделей среды, соответствующих различным уровням пространственных обобщений (рис.20). Первый, низший, уровень внутренней модели состоит из совокупности i-моделей отдельных клеток среды, причем семантика каждой i-модели отражает здесь пространственное положение клетки в среде. Необходимо отметить, что i-моделям клеток не соответствуют какие-либо конкретные объекты. Совокупность этих i-моделей является лишь "представлением автомата о пространстве". Определенное содержание может быть внесено в них только после осмотра среды (этот процесс будет описан ниже).
Рис.20. Структура внутренней модели среды.
i-Модели первого уровня по пространственному признаку объединяются в группы, каждая из которых представляется одной i-моделью второго уровня. Упорядоченная совокупность i-моделей второго уровня образует второй уровень модели среды. Аналогично могут быть образованы и более высокие уровни. Между i-моделями различных уровней устанавливаются связи, направленные от i-моделей низших к i-моделям высших уровней. i-Модели внутренней модели среды различных уровней будем называть в дальнейшем просто клетками модели среды соответствующих уровней.
В процессе планирования М-автомат не производит каких-либо "реальных" действий. Информация о среде фиксируется во внутренней модели среды при стратегическом осмотре, и в последующем все действия автомат производит "мысленно", используя различные уровни внутренней модели. Последние выбраны в М-автомате так, что простое действие переводит автомат из одной клетки первого уровня модели среды в другую; сложное действие переводит автомат в соседнюю клетку второго уровня модели среды; составное - в соседнюю клетку третьего уровня. Количество клеток различных уровней выбрано таким образом, что на осматриваемом участке среды план верхнего уровня представляет собой одно составное действие, выбираемое автоматом в зависимости от расположения цели и наличия в клетках среды тех или иных объектов. Нижний уровень плана составляет последовательность сложных действий. В процессе планирования двигательного поведения человек, как правило, не производит предварительного выбора конкретных элементарных действий, а ограничивается достаточно общими представлениями о направлении (или последовательности направлений) движения. Это обстоятельство позволяет нам не воспроизводить в автомате планирования простых действий.
ФИКСАЦИЯ ОЦЕНОК ОБЪЕКТОВ СРЕДЫ ВО ВНУТРЕННЕЙ МОДЕЛИ. Остановимся более подробно на процессах оценки автоматом осматриваемого участка среды и построения плана передвижения. Предусмотрены два режима построения плана: планирование промежуточного участка движения и окончание плана. В первом случае цель расположена вне осматриваемого участка среды и автомат на границе участка выбирает подцель - клетку, к которой планируется передвижение. В процессе планирования подцель может быть изменена. Во втором случае цель располагается внутри осматриваемого участка и на процесс планирования накладываются более жесткие ограничения - план должен быть окончен в заданной экспериментатором клетке "цель". Поскольку первый случай является более общим, будем рассматривать процесс планирования, полагая, что цель задана вне осматриваемого участка. При этом вначале выбираются подцели - клетки, находящиеся на пересечении одной из границ участка и прямой, соединяющей собственную клетку автомата и цель.
Оценка участка среды начинается с оценки пространственного расположения ячеек участка по отношению к подцели и минимальному пути к ней. Клетка модели среды первого уровня, в которой расположена подцель, получает максимальную оценку; остальные клетки оцениваются в зависимости от их близости к подцели и прямой, соединяющей подцель с собственной клеткой автомата (т.е. в зависимости от близости к минимальному пути). Оценка собственной клетки автомата равна нулю. В результате операций по пространственной оценке среды на первом уровне модели среды образуется некоторая оценочная поверхность (P-поверхность), которую в дальнейшем будем называть начальной. Примерный вид начальной P-поверхности показан на рис.21.
Рис.21. Начальная P-поверхность (g.0 - место расположения автомата, g.ц - подцель).
Дальнейшая оценка среды связана уже с учетом содержания в среде тех или иных объектов и зависит от "отношения" автомата к этим объектам. Клетки участка среды осматриваются автоматом поочередно, в фиксированном порядке. Стратегический осмотр производится при участии всех блоков РЭМа, и оценка содержимого каждой клетки среды определяется общим состоянием М-сети автомата в момент осмотра. В качестве инструмента оценки используется разность возбуждений i-моделей Пр и НПр эмоциональной сферы автомата. Результат оценки алгебраически суммируется с пространственной оценкой осматриваемой клетки, образуя на начальной P-поверхности "пик" или "впадину" в зависимости от типа воспринятого объекта. Такой процесс можно назвать первичной оценкой, поскольку на этой стадии учитывается содержание только осматриваемой клетки.
Вторичная оценка заключается в распространении представления о "приятном" или "неприятном" на несколько концентрических слоев вокруг той клетки, которая содержит какой-либо объект. Это распространение осуществляется по зависимости
P = P.0 + k*P'/n, (6.1)
где P - оценка клетки, n - номер слоя соседних клеток, P.0 - оценка пространственного расположения клетки, P' - оценка объекта, k - коэффициент пропорциональности.
В результате повышается оценка клеток, расположенных близко к "приятным" объектам, и понижается оценка клеток, расположенных близко к "неприятным" объектам. Образующуюся в итоге на первом уровне модели среды оценочную поверхность, учитывающую как пространственное расположение, так и конкретное содержание клеток среды, будем называть конечной P-поверхностью. Наличие иерархической организации внутренней модели среды позволяет автомату формировать обобщенные представления о среде в виде конечных Р-поверхностей второго и третьего уровней. Формирование таких P-поверхностей производится следующим образом. Выше мы говорили, что первый уровень внутренней модели представлен совокупностью i-моделей отдельных клеток среды. Результатом построения конечной P-поверхности первого уровня является определение возбужденности каждой из этих i-моделей. По связям, установленным от i-моделей первого уровня внутренней модели среды, возбуждение распространяется на второй и третий уровни. Образующиеся в результате этого процесса распределения возбуждений на i-моделях второго и третьего уровней внутренней модели среды и составляют P-поверхности соответствующих уровней.
Сформированные конечные P-поверхности используются в дальнейшем для построения плана передвижения в среде. По P-поверхности третьего уровня производится выбор клетки третьего уровня с максимальной оценкой, и составное действие, соответствующее направлению на нее, становится высшим уровнем плана. Выбор определенного составного действия оказывает влияние на выбор элементов плана низшего уровня (последовательности сложных действий) путем повышения возбуждения i-моделей соответствующих действий. (Например, при составном действии "вверх" будут повышены возбуждения i-модели сложного действия "вверх" и, несколько меньше, i-моделей "влево вверх" и "вправо вверх").
ПОСТРОЕНИЕ ПЛАНА ПО ВНУТРЕННЕЙ МОДЕЛИ СРЕДЫ. Построение плана действий низшего уровня связано с использованием конечной P-поверхности, сформированной на втором уровне модели среды. Пусть автомат строит план начиная с некоторой клетки g.0 второго уровня модели среды. Перебирая возможные сложные действия, автомат придает их i-моделям возбуждения, равные оценкам тех клеток (по P-поверхности), в которые соответствующие действия могут автомат перевести. Кроме того, некоторые i-модели действий получают дополнительное возбуждение от i-модели выбранного составного действия. Дополнительное возбуждение получают также i-модели сложных действий, наиболее соответствующих на данном этапе направлению на подцель. Сложное действие, i-модель которого имеет максимальное возбуждение, принимается в качестве первого элемента плана низшего уровня. Автомат "мысленно" осуществляет выбранное действие, перемещается в соответствующую ему клетку g.k второго уровня внутренней модели среды; процесс повторяется до тех пор, пока автомат не достигает клетки второго уровня, содержащей подцель. Последовательность выбираемых сложных действий запоминается.
ВЫБОР ВАРИАНТА ПЛАНА. В процессе выбора очередного этапа плана возможна ситуация, при которой несколько i-моделей действий имеют одинаковые или достаточно близкие возбуждения. Произвольный выбор одного из них может привести к построению неудовлетворительного плана, поскольку в конечном результате различные варианты могут оказаться неравноценными для автомата. С другой стороны, перебор и оценка всех возможных вариантов не характерны для человека, процессы планирования которого автоматом моделируются. Человек, как правило, просматривает только несколько вариантов и производит выбор лучшего из них, пользуясь некоторым субъективным "критерием оптимальности".
Аналогичный выбор варианта был предусмотрен и в описываемом М-автомате. В качестве "показателя ценности" построенного плана выбрана условная величина
N = СУММА[i=1..m]P.i / m, (6-2)
где m - количество этапов плана, P.i - оценка i-й клетки второго уровня внутренней модели среды, через которую проходит план.
Оценка плана производится автоматом на основании сравнения "показателя ценности" с заранее заданной величиной N.1, отражающей "прошлый опыт" автомата и являющейся "критерием ценности" плана. Если показатель ценности ниже критерия, то рассматривается следующий вариант плана. Этот процесс происходит до тех пор, пока не будет выполнено условие N>=N.1. Если же все варианты плана оцениваются ниже критерия или количество вариантов превышает возможность рассмотрения их автоматом, то происходит сравнение показателей ценности построенных вариантов и выбирается лучший из них. Тот факт, что оценка ни одного из вариантов не превысила критерий, выражается в увеличении возбужденности i-модели "неприятно" в эмоциональной сфере автомата. В дальнейшем это оказывает существенное влияние на выполнение выбранного плана. Если же в процессе выбора вариантов один из них получает оценку, превышающую критерий, то этот вариант принимается как окончательный и построение плана прекращается.
Процесс выбора варианта происходит следующим образом. При наличии двух равноценных действий из клетки g.i одно из них запоминается, а второе принимается для выполнения. (Случай существования трех и более разветвлений плана из одной клетки, во избежание чрезмерного усложнения автомата, не рассматривается, хотя необходимые здесь процедуры принципиально не отличаются от описываемых). Одновременно запоминается порядковый номер этапа плана, на котором произошло разветвление, и построение плана продолжается до возникновения следующего варианта. При втором разветвлении возможного пути производятся те же действия, что и в предыдущем случае, и построение плана продолжается до достижения намеченной подцели. В процессе построения плана запоминается последовательность клеток второго уровня, через которые предполагается передвижение автомата.
По окончании построения первого варианта плана подсчитывается его показатель ценности и, если он оказывается ниже критерия, вариант и его показатель ценности запоминаются, а автомат переходит к построению следующего варианта. Для этого он возвращается в клетку последнего разветвления плана, выполняет запомненное ранее действие и продолжает построение плана по описанным правилам. После окончания построения второго варианта подсчитывается его показатель ценности, и, если он оказывается ниже критерия, автомат возвращается в клетку предпоследнего разветвления и продолжает просмотр новых вариантов. Процесс продолжается до тех пор, пока не будет выбран удовлетворительный вариант или не окажутся просмотренными все возможные. В последнем случае для выбора лучшего варианта используются запомненные показатели ценности. В качестве окончательного выбирается вариант, имеющий максимальный показатель ценности. Процесс выбора варианта плана схематично показан на рис.22.
Рис. 22. Блок-схема процесса построения вариантов плана (n.1, n.2, m.1, m.2 - номера вспомогательных ячеек памяти).
Таким образом, результатом работы блока планирования является построение двухуровневого плана движения. Верхний уровень плана указывает общее направление движения на заданном участке среды; нижний уровень "расшифровывает" эту общую идею движения применительно к конкретным особенностям среды.
Каждый этап плана нижнего уровня представляет собой переход автомата из одной клетки второго уровня в другую. Для контроля за выполнением плана в автомате предусмотрено запоминание последовательности номеров этих клеток. При реальном передвижении автомата в среде специальная следящая система "по результатам" производит определение положения автомата на втором уровне внутренней модели среды и проверку соответствия этого положения запланированному. Кроме контроля за результатами действий автомата производится также и контроль "эмоционального" соответствия реальных и запланированных действии. Это осуществляется следующим образом. Как говорилось ранее, при построении плана автомат пользуется оценками различных клеток среды, сформированными в его эмоциональной сфере. Выбрав определенный план, автомат, на основе этих оценок, формирует последовательность ожидаемых "неприятных" эмоциональных воздействий. При выполнении плана специальная система следит за тем, чтобы реальные "неприятные" воздействия не превышали ожидаемых. Такой постоянный контроль "по результатам" и "по чувствам" за выполнением намеченного плана позволяет автомату более гибко и адекватно реагировать на случайные отклонения от запланированного пути или несоответствие реальной среды той, которая была воспринята при стратегическом осмотре.
ПОСТРОЕНИЕ ПЛАНОВ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ ЧЕЛОВЕКОМ. Двигательному поведению человека, как правило, предшествует акт планирования определенных действий на более или менее длительный промежуток времени. Планирование может производиться на различных уровнях - от выбора общей цели и приближенного анализа пути ее достижения до выбора конкретных действий в определенных ситуациях. При этом фиксация общей цели оказывает существенное влияние на выработку планов более низких уровней.
"План - это всякий иерархически построенный процесс в организме, способный контролировать порядок, в котором должна совершаться какая-либо последовательность операции".
Для выявления правил и приемов, применяемых человеком в процессе планирования, были изучены литературные данные по этому вопросу, а также проведено экспериментальное исследование деятельности человека-испытуемого по построению планов поведения в некоторой условной среде. Основная задача эксперимента состояла в том, чтобы установить специфические особенности изучаемой деятельности в тех конкретных условиях, в которых предстоит действовать конструируемому М-автомату РЭМ. Иначе говоря, необходимо было "привязать" сформулированные в общем виде литературные данные относительно процесса планирования к особенностям определенного ранее "сюжета" моделирования. Поэтому мы стремились построить психологический эксперимент как модель упомянутого сюжета, т.е. поставить человека-испытуемого примерно в те же условия, в которых должен действовать РЭМ. Одна из целей психологического эксперимента состояла, кроме того, в получении материала, пригодного для последующей оценки адекватности работы блока планирования, т.е. для сравнения планов поведения РЭМа с планами поведения человека в аналогичных условиях.
Методика эксперимента была построена таким образом, чтобы обеспечить наблюдение и фиксацию основных особенностей протекания взаимосвязанных процессов формирования планов испытуемыми в выбранной условной среде.
Предварительно, в специальном эксперименте исследовались индивидуальные особенности памяти испытуемых, связанные со скоростью запоминания зрительного материала. Для этого каждому испытуемому предъявлялся следующий тест. На листе бумаги в случайном порядке были написаны буквы русского алфавита. Перед испытуемым ставилась задача - в кратчайшее время прочесть буквы в алфавитном порядке. Время, затрачиваемое испытуемым на прочтение алфавита, измерялось. Эксперимент повторялся до тех пор, пока время воспроизведения не стабилизировалось. На основании анализа кривой запоминания делался вывод о необходимом времени предъявления материала в основном эксперименте для данного испытуемого. При этом применялось следующее эмпирическое правило: время предъявления принималось равным разности между стабилизировавшимся временем воспроизведения алфавита по тесту и временем, затрачиваемым испытуемым без теста.
Эксперимент по построению планов двигательного поведения был проведен с 20 испытуемыми.
Перед испытуемыми ставилась следующая задача: на предъявляемой условной схеме местности (среде) выбрать путь от исходной точки к целевой. Исходная и целевая точки задавались экспериментатором и отмечались на схеме местности специальным образом. Схема местности представляла собой разделенную на клетки плоскость. Каждая клетка была окрашена в один из четырех цветов - белый, зеленый, красный или синий (рис.13). Испытуемому сообщалось, что при выборе пути он должен исходить из следующих соображений: чем большее количество красных клеток пересекает маршрут и чем ближе он к этим клеткам, тем лучше выбранный путь; чем большее количество синих клеток пересекает маршрут и чем ближе он к этим клеткам, тем хуже выбранный путь; белые клетки нейтральны; зеленые клетки "немного хуже" белых; выбираемый путь должен быть по возможности коротким. С учетом этих условий испытуемому предлагалось выбрать оптимальный (с его точки зрения) план передвижения в среде.
Рис.13. Схема среды, предъявляемая испытуемым:
o - красные клетки: * -зеленые; x - синие.
Эксперимент проводился в следующем порядке.
1. Испытуемому объяснялась задача эксперимента и условия. Проводилось предварительное ознакомление с местностью. При этом показываемая испытуемому местность отличалась от той, на которой проводился основной эксперимент, расположением окрашенных клеток и их количеством.
2. На время t, которое выбиралось индивидуально в зависимости от результатов предварительного эксперимента с испытуемым, ему предъявлялась местность с обозначенными исходной и целевой клетками.
3. Испытуемому предлагалось воспроизвести на чистом листе бумаги все, что он запомнил на местности за время предъявления. (Предварительно давалась установка на выбор маршрута, а не на запоминание местности).
4. Испытуемому предлагалось уточнить маршрут и повторно на время t предъявлялась местность.
5. Испытуемому предлагалось нарисовать выбранный путь (или пути).
6. Повторение п.4.
7. Повторение п.5.
8. Повторение п.4.
9. Повторение п.3.
10. Изменялась поставленная задача. Испытуемому предлагалось на верхней границе местности самостоятельно выбрать целевую клетку и построить план ее достижения с учетом предыдущих условий. Предъявлялась местность.
11. Предлагалось нарисовать выбранный путь (или пути).
Все действия испытуемые сопровождали словесным отчетом. Последний этап эксперимента состоял в анализе и оценке испытуемым построенных им планов поведения. Проводилась также имитация изменения условий выбора маршрута передвижения. Испытуемому предлагалось выбрать путь "при наличии большого количества времени на передвижение", "при ограниченном времени", "при дефиците времени". Выбранные маршруты и их варианты фиксировались. В качестве примера ниже приведен протокол эксперимента с испытуемым Г.
ПРОТОКОЛ ЭКСПЕРИМЕНТА ПО ПОСТРОЕНИЮ ПЛАНА ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ
Испытуемый Г., 27 лет.
1. Минимальное время прочтения алфавита по тесту - 17сек. Время прочтения алфавита без теста - 14сек. Время предъявления основного материала выбрано равным 3сек.
2. Воспроизведение запомненного расположения клеток на местности.
Рисует местность (рис.14). "Хорошо запомнил область красных клеток. Синие помню плохо. Зеленые образуют поля, охватывающие красные клетки".
Рис.14. Схематическое воспроизведение среды испытуемым (первое предъявление).
3. Выбор плана передвижения.
Рисует план (рис.15). "Видел квадраты белого поля. Зеленое тоже образует квадраты. Где-то в центре есть синее поле. Не помню точно, где какие клетки, но если путь проведу так, то, по-моему, пройду через зеленое, белое и красное. Сколько будет красных - не знаю, но должен пройти или через них или совсем рядом. Путь, конечно, должен идти вправо. Вообще, вся правая часть мне кажется как-то лучше, больше привлекает внимание".
Рис.15. План передвижения, выбранный испытуемым (второе предъявление среды).
4. Выбор плана передвижения.
Рисует план (рис.16). "Теперь я смотрел только на правую часть. Вначале пошел вправо до красной клетки и от нее - дальше по прямой. Но там синие. Вернулся в красную клетку и пошел опять вправо, обходя синюю снизу, но так будет очень далеко. Нужно обходить сверху. Опять вернулся в красную и пошел вверх на белую поляну с красной клеткой, а оттуда прямо на цель. Еще раз просмотрел весь путь и решил "срезать" его немного. В самую нижнюю краевую клетку заходить не буду. Так, пожалуй, лучше".
Рис. 16. План передвижения, выбранный испытуемым (третье предъявление среды).
Пунктиром показаны просмотренные варианты, сплошной линией - окончательно выбранный план передвижения.
5. Воспроизведение расположения клеток на местности. Рисует местность (рис.17). "Теперь я постарался запомнить и левую часть, но все-таки правая мне как-то больше нравится. Четко выделяются зоны, явно плохие для маршрута. Например, в центре. Правда, слева много красных клеток и белого, по они очень далеко. А вот справа внизу очень хорошая область. Там и красных достаточно, и к цели по ним быстро пройти можно. И выше, там. где белая поляна, тоже хорошая область".
Рис. 17. Схематическое воспроизведение среды испытуемым (четвертое предъявление).
6. Выбор плана передвижения к произвольной клетке на верхней границе местности.
Рисует план (рис.18 ). "Теперь, конечно, можно пойти по-другому Можно было бы вообще обойти зеленое и по красным выйти наверх, но так очень далеко. Наверное, будет лучше идти через левую белую поляну".
Рис.18. План передвижения к произвольной клетке.
7. Имитация изменения условий выбора плана передвижения. "Если у меня много времени, то я пойду, пожалуй, влево. Там есть несколько красных. Зайду в белую поляну. Из нее - вверх, а там по красным клеткам дойду до цели. Если времени достаточно, но не слишком много, пойду так, как шел раньше - вправо через правую белую поляну. Ну, а если совсем мало времени, тогда даже не стану заходить на поляну, обойду только справа синий массив и - прямо к цели".
Выбранные испытуемым планы передвижения показаны на рис.19.
Рис. 19. Планы передвижения, выбранные испытуемым при изменении условий планирования:
-..-, --- избыток времени; -.- дефицит времени; - - - нейтральные условия.
В результате анализа словесных отчетов испытуемых были сделаны некоторые предположения о содержании и последовательности этапов построения человеком планов двигательного поведения. Одним из основных нам кажется предположение о формировании особого рода "внутренней модели", представляющей собой некоторый набор оценок участков среды, производимых в соответствии с особенностями среды и конечной целью планирования. Испытуемые, как правило, выделяли в предъявляемой им схеме местности "хорошие" и "плохие" участки. Характер оценки тех или иных участков обусловливался двумя причинами - наличием определенным образом окрашенных клеток (здесь было замечено разделение испытуемых на две группы: одни производили оценку в основном по синим клеткам, другие - по красным) и близостью клеток к кратчайшему пути - от исходной клетки к целевой.
На основе таких оценок участков среды производился выбор планов передвижения, их сравнение и окончательный выбор одного из них (варианта). Необходимо отметить, что различные испытуемые по-разному оценивали одни и те же участки среды. Так, например, испытуемый Г. при проведении анализа выбранных им планов отметил, что ему "с самого начала вся правая часть казалась лучше; она как-то приятнее, может быть даже гармоничнее". В то же время испытуемый Т. считал, что "левая часть гораздо интереснее, она больше привлекает внимание". Ряд испытуемых, первоначально фиксировавших внимание на одной из частей схемы местности (обычно, это была левая часть), в последующем изменяли свои оценки (испытуемый М.: "Сначала я строил обход синего поля слева, но теперь мне кажется, что путь справа будет лучше. Здесь достаточно много красного, от синих можно пройти далеко, и путь, по-моему, будет короче").
Таким образом, можно предположить, что произведенная оценка среды корректируется при получении дополнительной информации (повторных предъявлениях схемы среды) или изменении цели планирования (например, в условиях описанного эксперимента - при изменении целевой клетки). Различия в оценках среды можно, по-видимому, объяснить различным прошлым опытом и индивидуальными особенностями личности испытуемых.
При проведении экспериментального исследования были замечены следующие характерные особенности процесса планирования.
1. Производилась субъективная оценка среды, основанная на определенных интерпретациях ее элементов (например, синие - опасность).
2. Строилась иерархия планов. Выбор общего направления движения влиял на выбор конкретных этапов плана.
3. Просматривалось два-три варианта плана, проводилась их сравнительная оценка и на ее основе выбирался окончательный план поведения.
4. Запоминались в качестве ориентиров определенные элементы (клетки) среды, расположенные на каждом этапе выбранного плана.
Выявлено два механизма влияния высшего уровня плана двигательного поведения на выбор конкретных этапов плана. Первый механизм - влияние общего направления движения - обусловливает концентрацию внимания испытуемого на тех участках местности, которые расположены в "зоне главного направления". Второй механизм связан с коррекцией направления общего движения на каждом выбираемом этапе плана.
Сделанные в результате анализа экспериментов предположения, а также сведения о процессе планирования, имеющиеся в литературе, были положены в основу алгоритма блока планирования М-автомата РЭМ.
ОПИСАНИЕ БЛОКА ПЛАНИРОВАНИЯ ПОВЕДЕНИЯ. Особенности построения человеком планов двигательного поведения, замеченные при экспериментальном исследовании этого процесса, позволили построить модель, поведение которой в определенном отношении близко к поведению человека. Модель представляет собой неполный М-автомат и является одним из блоков автомата РЭМ, воспроизводящего процессы переработки информации, связанные с формированием двигательного поведения.
Поскольку планирование поведения обусловлено наличием определенной информации о среде, в модели предусмотрен осмотр участков среды, больших, чем окрестность автомата. В отличие от "ситуативного" осмотра среды в пределах окрестности автомата будем называть этот осмотр "стратегическим".
Стратегический осмотр заключается в последовательном восприятии содержимого клеток определенного участка среды и является первым этапом построения "внутренней модели" этого участка.
Цель движения автомата задается экспериментатором в виде координат клетки среды, которую в дальнейшем будем называть просто целью. Находясь в одной из клеток, автомат определяет направление движения на цель и, в соответствии с этим, производит выбор участка среды, необходимого для стратегического осмотра. Предполагается, что автомат всегда осматривает участок одного размера ("поле зрения" автомата) и располагает его "впереди" себя; кроме того, количество возможных поворотов автомата ограничено четырьмя (в принятой системе координат - вниз, вправо, вверх, влево). Выбор конкретного расположения участка определяется взаимным расположением в среде автомата и цели.
ПРЕДСТАВЛЕНИЕ ВНУТРЕННЕЙ МОДЕЛИ СРЕДЫ. Ограничение, связанное с фиксацией размеров осматриваемого участка среды, не является принципиальным. В то же время такое допущение позволяет считать, что в структуре автомата сформирована внутренняя модель соответствующего участка пространства среды. Исходя из этого предположения, мы задаем иерархию внутренних моделей среды, соответствующих различным уровням пространственных обобщений (рис.20). Первый, низший, уровень внутренней модели состоит из совокупности i-моделей отдельных клеток среды, причем семантика каждой i-модели отражает здесь пространственное положение клетки в среде. Необходимо отметить, что i-моделям клеток не соответствуют какие-либо конкретные объекты. Совокупность этих i-моделей является лишь "представлением автомата о пространстве". Определенное содержание может быть внесено в них только после осмотра среды (этот процесс будет описан ниже).
Рис.20. Структура внутренней модели среды.
i-Модели первого уровня по пространственному признаку объединяются в группы, каждая из которых представляется одной i-моделью второго уровня. Упорядоченная совокупность i-моделей второго уровня образует второй уровень модели среды. Аналогично могут быть образованы и более высокие уровни. Между i-моделями различных уровней устанавливаются связи, направленные от i-моделей низших к i-моделям высших уровней. i-Модели внутренней модели среды различных уровней будем называть в дальнейшем просто клетками модели среды соответствующих уровней.
В процессе планирования М-автомат не производит каких-либо "реальных" действий. Информация о среде фиксируется во внутренней модели среды при стратегическом осмотре, и в последующем все действия автомат производит "мысленно", используя различные уровни внутренней модели. Последние выбраны в М-автомате так, что простое действие переводит автомат из одной клетки первого уровня модели среды в другую; сложное действие переводит автомат в соседнюю клетку второго уровня модели среды; составное - в соседнюю клетку третьего уровня. Количество клеток различных уровней выбрано таким образом, что на осматриваемом участке среды план верхнего уровня представляет собой одно составное действие, выбираемое автоматом в зависимости от расположения цели и наличия в клетках среды тех или иных объектов. Нижний уровень плана составляет последовательность сложных действий. В процессе планирования двигательного поведения человек, как правило, не производит предварительного выбора конкретных элементарных действий, а ограничивается достаточно общими представлениями о направлении (или последовательности направлений) движения. Это обстоятельство позволяет нам не воспроизводить в автомате планирования простых действий.
ФИКСАЦИЯ ОЦЕНОК ОБЪЕКТОВ СРЕДЫ ВО ВНУТРЕННЕЙ МОДЕЛИ. Остановимся более подробно на процессах оценки автоматом осматриваемого участка среды и построения плана передвижения. Предусмотрены два режима построения плана: планирование промежуточного участка движения и окончание плана. В первом случае цель расположена вне осматриваемого участка среды и автомат на границе участка выбирает подцель - клетку, к которой планируется передвижение. В процессе планирования подцель может быть изменена. Во втором случае цель располагается внутри осматриваемого участка и на процесс планирования накладываются более жесткие ограничения - план должен быть окончен в заданной экспериментатором клетке "цель". Поскольку первый случай является более общим, будем рассматривать процесс планирования, полагая, что цель задана вне осматриваемого участка. При этом вначале выбираются подцели - клетки, находящиеся на пересечении одной из границ участка и прямой, соединяющей собственную клетку автомата и цель.
Оценка участка среды начинается с оценки пространственного расположения ячеек участка по отношению к подцели и минимальному пути к ней. Клетка модели среды первого уровня, в которой расположена подцель, получает максимальную оценку; остальные клетки оцениваются в зависимости от их близости к подцели и прямой, соединяющей подцель с собственной клеткой автомата (т.е. в зависимости от близости к минимальному пути). Оценка собственной клетки автомата равна нулю. В результате операций по пространственной оценке среды на первом уровне модели среды образуется некоторая оценочная поверхность (P-поверхность), которую в дальнейшем будем называть начальной. Примерный вид начальной P-поверхности показан на рис.21.
Рис.21. Начальная P-поверхность (g.0 - место расположения автомата, g.ц - подцель).
Дальнейшая оценка среды связана уже с учетом содержания в среде тех или иных объектов и зависит от "отношения" автомата к этим объектам. Клетки участка среды осматриваются автоматом поочередно, в фиксированном порядке. Стратегический осмотр производится при участии всех блоков РЭМа, и оценка содержимого каждой клетки среды определяется общим состоянием М-сети автомата в момент осмотра. В качестве инструмента оценки используется разность возбуждений i-моделей Пр и НПр эмоциональной сферы автомата. Результат оценки алгебраически суммируется с пространственной оценкой осматриваемой клетки, образуя на начальной P-поверхности "пик" или "впадину" в зависимости от типа воспринятого объекта. Такой процесс можно назвать первичной оценкой, поскольку на этой стадии учитывается содержание только осматриваемой клетки.
Вторичная оценка заключается в распространении представления о "приятном" или "неприятном" на несколько концентрических слоев вокруг той клетки, которая содержит какой-либо объект. Это распространение осуществляется по зависимости
P = P.0 + k*P'/n, (6.1)
где P - оценка клетки, n - номер слоя соседних клеток, P.0 - оценка пространственного расположения клетки, P' - оценка объекта, k - коэффициент пропорциональности.
В результате повышается оценка клеток, расположенных близко к "приятным" объектам, и понижается оценка клеток, расположенных близко к "неприятным" объектам. Образующуюся в итоге на первом уровне модели среды оценочную поверхность, учитывающую как пространственное расположение, так и конкретное содержание клеток среды, будем называть конечной P-поверхностью. Наличие иерархической организации внутренней модели среды позволяет автомату формировать обобщенные представления о среде в виде конечных Р-поверхностей второго и третьего уровней. Формирование таких P-поверхностей производится следующим образом. Выше мы говорили, что первый уровень внутренней модели представлен совокупностью i-моделей отдельных клеток среды. Результатом построения конечной P-поверхности первого уровня является определение возбужденности каждой из этих i-моделей. По связям, установленным от i-моделей первого уровня внутренней модели среды, возбуждение распространяется на второй и третий уровни. Образующиеся в результате этого процесса распределения возбуждений на i-моделях второго и третьего уровней внутренней модели среды и составляют P-поверхности соответствующих уровней.
Сформированные конечные P-поверхности используются в дальнейшем для построения плана передвижения в среде. По P-поверхности третьего уровня производится выбор клетки третьего уровня с максимальной оценкой, и составное действие, соответствующее направлению на нее, становится высшим уровнем плана. Выбор определенного составного действия оказывает влияние на выбор элементов плана низшего уровня (последовательности сложных действий) путем повышения возбуждения i-моделей соответствующих действий. (Например, при составном действии "вверх" будут повышены возбуждения i-модели сложного действия "вверх" и, несколько меньше, i-моделей "влево вверх" и "вправо вверх").
ПОСТРОЕНИЕ ПЛАНА ПО ВНУТРЕННЕЙ МОДЕЛИ СРЕДЫ. Построение плана действий низшего уровня связано с использованием конечной P-поверхности, сформированной на втором уровне модели среды. Пусть автомат строит план начиная с некоторой клетки g.0 второго уровня модели среды. Перебирая возможные сложные действия, автомат придает их i-моделям возбуждения, равные оценкам тех клеток (по P-поверхности), в которые соответствующие действия могут автомат перевести. Кроме того, некоторые i-модели действий получают дополнительное возбуждение от i-модели выбранного составного действия. Дополнительное возбуждение получают также i-модели сложных действий, наиболее соответствующих на данном этапе направлению на подцель. Сложное действие, i-модель которого имеет максимальное возбуждение, принимается в качестве первого элемента плана низшего уровня. Автомат "мысленно" осуществляет выбранное действие, перемещается в соответствующую ему клетку g.k второго уровня внутренней модели среды; процесс повторяется до тех пор, пока автомат не достигает клетки второго уровня, содержащей подцель. Последовательность выбираемых сложных действий запоминается.
ВЫБОР ВАРИАНТА ПЛАНА. В процессе выбора очередного этапа плана возможна ситуация, при которой несколько i-моделей действий имеют одинаковые или достаточно близкие возбуждения. Произвольный выбор одного из них может привести к построению неудовлетворительного плана, поскольку в конечном результате различные варианты могут оказаться неравноценными для автомата. С другой стороны, перебор и оценка всех возможных вариантов не характерны для человека, процессы планирования которого автоматом моделируются. Человек, как правило, просматривает только несколько вариантов и производит выбор лучшего из них, пользуясь некоторым субъективным "критерием оптимальности".
Аналогичный выбор варианта был предусмотрен и в описываемом М-автомате. В качестве "показателя ценности" построенного плана выбрана условная величина
N = СУММА[i=1..m]P.i / m, (6-2)
где m - количество этапов плана, P.i - оценка i-й клетки второго уровня внутренней модели среды, через которую проходит план.
Оценка плана производится автоматом на основании сравнения "показателя ценности" с заранее заданной величиной N.1, отражающей "прошлый опыт" автомата и являющейся "критерием ценности" плана. Если показатель ценности ниже критерия, то рассматривается следующий вариант плана. Этот процесс происходит до тех пор, пока не будет выполнено условие N>=N.1. Если же все варианты плана оцениваются ниже критерия или количество вариантов превышает возможность рассмотрения их автоматом, то происходит сравнение показателей ценности построенных вариантов и выбирается лучший из них. Тот факт, что оценка ни одного из вариантов не превысила критерий, выражается в увеличении возбужденности i-модели "неприятно" в эмоциональной сфере автомата. В дальнейшем это оказывает существенное влияние на выполнение выбранного плана. Если же в процессе выбора вариантов один из них получает оценку, превышающую критерий, то этот вариант принимается как окончательный и построение плана прекращается.
Процесс выбора варианта происходит следующим образом. При наличии двух равноценных действий из клетки g.i одно из них запоминается, а второе принимается для выполнения. (Случай существования трех и более разветвлений плана из одной клетки, во избежание чрезмерного усложнения автомата, не рассматривается, хотя необходимые здесь процедуры принципиально не отличаются от описываемых). Одновременно запоминается порядковый номер этапа плана, на котором произошло разветвление, и построение плана продолжается до возникновения следующего варианта. При втором разветвлении возможного пути производятся те же действия, что и в предыдущем случае, и построение плана продолжается до достижения намеченной подцели. В процессе построения плана запоминается последовательность клеток второго уровня, через которые предполагается передвижение автомата.
По окончании построения первого варианта плана подсчитывается его показатель ценности и, если он оказывается ниже критерия, вариант и его показатель ценности запоминаются, а автомат переходит к построению следующего варианта. Для этого он возвращается в клетку последнего разветвления плана, выполняет запомненное ранее действие и продолжает построение плана по описанным правилам. После окончания построения второго варианта подсчитывается его показатель ценности, и, если он оказывается ниже критерия, автомат возвращается в клетку предпоследнего разветвления и продолжает просмотр новых вариантов. Процесс продолжается до тех пор, пока не будет выбран удовлетворительный вариант или не окажутся просмотренными все возможные. В последнем случае для выбора лучшего варианта используются запомненные показатели ценности. В качестве окончательного выбирается вариант, имеющий максимальный показатель ценности. Процесс выбора варианта плана схематично показан на рис.22.
Рис. 22. Блок-схема процесса построения вариантов плана (n.1, n.2, m.1, m.2 - номера вспомогательных ячеек памяти).
Таким образом, результатом работы блока планирования является построение двухуровневого плана движения. Верхний уровень плана указывает общее направление движения на заданном участке среды; нижний уровень "расшифровывает" эту общую идею движения применительно к конкретным особенностям среды.
Каждый этап плана нижнего уровня представляет собой переход автомата из одной клетки второго уровня в другую. Для контроля за выполнением плана в автомате предусмотрено запоминание последовательности номеров этих клеток. При реальном передвижении автомата в среде специальная следящая система "по результатам" производит определение положения автомата на втором уровне внутренней модели среды и проверку соответствия этого положения запланированному. Кроме контроля за результатами действий автомата производится также и контроль "эмоционального" соответствия реальных и запланированных действии. Это осуществляется следующим образом. Как говорилось ранее, при построении плана автомат пользуется оценками различных клеток среды, сформированными в его эмоциональной сфере. Выбрав определенный план, автомат, на основе этих оценок, формирует последовательность ожидаемых "неприятных" эмоциональных воздействий. При выполнении плана специальная система следит за тем, чтобы реальные "неприятные" воздействия не превышали ожидаемых. Такой постоянный контроль "по результатам" и "по чувствам" за выполнением намеченного плана позволяет автомату более гибко и адекватно реагировать на случайные отклонения от запланированного пути или несоответствие реальной среды той, которая была воспринята при стратегическом осмотре.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Re: 02.06. НЕХВАТКА ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА
#5. РЕАЛИЗАЦИЯ М-АВТОМАТА РЭМ
Из предыдущего описания автомата РЭМ видно, что его функционирование может быть естественным образом разделено на два этапа. Первый - процесс построения плана двигательного поведения. Этот вид деятельности выполняется автоматом без непосредственных перемещений в среде и заканчивается формированием двухуровневого плана передвижения. Второй этап состоит в выполнении плана, т.е. в реальном передвижении в среде, и заканчивается в момент достижения цели или при обнаружении значительных отклонений от плана. В последнем случае, а также если достигнутая цель была только промежуточной и необходимо продолжить движение, автомат опять переходит к выполнению первого этапа, затем второго и т.д., до момента достижения главной цели, заданной экспериментатором.
Относительная самостоятельность функции М-автомата на каждом из этапов позволила нам реализовать автомат РЭМ в виде двух взаимодействующих моделей - планирования и выполнения планов двигательного поведения. Необходимость такой раздельной реализации была обусловлена малым объемом оперативной памяти той ЦВМ, которой мы могли пользоваться для машинного представления и экспериментального исследования РЭМа. Ниже мы еще вернемся к обсуждению преимуществ и недостатков, связанных с выбранным способом реализации автомата, а пока остановимся кратко на особенностях конкретного представления основных функций переработки информации и поведения в обеих моделях.
МОДЕЛЬ ПЛАНИРОВАНИЯ РЭМ-1. РЭМ-1 - неполный М-автомат - реализован в виде двух последовательно работающих программ для ЦВМ М-220. Первая программа предназначена для построения оценочных P-поверхностей. Исходной информацией для нее служат сведения о расположении объектов в среде, "субъективной" оценке каждого из объектов М-сетью РЭМа-2 и положении главной, заданной экспериментатором цели. Программа выделяет в среде участок для стратегического осмотра, определяет, если это необходимо, положение промежуточной цели и строит P-поверхности, соответствующие различным уровням внутренней модели среды.
Как уже упоминалось, каждая клетка верхнего уровня внутренней модели среды является представителем упорядоченной (пространственно) совокупности клеток предыдущего уровня. При реализации автомата РЭМ-1 был зафиксирован размер участка среды, осматриваемого автоматом в режиме планирования, и положение автомата внутри этого участка. Принято, что автомат осматривает участок длиной в 27 и шириной в 12 клеток. При этом сам автомат расположен в средней клетке нижней границы участка. Таким образом, нижний уровень внутренней модели среды представлен 324 i-моделями клеток. Общее количество формируемых автоматом уровней внутренней модели среды ограничено тремя. Все клетки одного уровня имеют одинаковые размеры, т.е. состоят из одинакового количества клеток предыдущего уровня. Зафиксировав способ пространственного объединения клеток каждого уровня, мы выделили 36 клеток второго уровня и 6 клеток третьего уровня внутренней модели среды (см. рис.20).
В принципе, стратегический осмотр и оценки различных объектов среды, необходимые для построения P-поверхностей всех уровней, должны производиться автоматом РЭМ-2, а результат осмотра должен передаваться программе построения P-поверхностей вообще без участия экспериментатора. Однако, поскольку, в силу ряда технических ограничений, мы вынуждены были строить модели РЭМ-1 и РЭМ-2 в виде отдельных программ для ЦВМ, решено было использовать это обстоятельство для проведения дополнительных самостоятельных экспериментальных исследований каждой из моделей. В связи с этим было предусмотрено осуществление всех "контактов" между РЭМ-1 и РЭМ-2 через человека-экспериментатора. Это позволило нам, во-первых, произвести отладку и настройку всех программ вне связи друг с другом (что весьма существенно при работе со сложными моделями) и, во-вторых, достаточно подробно исследовать поведение моделей, делая упор на выявление и иллюстрацию специфических особенностей каждой из них в отдельности.
Для обеспечения самостоятельного исследования моделей оказалось необходимым организовать дополнительную подготовку исходной для каждой модели информации. Так, например, для первой программы автомата РЭМ-1 - программы построения оценочных P-поверхностей - необходимо задавать информацию не только о расположении объектов в среде, но и об оценке каждого типа объекта. Такие оценки могут быть предварительно сформированы автоматом РЭМ-2 или заданы непосредственно экспериментатором.
Задание среды для программы построения оценочных P-поверхностей производилось следующим образом. В каждую клетку среды, содержащую определенный объект, заносился не знак этого объекта (номер i-модели М-сети автомата РЭМ-2), а некоторая условная величина, соответствующая оценке данного объекта. Подбором соотношений оценок различных объектов задавался тип М-автомата.
Значительное влияние па вид P-поверхностей оказывает также задаваемая экспериментатором оценка клетки "цель" ("сила цели"). Чем выше эта оценка, тем больше крутизна начальной P-поверхности и, следовательно, выше вероятность выбора автоматом таких этапов плана, которые проходят через клетки, расположенные вдоль минимального маршрута - прямой, соединяющей клетки автомата и цели. Задавая различные "силы цели", можно проследить изменение планов поведения автомата. Представляет интерес также сопоставление планов поведения автоматов различных типов при одинаковых "силах цели".
Блок-схема программы построения оценочных P-поверхностей приведена на рис.23. Программа написана для ЦВМ М-220 и содержит около 1100 команд. Время работы ЦВМ по данной программе составляет примерно полторы минуты.
Рис 23. Блок-схема программы построения оценочных поверхностей.
В другой программе, реализующей РЭМ-1,- построение плана двигательного поведения - используются сформированные конечные P-поверхности и, кроме описанных ранее механизмов планирования, содержится также дополнительный алгоритм коррекции "К". Алгоритм производит такую коррекцию P-поверхности второго уровня, которая облегчает автомату определение направления на цель. Как уже было описано выше, в процессе планирования автомат "мысленно" переходит из одной клетки второго уровня внутренней модели среды в другую - соседнюю. Выбор направления "шага" зависит от величины оценки соответствующей клетки. Для того чтобы на каждом этапе плана, т.е. после каждого "мысленного шага", автомат не терял общего направления на цель, алгоритм "К" увеличивает оценку (на втором уровне внутренней модели) одной или двух соседних клеток из окрестности автомата, ближайших к клетке, содержащей цель. Таким образом, алгоритм "К" играет роль своеобразного компаса. Коррекция при помощи алгоритма "К" представляет собой третий этап уточнения внутренней модели среды. Измененная в результате последовательных коррекций P-поверхность отражает уже не только оценки объектов среды и начальное взаимное расположение автомата и цели, но и учитывает потенциальное изменение положения автомата относительно цели в процессе последующего выполнения плана.
Увеличение на каждом этапе плана оценок определенных клеток окрестности автомата следует понимать как компонент "силы стремления" к цели или "установку" для ее достижения. Изменяя величину корректирующих добавок, можно проследить влияние этого параметра на процесс построения автоматом планов двигательного поведения.
Блок-схема программы построения планов поведения приведена на рис.24. Программа содержит около 1200 команд ЦВМ М-220. Время ее работы составляет одну-три минуты и зависит от количества просматриваемых автоматом вариантов плана.
Рис.24. Блок-схема программы построения планов. Обозначения те же, что и на рис.22.
МОДЕЛЬ ПЕРЕДВИЖЕНИЯ РЭМ-2. РЭМ-2 представляет собой полный М-автомат, организующий целенаправленное двигательное поведение. Процессы переработки информации, обеспечивающие автомату адекватность реакций на различные ситуации среды, осуществляются М-сетью, содержащей 90 i-моделей и 400 связей.
Автомат реализован в виде программы для ЦВМ М-220. Программа допускает изменение количества i-моделей и связей М-сети автомата, причем максимальное количество i-моделей не должно превышать 300, а максимальное количество связей - 1200. Все i-модели сети могут быть разделены не более чем на 30 групп, каждая из которых может иметь отличные от остальных параметры характеристик i-моделей. Введенные ограничения на максимальное количество элементов М-сети обусловлены объемом памяти и степенью быстродействия используемой ЦВМ М-220.
Как уже отмечалось, в автомате РЭМ не реализованы функции обучения и самоорганизации. Конкретно это выражается в том, что в процессе функционирования автомата проходимости связей и характеристики i-моделей его М-сети не изменяются.
Для удобства предварительной организации и настройки М-сети автомата принято, что каждая связь может быть либо усиливающей, либо тормозной. Величина проходимости связи выбирается в диапазоне от 0 до 1. Задание вида (тормозного или усиливающего), а также конкретной величины проходимости той или иной связи производилось в основном эвристически. Аналогично задавались и параметры характеристик i-моделей. В дальнейшем, при настройке автомата, осуществлялась необходимая коррекция - изменение проходимостей отдельных связей, изменение "знака", т.е. установление усиливающей связи взамен тормозной или наоборот, а также изменение значений параметров характеристик i-моделей.
Вид характеристик i-моделей был задан в соответствии с представлениями исходной гипотезы. Конкретно для реализации каждой из характеристик i-моделей выбраны следующие функции.
1. Характеристика торможения:
Kt.i = K.нi - K*СУММА[j=1..m](П[t-1].j*~R.ij), (6.3)
где Kt.i - текущее значение коэффициента возбудимости i-й i-модели; K.нi - начальное значение коэффициента возбудимости i-й i-модели; m - количество тормозных связей, подходящих к i-й i-модели; П[t-1].j - возбужденность i-моделей, имеющих связи, направленные к i-й i-модели; R.ij - проходимость тормозных связей, подходящих к i-й i-модели; K - коэффициент пропорциональности.
2. Характеристика затухания:
Пt.i = П[t-1].i*a, (6.4)
где a - коэффициент затухания возбужденности i-й i-модели, 0<=a<=1.
3. Характеристика возбуждения:
Пt.i = K.нi * ln СУММА[j=m+1..n](П[t-1].j*R.ij), (6.5)
где n - общее количество связей, подходящих к i-й i-модели; R.ij - проходимости усиливающих связей, подходящих к i-й i-модели.
Характеристики гипертрофии и адаптации для i-моделей М-сети автомата РЭМ не задавались.
Передача возбуждения в М-сети осуществляется в соответствии со следующим правилом:
Пt.i =
x при x>=y,
y при х<у, (6.6)
где
x =
(K.нi-K*СУММА[j=1..m](П[t-1].j*~R.ij)) * ln СУММА[j=m+1..n](П[t-1].j*R.ij) при СУММА[j=m+1..n](П[t-1].j*R.ij) > O.i
0 при СУММА[j=m+1..n](П[t-1].j*R.ij) <= O.i;
y = П[t-1].i * a;
O.i - порог возбуждения i-й i-модели.
Таким образом, в каждый момент времени возбужденность i-модели определяется либо внешними активными и тормозными воздействиями (Пt.i=x), либо собственным возбуждением в предыдущий момент (Пt.i=y).
В каждый момент времени СУТ производит выбор наиболее возбужденных i-моделей сети, для которых выполняется условие
П.i >= П.max - Z, (6.7)
где П.i - возбужденность i-й i-модели; П.max - возбужденность наиболее возбужденной i-модели сети; Z - допустимая разность возбуждений для выделяемых СУТ i-моделей.
Возбуждения выделенных СУТ i-моделей изменяются следующим образом:
П.о = Пн.j + П.s/K, (6.8 )
где П.j - возбужденность j-й i-модели после ее выделения СУТ; Пн.j - начальная возбужденность j-й i-модели; П.s - суммарное для всей группы выделенных i-моделей дополнительное возбуждение; K (K<=M) - количество выделенных СУТ i-моделей (M - максимальная величина группы выделяемых СУТ i-моделей; M задается экспериментатором и определяет максимальный "объем внимания").
Если в момент t j-я i-модель выделена СУТ, то в момент t+1 ее возбужденность
П[t+1].j = Пt.j * h, (6.9)
где h - коэффициент затухания возбуждения выделенных СУТ i-моделей, 0<=h<=1, h<a.
Затухание возбуждения j-й i-модели по зависимости (6.9) происходит до тех пор, пока в какой-то момент времени она не окажется вне выделенной СУТ группы i-моделей. После этого изменение ее возбуждения подчиняется общему правилу пересчета (6.6), принятому для М-сети автомата РЭМ.
Блок-схема программы, реализующей автомат РЭМ-2, приведена на рис.25. Программа содержит около 1200 команд. Время ее работы зависит от количества элементов (i-моделей и связей) М-сети и количества тактов (моментов дискретного времени) функционирования автомата. Для М-сети, содержащей 90 i-моделей и 400 связей, один такт работы, т.е. один пересчет, занимает примерно полторы минуты машинного времени ЦВМ М-220.
Рис.25. Блок-схема программы, реализующей М-автомат РЭМ-2.
При передвижении в среде РЭМ-2 пользуется планом, сформированным для этой же среды автоматом РЭМ-1. Если план оказывается неудачным и РЭМ-2 не в состоянии его выполнить, т.е. при рассогласовании "по чувствам" или "по результатам" плана и реального передвижения автомата, то возникает необходимость в построении нового плана, учитывающего изменившееся "эмоциональное" состояние автомата РЭМ-2. В этом случае РЭМ-2 формирует новые оценки объектов среды и новые критерии оценки плана поведения, которые и служат исходной информацией для работы автомата РЭМ-1. РЭМ-1 формирует новый план, передает его РЭМу-2 и т.д. Таким образом происходит взаимодействие автоматов. Посредником при этом является человек-экспериментатор, функции которого весьма ограничены и состоят в основном в периодической замене определенных перфокарт и вводе соответствующей программы в вычислительную машину. Несмотря на очевидную возможность автоматизации таких функций, т.е. передачи их самой машине, мы предпочли все же не объединять модели РЭМ-1 и РЭМ-2 в одну комплексную модель. Из сопоставления затрат машинного времени на просчет каждой из программ, составляющих автомат РЭМ, видно, что все построение плана занимает примерно столько же времени, сколько один такт работы М-сети автомата РЭМ-2. Если к тому же учесть, что для анализа процессов в М-сети необходимо хотя бы 15-20 тактов ее работы, становится понятным наше стремление сделать каждую из моделей как можно более самостоятельной. В противном случае вряд ли можно было бы надеяться на достаточно полное исследование модели планирования. Что же касается модели выполнения плана, т.е. РЭМа-2, то отсутствие непосредственной связи с РЭМом-1, в принципе, может отразиться на его работе только при нарушении плана. Поэтому мы выбрали такую схему исследования РЭМа-2, в которой нарушение плана поведения либо вообще не требовало дальнейшего продолжения эксперимента, либо требовало коррекции М-сети РЭМа-2, а не перестройки плана.
Не следует, однако, считать, что мы полностью отказались от исследования взаимодействия автоматов РЭМ-1 и РЭМ-2. Напротив, такое исследование составляло одну из важных задач нашей работы, поскольку необходимо было проверить целесообразность построения неполных М-автоматов. Однако такую проверку решено было сделать заключительным этапом экспериментального исследования автомата РЭМ.
Тактическая схема наших исследований состояла в следующем. На первом этапе необходимо было рассмотреть влияние на процесс построения плана таких параметров, как оценка объектов среды, "сила цели" и взаимное расположение автомата и цели в среде. Кроме того, следовало выяснить влияние различных параметров на количество просматриваемых автоматом вариантов плана поведения.
На втором этапе предполагалось выбрать один из наиболее характерных планов для данной среды и настроить автомат таким образом, чтобы выполнение этого плана не вызывало резких положительных или отрицательных "эмоциональных" реакций автомата. Впоследствии изменением структуры и параметров М-сети автомата мы надеялись продемонстрировать влияние предварительной организации на характер генерируемого автоматом поведения. Кроме того, необходимо было исследовать влияние ряда параметров М-сети и СУТ на процесс формирования внешних и внутренних реакций автомата.
И, наконец, на третьем этапе было решено проверить согласованность работы моделей планирования и выполнения плана и провести комплексное исследование автомата РЭМ.
Из предыдущего описания автомата РЭМ видно, что его функционирование может быть естественным образом разделено на два этапа. Первый - процесс построения плана двигательного поведения. Этот вид деятельности выполняется автоматом без непосредственных перемещений в среде и заканчивается формированием двухуровневого плана передвижения. Второй этап состоит в выполнении плана, т.е. в реальном передвижении в среде, и заканчивается в момент достижения цели или при обнаружении значительных отклонений от плана. В последнем случае, а также если достигнутая цель была только промежуточной и необходимо продолжить движение, автомат опять переходит к выполнению первого этапа, затем второго и т.д., до момента достижения главной цели, заданной экспериментатором.
Относительная самостоятельность функции М-автомата на каждом из этапов позволила нам реализовать автомат РЭМ в виде двух взаимодействующих моделей - планирования и выполнения планов двигательного поведения. Необходимость такой раздельной реализации была обусловлена малым объемом оперативной памяти той ЦВМ, которой мы могли пользоваться для машинного представления и экспериментального исследования РЭМа. Ниже мы еще вернемся к обсуждению преимуществ и недостатков, связанных с выбранным способом реализации автомата, а пока остановимся кратко на особенностях конкретного представления основных функций переработки информации и поведения в обеих моделях.
МОДЕЛЬ ПЛАНИРОВАНИЯ РЭМ-1. РЭМ-1 - неполный М-автомат - реализован в виде двух последовательно работающих программ для ЦВМ М-220. Первая программа предназначена для построения оценочных P-поверхностей. Исходной информацией для нее служат сведения о расположении объектов в среде, "субъективной" оценке каждого из объектов М-сетью РЭМа-2 и положении главной, заданной экспериментатором цели. Программа выделяет в среде участок для стратегического осмотра, определяет, если это необходимо, положение промежуточной цели и строит P-поверхности, соответствующие различным уровням внутренней модели среды.
Как уже упоминалось, каждая клетка верхнего уровня внутренней модели среды является представителем упорядоченной (пространственно) совокупности клеток предыдущего уровня. При реализации автомата РЭМ-1 был зафиксирован размер участка среды, осматриваемого автоматом в режиме планирования, и положение автомата внутри этого участка. Принято, что автомат осматривает участок длиной в 27 и шириной в 12 клеток. При этом сам автомат расположен в средней клетке нижней границы участка. Таким образом, нижний уровень внутренней модели среды представлен 324 i-моделями клеток. Общее количество формируемых автоматом уровней внутренней модели среды ограничено тремя. Все клетки одного уровня имеют одинаковые размеры, т.е. состоят из одинакового количества клеток предыдущего уровня. Зафиксировав способ пространственного объединения клеток каждого уровня, мы выделили 36 клеток второго уровня и 6 клеток третьего уровня внутренней модели среды (см. рис.20).
В принципе, стратегический осмотр и оценки различных объектов среды, необходимые для построения P-поверхностей всех уровней, должны производиться автоматом РЭМ-2, а результат осмотра должен передаваться программе построения P-поверхностей вообще без участия экспериментатора. Однако, поскольку, в силу ряда технических ограничений, мы вынуждены были строить модели РЭМ-1 и РЭМ-2 в виде отдельных программ для ЦВМ, решено было использовать это обстоятельство для проведения дополнительных самостоятельных экспериментальных исследований каждой из моделей. В связи с этим было предусмотрено осуществление всех "контактов" между РЭМ-1 и РЭМ-2 через человека-экспериментатора. Это позволило нам, во-первых, произвести отладку и настройку всех программ вне связи друг с другом (что весьма существенно при работе со сложными моделями) и, во-вторых, достаточно подробно исследовать поведение моделей, делая упор на выявление и иллюстрацию специфических особенностей каждой из них в отдельности.
Для обеспечения самостоятельного исследования моделей оказалось необходимым организовать дополнительную подготовку исходной для каждой модели информации. Так, например, для первой программы автомата РЭМ-1 - программы построения оценочных P-поверхностей - необходимо задавать информацию не только о расположении объектов в среде, но и об оценке каждого типа объекта. Такие оценки могут быть предварительно сформированы автоматом РЭМ-2 или заданы непосредственно экспериментатором.
Задание среды для программы построения оценочных P-поверхностей производилось следующим образом. В каждую клетку среды, содержащую определенный объект, заносился не знак этого объекта (номер i-модели М-сети автомата РЭМ-2), а некоторая условная величина, соответствующая оценке данного объекта. Подбором соотношений оценок различных объектов задавался тип М-автомата.
Значительное влияние па вид P-поверхностей оказывает также задаваемая экспериментатором оценка клетки "цель" ("сила цели"). Чем выше эта оценка, тем больше крутизна начальной P-поверхности и, следовательно, выше вероятность выбора автоматом таких этапов плана, которые проходят через клетки, расположенные вдоль минимального маршрута - прямой, соединяющей клетки автомата и цели. Задавая различные "силы цели", можно проследить изменение планов поведения автомата. Представляет интерес также сопоставление планов поведения автоматов различных типов при одинаковых "силах цели".
Блок-схема программы построения оценочных P-поверхностей приведена на рис.23. Программа написана для ЦВМ М-220 и содержит около 1100 команд. Время работы ЦВМ по данной программе составляет примерно полторы минуты.
Рис 23. Блок-схема программы построения оценочных поверхностей.
В другой программе, реализующей РЭМ-1,- построение плана двигательного поведения - используются сформированные конечные P-поверхности и, кроме описанных ранее механизмов планирования, содержится также дополнительный алгоритм коррекции "К". Алгоритм производит такую коррекцию P-поверхности второго уровня, которая облегчает автомату определение направления на цель. Как уже было описано выше, в процессе планирования автомат "мысленно" переходит из одной клетки второго уровня внутренней модели среды в другую - соседнюю. Выбор направления "шага" зависит от величины оценки соответствующей клетки. Для того чтобы на каждом этапе плана, т.е. после каждого "мысленного шага", автомат не терял общего направления на цель, алгоритм "К" увеличивает оценку (на втором уровне внутренней модели) одной или двух соседних клеток из окрестности автомата, ближайших к клетке, содержащей цель. Таким образом, алгоритм "К" играет роль своеобразного компаса. Коррекция при помощи алгоритма "К" представляет собой третий этап уточнения внутренней модели среды. Измененная в результате последовательных коррекций P-поверхность отражает уже не только оценки объектов среды и начальное взаимное расположение автомата и цели, но и учитывает потенциальное изменение положения автомата относительно цели в процессе последующего выполнения плана.
Увеличение на каждом этапе плана оценок определенных клеток окрестности автомата следует понимать как компонент "силы стремления" к цели или "установку" для ее достижения. Изменяя величину корректирующих добавок, можно проследить влияние этого параметра на процесс построения автоматом планов двигательного поведения.
Блок-схема программы построения планов поведения приведена на рис.24. Программа содержит около 1200 команд ЦВМ М-220. Время ее работы составляет одну-три минуты и зависит от количества просматриваемых автоматом вариантов плана.
Рис.24. Блок-схема программы построения планов. Обозначения те же, что и на рис.22.
МОДЕЛЬ ПЕРЕДВИЖЕНИЯ РЭМ-2. РЭМ-2 представляет собой полный М-автомат, организующий целенаправленное двигательное поведение. Процессы переработки информации, обеспечивающие автомату адекватность реакций на различные ситуации среды, осуществляются М-сетью, содержащей 90 i-моделей и 400 связей.
Автомат реализован в виде программы для ЦВМ М-220. Программа допускает изменение количества i-моделей и связей М-сети автомата, причем максимальное количество i-моделей не должно превышать 300, а максимальное количество связей - 1200. Все i-модели сети могут быть разделены не более чем на 30 групп, каждая из которых может иметь отличные от остальных параметры характеристик i-моделей. Введенные ограничения на максимальное количество элементов М-сети обусловлены объемом памяти и степенью быстродействия используемой ЦВМ М-220.
Как уже отмечалось, в автомате РЭМ не реализованы функции обучения и самоорганизации. Конкретно это выражается в том, что в процессе функционирования автомата проходимости связей и характеристики i-моделей его М-сети не изменяются.
Для удобства предварительной организации и настройки М-сети автомата принято, что каждая связь может быть либо усиливающей, либо тормозной. Величина проходимости связи выбирается в диапазоне от 0 до 1. Задание вида (тормозного или усиливающего), а также конкретной величины проходимости той или иной связи производилось в основном эвристически. Аналогично задавались и параметры характеристик i-моделей. В дальнейшем, при настройке автомата, осуществлялась необходимая коррекция - изменение проходимостей отдельных связей, изменение "знака", т.е. установление усиливающей связи взамен тормозной или наоборот, а также изменение значений параметров характеристик i-моделей.
Вид характеристик i-моделей был задан в соответствии с представлениями исходной гипотезы. Конкретно для реализации каждой из характеристик i-моделей выбраны следующие функции.
1. Характеристика торможения:
Kt.i = K.нi - K*СУММА[j=1..m](П[t-1].j*~R.ij), (6.3)
где Kt.i - текущее значение коэффициента возбудимости i-й i-модели; K.нi - начальное значение коэффициента возбудимости i-й i-модели; m - количество тормозных связей, подходящих к i-й i-модели; П[t-1].j - возбужденность i-моделей, имеющих связи, направленные к i-й i-модели; R.ij - проходимость тормозных связей, подходящих к i-й i-модели; K - коэффициент пропорциональности.
2. Характеристика затухания:
Пt.i = П[t-1].i*a, (6.4)
где a - коэффициент затухания возбужденности i-й i-модели, 0<=a<=1.
3. Характеристика возбуждения:
Пt.i = K.нi * ln СУММА[j=m+1..n](П[t-1].j*R.ij), (6.5)
где n - общее количество связей, подходящих к i-й i-модели; R.ij - проходимости усиливающих связей, подходящих к i-й i-модели.
Характеристики гипертрофии и адаптации для i-моделей М-сети автомата РЭМ не задавались.
Передача возбуждения в М-сети осуществляется в соответствии со следующим правилом:
Пt.i =
x при x>=y,
y при х<у, (6.6)
где
x =
(K.нi-K*СУММА[j=1..m](П[t-1].j*~R.ij)) * ln СУММА[j=m+1..n](П[t-1].j*R.ij) при СУММА[j=m+1..n](П[t-1].j*R.ij) > O.i
0 при СУММА[j=m+1..n](П[t-1].j*R.ij) <= O.i;
y = П[t-1].i * a;
O.i - порог возбуждения i-й i-модели.
Таким образом, в каждый момент времени возбужденность i-модели определяется либо внешними активными и тормозными воздействиями (Пt.i=x), либо собственным возбуждением в предыдущий момент (Пt.i=y).
В каждый момент времени СУТ производит выбор наиболее возбужденных i-моделей сети, для которых выполняется условие
П.i >= П.max - Z, (6.7)
где П.i - возбужденность i-й i-модели; П.max - возбужденность наиболее возбужденной i-модели сети; Z - допустимая разность возбуждений для выделяемых СУТ i-моделей.
Возбуждения выделенных СУТ i-моделей изменяются следующим образом:
П.о = Пн.j + П.s/K, (6.8 )
где П.j - возбужденность j-й i-модели после ее выделения СУТ; Пн.j - начальная возбужденность j-й i-модели; П.s - суммарное для всей группы выделенных i-моделей дополнительное возбуждение; K (K<=M) - количество выделенных СУТ i-моделей (M - максимальная величина группы выделяемых СУТ i-моделей; M задается экспериментатором и определяет максимальный "объем внимания").
Если в момент t j-я i-модель выделена СУТ, то в момент t+1 ее возбужденность
П[t+1].j = Пt.j * h, (6.9)
где h - коэффициент затухания возбуждения выделенных СУТ i-моделей, 0<=h<=1, h<a.
Затухание возбуждения j-й i-модели по зависимости (6.9) происходит до тех пор, пока в какой-то момент времени она не окажется вне выделенной СУТ группы i-моделей. После этого изменение ее возбуждения подчиняется общему правилу пересчета (6.6), принятому для М-сети автомата РЭМ.
Блок-схема программы, реализующей автомат РЭМ-2, приведена на рис.25. Программа содержит около 1200 команд. Время ее работы зависит от количества элементов (i-моделей и связей) М-сети и количества тактов (моментов дискретного времени) функционирования автомата. Для М-сети, содержащей 90 i-моделей и 400 связей, один такт работы, т.е. один пересчет, занимает примерно полторы минуты машинного времени ЦВМ М-220.
Рис.25. Блок-схема программы, реализующей М-автомат РЭМ-2.
При передвижении в среде РЭМ-2 пользуется планом, сформированным для этой же среды автоматом РЭМ-1. Если план оказывается неудачным и РЭМ-2 не в состоянии его выполнить, т.е. при рассогласовании "по чувствам" или "по результатам" плана и реального передвижения автомата, то возникает необходимость в построении нового плана, учитывающего изменившееся "эмоциональное" состояние автомата РЭМ-2. В этом случае РЭМ-2 формирует новые оценки объектов среды и новые критерии оценки плана поведения, которые и служат исходной информацией для работы автомата РЭМ-1. РЭМ-1 формирует новый план, передает его РЭМу-2 и т.д. Таким образом происходит взаимодействие автоматов. Посредником при этом является человек-экспериментатор, функции которого весьма ограничены и состоят в основном в периодической замене определенных перфокарт и вводе соответствующей программы в вычислительную машину. Несмотря на очевидную возможность автоматизации таких функций, т.е. передачи их самой машине, мы предпочли все же не объединять модели РЭМ-1 и РЭМ-2 в одну комплексную модель. Из сопоставления затрат машинного времени на просчет каждой из программ, составляющих автомат РЭМ, видно, что все построение плана занимает примерно столько же времени, сколько один такт работы М-сети автомата РЭМ-2. Если к тому же учесть, что для анализа процессов в М-сети необходимо хотя бы 15-20 тактов ее работы, становится понятным наше стремление сделать каждую из моделей как можно более самостоятельной. В противном случае вряд ли можно было бы надеяться на достаточно полное исследование модели планирования. Что же касается модели выполнения плана, т.е. РЭМа-2, то отсутствие непосредственной связи с РЭМом-1, в принципе, может отразиться на его работе только при нарушении плана. Поэтому мы выбрали такую схему исследования РЭМа-2, в которой нарушение плана поведения либо вообще не требовало дальнейшего продолжения эксперимента, либо требовало коррекции М-сети РЭМа-2, а не перестройки плана.
Не следует, однако, считать, что мы полностью отказались от исследования взаимодействия автоматов РЭМ-1 и РЭМ-2. Напротив, такое исследование составляло одну из важных задач нашей работы, поскольку необходимо было проверить целесообразность построения неполных М-автоматов. Однако такую проверку решено было сделать заключительным этапом экспериментального исследования автомата РЭМ.
Тактическая схема наших исследований состояла в следующем. На первом этапе необходимо было рассмотреть влияние на процесс построения плана таких параметров, как оценка объектов среды, "сила цели" и взаимное расположение автомата и цели в среде. Кроме того, следовало выяснить влияние различных параметров на количество просматриваемых автоматом вариантов плана поведения.
На втором этапе предполагалось выбрать один из наиболее характерных планов для данной среды и настроить автомат таким образом, чтобы выполнение этого плана не вызывало резких положительных или отрицательных "эмоциональных" реакций автомата. Впоследствии изменением структуры и параметров М-сети автомата мы надеялись продемонстрировать влияние предварительной организации на характер генерируемого автоматом поведения. Кроме того, необходимо было исследовать влияние ряда параметров М-сети и СУТ на процесс формирования внешних и внутренних реакций автомата.
И, наконец, на третьем этапе было решено проверить согласованность работы моделей планирования и выполнения плана и провести комплексное исследование автомата РЭМ.
Gudleifr- Admin
- Сообщения : 3403
Дата регистрации : 2017-03-29
Страница 3 из 5 • 1, 2, 3, 4, 5
Похожие темы
» 02.03. СПОСОБНОСТЬ БОЛТАТЬ - ЕЩЕ НЕ ПРИЗНАК ИНТЕЛЛЕКТА
» Батальоны искусственного интеллекта - Battle Isle
» Батальоны искусственного интеллекта - Battle Isle
Страница 3 из 5
Права доступа к этому форуму:
Вы не можете отвечать на сообщения