Холистический подход к языку

Брайан Д. Джозефсон
Лаборатория Кавендиша, Madingley Road, Кембридж CB3 0HE, Англия.
email: bdj10@cam.ac.uk
а также
Дэвид Г. Блэр
Отдел морских операций, DSTO, PO Box 44, Пирмонт, NSW 2009, Австралия.
email: david.blair@dsto.defence.gov.au

 

Оригинал статьи вы найдете по адресу http://www.tcm.phy.cam.ac.uk/~bdj10/language/lang1.html

Аннотация

Следующий отчет о прогрессе рассматривает приобретение языка как прежде всего попытку создания процессов, которые соединяют вместе плодотворным образом лингвистический ввод и другую деятельность. Таким образом, представления, сделанные из лингвистического ввода, являются такими, которые оптимально эффективны при опосредствовании таких взаимосвязей. Эффективное устройство регистрации языков должно содержать механизмы, специфичные для задачи создания желаемых процессов меж соединений в языковой среде, в которой сам учащийся изучает язык. Анализ этого требования дает четкие указания относительно того, какими могут быть эти механизмы.

Оригинальная дата подготовки этого отчета: 29 ноября 1982 года.
Исправления добавлены в 1995 году, аннотация, 1996 год.

1. Введение

Этот отчет о ходе работы дает в сжатой форме результаты нового подхода к проблеме языка, который пытается разобраться с предметом на целостной основе, то есть требовать, чтобы наши идеи были применимы к явлению языка в целом, а не заниматься, скажем, только лингвистическими аспектами или просто психологическими аспектами. Мы подозреваем, что последний тип подхода аналогичен попытке понять трехмерный объект на основе его двумерной проекции: теории, полученные при изучении одного аспекта языка, могут хорошо работать в этой конкретной области, но совершенно неприменим вне его.

Нам посчастливилось иметь вначале малоизвестный общий рассказ о многих аспектах интеллекта, включая язык (Mahesh Yogi 1974). Некоторые разъяснения этого очень абстрактного описания были получены из работы Сэмпа (1979) и работы Экблада (1981). Необходимость интеграции очень общих принципов с вниманием к деталям была удовлетворена за счет использования идей работы Дика (1978) и Маркуса (1980).

Мало можно сделать в этом введении, чтобы обобщить теорию, за исключением того, что правила обработки языка и механизмы их приобретения играют центральную роль; и далее, что, одновременно удерживая внимание на уровнях очень абстрактных принципов и менее абстрактных общих фактов о языке, один ведет к тонкому следу, на котором обнаруживается, что все общие правила объясняются по существу простым и прямым образом.

Общая форма этой работы включает в себя типы аргументов, сильно отличающиеся от обычных аналитически-дедуктивных (которые умудряются «доказать» данную гипотезу как правильную), и многие из идей содержатся неявно в аргументах, а не в прямо сказано. Исключительно мыслители левого мозга, возможно, должны немедленно прекратить чтение. Для остальных читателей предлагается уделить больше внимания поглощению основных идей, чем их критическому анализу. Важно, чтобы ум был допущен к спонтанной работе над идеями. Для нас мы находим степень соответствия, которая может быть получена между общими интуитивно привлекательными гипотезами и шаблонами в лингвистических и других данных, что является хорошим признаком того, что идеи являются разумным приближением к истине. На данном этапе исследования не представляется возможным попытаться сделать теорию совершенной и полностью изучить все перестановки и комбинации рассматриваемых понятий; поэтому существует ряд пробелов в теории, сформулированных в этом отчете, и поэтому ее следует рассматривать как удобное место для остановки на пути к совершенству (что очень далеко от того, где мы сейчас находимся).Настоящая работа может быть только в первом приближении к истине, и будущие исследования потребуются для исправления любых ошибок и добавления дополнительных необходимых деталей.

2. Язык в целом

Лингвистическое сообщение обменивается между отправителем и получателем через канал связи. Мы сосредоточимся здесь на процессах получателя по двум причинам: (i) понимание языка не сильно зависит от способности говорить, и поэтому законно рассматривать его в изоляции и (ii) понимание является первичным в что говорящий должен адаптировать то, что он говорит, к тому, что слушатель может понять, но обратное не применимо. (Наша концентрация на приемнике обусловлена только нашим желанием ограничить широту рассматриваемых проблем, а не фундаментальной неприменимостью наших понятий к проблеме производства речи).

Лингвистический обмен – это очень полезный инструмент для пользователей языка. Эта утилита зависит от того, что получатель способен перевести сообщение в формат, в котором он способен направлять свои действия. Он должен быть переведен из кода языка во внутренний код, прежде чем это станет возможным. Это мы называем процессом интерпретации. Процесс перевода и вспомогательные к нему процессы включают в себя множество конкретных подпроцессов, которые изучаются при приобретении соответствующего языка. Языковые учащиеся используют только некоторые из этих процессов, и они могут использовать упрощенные или ошибочные процессы, которые приводят к непониманию или недопониманию.

Внутренний код, чтобы он мог направлять действия, должен в некотором смысле состоять из представления человека о том, что есть или что может быть (или что было). Существование внутреннего кода не зависит от языка; язык – это просто альтернативный способ его создания. Приобретение языка по существу – это изучение правильного способа подключения внутреннего кода и внешнего языка. Но нет уникального «правильного пути», поскольку на самом деле у пользователей языка есть множество различных систем обработки. Их окружающая среда отличается, и поэтому их приобретение отличается. Но их окружающая среда также имеет сходство, и разные системы пользователей в целом эквивалентны для эффективного обмена информацией. Тем не менее, «значение», придаваемое высказыванию, на самом деле (за исключением особых случаев) является субъективной сущностью (и в какой-то степени интерсубъективной), а не объективной, как предполагалось во многих трактовках языка.

Грамматика играет важную, но не исключительную роль в регулировании инициирования процессов интерпретации. Несоответствующий вход игнорируется в первом случае, что значительно уменьшает количество возможностей, которые рассматриваются слушателем. Уместность ввода определяется в основном языковыми категориями. Выбирая категории в своем лингвистическом выпуске, как учитель языка изучает, говорящий может определить, какие комбинации объектов будут собирать слушатели.

Язык имеет прагматический, а также семантический компонент (а также синтаксические и фонологические компоненты). То есть некоторые лингвистические формы предполагают, что слушатель будет делать определенные вещи с предоставленной информацией. Пользователи изучают преимущества выполнения этих конкретных вещей, воплощая информацию в своей системе правил или процессов, а тот факт, что слушатели знают и применяют эти соглашения, используется говорящими, когда они используют язык.

3. Приобретение и применение процессов (или правил)

Приведенное здесь обращение во многом напоминает теорию Сэмпа (1979). Обратите внимание, что процесс, который пользователь языка применяет на языке обработки, фактически является тем же самым, что и правило, говоря ему, что он должен делать. Такое правило не совпадает с правилом грамматики или лингвиста, последнее правило является описательным, тогда как правила, относящиеся к фактическим процессам, являются предписывающими. Но два типа правил явно тесно связаны между собой. Например, правило лингвиста о том, что определенное слово (в данном контексте, возможно) имеет определенный смысл, несет с собой предписывающее правило, которое, если слово слышится в данном контексте, тогда код, который представляет это значение, должен быть создан система. Из этого мы заключаем, что ядром системы сбора данных должен быть набор процессов, которые учитывают отношения типа, известные лингвисту, и автоматически модифицируют систему, чтобы соответствующий процесс стал доступен (или применяется правило).

Отметив это, мы должны продолжать наблюдать, что любые правила, открытые такими средствами, могут быть неправильными или действительными только при определенных условиях. Поэтому система должна продолжать изучать (и применять) дополнительные знания, которые ограничивают применение правил. Система должна изучить две разные вещи, которые мы будем называть областью применимости правил и их условиями применимости. Смысл первого заключается в том, что область функции в математике, другими словами, только внутри определенного набора сущностей правило должно применяться вообще, в то время как вопрос о том, следует ли применять правило к сущности который находится внутри домена, является вопросом других условий, которые могут применяться независимо от того, на каком объекте действуют правила. С точки зрения изучения областей и условий крайне важно наблюдать, что, когда правило применяется к сущности вне области правила, значительный результат может произойти только случайно, в то время как произойдет более значительный случайный результат для объекта внутри домена (в зависимости от вероятности выполнения соответствующего условия). В принципе, тогда (мы не хотим рассматривать подробности здесь), система может быть разработана для обнаружения домена и условий правила. Обратите внимание, что, если ошибочное правило ошибочно получено, указанные критерии приведут к тому, что домен станет несуществующим.

Для полноты следует отметить, что система может расширить свою концепцию области правила, чтобы учесть зависимость правила от параметра, то есть область зависит от параметра. Система принимает первое приближение фиксированной области, чтобы учесть эту зависимость параметра. Этот пример иллюстрируется тем фактом, что правила присвоения фонемы звуку зависят от контекста, а также зависят от таких факторов, как акцент динамика. Механика не будет обсуждаться здесь далее.

Наш подход требует существования процессов, которые производят модификации или варианты правил. Ряд таких процессов, изменяющих правило или вариант создания которых: (I) создает новое правило, в котором константа в старом правиле становится переменной (область изменения которой впоследствии определяется); это форма обобщения; (II) добавление дополнительных переменных: это применяется, когда система узнает конструкцию, немного сложную, чем та, которую она уже может обрабатывать; (III) создание правила мутантов с некоторой постоянной измененной; (IV) правила, сделанные «разбиением процессов», механизм, который включает разделение ранее изученного процесса на два компонента. Примеры будут приведены ниже.
Рассматриваемые механизмы могут привести к тому, что структура, отмеченная в системной грамматике. Мутантный процесс является одним из механизмов этого. Также может быть, что одно из условий для одного правила заключается в том, что другое правило должно работать одновременно; это приводит к вложению одного процесса в другой.

4. Приобретение языков как эволюция

Если система постоянно добавляет и разрабатывает свои правила, и в то же время она предпочитает те правила, которые дают наилучший результат (когда они применяются к пониманию предложения и использованию полученной информации), он будет постепенно приближаться к оптимальная структура правил, то есть экспертного пользователя языка. Мы отмечаем регулирующий механизм, который применяется здесь: если структура трудно освоить, ораторы будут стремиться не использовать ее, так как им будет трудно понять. Но ораторы придумывают новые процессы (слова, приложения слов, иногда новые грамматические конструкции). Независимо от того, распространяются они на язык или нет, это функция их полезности, через довольно очевидные механизмы, которые здесь не будут подробно описаны.

5. Функциональный подход Дика и его интерпретация в существующих рамках

Подход Дика к языку заключается в том, чтобы рассматривать вербальный ввод как информацию, необходимую слушателю, в соответствии с набором четко определенных конвенций. Например, если слушателю требуется что-то переместить, ему необходимо знать (а) характер задачи, обозначаемый словом «двигаться» (б) значения некоторых соответствующих переменных, таких как объект, его назначение и используемые средства. В этом примере вербальный ввод имеет общий вид, такой как «переместить X в Y, используя Z», где X, Y и Z обозначают лингвистические выражения. Как такое высказывание создает свои последствия? Мы ищем простой механизм, соответствующий фактам.

Сначала мы рассмотрим влияние слова «двигаться». Наша модель заключается в том, что (на определенном уровне ее функционирования, во всяком случае) система сначала создает код L (перемещение), соответствующий перемещению слова. Затем он переводит этот код в код S (move), представляющий смысл перемещения, то есть процесс перемещения чего-то. Второй, семантический код – это тот, который при правильных условиях способен активировать программы для движущихся объектов. Такие программы потребуют в определенных точках информации, такой как указано лингвистическими выражениями X, Y и Z. Когда высказывание слышится и интерпретируется, эта информация должна храниться (в долгосрочной или кратковременной памяти) в таком что он автоматически появляется, когда это необходимо.

Проблема с памятью связана не с лингвистическим вводом. Система обладает такой же способностью запоминать действия, которые она обнаружила для себя методом проб и ошибок. Мы предполагаем, что коллекции информации хранятся в независимо адресуемых блоках памяти, и что в блоке конкретные элементы сохраняются и извлекаются с помощью определенных «кодов запроса». Если это так, естественно предположить, что информация, полученная лингвистически, хранится в блоках памяти, используя эти же коды запросов.

Но какие коды хранятся точно в соответствии с X, Y и Z в нашем примере? Требование того, чтобы элементарные составляющие процессов были максимально простыми, приводит нас к гипотезе о том, что система использует набор кодов x, y и z, которые действуют как коды не только для лингвистической формы единицы (X, Y или Z) но и для значения. Коды x, y и z действуют как метки для блоков памяти, которые содержат всю необходимую информацию. Предполагается, что, когда лингвистическая единица, такая как представленная X, распознается, ей присваивается метка с соответствующим блоком памяти, который используется для хранения с помощью соответствующих кодов запроса указанной информации. Интерпретационные устройства, такие как X, Y и Z, – это вопрос извлечения информации из заданного блока памяти, преобразования ее в соответствии с соответствующим правилом интерпретации и вставки результата обратно в тот же блок памяти (но не в идентичной памяти поскольку коды запроса для разных типов информации различны).

Характер типичного правила или процесса интерпретации можно увидеть, возвращаясь к нашему примеру «переместите X в Y, используя Z». Вход в процесс представляет собой набор кодов L (move), x, y, z (хранится под подходящими кодами запроса), а выход представляет собой сбор S (move), x, y, z, снова сохраненный под подходящим запросом коды. Операция связана с переводом кода для перехода от версии L к версии S вместе с копированием кодов x, y и z из их исходных кодовых мест запроса в новые поля кода запроса, связанные с семантической информацией.
Эффект процесса интерпретации заключается в создании набора информационных кодов, в свою очередь, обозначенных кодами запроса, которые хранятся либо в краткосрочной памяти, либо в маркированном блоке долговременной памяти. Система должна быть такой, чтобы она могла обрабатывать сохраненные коды, такие как x, y и z, как метки для подпрограмм и принимать необходимые меры для возврата в конце. Наиболее правдоподобным механизмом является тот, который соответствует интуитивной идее сделать конкретный план действий из имеющихся знаний (см. Дискуссию Eckblad, касающуюся компьютерного языка SIMULA 67 (стр. 104 из Eckblad 1981)).
Можно спросить, почему мы не рассматриваем слово «двигаться» так же, как X, Y и Z, т.е. как переменная, а не константа. Существует множество причин. Самый простой из них состоит в том, что коды семантического запроса тесно связаны со значением ключевого слова, например, move: они указывают на семантическую роль переменных. Таким образом, правилу интерпретации в любом случае необходимо явно зависеть от ключевого слова. Кроме того, исследования Дика показывают, что области, над которыми применяются правила, также зависят от ключевого слова. Например, в таком предложении, как «Встреча длилась три часа», переменная, обозначающая продолжительность, обязательна (поскольку используется глагол «последнему»), в то время как это не обязательно в предложении, например, «Они обсудили вопрос три часа’. Оба эти факта указывают, что ключевое слово должно быть явным в спецификации правил. Поэтому мы предполагаем, что система, которая знает правило, является той, которая содержит механизм, который может выполнять указанный процесс или преобразование. Следующие моменты, которые следует учитывать, это то, как механизм получает свой вклад и что вызывает его. По определению, процесс должен быть вызван, если присутствует сигнал, который находится внутри его домена, и, если выполняются условия, относящиеся к правилу. Очевидно, что вначале обнаруживаются шаблонные детекторы, чтобы увидеть, присутствуют ли паттерны, попадающие в область данного правила. Информация должна храниться в подходящем буфере, как в модели разбора Marcus (1980). Коды, представляющие информацию, подлежащую экспертизе, должны храниться механизмом, который сохраняет (в лингвистической обработке) всю важную информацию об исходном временном порядке и представляет для просмотра необходимую информацию, касающуюся составляющих буфера.

Мы знаем (например, из трансформационной грамматики), что общий базис распознавания форм – это составная категория (плюс временный порядок). Вопрос о том, как на самом деле узнаются категории и модели, останется до конца, и на данный момент мы рассмотрим механику переноса из буфера. Существенным ключом является рассмотрение связанных форм, таких как активные и пассивные формы одного и того же высказывания. Обычно предполагается, что семантические представления двух таких высказываний идентичны (кроме, возможно, дифференцирующих маркеров), что свидетельствует о том, что их значения, как известно, идентичны. Неразумно предполагать, что каждое из очень большого числа правил семантической интерпретации, присутствующих на данном языке, должно дублироваться, а существование механизма трансформации, который шунтирует информацию в другой порядок, кажется неэффективным (хотя и действительным как часть лингвистов ‘). Вместо этого мы можем установить связь с теорией Дика и постулировать промежуточный процесс маркировки, применяемый к тем элементам в буфере, которые принадлежат шаблону, который впоследствии будет интерпретироваться.
Это будет проиллюстрировано на примере двух связанных предложений

1: Джон пнул мяч
2: Мяч был птнут Джоном

Мы предполагаем, что предварительные процессы распознают «Джон», «удар ногой», «мяч» и «удар» (в примере 2) в качестве единиц и присваивают им метки, которые хранятся в буфере Marcus. Отношения между «ногами» и «ногами» подтверждают их совместное использование кода L (удар) и их отличия от особенностей, которые включают маркеры для активного и пассивного соответственно. Коды в буфере включают информацию об их грамматических категориях (например, NP, VP). Эта информация, вместе с порядком в буфере, достаточна для обозначения различных «пресемантических функций» единиц, а именно: глагол, агент и цель в обозначениях Дика (мы используем слово presemantic в предпочтении семантике Дика, так как на нашей модели эти атрибуты не являются точными определяющими семантическими функциями (вместо этого смысл генерируется процессом / правилом интерпретации, действующим на пресмемантическом маркер)). Эти предварительные метки (пресемантические коды запросов) прикрепляются к элементам в буфере и используются для извлечения информации. Возможны два режима: немедленная интерпретация на основе известного процесса интерпретации или задержка интерпретации, и в этом случае ярлык прикрепляется к не интерпретированным кодам, которые хранятся с использованием пресемантических кодов в качестве маркеров, так что процесс интерпретации может работать на них позже. В первом случае информация в его семантической форме может быть оценена немедленно, так что при необходимости можно попробовать альтернативную схему или интерпретацию. Когда правдоподобная интерпретация была получена, информация может храниться в блоке памяти, индексированном меткой.

Мы останавливаемся, чтобы рассмотреть, как работает буфер Marcus. Существенной возможностью является то, что используется механизм репетиции. Содержимое буфера обычно затухает со временем, но может быть доведено до уровня процесса, который повторно проверяет содержимое буфера в порядке, который представляет связанную временную последовательность. Элементы больше не сохраняются в буфере после их сборки в группу, и код для группы может быть добавлен в буфер в соответствующем месте. В конце буфера вставлены новые элементы, полученные с помощью процесса идентификации единицы с акустического ввода. (Особая реализация этой модели, основанная на маркировке содержимого буфера с порядковыми числами, позволяет постоянно перемещать содержимое буфера в начало, когда становится доступным пространство).

Что происходит с полученной в результате информацией, которая теперь интерпретируется или просто сгруппирована на основе открытия шаблонов? Это вопрос прагматики использования лингвистической информации. Один случай – это то, в котором обрабатываемая единица является частью более крупного шаблона (например, одному из приведенных выше высказываний могло предшествовать слова «Я знаю это». Характер естественного языка таков, что правильная процедура просто заменяет информацию в буфере кодом, представляющим целое (как в парсере Маркуса). Это подразумевается тем фактом, что единица, такая как фраза, может рассматриваться как единая сущность с особым значением ее своя.

Альтернативой является то, что блок не встроен в большую конструкцию и, следовательно, функционирует как полное целое. Например, это может быть запрос, например, «приходить сюда», или декларация, такая как «Луна будет полной сегодня». Метка, дающая доступ к значению тега высказывания, представляет собой ценную (?) Часть информации, а слушатель должен определить, что делать с меткой (эквивалентно, что делать с информацией). Этот вопрос подпадает под общий заголовок прагматики. Как видно из этих двух примеров, прагматическое действие иногда является вопросом социальной или лингвистической конвенции, а иногда и вопросом общего интеллекта (который более или менее выходит за рамки круга ведения нынешней теории). В первом примере конвенция должна рассматривать действие, описанное как действие, которое должно выполняться, если не отменено другими факторами (это поднимает общую точку зрения на то, что одним из аспектов прагматики является определение действительности, надежности или пригодности для использования информации, предоставленной докладчиком, и для того, чтобы воздействовать на результаты оценки соответствующим образом). Во втором случае ответ не связан с конвенцией, но один из определения того, каким образом предоставленная информация может быть полезной, и хранения результатов любых вычетов или решений, с тем чтобы аналогичные операции могли быть опробованы в будущее.

6. Правила и целевые аспекты языка

Каков фактический статус правил в обработке языка? Конечной целью языка является передача информации, а языковые соглашения имеют ценность только в той степени, в которой они поддерживают эту цель. Мы можем описать ситуацию следующим образом: ораторы и слушатели имеют разные цели и пытаются достичь их либо путем применения процессов, которые соответствуют принятым конвенциям, либо любыми другими способами, которые могут быть обнаружены. Соглашения являются рабами, а не мастерами. Из этого следует ряд пунктов. Во-первых, он имеет некоторые преимущества для обоих участников, чтобы они соответствовали соглашениям, поскольку соглашения уменьшают степень возможной путаницы и ошибки. Но есть много ситуаций, когда целенаправленные процессы поиска позволяют достичь соответствующего результата без соблюдения конвенций. Простым примером является ситуация, когда один компонент группы, лежащий внутри области интерпретации, достаточен для определения того, какой процесс интерпретации задействован (например, если слово является формой глагола «move», как в случае, рассмотренном выше). Слушатель может найти остальные компоненты группы, просто сканируя буфер Marcus, конформация к обычному шаблону не нужна. Читатель заметит совпадение, но не идентичность с темой Уилкса (1973), о том, что синтаксис играет вспомогательную роль в интерпретации языка, поскольку большая часть структуры определяется только одним значением.

Это в значительной степени тот факт, что правила могут быть преодолены, что придает языку его атрибуты гибкости и адаптивности. Связь между словами и смыслом является нежесткой, а слушатель понимает, что явно не указано правилами. Эта гибкость позволяет динамику создавать новые правила, которые позволяют связать новые конфигурации идей с языком. Более того, тот факт, что слушатель имеет возможность иногда интерпретировать элемент языка, даже когда он не знает соответствующих правил, является основным средством, с помощью которого он действительно может обнаружить правила.

7. Новая и старая информация и проблема Анафоры

До сих пор мы не учитывали тот факт, что язык может ссылаться на существующие когнитивные структуры и добавлять к ним, а не просто создавать новые когнитивные структуры. Этот факт учтен в нашей теории простым способом, ссылаясь на конкретные прагматические процессы. Обратите внимание, во-первых, что речь может в силу прагматики привлечь внимание слушателя к внешним объектам. Например, высказывание «Это интересное насекомое» может активировать те части механизмов восприятия слушателя, которые участвуют в выборочном посещении насекомых. Точно так же фраза, такая как «человек, которого я представил вам на обед вчера», может активировать механизмы поиска внутренней памяти и активировать код для конкретного человека, обозначенного фразой. В этом случае для этого нового кода необходимо вставить в буфер Marcus (или обработать альтернативным прагматическим процессом) вместо кода, который соответствует соответствующей фразе. Общее правило заключается в том, что прагматически указываемые пост-семантические процессы должны выполняться немедленно, когда это возможно. Мы не будем подробно останавливаться на возможных вариантах.

Очевидно, что анафора (использование части высказывания для обращения к другой части, с использованием местоимения или повторения слова) является связанной проблемой. Тот факт, что анафора работает эффективно, указывает на то, что способ записи высказывания в память включает в себя процессы, предназначенные для последующего повторного вызова с помощью анафорической ссылки – что можно назвать упреждающей памятью. Коды, которые, как известно из опыта, возможно, нужно будет отозвать, вскоре сохраняются временно в регистрах, индексированных словами, к которым относятся коды (чтобы они были вызваны, если слово повторяется) или такими функциями, как число и пол, чтобы они может быть вызвано последующим использованием местоимения, имеющего те же особенности. В одном регистре может храниться только один элемент, и прагматика языка, по-видимому, определяет, перемещается ли данный элемент из регистра или нет.

8. Разные вопросы

Сейчас мы кратко обсудим ряд вопросов, в основном касающихся выявления закономерностей, которые будут иметь отношение к любому подробному исследованию представленных здесь концепций.

(I) Очевидно, что наиболее эффективным для обнаружения паттерна является ряд независимых процессоров, работающих параллельно. Однако это замечание подлежит некоторым оговоркам. Как уже обсуждалось, бывают случаи, когда одно правило открыто как вариант другого. В таких случаях задействованы системные сети процессов, и разные шаблоны могут совместно использовать элементы обработки.

(II) Тот факт, что в качестве основы для дальнейшей обработки выбран только один образец из ряда возможностей, указывает на использование механизма взаимного торможения.

(III) Мы можем (в ограниченной степени) оправиться от ошибок путем обратного отслеживания. Для этого требуются механизмы для запоминания промежуточных состояний при обработке и для эффективного удаления ошибок.

(IV) Шаблоны могут быть обнаружены, в принципе, либо серийно (с использованием исходного ввода, либо выхода процесса репетиции), либо параллельным процессом с использованием логической схемы. Вероятно, оба метода используются в некоторой степени.

9. Приобретение правил

Теперь мы решаем ключевой вопрос: как сложный набор навыков, который был описан, приобретен? Предполагается, что основные механизмы охватываются следующими идеями, которые воспроизводятся с небольшим усилением из лекции Махариши Махеша Йоги (1974) под названием «Наука творческого интеллекта и речи».

Начнем с того, что для ученика языка постепенно открывается порядок того, что изначально представляет собой беспорядочный случайный шум, поскольку развиваются когнитивные структуры, способные представлять значимость и форму языка. В начале речь представляется только на уровне звука. Когда обнаруживаются корреляции между звуком и представлениями мира, ответ становится возможным для языка, представленного на уровне его звука.
Затем внимание уделяется шаблонам, видимым на языке, и по мере того, как осмысленные шаблоны становятся знакомыми, приобретаются процессы обнаружения паттернов и их использования. Таким образом, знание грамматики приобретается.

Когда становится возможным выбирать шаблоны в речи (значения которых вообще неизвестны), внимание уделяется выяснению значений другими способами, и обнаруживаются разнообразные правила, используемые языком для обозначения слов к значению.

Наконец, когда правила для буквальных значений стали знакомы, внимание обращается на то, что говорят ораторы на самом деле (часто выходящие за пределы буквального значения), что они говорят, и, таким образом, изучают прагматические аспекты языка.

(Комментарий: приведенное выше описание не относится к четырем разделенным этапам развития. Все, что подразумевается, заключается в том, как приобретение знаний на одном уровне зависит от знаний, полученных на предыдущих уровнях).

Дав этот общий план, мы перейдем к описанию подробных механизмов. Мы не будем пытаться сформулировать общую формулировку, а обсудим вместо этого несколько примеров, которые иллюстрируют задействованные механизмы.

В случае знакомых предметов, таких как таблицы или шары, или таких категорий, как еда или известные люди, или общие действия, такие как ходьба или еда, можно ожидать, что слушатель уже имеет коды которые представляют их. Возбуждение таких кодов значительно коррелирует с наличием соответствующих слов. Мы вызываем механизм, который связывает рецепторы, избирательно реагирующие на звуки с соответствующими семантическими кодами. Таким образом, приобретается примитивный тип лингвистического правила, который связывает звук и смысл.

Предполагаемая связь означает, что представление объекта и т. Д. Может быть вызвано слушанием этого слова, и последуют соответствующие ответы. В той мере, в какой такие результаты дают положительные результаты (особенно характер соответствия между ожиданиями и реальностью), правило усиливается (в круге ведения предыдущего обсуждения устанавливаются условия действительности правила).

Следующий этап – открытие шаблонов. Единственными образцами, которые полезно знать, являются те, которые имеют специфические интерпретации, которые передают больше информации в виде группы, чем передаются в целом элементами шаблона, взятыми отдельно. Мы предполагаем, что на этой основе обнаруживаются шаблоны в языке.

Шаблон представляет собой абстракцию, искусственно наложенную на структуру: для любого заданного шаблона, существует определяющий процесс, который определяет, присутствует ли шаблон. Поэтому мы предлагаем (имея в виду лингвистические данные о характере лингвистических паттернов), чтобы соблюдалась следующая общая процедура:

(i) обнаружено значимое созвездие (в соответствии с процедурами, рассмотренными ниже);

(ii) создается правило определения шаблона, которое применяется к данному созвездию;

(iii) правило применяется к последующему вводу и т. д., чтобы искать больше экземпляров шаблонов, соответствующих одному и тому же правилу.

(iv) эти новые экземпляры рассматриваются, чтобы определить, насколько они соответствуют цели, для которой (в силу того, как части системы работают вместе для выполнения общей функции), они предназначены.

(v) изменения правил (с целью улучшения общей полезности, с точки зрения увеличения числа положительных результатов и сокращения числа отрицательных результатов, правила).

(vi) правила определения шаблонов обычно включают категории (например, существительные или вспомогательные средства). Категории возникают в результате процесса расширения с прототипического примера, как будет объяснено в свое время.

Эта процедура сначала будет обсуждаться для случая стандартных единиц ввода (таких как морфемы, слова или фразы). Это вырожденный случай шаблона, в котором все примеры шаблона близки друг другу (например, все произношения конкретного слова). Мы полагаем, что система уже научилась реагировать на слово и т. Д. На основе его звука. Это означает, что детекторы, которые избирательно реагируют на звук, связаны с кодами, которые функционируют в качестве значения. Система еще не представляет слово и т. Д. В качестве единицы – на самом деле у нее нет кода для представления единицы как единицы речи. Это изменение происходит, когда он предварительно назначает код для соответствующего сегмента ввода. В то время, когда он делает это, он должен хранить определенные корреляции, которые будут функционировать как процессы или правила: который связывает функции акустического ввода с новым кодом и который связывает новый код с семантическим кодом (две ассоциации могут быть изучены в разное время, вторая после первой). Как было намечено ранее, система теперь расколола свое первоначальное правило на два. Но первый один включает в себя функцию проверки того, что вход согласуется с записью ранее, когда новый код был впервые назначен.

Новый код слова и т. Д. Имеет целью в более широком контексте указать, что слово имеет конкретное значение. Теперь мы ссылаемся на принцип, согласно которому система пытается изменить правило, которое определяет, должен ли новый код назначаться на данный вход, и отмечая, что вход все еще связан с ожидаемым значением. Это приводит к тому, что система определяет пределы, по которым может варьироваться произношение слова (которое может быть зависимым от контекста, например, зависит от акцента). Мы получаем систему, способную избирательно реагировать на данное слово. Если слово имеет более одного значения, оно может изучить новое семантическое правило, которое связывает новое значение с предыдущим кодом для слова, не задумываясь о том, как идентифицировать слово.

Подобный аргумент, который не будет подробно изложен, показывает, что эти идеи применимы к восприятию фонем в речи. В приведенной выше экспозиции мы косвенно говорили о телефонах (единицах звука). Система может в принципе узнать с помощью средств, аналогичных уже обсуждавшийся, интерполировать стадию обнаружения фонемы, но здесь процесс, который разделен на две части, – это восприятие ввода, а не его интерпретация. Аппаратное обеспечение для этого почти наверняка врожденное, а также, возможно, оборудование для работы со слогами (аппаратное обеспечение, состоящее из специальных блоков памяти, сигнальных каналов и т. Д.).
Теперь мы переходим к более тонкой проблеме обучения обнаружению синтаксических шаблонов. Наша теория предполагает, что первым этапом является обнаружение значимого созвездия единиц. Буфер Marcus является естественным инструментом для этого.

Мы предполагаем, что система уже научилась распознавать ряд общих слов, знает их значения и также назначила им коды, которые могут храниться в буфере Marcus. Когда вызывается предложение, относящееся к текущей сцене, коды для некоторых слов хранятся в буфере. Учащийся изучает свою среду, ища что-то, соответствующее одному из кодов в буфере, фокусирует внимание на этой части среды, а затем снова смотрит в буфер, чтобы обнаружить дальнейшие коды, соответствующие этой части сцены. Таким образом, он стремится найти значимую группу, например, один код может быть именем для объекта, а другой – кодом для его цвета.

Следующий этап заключается в том, что изменения происходят в системе типа, которая в конечном итоге приводит как к способности распознавания образов, так и к приобретению процесса интерпретации для группы. Необходим ряд изменений, которые не обязательно должны выполняться одновременно. Процессы будут проиллюстрированы с помощью конкретного примера. Предположим, что слушатель слышит предложение (например, «принесите красный шар»), содержащий слова «красный» и «мяч» в указанном порядке (по причинам, которые станут ясными) между ними не будет промежуточных слов. Предположим также, что красный шар виден. Буфер содержит коды для «красного» и «шарового» (L1 и L2, скажем), и уже описанные процессы система может выбрать эту пару кодов как значимую группу. На неязыковой или семантической стороне, предполагается, что система имеет возможность представлять определенные факты о соответствующей реальности, например, что мяч является объектом, а красный – цветом, для которого он использует коды запросов S1 (для цвета) и S2 (для объекта). Предположим теперь, что двум словам группы также присваиваются произвольные коды P1, P2, которые позже будут функционировать как предсемантические коды. Система также отмечает решающий порядок специального элементы буфера. Ориентируясь, мы предполагаем, что коды, обозначающие порядковые числа, используются, так что «красный» получает код «первый» и «мяч» второй, при условии, что нет промежуточных слов.

Теперь система может получить несколько процессов/правил, заметив корреляции, присутствующие в этом примере. На первый взгляд, коды красного, первого, цветного и пресемантического кода S1 должны быть скоррелированы вместе, чтобы действовать как потенциальный процесс, но небольшая мысль указывает, что фактическая роль порядковой информации на естественном языке заключается в том, чтобы обеспечить ограничение для правила для применения (например, для того, чтобы данный тип шаблона считался присутствующим). Чистый эффект всех этих процессов заключается в том, чтобы комбинация «красный шар» была переведена в правильную семантическую форму (включая коды запроса), проходя через промежуточную стадию пресемантических кодов. Следующий этап заключается в том, чтобы система обобщала свои процессы для работы с категориями слов, а не с фиксированными словами, как в этом примере. Вспомните обращение, данное для предложений типа «переместить X в Y, используя Z» (хотя здесь мы имеем дело с более простым видом конструкции). Новый процесс включает в себя назначение и маркировку конкретного появления одного из слов произвольной меткой и обработку этой метки как переменной, подлежащей повторной записи в семантической форме в соответствии с соответствующими кодами запросов, в новой (обобщенной) версии интерпретации (формы, описанной ранее). Мы хотим, чтобы система была в состоянии сделать правильное семантическое представление всех групп типа «красный X». Предполагаемый механизм для этого состоит в том, что система собирает под определенной меткой категории все экземпляры, для которых работает данный процесс интерпретации, и рассматривает эту метку как указание на домен, для которого должно применяться правило.
Описанная процедура представляет собой первую процедуру расширения категории и основана на существенно семантических соображениях: все элементы категории имеют схожую семантику. Если критерий подобной семантики отбрасывается, расширение возможно для более крупных категорий, в конечном итоге заканчивается фактическими лингвистическими категориями соответствующего языка. Тот факт, что речь идет о языке, который здесь имеет значение, заключается в том, что правила данного языка, которые определяют, какие типы шаблонов имеют смысл, содержат синтаксические категории, а не семантические. Например, тот факт, что на английском языке предлог последовательности – существительное – это грамматическая комбинация, проявляется в двух фразах «под мостом» и «при обстоятельствах», семантика которых совершенно не связана. Следствием этого факта является то, что процедура условного расширения категории путем добавления нового слова, который бы вписывался в уже известный шаблон, если бы он был помещен в эту категорию, часто будет собирать значимую комбинацию (хотя он может также собирать бессмысленные комбинации вместо этого, выбрав неподходящий набор для группировки вместе). Мы вынуждены предполагать, что система находит элементы условной категории таким образом и подтверждает или отменяет их, пытаясь присвоить значение группе. Это дает общую процедуру, с помощью которой могут быть установлены грамматические категории (любые ошибочные присвоения, полученные описанными средствами, будут, в конечном счете, аннулированы в силу того факта, что такие группировки вообще не могут быть интерпретированы каким-либо разумным правилом).

Вышеупомянутый процесс обнаружения категории, в сочетании с обнаружением шаблонов, является кумулятивным. Процесс начинается с нескольких очень простых комбинаций, таких как прилагательное-существительное, о котором говорилось выше, что приводит к открытию нескольких базовых категорий. Эти исходные категории позволяют обнаруживать новые шаблоны, что приводит к приобретению более сложных моделей, а также к тем дополнительным категориям, которые применяются к определенным шаблонам. Стоит отметить, хотя мы не будем подробно останавливаться на этом вопросе, что постепенный рост данного языка, вероятно, проходит через подобные пути.
Одной из известных закономерностей языка является то, что отдельные шаблоны обычно относятся к определенным категориям (шаблон рассматривается как единое целое). Например, на английском языке комбинация ADJ, NP относится к категории NP. Подобные факты о языке можно обнаружить с помощью средств, аналогичных уже описанным.
Мы вкратце отмечаем применение наших идей к проблеме, упомянутой ранее, о том, что система знает, что, например, активные и пассивные версии данного предложения имеют аналогичное значение. Возьмем в качестве примера приведенные ранее предложения:

1: Джон пнул мяч
2: Мяч был птнут Джоном

В первом предложении признак имени существительного-глагола-паттерна распознается, и применимое правило для пресемантической маркировки генерирует агент ярлыков, глагол и цель соответственно (соответствующее правило, дающее соответствие 1-го -> агента и т. Д.). Правила интерпретации связывают эти пресемантические коды с семантическими кодами, которые определяют фактические семантические роли. Теперь мы предположим, что человек, слушающий вторую конструкцию, но еще не знакомый с ней, пытается назначить пресемантические маркеры элементам в буфере Marcus таким образом, что предыдущее правило интерпретации будет по-прежнему применяться. Это приводит к тому, что последний элемент группы теперь характеризуется как агент, а не первый. Изучается новое правило, касающееся порядка и пресемантических кодов. Исследование его сферы действия приводит к корреляции с использованием обнаруженной пассивной формы и к спецификации этой новой категории.

10. Приобретение сложной семантики

На основе своих знаний о шаблонах языка система может изучать очень большое количество правил или конвенций для интерпретации. То, что они по существу являются обычными, можно увидеть из таких примеров, как приведенный, «в данных обстоятельствах». То, что ясно произошло, заключается в том, что новая фраза была изобретена как сокращенная версия и была выбрана так, чтобы соответствовать существующей схеме, частично из-за простоты производства, а частично из-за непринужденности (для слушателя) обнаружения паттерна. То, что слушатель должен сделать, чтобы научиться использовать такие незнакомые конструкции, заключается в том, чтобы хранить незнакомую лингвистическую фигуру в качестве помеченной группы (в представлении большего выражения, в которой она встроена), а также искать в любом случае в его распоряжении, для представления значения. В принципе, процесс взаимной корреляции подберет правило интерпретации, но мы не пытались подробно изучить вопрос.

11. Приобретение прагматики

Основной принцип тот же, за исключением того, что конечный продукт не является присвоением значения кусочку языка, а определением знания, которое должно быть выведено из значения. Разделительная линия между семантикой и прагматикой, вероятно, состоит в том, что семантика включает специальные лингвистические системы, посвященные перекодированию лингвистической информации в форму внутренней речи, тогда как прагматика включает в себя механизмы общего вывода.

12. Врожденные знания

Теперь мы изменим тему, чтобы обсудить мнение, к которому приводит нас наша теория о роли врожденного знания. Этот взгляд является промежуточным по сравнению с Хомским и Пиаже. В нашей теории мы задействовали ряд очень специфических механизмов (в основном специальных воспоминаний, информационных каналов и корреляционных детекторов). Разумно предположить, что они опосредованы врожденными структурами (которые, если кто-то так устроен, можно говорить в терминах врожденного знания языка). Хотя в принципе можно представить способы, с помощью которых можно было бы узнать «знание», такие механизмы вряд ли будут функционировать с надежностью, которую они на самом деле имеют (у головоломок, по-видимому, подобных трудностей, с которыми сталкиваются люди).
С другой стороны, нам не нужно ссылаться на нашу «основную грамматику» Хомски. Мы уже указали, как можно получить знания о простых грамматических категориях и формах.

13. Согласование компонентных подпроцессов

В этой статье мы описали очень много подпроцессов, связанных с языком. Проблема того, как все они координируются, обсуждается в лекциях Махариши Махеша Йоги (1974) и в докладе Джозефсона (1982).

14. Другие проблемы, связанные с теорией

Здесь мы хотим проиллюстрировать теорию в действии, указав, как решаются некоторые конкретные проблемы.

(I) Слова, не имеющие конкретной ссылки. В некоторых теориях языка предполагается, что слова имеют значения в силу наличия конкретных референтов, предложения, которое сталкивается со значительными трудностями, если попытаться его реализовать. В настоящей теории смысл в первом субъекте субъективен, а ссылка, охватываемая значением слова, – это тот, который соединяет вместе внутренние сигналы в системе. Таким образом, область значений – это язык внутреннего языка системы, и любые используемые им коды могут быть связаны с речевыми единицами. Таким образом, мы можем легко понять, как такие слова, как «не», «легко», «круглые» и т. Д., приобретают смысл в лингвистических системах своих пользователей.

(II) Разница между пониманием детьми и взрослыми слов (вопрос, поднятый К. Спарком-Джонсом).
Типичным примером является слово «словарь». Ребенок при первом контакте со словом может не иметь понятия о его реальном значении, но тем не менее может легко распознать конкретный словарь и назначить ему код. В нашей теории изменение, которое происходит, когда ребенок учит реальному значению слова, является примером обновления правила. Исходное правило, которое присваивается слову, код для конкретной книги изменяется на правило, которое присваивает слово лучше, чем слово, которое представляет его реальный смысл.

Это не единственный способ изменения. В ситуации, когда слово понимается по-разному, потому что больше узнано о сущности, к которой применяется это слово, соответствующее изменение заключается в том, чтобы хранить больше информации в блоке памяти, доступ к которому имеет код для значения.

(III) Язык, используемый в качестве секретного кода (возражение, выдвинутое комитетом по присуждению грантов, иллюстративным примером является наш).

Иностранный агент видит шпиона, которого он должен встретиться, подходит к нему и замечает: «Мы в последний раз встречались в Питтсбурге, я полагаю». Шпион отвечает: «Нет, это было в Берлине в 1944 году» (обмен был заранее установленным для установления личности).

Объяснение этого интересного фрагмента лингвистического поведения явно требует учета конкретных предшествующих инструкций, которые мы можем символически представить следующим образом: шпиону говорят: «Ваш контакт скажет: «А», а затем вы ответите «В». Не вдаваясь в подробности, мы можем видеть, что правильным прагматическим эффектом интерпретации этой информации является создание нового правила интерпретации, которое предполагает обработку предложения A как специального, имеющего свой собственный индивидуальный код a, и назначение знакового кода a ‘к этому, который дает доступ к блоку памяти, в котором хранится информация, такая как тот факт, что говорящий является иностранным агентом и что шпион должен отвечать на B. (Механизмы психологического возбуждения могут быть вызваны с учетом того факта, что нормальный ответ ( обработка заявления по его номинальной стоимости) запрещена).

Источники

Дик, SC (1978), Функциональная грамматика, Северная Голландия, Оксфорд.
Экблад, Г. (1981), Теория Схемы, Академическая пресса, Лондон.
Джозефсон, BD (1982), «О цели», «Отчет о ходе работы лаборатории Кавендиша» TCM/29/1982.
Махеш Йоги, Махариши (1974), многочисленные видеозаписи лекций, в частности лекционный курс «Наука творческого интеллекта», лекция 25 которого касается конкретно речи.
Маркус, MP (1980), Теория синтаксического распознавания для естественного языка, MIT Press, Кембридж, Массачусетс и Лондон.
Skemp, RR (1979), Intelligence, Learning and Action, Wiley, Chichester и New York.
Wilks, Y. (1973), Подход искусственного интеллекта к машинным переводам, в компьютерных моделях мысли и языка, изд. RC Schank и KM Colby, Freeman, Сан-Франциско.