Анализ 2430 языков показал: грамматики следуют паттернам, но универсалий лишь треть

Анализ 2430 языков показал, что разнообразие грамматик не хаотично: за ним стоят повторяющиеся закономерности, но далеко не все из них универсальны. Международная команда лингвистов проверила 191 предполагаемую «грамматическую универсалию» и пришла к выводу, что подтверждения заслуживает лишь около трети подобных утверждений. Это означает: в языке действительно много общих линий развития, однако строгих правил, действующих «везде и всегда», меньше, чем считалось ранее.

Под грамматическими универсалиями лингвисты понимают обобщения вроде: «Если в языке есть множественное число, то есть и единственное» или «Если числительное следует за существительным, то и прилагательное, как правило, стоит после существительного». Важно, что такие утверждения описывают не внешнее сходство языков, а ограничения на допустимые различия между ними — своего рода правила, определяющие, как языки могут отличаться друг от друга и какие комбинации грамматических свойств практически не встречаются.

Проблема в том, что значительная часть этих универсалий возникла на базе ограниченных выборок — десятков, иногда сотен языков, не всегда репрезентативных географически и генеалогически. Новая работа, выполненная исследователями из нескольких университетов Германии и США, расширила масштаб проверки: в качестве эмпирической базы использована Grambank — крупная типологическая база грамматических признаков, охватывающая 2430 языков из разных семей и регионов мира.

Команда проверила несколько классов универсалий. Во-первых, иерархические — про соотношения грамматических категорий (например, что наличие одной категории влечет наличие другой). Во-вторых, универсалии порядка слов — как внутри предложения (позиции подлежащего, сказуемого, дополнения и атрибутов), так и в более широком дискурсивном контексте. Отдельно рассматривали «прочие» закономерности, не попадающие в эти рамки. Для анализа применяли байесовские статистические модели, позволяющие учитывать родство языков и их географическую близость, чтобы не спутать наследуемые или заимствованные черты с истинными универсальными тенденциями.

Результат оказался трезвящим: около трети проверенных утверждений выдержали строгую статистическую проверку с учетом филогенетических связей и ареальных влияний. Это означает, что многие широко цитируемые «правила» на деле являются сильными тенденциями в ограниченных регионах или семьях, а не универсальными законами человеческой речи. Тем не менее подтвержденная часть универсалий по-прежнему указывает на глубокие когнитивные и функциональные ограничения, формирующие грамматики по всему миру.

Показательный пример — универсалии, связывающие наличие множества с единственным числом: они подтверждают идею о том, что грамматические категории организованы иерархически и редко возникают в изоляции. Схожим образом работает логика порядка слов: если язык выстраивает одни элементы после существительного, он чаще склонен располагать и другие зависимые компоненты в той же позиции. Такие паттерны отражают общую направленность синтаксической организации и удобство обработки речи для носителей.

Почему же многие старые универсалии не выдерживают масштабной проверки? Во-первых, языки тесно взаимосвязаны: внутри одной семьи признаки часто совпадают просто по наследованию, а не потому, что так «устроен» язык вообще. Во-вторых, ареальные кластеры (соседство языков) порождают сходство из-за контактов и заимствований. Наконец, описание грамматики в источниках бывает неоднородным: одни свойства кодируются по-разному, и сравнение без единых критериев искажает картину. Байесовский подход с контролем филогенетики и географии как раз и минимизирует эти риски.

Что дает это исследование лингвистике? Во-первых, более надежный перечень действительно устойчивых закономерностей. Во-вторых, уточнение методологии: без учета родства и ареала говорить об «универсальности» преждевременно. В-третьих, практическую базу данных для моделирования эволюции грамматики: теперь можно точнее оценивать, какие изменения вероятны, а какие — редкость, и на каких временных шкалах они происходят.

Результаты важны и для смежных областей. В психолингвистике подтвержденные универсалии можно трактовать как отражение общих когнитивных ограничений — того, как наш мозг предпочитает структурировать лингвистическую информацию. Для вычислительной лингвистики и технологий обработки естественного языка это означает возможность строить модели, учитывающие универсальные тенденции и уменьшающие зависимость от больших корпусов для малоописанных языков. А типологам и полевым лингвистам исследование подсказывает приоритетные зоны для проверки и доописания.

Отдельного внимания заслуживает сама база Grambank. Это систематизированный набор бинарных и многозначных грамматических параметров, который кодирует ключевые свойства морфологии и синтаксиса. Ее достоинство — сопоставимость: языки описываются по одной схеме, что резко повышает надежность статистических выводов. Однако и тут есть ограничения: если для какого-то языка доступны лишь фрагментарные описания, часть признаков остается неопределенной, а значит, оценки сопровождаются большей неопределенностью.

Критически важен и выбор статистической рамки. Байесовские модели позволяют формализовать неопределенность, комбинировать разные источники информации (структуру родственных связей, географию, наблюдаемые признаки) и получать вероятностные, а не «черно-белые» ответы. В результате универсалия может быть не просто «верна/неверна», а иметь высокую или низкую апостериорную вероятность истинности при заданных данных и допущениях. Такой подход честнее отражает реальность, где грамматические тенденции редко бывают абсолютными.

Надо подчеркнуть, что «только треть» — это не поражение идеи универсалий, а ее очистка. На смену догматическим формулировкам приходят статистически обоснованные закономерности. Это делает типологию более предсказательной: мы лучше понимаем, какие комбинации признаков устойчивы, какие — нестабильны, а какие почти не встречаются, и почему.

Какие направления открываются дальше? Во-первых, углубление по линиям, где подтверждения слабые: возможно, часть универсалий выполняется лишь при дополнительных условиях — например, для языков определенной морфологической организации или при конкретной информационной структуре высказываний. Во-вторых, объединение грамматических данных с фонетикой и семантикой: некоторые синтаксические паттерны могут зависеть от просодии или инвентаря морфем. В-третьих, развитие динамических моделей, отслеживающих, как универсалии появляются и исчезают в ходе языковой эволюции.

Для преподавания языков и грамматики этот сдвиг тоже значим. Учебные материалы могут меньше опираться на «жесткие правила» и больше — на вероятностные ожидания и типологические тенденции. Это помогает объяснять учащимся, почему в одном языке «срабатывает» то, что в другом считается исключением, и чему стоит удивляться меньше, чем кажется на первый взгляд.

Наконец, работа поднимает философский вопрос: что именно делает человеческий язык «человеческим»? Если универсалий меньше, чем мы думали, то уникальность языка определяется не набором неизменных правил, а общими когнитивными ограничениями плюс историей конкретных сообществ, их контактов и инноваций. Универсалии в таком понимании — это не догмы, а контуры возможного, внутри которых культура и история рисуют бесконечно разнообразные грамматики.

Итог ясен: грамматики разных языков подчиняются повторяющимся паттернам, но универсальность этих паттернов ограничена. Широкий корпус данных, строгая статистика и учет родства с географией позволяют отделить действительно устойчивые закономерности от случайных совпадений и региональных мод. Это делает картину языкового многообразия одновременно более сложной и более понятной.

2
1
Прокрутить вверх