Mathematical Linguistics Research Papers - Academia.edu (original) (raw)

Автор: Борис Иомдин (кандидат филологических наук, заведующий сектором теоретической семантики Института русского языка им. Виноградова РАН, доцент факультета филологии НИУ ВШЭ, преподаватель Школы анализа данных Яндекса) В 2014 году... more

Автор: Борис Иомдин (кандидат филологических наук, заведующий сектором теоретической семантики Института русского языка им. Виноградова РАН, доцент факультета филологии НИУ ВШЭ, преподаватель Школы анализа данных Яндекса)

В 2014 году выйдет первый том активного словаря русского языка. Один из участников проекта, заведующий сектором теоретической семантики Института русского языка РАН лингвист Борис Иомдин рассказал в интервью ПостНауке, как идет работа над целостным описанием языка в издании, основанном на принципе согласованности словаря и грамматики.
Один из лучших российских лексикографов Юрий Дереникович Апресян выдвинул идею интегрального описания языка и системной лексикографии, состоящую в том, что описания словаря и грамматики должны быть согласованы друг с другом, делаться на одном формальном языке. Язык таким образом должен быть представлен как система. Словарь должен состоять из лексикографических типов (все, что может быть описано единообразно, надо описывать именно так) и лексикографических портретов (описание индивидуальных различий слов). Для толкований был разработан метаязык.

Впервые данная идея воплотилась в англо-русском словаре синонимов, вышедшем небольшим тиражом и остающемся популярным до сего дня. После большого перерыва вышел «Новый объяснительный словарь синонимов русского языка» — словарь, в котором впервые данные принципы были реализованы на материале русского языка. Полное переработанное издание этого словаря вышло в 2004 году. Словарь большой и новаторский, но в нем описано 354 синонимических ряда, что в масштабах всего русского языка очень мало. Были выбраны частотные, наиболее интересные для описания слова.
Идея создания полного интегрального словаря русского языка впервые сейчас реализуется в проекте «Активный словарь русского языка». В словарь входит наиболее частотная, общеупотребительная часть лексики — около 12 000 слов. Это количество примерно соответствует словарному запасу образованного носителя языка. Словарный запас Пушкина — не более 20 000 слов. По данным британских исследований, 7500 слов покрывают 93 % текстов. Достаточно выучить это количество английских слов, чтобы понимать практически все. В словарях «Макмиллан» такие слова помечаются звездочками.
Список частотных слов очень полезен, но активный словарь русского языка содержит не просто частотные слова, но системно их описывает, так, как это не делалось никогда раньше. В словарной статье каждого слова есть несколько зон. В зоне толкования на едином для всего словаря метаязыке описывается значение без синонимов, омонимов, ничего лишнего и без недоговоренностей. Это системные описания значений слов. В зоне управления впервые дается информация о глагольном управлении и управлении всех предикатных слов, которые могут описывать ситуацию. Ситуацию могут описывать не только глаголы, но и многие существительные (переводчик — чего? с какого языка? и т. д.). В активном словаре дается подробная информация о всех частотных словосочетаниях, синтаксических конструкциях, в которых слово может быть употреблено, информация о его синонимах, антонимах, аналогах (словах с похожим, но не настолько близким значением, как у синонимов) и дериватах (словах, находящихся с данным в отношениях производности).

С практической точки зрения идея активного словаря состоит в том, чтобы смоделировать языковую способность носителей. Это дает возможность не только понять слово в контексте, на что направлены любые пассивные словари, но и самому говорить правильно, понять, как выразить нужный смысл разными идиоматическими способами. Когда будет создан полный интегральный словарь русского языка, будет описана половина языка (вторая половина — описание грамматики, но в словаре содержится гораздо больше информации, чем в грамматике, ведь она представляет собой общее описание, а словарь — частное).
Работа над активным словарем русского языка идет в секторе теоретической семантики Института русского языка РАН, созданном Юрием Дерениковичем Апресяном. Она началась в 2007 году, а в 2010 году вышел «Проспект активного словаря русского языка», в котором были разъяснены его основные принципы, был приведен полный словник будущего словаря и образцы словарных статей разных жанров, принадлежащих всем его авторам, которых на сегодняшний день 13 человек. Каждая словарная статья по 2 раза обсуждается на научных семинарах сектора и очень тщательно обрабатывается всем коллективом. В 2014 году должен выйти находящийся сейчас в печати первый том Активного словаря русского языка под редакцией Ю. Д. Апресяна с буквы «а» по «г», а сейчас ведется работа над вторым томом.