Ekaterina Rakhilina | National Research University Higher School of Economics (original) (raw)
Papers by Ekaterina Rakhilina
ОПЫТ СОЗДАНИЯ ОНЛАЙН-РЕСУРСА ДЛЯ ЛИНГВИСТИЧЕСКОГО КОММЕНТИРОВАНИЯ (ПОВЕСТЬ «ФАТАЛИСТ» М. Ю. ЛЕРМОНТОВА), 2024
В статье описывается новый электронный ресурс, предназначенный для лингвистического комментирова... more В статье описывается новый электронный ресурс, предназначенный для лингвистического комментирования текстов. Предметом комментариев служит художественный текст XIX в. на русском языке: повесть «Фаталист» М. Ю. Лермонтова. Но содержательно комментарии выходят далеко за пределы одного текста: они представляют собой попытку описать лексико-семантические и морфосинтаксические сдвиги, произошедшие в русском языке после XIX в., выявить их истоки, причины, а иногда и типологические параллели. Факты языковых изменений — обнаруженные с опорой на текст Лермонтова и далеко не всегда очевидные современному носителю языка — последовательно обосновываются на материале Национального корпуса русского языка. Разработанный функционал учитывает потребности и пользователя (в первую очередь, школьников и учителей, на которых ориентирован ресурс), и эксперта-комментатора. Все это вместе делает настоящий проект принципиально отличным от всех остальных, в чем-то аналогичных — авторских словарей (не привязанных к конкретному тексту, мало внимания уделяющих грамматике и диахронии), литературоведческих комментариев (обычно свободных от собственно лингвистического анализа), лингвистических корпусов (не содержащих полнотекстовых исследовательских комментариев) и под.
ЖИЗНЬ И СУДЬБА КАЛЕК XVIII ВЕКА: ОПЫТ КОРПУСНОГО ИССЛЕДОВАНИЯ , 2024
В статье исследуется процесс семантического калькирования — на корпусных данных русского языка XV... more В статье исследуется процесс семантического калькирования — на корпусных данных русского языка XVIII–XIX вв. Акцент делается не на вхождении языковой единицы в язык, то есть на самом появлении кальки, а на ее последующем существовании в нем. Рассматриваются разные этапы адаптации калькированного слова к морфо-синтаксической системе, лексическая конкуренция новой единицы с другими — вплоть до причин исчезновения ее из узуса. Материалом нашего исследования стало полисемичное слово расположение, структура многозначности которого претерпела значительные изменения c тех пор, как оно вошло в язык. Эти изменения были тщательно прослежены по корпусным и словарным данным, а также данным картотеки Института русского языка им. В. В. Виноградова РАН; были определены наборы контекстов, свойственных каждому историческому периоду жизни этого слова. Это позволило рассматривать лексему расположение на фоне обширных данных европейских исторических корпусов и академических словарей. Совпадение сочетаемостных и грамматических свойств кальки в языке-реципиенте и калькируемой лексемы в языке-источнике, с одной стороны, и учёт экстралингвистических данных — с другой, позволили определить время и язык калькирования. Корпусные свидетельства о последующих расхождениях свойств источника с реципиентом позволяют говорить о моделях диахронического изменения калькированной лексики.
Building a Database of Conversational Routines, 2024
This paper discusses the Routinicon, a new constructicographic resource for the description of co... more This paper discusses the Routinicon, a new constructicographic resource for the description of conversational routines. Conversational routines are defined as conventional formulaic expressions that language speakers use in standard extralinguistic situations (cf. Bless you! as a reaction to sneezing or Who's there? as a typical answer to a knock on the door). The Routinicon's goal is to accumulate the routines that constitute the inventory of conventional expressions in Russian language and systematically describe them in a way that would enable future cross-linguistic comparison and typological research. Conceptually, the Routinicon is a natural extension of such projects as the Russian Constructicon and Pragmaticon. It inherits their approach to the systematization of phraseological units as well as to the data collection. At the same time, the new project focuses on a fundamentally different domain of units and hence offers a radically new structure of linguistic annotation. Its principles and challenges are addressed in the paper.
Russian Learner Corpus: Towards Error-Cause Annotation for L2 Russia, 2024
Russian Learner Corpus (RLC) is a large collection of learner texts in Russian written by native ... more Russian Learner Corpus (RLC) is a large collection of learner texts in Russian written by native speakers of over forty languages. Learner errors in part of the corpus are manually corrected and annotated. Diverging from conventional error classifications, which typically focus on isolated lexical and grammatical features, the RLC error classification intends to highlight learners' strategies employed in the process of text production, such as derivational patterns and syntactic relations (including agreement and government). In this paper, we present two open datasets derived from RLC: a manually annotated full-text dataset and a dataset with crowdsourced corrections for individual sentences. In addition, we introduce an automatic error annotation tool that, given an original sentence and its correction, locates and labels errors according to a simplified version of the RLC error-type system. We evaluate the performance of the tool on manually annotated data from RLC.
От глагольных форм – к служебным словам: грамматикализация в русском и казахском языках сквозь призму текстов билингвов, 2024
Статья посвящена сопоставлению грамматикализации нефинитных глагольных форм в русском и казахском... more Статья посвящена сопоставлению грамматикализации нефинитных глагольных форм
в русском и казахском языках. В качестве примера выбраны формы глаголов зрительного восприятия смотреть, глядеть и қара, на основе которых в обоих языках образовались группы служебных слов с семантикой обусловленности. Отправной точкой для
исследования стали наблюдения над нестандартным использованием русских деепричастий смотря и глядя, а также несмотря на (то что) в текстах, написанных казахскими билингвами и включенных в Русский учебный корпус (RLC, web-corpora.net/RLC).
Мы обнаружили, что соотношение деепричастий смотря и глядя и других форм этих
глаголов в текстах билингвов кардинально отличается от аналогичного соотношения
в Национальном корпусе русского языка (НКРЯ, ruscorpora.ru). Отталкиваясь от этого
наблюдения, мы реконструировали по данным НКРЯ менявшееся с течением времени
соотношение русских деепричастий смотря и глядя и семантическую эволюцию производных служебных слов. Обратившись к родному языку авторов, мы обнаружили,
что в нем тоже есть послелоги с семантикой обусловленности, являющиеся результатами грамматикализации конвербов и причастия, образованных от глагола қара. Но,
несмотря на это сходство, процесс грамматикализации в казахском языке осуществлялся по иным траекториям. Анализ подтверждает неслучайный характер отклонений
от правил русского языка в текстах билингвов, а также выявляет глубокую связь между
грамматикализацией глагольных форм и «лексическим фактором», то есть различиями
между лексическими системами двух языков и, в частности, неполным семантическим
соответствием глаголов зрительного восприятия.
Creation and analysis of the Multimedia Russian Corpus for gesture research, 2024
The chapter considers gesture studies in relation to corpus linguistic work. The focus is on the ... more The chapter considers gesture studies in relation to corpus linguistic work. The focus is on the Multimedia Russian Corpus (MURCO), part of the Russian National Corpus. The chapter includes a brief biography of the creator of this corpus, Elena Grishina. The compilation of the corpus out of a set of Russian classic feature films and recorded lectures is described as well as the methods of annotating it in detail. The gesture coding is not limited to manual/hand gestures, but also includes head gestures and use of eye gaze. The chapter considers the findings from the corpus, and reported in Grishina’s posthumously published volume on Russian gestures from a linguistic point of view. The categories include pointing gestures, representational gestures, auxiliary (discourse-structuring) gestures, and several cross-cutting categories, including gestures in relation to pragmatics and to grammatical categories, like verbal aspect. Additional consideration is given to other video corpora in English (and other languages) which are being used for gesture research, namely the UCLA NewsScape library being managed by the Red Hen Lab and the Television Archive.
This electronic file may not be altered in any way. The author(s) of this article is/are permitte... more This electronic file may not be altered in any way. The author(s) of this article is/are permitted to use this PDF file to generate printed copies to be used by way of offprints, for their personal use only. Permission is granted by the publishers to post this file on a closed server which is accessible to members (students and staff) only of the author’s/s’ institute, it is not permitted to post this PDF on the open internet. For any other use of this material prior written permission should be obtained from the publishers or through the Copyright Clearance Center (for USA: www.copyright.com). Please contact rights@benjamins.nl or consult our website: www.benjamins.com
HAL (Le Centre pour la Communication Scientifique Directe), Oct 23, 2015
Studies in language companion series, Mar 15, 2023
Вестник Томского государственного университета, Jun 1, 2015
Constructional approaches to language, Jul 17, 2018
HAL (Le Centre pour la Communication Scientifique Directe), Mar 23, 2017
Russian Literature, Jul 1, 2022
HAL (Le Centre pour la Communication Scientifique Directe), May 31, 2018
Automatic Documentation and Mathematical Linguistics, Aug 1, 2008
We present information on a specific system developed at the Department of Linguistic Research at... more We present information on a specific system developed at the Department of Linguistic Research at VINITI. It is the information Internet portal Russian Linguistics (RUSLING). The system prototype is the well-known system LINGUIST List—the main worldwide linguistic resource. RUSLING can be considered a localization of LINGUIST List for Russian linguistics. The usefulness of such a localization is discussed.
ОПЫТ СОЗДАНИЯ ОНЛАЙН-РЕСУРСА ДЛЯ ЛИНГВИСТИЧЕСКОГО КОММЕНТИРОВАНИЯ (ПОВЕСТЬ «ФАТАЛИСТ» М. Ю. ЛЕРМОНТОВА), 2024
В статье описывается новый электронный ресурс, предназначенный для лингвистического комментирова... more В статье описывается новый электронный ресурс, предназначенный для лингвистического комментирования текстов. Предметом комментариев служит художественный текст XIX в. на русском языке: повесть «Фаталист» М. Ю. Лермонтова. Но содержательно комментарии выходят далеко за пределы одного текста: они представляют собой попытку описать лексико-семантические и морфосинтаксические сдвиги, произошедшие в русском языке после XIX в., выявить их истоки, причины, а иногда и типологические параллели. Факты языковых изменений — обнаруженные с опорой на текст Лермонтова и далеко не всегда очевидные современному носителю языка — последовательно обосновываются на материале Национального корпуса русского языка. Разработанный функционал учитывает потребности и пользователя (в первую очередь, школьников и учителей, на которых ориентирован ресурс), и эксперта-комментатора. Все это вместе делает настоящий проект принципиально отличным от всех остальных, в чем-то аналогичных — авторских словарей (не привязанных к конкретному тексту, мало внимания уделяющих грамматике и диахронии), литературоведческих комментариев (обычно свободных от собственно лингвистического анализа), лингвистических корпусов (не содержащих полнотекстовых исследовательских комментариев) и под.
ЖИЗНЬ И СУДЬБА КАЛЕК XVIII ВЕКА: ОПЫТ КОРПУСНОГО ИССЛЕДОВАНИЯ , 2024
В статье исследуется процесс семантического калькирования — на корпусных данных русского языка XV... more В статье исследуется процесс семантического калькирования — на корпусных данных русского языка XVIII–XIX вв. Акцент делается не на вхождении языковой единицы в язык, то есть на самом появлении кальки, а на ее последующем существовании в нем. Рассматриваются разные этапы адаптации калькированного слова к морфо-синтаксической системе, лексическая конкуренция новой единицы с другими — вплоть до причин исчезновения ее из узуса. Материалом нашего исследования стало полисемичное слово расположение, структура многозначности которого претерпела значительные изменения c тех пор, как оно вошло в язык. Эти изменения были тщательно прослежены по корпусным и словарным данным, а также данным картотеки Института русского языка им. В. В. Виноградова РАН; были определены наборы контекстов, свойственных каждому историческому периоду жизни этого слова. Это позволило рассматривать лексему расположение на фоне обширных данных европейских исторических корпусов и академических словарей. Совпадение сочетаемостных и грамматических свойств кальки в языке-реципиенте и калькируемой лексемы в языке-источнике, с одной стороны, и учёт экстралингвистических данных — с другой, позволили определить время и язык калькирования. Корпусные свидетельства о последующих расхождениях свойств источника с реципиентом позволяют говорить о моделях диахронического изменения калькированной лексики.
Building a Database of Conversational Routines, 2024
This paper discusses the Routinicon, a new constructicographic resource for the description of co... more This paper discusses the Routinicon, a new constructicographic resource for the description of conversational routines. Conversational routines are defined as conventional formulaic expressions that language speakers use in standard extralinguistic situations (cf. Bless you! as a reaction to sneezing or Who's there? as a typical answer to a knock on the door). The Routinicon's goal is to accumulate the routines that constitute the inventory of conventional expressions in Russian language and systematically describe them in a way that would enable future cross-linguistic comparison and typological research. Conceptually, the Routinicon is a natural extension of such projects as the Russian Constructicon and Pragmaticon. It inherits their approach to the systematization of phraseological units as well as to the data collection. At the same time, the new project focuses on a fundamentally different domain of units and hence offers a radically new structure of linguistic annotation. Its principles and challenges are addressed in the paper.
Russian Learner Corpus: Towards Error-Cause Annotation for L2 Russia, 2024
Russian Learner Corpus (RLC) is a large collection of learner texts in Russian written by native ... more Russian Learner Corpus (RLC) is a large collection of learner texts in Russian written by native speakers of over forty languages. Learner errors in part of the corpus are manually corrected and annotated. Diverging from conventional error classifications, which typically focus on isolated lexical and grammatical features, the RLC error classification intends to highlight learners' strategies employed in the process of text production, such as derivational patterns and syntactic relations (including agreement and government). In this paper, we present two open datasets derived from RLC: a manually annotated full-text dataset and a dataset with crowdsourced corrections for individual sentences. In addition, we introduce an automatic error annotation tool that, given an original sentence and its correction, locates and labels errors according to a simplified version of the RLC error-type system. We evaluate the performance of the tool on manually annotated data from RLC.
От глагольных форм – к служебным словам: грамматикализация в русском и казахском языках сквозь призму текстов билингвов, 2024
Статья посвящена сопоставлению грамматикализации нефинитных глагольных форм в русском и казахском... more Статья посвящена сопоставлению грамматикализации нефинитных глагольных форм
в русском и казахском языках. В качестве примера выбраны формы глаголов зрительного восприятия смотреть, глядеть и қара, на основе которых в обоих языках образовались группы служебных слов с семантикой обусловленности. Отправной точкой для
исследования стали наблюдения над нестандартным использованием русских деепричастий смотря и глядя, а также несмотря на (то что) в текстах, написанных казахскими билингвами и включенных в Русский учебный корпус (RLC, web-corpora.net/RLC).
Мы обнаружили, что соотношение деепричастий смотря и глядя и других форм этих
глаголов в текстах билингвов кардинально отличается от аналогичного соотношения
в Национальном корпусе русского языка (НКРЯ, ruscorpora.ru). Отталкиваясь от этого
наблюдения, мы реконструировали по данным НКРЯ менявшееся с течением времени
соотношение русских деепричастий смотря и глядя и семантическую эволюцию производных служебных слов. Обратившись к родному языку авторов, мы обнаружили,
что в нем тоже есть послелоги с семантикой обусловленности, являющиеся результатами грамматикализации конвербов и причастия, образованных от глагола қара. Но,
несмотря на это сходство, процесс грамматикализации в казахском языке осуществлялся по иным траекториям. Анализ подтверждает неслучайный характер отклонений
от правил русского языка в текстах билингвов, а также выявляет глубокую связь между
грамматикализацией глагольных форм и «лексическим фактором», то есть различиями
между лексическими системами двух языков и, в частности, неполным семантическим
соответствием глаголов зрительного восприятия.
Creation and analysis of the Multimedia Russian Corpus for gesture research, 2024
The chapter considers gesture studies in relation to corpus linguistic work. The focus is on the ... more The chapter considers gesture studies in relation to corpus linguistic work. The focus is on the Multimedia Russian Corpus (MURCO), part of the Russian National Corpus. The chapter includes a brief biography of the creator of this corpus, Elena Grishina. The compilation of the corpus out of a set of Russian classic feature films and recorded lectures is described as well as the methods of annotating it in detail. The gesture coding is not limited to manual/hand gestures, but also includes head gestures and use of eye gaze. The chapter considers the findings from the corpus, and reported in Grishina’s posthumously published volume on Russian gestures from a linguistic point of view. The categories include pointing gestures, representational gestures, auxiliary (discourse-structuring) gestures, and several cross-cutting categories, including gestures in relation to pragmatics and to grammatical categories, like verbal aspect. Additional consideration is given to other video corpora in English (and other languages) which are being used for gesture research, namely the UCLA NewsScape library being managed by the Red Hen Lab and the Television Archive.
This electronic file may not be altered in any way. The author(s) of this article is/are permitte... more This electronic file may not be altered in any way. The author(s) of this article is/are permitted to use this PDF file to generate printed copies to be used by way of offprints, for their personal use only. Permission is granted by the publishers to post this file on a closed server which is accessible to members (students and staff) only of the author’s/s’ institute, it is not permitted to post this PDF on the open internet. For any other use of this material prior written permission should be obtained from the publishers or through the Copyright Clearance Center (for USA: www.copyright.com). Please contact rights@benjamins.nl or consult our website: www.benjamins.com
HAL (Le Centre pour la Communication Scientifique Directe), Oct 23, 2015
Studies in language companion series, Mar 15, 2023
Вестник Томского государственного университета, Jun 1, 2015
Constructional approaches to language, Jul 17, 2018
HAL (Le Centre pour la Communication Scientifique Directe), Mar 23, 2017
Russian Literature, Jul 1, 2022
HAL (Le Centre pour la Communication Scientifique Directe), May 31, 2018
Automatic Documentation and Mathematical Linguistics, Aug 1, 2008
We present information on a specific system developed at the Department of Linguistic Research at... more We present information on a specific system developed at the Department of Linguistic Research at VINITI. It is the information Internet portal Russian Linguistics (RUSLING). The system prototype is the well-known system LINGUIST List—the main worldwide linguistic resource. RUSLING can be considered a localization of LINGUIST List for Russian linguistics. The usefulness of such a localization is discussed.
М.: Языки славянских культур, 2012, 500-508., 2021
Рассматривается история употреблений глагола колебать и некоторых его приставочных производных-пр... more Рассматривается история употреблений глагола колебать и некоторых его приставочных производных-прежде всего, заколебать, резко изменившего свое значение (от 'начать колебать' к 'надоесть') приблизительно в последней трети XX в. в силу эффектов, связанных с эвфемистической заменой. Данное явление, интересное само по себе, позволяет также обсудить некоторые нетривиальные вопросы диахронической семантики, русской глагольной префиксации и механизмов сдвига лексической сочетаемости в языке.
NRU HSE. Series WP BRP "Linguistics". 2014. No. 18., 2014
In this paper we present an approach to lexical typology which will be referred to as the “frame ... more In this paper we present an approach to lexical typology which will be referred to as the “frame method”. It was developed and tested in the Moscow Lexico-Typological Group and is currently used in all its projects, such as Majsak, Rakhilina (eds.) 2007, Britsyn et al. (eds.) 2009,
Kruglyakova 2010, Reznikova et al. 2012.
Our main principle, taken from the Moscow semantic school (Apresjan 1974/1992, cf. also Firth 1957: 11), is that lexical meanings can be studied and reconstructed by observing the word’s “surroundings”, primarily their collocation. Then, they can be compared by procedures
similar to those used in grammatical typology.
Section One will clarify the goals of lexical typology (LT), as we see them in relation to our method, and the method itself will be presented in more detail in Section Two.
Keywords: lexical typology, semantics, frame-based approach
NRU HSE. Series WP BRP "Linguistics". 2015., 2015
This paper focuses on some lexical properties of two groups of verbs in the languages of the worl... more This paper focuses on some lexical properties of two groups of verbs in the languages of the world, without trying to provide an exhaustive typological description of these groups. The first group includes the verbs of movement through air (verbs of 'flying'); the other includes those verbs that designate temporary separation from a supporting surface (verbs of 'jumping').
Keywords: lexical semantics, lexical typology, verbs of motion, flying, jumping, falling
B.: Mouton de Gruyter, 2016, 95-131., 2016
The article deals with the methodology and techniques of lexical typological studies. It focuses ... more The article deals with the methodology and techniques of lexical typological studies. It focuses on the cross-linguistic analysis of semantic areas that are deeply involved in semantic derivation processes, i.e. they either make a wide use of words coming from other semantic domains (as is the case with pain predicates) or frequently give rise to extended meanings (as e.g. rotation verbs, sound verbs, aqua-motion verbs, adjectives of quality). Based on these data, we propose a general approach to a lexical-typological study-a frame-based approach. It is argued that semantic comparison should rely on a set of conceptual frames that underlie the domains under examination and that can be revealed through the analysis of word combinability in natural texts (corpora, spontaneous speech, etc.). The results obtained by this approach can be easily visualized as semantic maps, in which nodes are associated with frames. This technique is illustrated by several examples, which testify to its applicability not only to well-attested domains of semantic typology (like colors, body parts, cutting and breaking, etc.), but also to less observable and highly metaphorical domains. The typological analysis of these areas is appealing, as it allows not only to investigate their lexical organization, but also to compare, in a systematic way, the semantic shifts observed in different languages.
Acta Linguistica Petropolitana. 2020. XVI(1): 579–608., 2020
Статья описывает систему глаголов падения в одном из памирских языков (малых восточно-иранских) —... more Статья описывает систему глаголов падения в одном из памирских языков (малых восточно-иранских) — шугнанском. Она опирается как на первичные данные, специально собранные для этой статьи, так и на данные словаря Д. Карамшоева [1988], проверенные во время полевых исследований.Показано, что в шугнанском действует доминантный глагол wêx̌tow, который в целом покрывает основные ситуации падения. Параллельно в этом языке имеется несколько «малых» глаголов, для описания резкого обрушения (čuk ðêdow), особой траектории падения (фразовый глагол ole sittow ‘падать кубарем’) и нарушения целостности (nixix̌tow ‘разваливаться’). В качестве глаголов падения в шугнанском функционируют и глаголы других, семантически близких, полей — поля вращения (gāx̌tow ‘поворачиваться’), поля прыгания (zibidow ‘прыгать’) и поля удара (ðêdow ‘ударять, стучать’). Типологически материал шугнанского ценен тем, что позволяет выявить прототипические фреймы, обеспечивающие семантическое пересечение выделенных глаголов с полем падения. Для вращения это падающие деревья, для прыгания — открепление функционально связанных друг с другом объектов и частей от целых, для удара — падение с акцентом на результат (в первую очередь, падение человека с указанием части тела, приходящей в контакт с твердой поверхностью).
Ключевые слова: лексическая типология, метафора, метонимия, падение, памирские языки, топология предметов, шугнанский язык.
Acta Linguistica Petropolitana. 2020. XVI(1): 9–63., 2020
Аннотация. В статье представлены результаты типологического анализа глаголов падения, выполненног... more Аннотация. В статье представлены результаты типологического анализа глаголов падения, выполненного на материале 42 языков. Под падением здесь понимается неконтролируемое перемещение в воздушной среде вниз без контакта с поверхностью под действием силы тяжести. В этой зоне мы выделяем 4 основные ситуации (фрейма), которые регулярно служат основой для лексических противопоставлений: перемещение с более высокой поверхности на более низкую ('ваза упала со стола'), потеря вертикальной ориентации ('ваза упала, и вода вылилась на скатерть'), падение-разрушение ('дом рухнул') и открепление ('платье упало с вешалки'). В зависимости от стратегии кодирования этих фреймов мы различаем для поля падения несколько типов лексических систем. Полярные точки в такой типологии образуют доминантная стратегия (все фреймы описываются одним глаголом) и дистрибутивная система (для каждого фрейма используется особый глагол). В статье обсуждаются также дополнительные параметры, влияющие на выбор лексических средств,-в частности, тип падающего субъекта, количество падающих предметов, специфика исходной позиции субъекта, особенности его положения в конечной точке, причина падения и др.
Acta Linguistica Petropolitana. 2020. XVI(1): 64–114., 2020
Аннотация. В статье обсуждаются метафорические употребления глаголов падения, выявленные на матер... more Аннотация. В статье обсуждаются метафорические употребления глаголов падения, выявленные на материале 20 языков. Для изучаемых лексем характерен широкий спектр переносных значений, причем модели сдвигов регулярно повторяются по крайней мере в нескольких языках выборки, ср. известную метафору LESS IS DOWN, а также, например, семантику наступления сезона или времени суток, превращения, капитуляции, отставания от группы и мн. др. Мы показываем, что источником переносных употреблений в каждом случае следует считать не идею падения в целом, а конкретный фрейм в структуре поля, т. е. определенный тип неконтролируемого перемещения вниз. В частности, наступление временно́го периода восходит к падению с более высокой поверхности, превращение-к потере вертикальной ориентации, капитуляция-к разрушению, отставание от группык откреплению. Связи такого рода хорошо прослеживаются при типологическом анализе механизмов семантического сдвига. Ключевые слова: лексическая типология, глаголы падения, метафора, типология метафор.
Труды института русского языка им. В.В. Виноградова. 2020. № 25. С. 265-276., 2020
В статье рассматривается история семантической эволюции почти вышедшего из употребления русского ... more В статье рассматривается история семантической эволюции почти вышедшего из употребления русского глагола таиться и его префиксальных производных (затаиться, притаиться, утаиться). Показано, что значение этих глаголов в русском языке XVIII–XIX вв. в ряде отношений существенно отличалось от современного. Проведены наблюдения над параметрами, различающими квазисинонимы ряда со значением ʻпрятатьсяʼ: прятаться и скрываться, уточнено место каждого из них на шкале контроля. Подробно проанализированы приставочные глаголы, производные от таиться, и на основе сделанных наблюдений описана диахроническая семантика этой сравнительно малочастотной лексической группы. Проведенное исследование обнаруживает свойственную этому ряду постепенную стативизацию, связанную с потерей агентивности и контролируемости, а также процесс лексикализации — «застывание» устаревающей лексемы в какой-то определенной словоизменительной форме или конструкции, которое приводит к значительному росту частотности практически вышедшего из употребления слова. Судьба таиться и близких ему лексем хорошо иллюстрирует общие исторические процессы,
связанные со сдвигом лексического значения. Прежде всего это мотивированность семантической сочетаемости на каждом временнóм этапе, а также взаимозависимость лексических и грамматических свойств языковой единицы, которую может отразить только интегральное описание. Оба эти аспекта неразрывно связаны с вкладом Ю.Д. Апресяна в общую теорию языка.
Ключевые слова: диахроническая семантика, лексика, русский язык, глаголы, корпусные исследования, стативизация, лексикализация.
Russian Linguistics, 2013
ABSTRACT
Lecture Notes in Computer Science, 2009
Abstract. The paper presents a study in lexical typology. We focus on the se-mantic domain of pai... more Abstract. The paper presents a study in lexical typology. We focus on the se-mantic domain of pain as one of the most universal and complex areas of hu-man experience. The predicates of unpleasant bodily sensations are compared in a sample of 23 languages. The ...
SSRN Electronic Journal, 2000
Language Typology and Universals, 2006
... Sprachtypol. Univ. Forsch. (STUF) 59 (2006) 3, 253269 * The present paper is a substantially... more ... Sprachtypol. Univ. Forsch. (STUF) 59 (2006) 3, 253269 * The present paper is a substantially revised version of Kopcevskaja-Tamm & Rakhilina [Raxilina] (1999). ... Sprachtypol. Univ. Forsch. (STUF) 59 (2006) 3 255 Page 4. 2.3. ...
The Lexical Typology of Semantic Shifts, 2000
Studies in Language Companion Series, 2010
М.: Изд-во РГГУ, 2017, т. 2, 384-394., 2017
В статье описывается история употребления русской конструкции с глаголом говорить, которая сегодн... more В статье описывается история употребления русской конструкции с глаголом говорить, которая сегодня служит обычным маркером прямой речи говорящего. Исследование проводится c привлечением текстов XIX века, и опирается среди прочего на особым образом размеченный корпус текстов этого периода. Ключевые слова: корпусные исследования, история русского языка, языковые контакты, дискурсивные маркеры, лексическая семантика, грамматикализация
Славный корабль – омулевая бочка… К вопросу о микро-истории семантических переходов, 2019
Д. А. Рыжова Национальный исследовательский университет «Высшая школа экономики» (Россия, Москва)... more Д. А. Рыжова Национальный исследовательский университет «Высшая школа экономики» (Россия, Москва) daria.ryzhova@mail.ru СЛАВНЫЙ КОРАБЛЬ-ОМУЛЕВАЯ БОЧКА… К МИКРО-ИСТОРИИ СЕМАНТИЧЕСКИХ ПЕРЕХОДОВ* В статье обсуждается процесс семантического развития русского прилагатель-ного славный в период с начала XVIII в. и до начала XXI в. На материале НКРЯ определяется набор основных значений слова, сосуществующих и сменяющих друг друга. Показано, что в XVIII веке слово славный употребляется преимущественно (по крайней мере, в письменных текстах) в значении 'известный, прославленный'. Это значение почти полностью устаревает уже к XIX веку, а на базе семантики из-вестности формируется значение сильной положительной оценки. Подобные пере-ходы ('известный' => 'хороший' как частный случай более общей модели 'отлича-ющийся от других' => 'хороший') зафиксированы во многих других языках мира. Пик частотности оценочных употреблений слова славный приходится на XIX в., а в XX-XXI вв. оно не только реже употребляется в качестве оценочного маркера, но и меняет значение ярко положительной оценки на семантику умеренной, «снис-ходительной» похвалы. Этот процесс постепенного выхода из узуса оценочного маркера представляет особый интерес, поскольку он отличается от засвидетельст-вованных и описанных ранее. Ключевые слова: лексическая семантика, корпусная лингвистика, микродиахро-ния, русский язык, оценочная лексика, семантический переход, славный * Исследование поддержано грантом РФФИ №17-04-00517-ОГН «Развитие морфологическо-го и семантико-синтаксического компонентов корпусного описания грамматики современного русского языка».
Говорю я, Карл..., 2017
НИУ Высшая Школа Экономики, Институт РЯ РАН, Москва, Россия В статье описывается история употребл... more НИУ Высшая Школа Экономики, Институт РЯ РАН, Москва, Россия В статье описывается история употребления русской конструкции с глаголом говорить, которая сегодня служит обычным маркером пря-мой речи говорящего. Исследование проводится c привлечением тек-стов XIX века, и опирается среди прочего на особым образом разме-ченный корпус текстов этого периода. Ключевые слова: корпусные исследования, история русского языка, языковые контакты, дискурсивные маркеры, лексическая семантика, грамматикализация Rakhilina The paper describes the diachronic development of Russian construction with the verb govorit' 'to say', the main marker introducing the direct speech. The analysis relies heavily on the data from XIX century Russian as presented in a special annotated corpus of Early Modern Russian.
«Тамань сегодня»: корпусное исследование русского языка XIX века , 2016
Материалы ежегодной международной научной конференции. 20–23 марта 2018, Санкт-Петербург / РГПУ им. А. И. Герцена, кафедра языкового и литературного образования ребенка, лаборатория детской речи, межвузовский центр билингвального и поликультурного образования; — Иваново: ЛИСТОС, 2018, стр.188-192, 2018
Идея настоящей работы, как и ряда других наших исследований (ср., например, Рахилина 2014), восхо... more Идея настоящей работы, как и ряда других наших исследований (ср., например, Рахилина 2014), восходит к знаменитой книге Анри Фрея «Грамматика ошибок», которая была написана в начале XX века и пока совершенно не устарела. В ней Фрей обратил внимание на случаи отклонения от стандартного языкового узуса (то есть, с точки зрения нормативной лингвистики, – ошибки) и показал, что неканоническая речевая продукция представляет для лингвиста не меньший интерес, чем стандартный языковой материал. Потом эта идея была надолго забыта и вернулась в теоретическую лингвистику много позже, в том числе и благодаря хорошо известным исследованиям Стеллы Наумовны Цейтлин – см.,
например, (Цейтлин 1982) и др.
Источником для нашего нестандартного языкового материала здесь стали письменные тексты изучающих русский язык студентов, собранные в Учебном корпусе русского языка RLC. Рассматривая его, мы несколько изменим угол зрения, традиционный для использования учебных корпусов. Мы не будем говорить о трансфере, статистике ошибок и методике их коррекции. В данном случае нас будет интересовать сам русский язык и те тонкие, но типологически релевантные правила употребления языковых единиц (своего рода скрытая лексико-грамматика), которые становятся очевидны исследователю только в момент языковой интерференции русского и какого-то другого языка.
Речь пойдет о предикатах ПАДЕНИЯ. До некоторой степени они были уже исследованы нами в рамках лексико-типологического проекта MLexTс использованием фреймового подхода (Рахилина, Резникова 2013), который предполагает выделение типичных ситуаций (фреймов) на основе сочетаемостных характеристик лексем, покрывающих данное поле в каждом рассматриваемом языке. Какая-то информация о таких характеристиках содержится в словарях – толковых и переводных. Более детальные
сведения о сочетаемости часто можно почерпнуть из обычных корпусов или других коллекций стандартных текстов – именно они дают представление о типичных для того или иного языка лексических сочетания. Однако корпусные материалы не дают прямых данных о сочетаемостных запретах, то есть о границах употребления языковых единиц. В стандартном случае запреты и границы описываются в результате типологического анкетирования. Первичные анкеты строятся на корпусных и словарных данных, которые используются для установления начального набора фреймов. Сейчас это уже отработанная, рутинная технология, которая в большой степени может быть автоматизирована (Рыжова 2017), как минимум в своей базовой, не аналитической фазе.
Учебные корпуса снабжают нас принципиально другим языковым
материалом, который позволяет существенно дополнить полученные в результате типологического анализа данные.
В кн.: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.) / Под общ. ред.: В. Селегей. Вып. 19(26). М. : Изд-во РГГУ, 2020. С. 241-255., 2020
We present a new open-access electronic resource named the Russian Constructicon that offers a se... more We present a new open-access electronic resource named the Russian
Constructicon that offers a searchable database of Russian constructions accompanied by descriptions of their properties and illustrated with corpus examples. The project was carried out over the period 2016–2020 and at present contains an inventory of over 2200 multi-word constructions of Contemporary Standard Russian. We prioritize “partially schematic” constructions that lie between the two extremes of fully compositional syntactic sequences on the one hand and fully idiomatic (phraseological) expressions on the other hand. Constructions of this type are difficult to account for in terms of either lexicon or grammar alone, and are often underrepresented in reference works of Russian. A typical construction in our database contains a fixed part (anchor words) and an open slot that can be filled with a restricted set of lexemes. In this paper we first focus on key characteristics of this resource that make it different from existing constructicons of other
languages. Second, we describe how the new interface will be designed
and how it will serve the needs of both linguists and L2 learners of Russian. In particular, we discuss various search possibilities relevant for different users and those parameters that are available for specifying the retrieval output. An example of an entry is given to show how the information about each construction is structured and presented. Third, we provide an overview of our multi-level semantic classification of constructions. We argue that our system of semantic and syntactic tags subdivides our items into meaningful classes and smaller groups and eventually facilitates the identification of constructional families and clusters. This methodology works well in turning the initial list of constructions as unrelated units into a structured network and makes it possible to refine and expand the collected inventory of constructions in a systematic way.
Lecture Notes in Computer Science, 2009
P. Bosch, D. Gabelaia, and J. Lang (Eds.): TbiLLC 2007, LNAI 5422, pp. 6979, 2009. © Springer-Ve... more P. Bosch, D. Gabelaia, and J. Lang (Eds.): TbiLLC 2007, LNAI 5422, pp. 6979, 2009. © Springer-Verlag Berlin Heidelberg 2009 ... Dealing with Polysemy in Russian National Corpus: ... Ekaterina V. Rakhilina1, Tatiana I. Reznikova2, and Olga Yu. Shemanaeva3
Корпусные исследования особенностей речи нестандартных говорящих («эритажный» русский), 2015
Семантическая разметка лексики в Национальном корпусе русского языка: принципы, проблемы, перспективы, 2005
Задачи и принципы семантической разметки в НКРЯ, 2009
Воз мож ность по ис ка слов по се ман ти че ским по ме там ра бо та ет в На цио наль ном кор пу с... more Воз мож ность по ис ка слов по се ман ти че ским по ме там ра бо та ет в На цио наль ном кор пу се рус ско го язы ка вот уже три го да-поль зо-ва тель мо жет най ти не толь ко кон тек сты, в ко то рых упот реб ля ют ся, ска жем, гла го лы за-па ха или зву ка, но и про ве рить воз мож ность со че та ний се ман ти че ских при зна ков в ком-би на ции лек сем-на при мер, до пус ти мость со че та ния не пред мет ных имен с гла го ла ми дви же ния, при ла га тель ных цве та с не пред-мет ны ми име на ми и т.д. Воз мож ность по ис ка слов по се ман ти че ским по ме там ра бо та ет в На цио наль ном кор пу се рус ско го язы ка вот уже три го да-поль зо ва тель мо жет най ти не толь ко кон тек сты, в ко то рых упот реб ля ют ся, ска жем, гла го лы за па ха или зву ка, но и про ве-рить воз мож ность со че та ний се ман ти че ских при зна ков в ком би на ции лек сем-на при мер, до пус ти мость со че та ния не пред мет ных имен с гла го ла ми дви же ния, при ла га тель ных цве та с не пред мет ны ми име на ми и т.д. Воз мож ность по ис ка слов по се ман ти че ским по ме там ра бо-та ет в На цио наль ном кор пу се рус ско го язы ка Е. В. Ра хи ли на, Г. И. Кус то ва, О. Н. Ля шев ская, Т. И. Рез ни ко ва, О. Ю. Ше ма нае ва Е. В. Ра хи ли на, Г. И. Кус то ва, О. Н. Ля шев ская и др. За да чи и прин ци пы се ман ти че ской раз мет ки лек си ки в НКРЯ 1 1. Вве де ние оз мож ность по ис ка слов по се ман ти-че ским по ме там ра бо та ет в На цио-наль ном кор пу се рус ско го язы ка вот уже три го да-поль зо ва тель мо жет най ти не толь ко кон тек сты, в ко то рых упот реб ля ют ся, ска жем, гла го лы за па ха или зву ка, но и про ве рить воз мож ность со че та ний се ман ти че ских при зна ков в ком би на ции лек сем-на при мер, до пус ти мость со че та ния не пред мет ных имен с гла го ла ми дви же ния, при ла га тель ных цве та с не пред мет ны ми име на ми и т.д. Ис ход но лек си ко-се ман ти че ская клас си фи ка ция в нкря ба-зи ро ва лась на прин ци пах сис те мы «Лек си ко граф» (http://www. lexicograph.ru, [Кра силь щик, Ра хи ли на 1992; Кус то ва, Па ду че ва 2004]); при этом для це лей раз мет ки Кор пу са эта сис те ма бы ла 1 Исследование выполнено при частичной финансовой поддержке Российского фонда фундаментальных исследований, грант № 08-06-00197-а.
Корпус как творческий проект, 2009
На цио наль ный кор пус рус ско го язы ка был от крыт для сво бод но го дос ту па в ин тер не те ... more На цио наль ный кор пус рус ско го язы ка был от крыт для сво бод но го дос ту па в ин тер не те 29 ап ре ля 2004 го да-с тех пор про шло 5 с по ло ви ной лет, для ин тер нет-про ек та это мно го. За кон чи лись два эта па ра бо ты над кор пу сом в рам ках осо бой ис сле до ва тель-ской про грам мы Рос сий ской ака де мии на ук: этап 2003-2005, ко то рый ос ве щен в сбор ни ке «На цио наль ный кор пус рус ско-го язы ка 2003-2005» и этап 2006-2008. О ре зуль та тах вто ро го эта па под роб но рас ска за но в этом сбор ни ке. Да же из ог-лав ле ния вид но, что с Кор пу сом свя за на боль шая и всё бо лее раз но об раз ная дея-тель ность, не со мнен но, ин те рес ная для раз ных об лас тей лин гвис ти ки. Но пуб ли-ка ции, ка саю щие ся от дель ных фраг мен-тов ра бо ты над Кор пу сом, всё же не мо гут Введение а цио наль ный кор пус рус ско го язы ка был от крыт для сво бод но-го дос ту па в ин тер не те 29 ап ре-ля 2004 го да-с тех пор про шло 5 с по ло ви ной лет, для ин тер нет-про ек та это мно го. За кон чи лись два эта па ра бо ты над кор пу сом в рам ках осо бой ис сле до ва тель ской про грам мы Рос сий ской ака де-мии на ук: этап 2003-2005, ко то рый ос ве щен в сбор ни ке «На цио-наль ный кор пус рус ско го язы ка 2003-2005» и этап 2006-2008. О ре зуль та тах вто ро го эта па под роб но рас ска за но в этом сбор ни ке. Да же из ог лав ле ния вид но, что с Кор пу сом свя за на боль шая и всё бо лее раз но об раз ная дея тель ность, не со мнен но, ин те рес ная для раз-ных об лас тей лин гвис ти ки. Но пуб ли ка ции, ка саю щие ся от дель ных фраг мен тов ра бо ты над Кор пу сом, всё же не мо гут дать пред став ле-ния о про ек те в це лом, его раз ви тии, об щих за да чах и пер спек ти вах, его, ес ли мож но так ска зать, «фи ло со фии». Вос пол нить этот про бел мы и по про бу ем в на стоя щей ста тье. Е. В. Рахилина Кор пус как твор че ский про ект
Bloomington, Indiana: Slavica, 2017, 297-311., 2017
The paper discusses the emergent grammaticalization of Russian prepositional phrase bez konca, li... more The paper discusses the emergent grammaticalization of Russian prepositional phrase bez konca, lit. 'without end'. Various corpus data (including specialized corpora of Russian) allow us to isolate several stages of this process, which finally results in a kind of iterative marker. The resulting meaning of (habitual) iterativity is not fully compositional but has well established crosslinguistic counterparts. В статье на корпусном материале (в том числе с использованием специали зи рованных корпусов) обсуждается проблема грамматикализации русского пред ложного сочетания без конца. Прослеживается процесс его превращения в грам матический маркер и выявляются ограничения на этот процесс. Показано, что возникающее в результате особое значение (хабитуальной) итеративности неком по зиционально, но типологически релевантно и ожидаемо.
М.: Алетейя, 2019., 2019
Исследовательский проект, первые результаты которого отражены в этой книге, связан с созданием ми... more Исследовательский проект, первые результаты которого отражены в этой книге, связан с созданием микроисторической (XVIII-XXI вв.) базы данных, включающей конструкции с грамматическим и квазиграмматическим значением: времени, отрицания, неопределенности, и-среди других-значений, так или иначе связанных с областью квантификации. Здесь мы собрали некоторые интересные фрагменты нашей базы и публикуем их с подробным лингвистическим комментарием, иллюстрируя отдельные аспекты процесса грамматикализации / конструкционализации 1 и его особенности в отношении квантификативных конструкций. Эти фрагменты легко сложились в небольшую цельную монографию. В проекте участвуют как преподаватели (Я. Э. Ахапкина и Т. И. Резникова), так и студенты школы лингвистики НИУ ВШЭ (Мария Царева, Анна Кондратьева, Федор Голосов, Виолетта Иванова, Анастасия Тимошина, Степан Михайлов, Татьяна Масуми, Анна Клезович и другие). Эту монографию придумала, составила, а во многих частях просто написала Екатерина Роландовна Добрушина. Важнейшее участие в ее редактировании и издании приняла Яна Эмильевна Ахапкина, которая ведет этот проект со студентами первого курса школы лингвистики НИУ ВШЭ.
VON A WIE ASPEKT BIS Z WIE ZDVOŘILOST. Ein Kaleidoskop der Slavistik für Tilman Berger. zum 65. Geburtstag. Tübingen Library Publishing 2021, p. 289-296, 2021
Эта статья – результат нашей работы над классическими текстами русской литературы. Мы все так к н... more Эта статья – результат нашей работы над классическими текстами русской литературы. Мы все так к ним привыкли, что часто не замечаем постепенного старения их языка и его неизбежного отдаления от сегодняшней обыденной русской речи – как не замечаем облупившейся штукатурки на стенах полюбившихся домов или морщин на родных и близких нам лицах. Но так же, как утратившие современность города превращаются в музеи старины, а старики – в увлекательных рассказчиков о былом, так и тексты XIX века оказываются собраниями свидетельств о прежнем русском языке и о тех системных сдвигах, которые в нем происходят. Пока еще такие свидетельства нечасто лежат на поверхности: их приходится разыскивать и тщательно проверять на «антикварность», прежде чем они становятся заслуживающими внимания «лингвистическими экспонатами». Одним из сюжетов, родившихся из наблюдений над языком повести «Фаталист» М.Ю.Лермонтова, мы хотели бы здесь поделиться.
Вопросы языкознания, 2016, 2, 7-21., 2016
Статья посвящена вкладу Ч. Филлмора в современную лингвистику. В ней обсуждаются идеи Филлмора, к... more Статья посвящена вкладу Ч. Филлмора в современную лингвистику. В ней обсуждаются идеи Филлмора, которые на много лет вперед определили ее развитие-падежная грамматика, пресуппозиция и дейксис, фреймы, теория грамматики конструкций.
Belgian Journal of Linguistics 2020; Volum 34. ISSN 0774-5141.s 161 - 173., 2020
We provide a practical step-by-step methodology of how to build a full-scale constructicon resour... more We provide a practical step-by-step methodology of how to build a full-scale constructicon resource for a natural language, sharing our experience from the nearly completed project of the Russian Constructicon, an open-access searchable database of over 2,200 Russian constructions (https://site.uit.no/russian-constructicon/). The constructions are organized in families, clusters, and networks based on their semantic and syntactic properties, illustrated with corpus examples, and tagged for the CEFR level of language proficiency. The resource is designed for both researchers and L2 learners of Russian and offers the largest electronic database of constructions built for any language. We explain what makes the Russian Constructicon different from other constructicons, report on the major stages of our work, and share the methods used to systematically expand the inventory of constructions. Our objective is to encourage colleagues to build constructicon resources for additional natural languages, thus taking Construction Grammar to a new quantitative and qualitative level, facilitating cross-linguistic comparison.
Studies in Baltic and other languages: A Festschrift for Axel Holvoet on the occasion of his 65th birthday / Peter Arkadiev, Jurgis Pakerys, Inesa Šeškauskienė, Vaiva Žeimantienė (eds.), 2021
The paper analyzes some non-trivial properties of the Russian particle čut' (≈ 'a little') as wel... more The paper analyzes some non-trivial properties of the Russian particle čut' (≈ 'a little') as well as its reduplicated counterpart čut'-čut' used as a discourse marker. The rapid grammaticalization of čut' started around the 17 th century resulted in the coexistence of three types of values: quantitative ('small quantity'), avertive (followed by negation and often by bylo), and immediate ('as soon as'). This is a peculiar polysemy; what makes it even more peculiar is the fact that a large part of quantitative values related to nominal quantity is a very recent development and not an early inheritance as one might a priori expect.
Time as secondary to space: Russian pod ‘under’ and iz-pod ‘from-under’ in temporal constructions, 2013
ВРЕМЕННЫ Е ЗНАЧЕНИЯ РУССКИХ ПРЕДЛОГОВ: ГРАНИЦЫ МЕТАФОРИЗАЦИИ, 2013
НАЧАЛЬНАЯ СТАДИЯ ГРАММАТИКАЛИЗАЦИИ ЗНАЧЕНИЙ ГЛАГОЛЬНОЙ МНОЖЕСТВЕННОСТИ В КВАЗИГРАММАТИЧЕСКИХ КОНСТРУКЦИЯХ, 2013
Категориальная структура и грамматика конструкций контейнеры, 2010
Конструкция анекдота с точки зрения грамматики конструкций, 2009
Olga Artyushkina, Vladimir Beliakov, Natalia Bernitskaïa, Tatiana Bottineau (éds.). Études de linguistique slave – mélanges offerts à Robert Roudet. Toulouse: Presses universitaires du Midi, 2020, 161–176, 2020
Russian Linguistics, 2013, 37.3, 347–359., 2013
The article examines the relationship between time and space in language on the basis of adjectiv... more The article examines the relationship between time and space in language on the basis of adjectives denoting high or low speed in Russian and other (mostly Slavic) languages. In physics the notion of speed is defined in terms of time and space (distance per time unit). It is argued, however, that speed in natural language is a primarily temporal concept involving the comparison of the temporal properties of a 'target situation' with those of a 'norm'. Speed terms are shown to develop their own metaphors and metonymies, subsequently becoming connectors and intensifying markers. This argument has important theoretical implications insofar as it demonstrates that the domain of time is less dependent on space than the traditional view might indicate.
The paper deals with a well known problem of the distribution of grammatical markers within a cer... more The paper deals with a well known problem of the distribution of grammatical markers within a certain category and whether this distribution is motivated semantically or not. It discusses the choice of singular and plural forms of nouns in Russian texts. Anna Wierzbicka was one of the first to recognize that the rules which regulate the usage of number markers in Russian are language-specific. She compared the Russian system with the systems of other languages, mainly, English and Polish (cf. Wierzbicka 1988). According to her theoretical assumptions, the difference of the linguistic behaviour of singular and plural forms is always semantically motivated, even if the corresponding nouns represent the same taxonomic class and occur in the same context (like different pieces of furniture, or kinds of vegetables, or types of dishes, etc.). The difference is always determined by the semantics of nouns and the typical functions of the extralinguistic objects they encode. This approach has been pursued by a number of scholars (see: Поливанова 1997; Ляшевская 2004а and others). Our paper develops this approach further on the basis of very different data. We take our data from texts written by nonstandard speakers of Russian (as defined by Mustajoki, Protassova & Vakhtin 2010) who are bilinguals. In our case these are students of the major universities in Almaty, who speak Russian fluently and acquired it long before entering university, having Kazakh as their native language. We have gathered and tagged a corpus of bilingual texts of this kind containing 60 000 tokens. This is a part of the Russian learner corpus (RLC) which facilitates identification of deviations from standard Russian. The analysis of these deviations is of particular interest for linguistic theory, since they provide cases of interference and interaction for languages of very different structure, such as Russian and Kazakh. The main goal of our paper is to show that the deviations in nominal number marking we come across in the texts of bilinguals are not arbitrary but motivated. They follow semantic strategies which are characteristic for speakers appealing to both systems at once. The paper argues that the violation of standard usage observed in the learner corpus can specify the rules governing Russian number usage which have been violated, even though the domain of number has been well described already.
Lingvisticae Investigationes, 1994
Résumé/Abstract Les As. présentent quelques résultats concernant une base de données en cours de ... more Résumé/Abstract Les As. présentent quelques résultats concernant une base de données en cours de construction sur les transformés nominaux russes. L'analyse se limite à un seul type de contexte syntaxique: celui formé par un verbe opérateur introduisant un nom ...
Studies in Language Companion Series, 1999
Linguisticae Investigationes Revue Internationale De Linguistique Francaise Et De Linguistique Generale, 1994
VINITI and V. V. Vinogradov Institute of Russian Language, Russian Academy of Sciences, Moscow On... more VINITI and V. V. Vinogradov Institute of Russian Language, Russian Academy of Sciences, Moscow One of the main advantages of the Russian National Corpus is its semantic tagging based on an extensive semantic classification of the lexicon – separate for nouns, verbs, adjectives, adverbs and numerals (see Kustova e.a. 2005). Semantic annotations, combined with morphological tagging, make it possible to answer queries that concern not only separate words and word forms but also semantically characterized classes of words, as well as constructions with components presented as morphologically and/or semantically described classes.
Typological Studies in Language, 1999
Vestnik Tomskogo gosudarstvennogo universiteta. Filologiya, 2015
Модели семантической деривации многозначных качественных прилагательных: метафора, метонимия и их взаимодействие, 2009
СЕМАНТИЧЕСКИЕ ФИЛЬТРЫ ДЛЯ РАЗРЕШЕНИЯ МНОГОЗНАЧНОСТИ В НАЦИОНАЛЬНОМ КОРПУСЕ РУССКОГО ЯЗЫКА: ПРИЛАГАТЕЛЬНЫЕ 1 SEMANTIC FILTERS FOR THE WORD SENSE DISAMBIGUATION IN RNC: ADJECTIVES, 2007
В статье представлена система семантических фильтров имен прилагательных, которая используется дл... more В статье представлена система семантических фильтров имен прилагательных, которая используется для разрешения неоднозначности лексико-семантической разметки в Национальном корпусе русского языка. Большинство значений многозначных прилагатель-ных (как и других многозначных слов) в словаре Корпуса снабжено пометой семантического класса. В тексте каждое вхождение слова автоматически получает все словарные семантиче-ские пометы. С помощью семантических фильтров лишние пометы автоматически удаляют-ся. Мы уже писали в наших предыдущих публикациях о том, какова идеология семантических фильтров для Национального корпуса русского языка и какова технология их создания (см. [Кустова, Ляшевская, Падучева, Рахилина 2005], [Рахилина, Кобрицов, Кустова, Ляшевская, Шеманаева 2006]; о различных идеологиях семанти-ческой классификации лексики и семантической разметки см. также [Atkins 1993], [Fellbaum, Grabowski, Landes 1998], [Dolan, Vanderwende, Richardson 2002]). Поэтому сейчас мы ограничимся лишь короткой справкой. В Корпусе наряду с морфологической разметкой существует семантическая разметка: слову в электронном слова-ре Корпуса приписываются различные семантические пометы-таксономический класс (кинжал: «оружие», печаль: «эмоция», кривляться: «поведение»), мереология (каблук: «части одежды и обуви»), топология (ниша: «вместилище»), оценка (благоухание: «положительная оценка», пресмыкаться (перед кем): «отрицательная оценка»), некоторые словообразовательные пометы, важные для семантики (проверка: «отглагольное», здешний: «отадвербиальное»), и т.п. Помимо очевидной лингвистической ценности такой разметки, ее можно использо-вать еще и как средство разрешения многозначности слов в текстах Корпуса. В обычных бумажных словарях разные значения идут под разными номерами. Это неудобно для пользо-вателя Корпуса (поскольку он не помнит, сколько значений выделяет тот или иной словарь и под какими номе-рами они идут) и нерационально с точки зрения возможных лингвистических исследований, которые могут про-водиться на Корпусе и для которых он (в числе многих других важных задач) был задуман и создан. В электро-нном словаре Корпуса вместо номеров (точнее, наряду с номерами) значениям приписываются семантические пометы, т.е. семантический класс, например: обивка (закончена)-«физическое воздействие», (шелковая) обивка-«вещества и материалы». Основная проблема перенесения помет из словаря в тексты Корпуса состоит в следующем. В словаре Корпуса у многозначного слова обычно имеется несколько семантических помет (поскольку разные значения слова обычно, хотя и не всегда, принадлежат к разным семантическим классам). Когда программа автоматически расставляет пометы в тексте, то она каждому вхождению слова приписывает все пометы, которые есть у слова в словаре, поскольку программа не знает, в каком значении выступает слово в данном тексте, и не может выбрать единственную правильную помету, удалив все лишние. Это должны сделать семантические фильтры. Фильтр основан на принципе контекстной однозначности. В контексте слово выступает в определенном значении. Если сформулировать параметры контекста или контекстов, соответствующих данному значению, и сделать соответ-ствующий поисковый запрос, Корпус выдаст примеры употребления слова в данном значении-которому соо-тветствует определенная семантическая помета. Остальные пометы удаляются. И так для каждого значения. Таким образом, многозначность снимается с точностью до семантического класса (т.е. с точностью до семанти-ческой пометы). Тем самым пользователь получает возможность формулировать поисковые запросы и получать Труды международной конференции "Диалог 2007" 582 1 Данная работа выполняется при поддержке РФФИ, проект № 05-06-80396, и РГНФ, проект № 05-04-04008а
Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация, 2018,16(2):5-18, 2018
Статья посвящена проблеме создания модуля автоматического извлечения из текстов русского языка ос... more Статья посвящена проблеме создания модуля автоматического извлечения из текстов русского языка особых единиц - дискурсивных формул. Под дискурсивными формулами (ДФ) мы понимаем неоднословные конструкции, которые, однако, не содержат переменных и выступают в роли ответных реплик на вербальный стимул. Работа над программным модулем включала в себя несколько этапов, в том числе ручную разметку пьес по выявленным в ходе работы критериям. Процесс автоматического извлечения ДФ предусматривает деление текста на синтаксические единицы, соотносимые с клаузой, предсказание принадлежности каждой из единиц к классу ДФ на основании выделенного нами набора признаков и формирование итогового списка ДФ. В качестве алгоритма классификации используется равновесное голосование четырех классификаторов: Random Forest Classifier, Logistic Regression, Ridge Classifier, Support Vector Classifier.
Ключевые слова: дискурсивные формулы, грамматика конструкций, машинное обучение, автоматическое извлечение сущностей
Труды института русского языка им. В.В. Виноградова. 2019. Т. 21. С. 256-283., 2019
В статье представлено обсуждение маркирования семантики особых конструкций разговорной речи — дис... more В статье представлено обсуждение маркирования семантики особых конструкций разговорной речи — дискурсивных формул. Вопрос о специальных средствах маркирования значения возникает в связи со свойством дискурсивных формул выступать в качестве законченных фиксированных реплик, без контекста внутри высказывания говорящего, и одновременно присущей им способности быть полисемичными. На примере русской многозначной дискурсивной формулы Да ну! показывается, как в случае полисемии таких единиц может происходить различение значений: помимо просодии смыслоразличительную функцию выполняет жестикуляция, сопровождающая высказывание. В тексте статьи приводится классификация контекстов употребления формулы Да ну! и выделяются пять основных ее значений: удивление, удивление-недоверие, девалоризация собеседника, девалоризация речевого акта собеседника и «положительная» девалоризация опасения. Коротко освещаются предполагаемый путь конструкционализации формулы и развития каждого из значений. Далее производится количественный анализ жестикуляции, встретившейся при употреблениях формулы в Мультимедийном корпусе русского языка, основанный на разметке всех движений говорящего в момент произнесения Да ну!. Выявляется корреляция между выделенными значениями и набором определенных жестов, что позволяет с одной стороны выстроить карту смежности существующих значений формулы, а с другой стороны получить представление о семантике свойственных разным значениям жестов.
Ключевые слова: грамматика конструкций, дискурсивные формулы, жестикуляция, полисемия, прагматика
Вопросы языкознания, 2021, 2: 7–27., 2021
В статье обсуждается проблема преобразования классификации речевых актов, заимствованной из филос... more В статье обсуждается проблема преобразования классификации речевых актов, заимствованной из философии, в типологическую категорию. Трудность такого преобразования лежит в широкой вариативности формы выражения иллокутивной силы. Несмотря на то, что с основными речевыми актами традиционно ассоциируют определенные формальные признаки (ср. интонационный контур для вопроса), это не позволяет учесть более тонкой классификации (например, противопоставить комплимент сообщению о факте), а главное-полностью исключает из рассмотрения косвенные речевые акты, в природе которых лежит непрямое соответствие формы смыслу сообщения. Для преодоления этого обстоятельства в качестве маркеров категории предлагается рассматривать языковые единицы за пределами речевого акта, а именно специальный класс идиоматичных ответных реплик (ср.: А как же!, Не скажи!, Еще чего!), называемых дискурсивными формулами. Для исследования этого класса авторы опираются на составленный для русского языка список из более 700 формул. Корпусный анализ их употребления показывает, что использование дискурсивных формул во многом зависит от иллокутивной силы высказывания, на которое они реагируют. Сравнение сочетаемости дискурсивных формул в разных языках дает возможность выделить релевантные прагматические противопоставления среди контекстных высказываний. Представленный в статье опыт такого исследования на небольшом фрагменте стимульных речевых актов для русских и английских формул запрета и отказа показывает, что данный материал имеет потенциал для проверки, уточнения и дополнения общепринятой классификации с лингвистического ракурса. Ключевые слова: диалог, дискурс, дискурсивные формулы, прагматика, речевые акты Благодарности: Авторы сердечно благодарят анонимных рецензентов за их критические замечания и ценные советы, а также студентов НИУ ВШЭ, которые принимали участие в нашем проекте, в особенности Е. А. Слепак, Е. Ю. Козюк, Е. И. Афанасьеву и Ю. А. Яковлеву. Работа поддержана Министерством науки и высшего образования РФ (075-15-2020-793).
Вопросы языкознания. 2021. № 2. С. 7-27, 2021
В статье обсуждается проблема преобразования классификации речевых актов, заимствованной из филос... more В статье обсуждается проблема преобразования классификации речевых актов, заимствованной из философии, в типологическую категорию. Трудность такого преобразования лежит в широкой вариативности формы выражения иллокутивной силы. Несмотря на то, что с основными речевыми актами традиционно ассоциируют определенные формальные признаки (ср. интонационный контур для вопроса), это не позволяет учесть более тонкой классификации (например, противопоставить комплимент сообщению о факте), а главное-полностью исключает из рассмотрения косвенные речевые акты, в природе которых лежит непрямое соответствие формы смыслу сообщения. Для преодоления этого обстоятельства в качестве маркеров категории предлагается рассматривать языковые единицы за пределами речевого акта, а именно специальный класс идиоматичных ответных реплик (ср.: А как же!, Не скажи!, Еще чего!), называемых дискурсивными формулами. Для исследования этого класса авторы опираются на составленный для русского языка список из более 700 формул. Корпусный анализ их употребления показывает, что использование дискурсивных формул во многом зависит от иллокутивной силы высказывания, на которое они реагируют. Сравнение сочетаемости дискурсивных формул в разных языках дает возможность выделить релевантные прагматические противопоставления среди контекстных высказываний. Представленный в статье опыт такого исследования на небольшом фрагменте стимульных речевых актов для русских и английских формул запрета и отказа показывает, что данный материал имеет потенциал для проверки, уточнения и дополнения общепринятой классификации с лингвистического ракурса. Ключевые слова: диалог, дискурс, дискурсивные формулы, прагматика, речевые акты Благодарности: Авторы сердечно благодарят анонимных рецензентов за их критические замечания и ценные советы, а также студентов НИУ ВШЭ, которые принимали участие в нашем проекте, в особенности Е. А. Слепак, Е. Ю. Козюк, Е. И. Афанасьеву и Ю. А. Яковлеву. Работа поддержана Министерством науки и высшего образования РФ (075-15-2020-793).
Дискурсивные формулы, полисемия и жестовое маркирование, 2019
ДИСКУРСИВНЫЕ ФОРМУЛЫ, ПОЛИСЕМИЯ И ЖЕСТОВОЕ МАРКИРОВАНИЕ* Лене Гришиной Да ну вас, да ну вас, да н... more ДИСКУРСИВНЫЕ ФОРМУЛЫ, ПОЛИСЕМИЯ И ЖЕСТОВОЕ МАРКИРОВАНИЕ* Лене Гришиной Да ну вас, да ну вас, да ну вас (Закат, предпоследний, погас). Житейская глупость и грубость Уже не касаются нас. Касаются-влажные ветки Твоей побледневшей щеки. Заботы, как бурые белки, Умчались по веткам, легки. И. В. Чиннов. «Да ну вас, да ну вас, да ну вас...» (1978) В статье представлено обсуждение маркирования семантики особых конструк-ций разговорной речи-дискурсивных формул. Вопрос о специальных средст-вах маркирования значения возникает в связи со свойством дискурсивных формул выступать в качестве законченных фиксированных реплик, без контекста внутри высказывания говорящего, и одновременно присущей им способности быть по-лисемичными. На примере русской многозначной дискурсивной формулы Да ну! показывается, как в случае полисемии таких единиц может происходить разли-чение значений: помимо просодии смыслоразличительную функцию выполняет жестикуляция, сопровождающая высказывание. В тексте статьи приводится клас-сификация контекстов употребления формулы Да ну! и выделяются пять основ-ных ее значений: удивление, удивление-недоверие, девалоризация собеседника, 1 Исследование выполнено при поддержке гранта РНФ № 16-18-02071
University of Massachusetts occasional papers, 2004
... by Barbara H. Partee Formal , Lexical Semantics , Vladimir Borschev , Barbara H. Partee , Nat... more ... by Barbara H. Partee Formal , Lexical Semantics , Vladimir Borschev , Barbara H. Partee , Natasha Kondrashova , Elena Paducheva , Orin Percus , Asya Pereltsvaig , Ekaterina Rakhilina. Add To MetaCart. ...
Genitive of cause and cause of genitive, 2015
Для русского языка до сих пор актуальна проблема описания конструк-ций с субъектным генитивом при... more Для русского языка до сих пор актуальна проблема описания конструк-ций с субъектным генитивом при отрицании-такого, которое бы давало возможность предсказать выбор между родительным и именительным в кон-текстах типа фонарей не горело-фонари не горели. Между тем, как извест-но, эта тема освещалась во множестве лингвистических работ, как дескрип-тивных (ср., например, [Ицкович 1983] или [РГ-80]), так и теоретических (ср., например, [Guiraud-Weber 1984] или [Апресян 1985]). Дескриптивный под-ход не дал убедительных результатов потому, что в этой зоне русской грам-матики далеко не всегда действуют жесткие запреты: важно понять принци-пы, на которых основано правило выбора. На эту тему теоретиками выдвига-лись разные гипотезы. В целом все они, как пишет Ю. Д. Апресян [2006: 45], опирались на идею существования субъекта-в самом широком смысле: речь идет о том, что генитив выбирается говорящим тогда, когда описывается ситуация, которая в конечном счете может быть сведена к констатации суще-ствования субъекта. Однако подходы к такому цельному описанию делались разные. Во-первых, были попытки встроить генитивную конструкцию в так на-зываемую теорию неаккузативности, ср. [Perlmutter 1978; Levin, Rappaport Hovav 1995]. Согласно этой теории, имеется два семантико-синтаксических класса непереходных глаголов: при одних подлежащее ведет себя как субъект переходного глагола (ср. глаголы со значением 'прыгать' или 'дышать'), а при других-как объект переходного глагола (таковы, например, 'лежать' или 'падать'); последние, а вслед за ними и теория данного противопоставле-* Данная работа выполнена при поддержке фонда National Science Foundation (грант BCS-04-18-311, руководитель проекта Б. Парти) и фонда РФФИ (грант № 05-06-80396).
Е.В. Рахилина Мы едем, едем, едем... Русское (или близкое русскому польское) ехать в типологическ... more Е.В. Рахилина Мы едем, едем, едем... Русское (или близкое русскому польское) ехать в типологических рабо-тах служит примером "изысканного" способа движения (ср., например, Goddard 1997)-действительно, во многих европейских языках нет прямых аналогов это-го глагола. Между тем, если опираться на общепринятые словарные толкования ехать, создается впечатление, что он вовсе не обозначает способа движения как такового, а всего лишь описывает специальные условия движения, накладывая некоторые ограничения на субъект и средство перемещения, а именно: двигать-ся должен транспорт-причем прототипически-колесный, а также пассажиры этого транспорта. То, как или за счет чего происходит в этом случае переме-щение (т.е. собственно способ движения), в таких описаниях игнорируется и, следовательно, признается несущественным для семантики ехать-ср. сколь-зить, лезть, ползти и другие характерные глаголы способа движения, для кото-рых этот аспект является определяющим. Заметим, что, в дополнение к общему представлению, Ю.Д. Апресян предлагает считать ехать глаголом целенаправ-ленного движения (см. Апресян 1974: 107, 122; Апресян 1995: 53-54): этим он, в частности, объясняет запрет на сочетания типа *дрова едут. Между тем, с точки зрения структуры толкования в целом, 'целенаправленность' тоже всего лишь дополнительный компонент значения, но не характеристика способа движения. Следовательно, "каноническое" представление о семантике ехать нико-гда не подвергалось сомнению, и, следовательно, ехать должен быть признан не просто редким, а нестандартным, неклассическим глаголом способа движе-ния. Однако такой языковой образ ехать вызывает целый ряд вопросов. Во-первых, в ситуации целенаправленного движения транспорта в рус-ском языке выбирается обобщающий глагол идти, ср.: автобус идет в парк, этот поезд не идет до Владимира и т.д. Подробнее эта проблема обсуждалась в Рахилина 2000: 303-309-в частности, там обращалось внимание на неприемле-мость ехать при описании движения "маршрутного" транспорта, в первую оче-редь, железнодорожного, ср. *поезд не едет до Владимира; ?? автобус едет в парк. Если же ехать разрешено, то оно описывает движение, не полностью кон-тролируемое субъектом, а значит, не целенаправленное, ср. за нами идет авто-бус и за нами едет автобус: если автобус послан навстречу (контекст целена-правленного движения, маршрут которого известен), предпочтительнее идет, в случае немаркированного с точки зрения цели движения ('мы едем в машине; сзади нашей машины движется автобус'-его маршрут и цель движения нам неизвестны), возможно только едет. Таким образом, большая часть транспорта все-таки не едет, а идет, а если едет, то как раз нецеленаправлено. Возникает вопрос, как это обстоятель-ство совмещается с природной (по Ю.Д. Апресяну) целенаправленностью ехать-или, может быть, запрет на *дрова едут можно объяснить как-то иначе? Второй вопрос касается контекстов, не связанных с транспортом и по-этому остающихся "за бортом" основного значения-ведь едут в русском языке не только машины и пассажиры, но и лыжи-с горы, повязки и шапки-с голо-вы, чашки-по столу и под. Такие примеры фиксируются в толковых словарях, но механизм образования подобных (переносных?) значений или употреблений ехать остается неясен-если считать, что ехать не подразумевает никакого
Прототипическим субъектом для глагола ползти является змея-с точки зрения русского языка, она про... more Прототипическим субъектом для глагола ползти является змея-с точки зрения русского языка, она просто никак иначе не умеет двигаться (ср. *змея лезет, едет, спускается, поднимает-ся...). Движение змеи-это целенаправленное движение живого существа в непосредственном контакте с поверхностью земли за счет собственных мышечных усилий. Представляется, что имен-но так можно описать специфику ползти как способа движения. Понятно, что не всякий субъект, допустимый при этом глаголе, идеально соблюдает эти условия-тем не менее, как выясняется, в целом данный прототип довольно хорошо сохраняется в самых разных контекстах. Рассмотрим их последовательно. 1. Живые существа: контакт с поверхностью Начнем с живых существ-движущихся по собственной воле и с собственной целью. Все они, начиная с человека и кончая на-секомыми, когда ползут, движутся, прилагая к этому некоторые усилия, и в процессе такого движения оказываются в той или иной степени «прижаты» к земле. Это может быть не только не-посредственный контакт нижней поверхности тела-как у чело-века, ползущего по-пластунски, краба, рака или черепахи: насе-комые ползут, передвигаясь на своих лапках и тело их все-таки отстоит на некоторое расстояние от поверхности, по которой они движутся. Важно, однако, что это расстояние пренебрежимо мало по человеческим меркам, так что можно считать, что мошки и букашки, какими человек видит их, передвигаются практически в контакте с замлей-т. е. ползут. Обратим внимание, что к длинноногому существу, например, к жирафу, у которого расстоя-ние от земли до туловища достаточно велико, глагол ползти не применим 1. Точно так же не применим глагол ползти и к чело-* Эта статья продолжает серию работ, посвященных семантике русских глаголов способа движения [Рахилина 2000; 2001; 2001а; 2002; 2002а]. Данное исследо-вание поддержано грантом РГНФ № 02-04-00303а. 1 Даже в том случае, если жираф движется не отрывая копыт от поверхности-вопреки тому, что утверждается в [Кошелев 1996], где описание ползти строится
Вопросы языкознания. 2018. № 1. С. 148-154., 2018
О НЕКОТОРЫХ НАПРАВЛЕНИЯХ СОВРЕМЕННОЙ ФРАНЦУЗСКОЙ ЛИНГВИСТИКИ 0. Вводные замечания. Черта французс... more О НЕКОТОРЫХ НАПРАВЛЕНИЯХ СОВРЕМЕННОЙ ФРАНЦУЗСКОЙ ЛИНГВИСТИКИ 0. Вводные замечания. Черта французской лингвистики, которая, может быть, в первую очередь поражает постороннего наблюдателя-это ее разнообразие. В отличие от многих других стран Европы, где, как правило, в теоретической лингвистике доминирует только одна науч-ная школа, часто к тому же связанная с генеративным направлением (как в Голландии или Италии) или же самостоятельная (как "школа Дресслера" в Австрии), Франция в полной мере воплощает справедливость известного афоризма, что "лингвистик столько же, сколько лингвистов". Конечно, далеко не все из этих "лингвистик" хорошо извест-ны за пределами Франции (в том числе и у нас), а некоторые и практически вовсе неизвестны; между тем, многие из них явно заслуживают большой популярности. Знакомство с французской лингвистикой тем более оправдано, что даже широко известные направления современной лингвистической теории (такие например, как генеративное или когнитивное) редко существуют во Франции в каноническом виде и обычно получают настолько своеобразное преломление на французской лингвисти-ческой почве, что с трудом оказываются узнаны и признаны своими "прародителями". Настоящий обзор был задуман как панорама прежде всего общетеоретических школ и направлений; полностью или почти полностью за рамками нашего изложения остаются поэтому такие темы (бесспорно, заслуживающие отдельного обсуждения), как французская фонология и фонетика, большинство "частных" описательных линг-вистик (например, богатейшие по своим традициям французские востоковедение и африканистика, славистика и др.), а также большинство смежных дисциплин (таких, как психолингвистика, история языка, семиотика и др.). Впрочем, в этом отно-шении будет сделано несколько важных исключений, связанных с тем, что фран-цузская теоретическая лингвистика почти во всех своих направлениях очень склонна как раз к междисциплинарной экспансии, своего рода "теоретической центробеж-ности" 1. По необходимости, мы в ряде случаев учитываем не только собственно француз-скую, но и франкоязычную лингвистику-прежде всего это касается некоторых науч-ных центров Бельгии и Швейцарии, работающих в тесном контакте с Францией; однако преимущественное внимание уделено, естественно, французским (и даже, скорее, парижским) лингвистическим школам. Разумеется, неполнота картины при такого рода замысле неизбежна. Укажем лишь, что при перечислении имен мы старались отдавать предпочтение лингвистам, являю-1 Здесь сказывается и господствующая структура научно-организационных связей, либо достаточно прочно удерживающих лингвистику в области традиционной филологии, либо-в более модернизированных структурах-подчиняющих ее требованиям информатики, искусственного интеллекта и т.п. 107
Как ни странно, история развития лингвистики — вообще говоря, гуманитарной нау-ки — оказалась нео... more Как ни странно, история развития лингвистики — вообще говоря, гуманитарной нау-ки — оказалась необычайно тесным образом связана с историей информатики и вычислительной техники. Общеизвестно, что идея машинного перевода, возникшая в конце пятидесятых годов в "пик" кибернетического бума, дала совершенно новый импульс лингвистической науке (причем, как теперь очевидно, прежде всего тео-ретической). Конечно, некоторые области прикладной лингвистики просто не могли возникнуть до рождения первых вычислительных машин, но гораздо более неожиданно, что при этом совершенно изменилась и, так сказать, общая парадигма науки — лингвистика стала казаться точной наукой. Появились и новые требования к лингвистическим работам-они вторили математике: определения должны быть эф-фективными, описания непротиворечивыми, и т.д. Неважно, что эти требования не выполнялись, и, как стало ясно гораздо позже, не могли выполняться,-важно, что они были, оставили свой след и даже в каком-то виде сохранились до сих пор именно в качестве критериев научности. Постепенное (а в нашей стране скорее внезапное) появление новых машин-быст-рых и вместе с тем обладающих огромными возможностями памяти-опять открывает новые прикладные области для лингвистики: прежде всего это базы данных, по-зволяющие классифицировать языковые факты. Снова потенциал машин дает на-дежду (или иллюзию), что с его помощью можно бесстрашно переплыть бесконечное лексическое море, море употреблений, различного рода сочетаний и т.п.: в машине бесконечное превращается в счетное и кажется обозримым-таким образом, для каких-то задач мечта о полноте языкового материала становится реальностью. Эти задачи, на наш взгляд, связаны с описанием лексики и созданием автоматических словарей. Обратим внимание, что здесь тоже меняется подход к проблеме: если традиционная лексикография ориентировалась на описание отдельного слова как самостоятельного объекта исследования, то теперь на первый план выходит исследование классов слов, объединенных по одному или нескольким признакам. Задача описания слова (или группы семантически близких слов) уже осознана как неразрешимая в силу сво-ей неограниченности; однако с помощью базы данных можно формулировать ее, так сказать, частные "подзадачи", причем многие из них имеют исчерпывающие решения. Простым примером такого рода может служить задача сопоставления значений некоторых двух признаков, например: верно ли, что все имена обозначающие части, могут выступать в генитивной конструкции (ср. ножка стула, ручка двери, но нос лица). База данных, содержащая некоторую семантико-синтаксическую информацию о каждой лексеме, позволяет сравнить класс лексем, обозначающих части, и класс лексем, допускающих в конструкции "часть-целое" родительный падеж. Заметим, что ни один из существующих словарей не даст возможности получить аналогичный результат: мы не найдем там ни последовательно представленной информации о частях, ни тем более помет о возможности генитива, т.к. в свете глобального лексикографического описания такого рода сведения окажутся слишком частными. 107
Рецензия на сборник «Контенсивные аспекты языка: константность и вариативность», 2017
Статья посвящена истории одного из самых известных московских цент-ров лингвистики и семиотики вт... more Статья посвящена истории одного из самых известных московских цент-ров лингвистики и семиотики второй половины двадцатого века в России-Отдела семиотики / теоретических проблем информации Всесоюзного / Всероссийского Института научной и технической информации (ВИНИТИ) Российской академии наук и роли Григория Ефимовича Крейдлина в его жизни. Ключевые слова: Семиотика, история лингвистики, ВИНИТИ РАН, Г.Е. Крейдлин. Мое знакомство с Гришей случилось прозаически: меня взяли на работу во Всероссийский институт научной и технической инфор-матики, в отдел, который тогда назывался Отделом семиотики, где Гриша уже давно работал. Институт располагался удобно-недалеко от метро Сокол в ти-хом Балтийском переулке, и от дома мне было туда идти пешком минут двадцать неспешным шагом. Это было странное, немнож-ко нелепое, но уютное здание-говорили, в прошлом богадельня. Прежняя аура в нем прижилась надолго: коридорные стены были какие-то больнично-зеленые, и, кажется, там никогда не мыли окна. На третьем этаже, где располагалась дирекция, вдоль широченной лестницы висела огромная стенгазета-под названием что-то вроде «Комсомолия». Она добавляла ауры: меня чуть не исключили из комсомола за то, что закончив университет, я не встала на время летнего перерыва на комсомольский учет в ЖЭК. Потом, правда, ограничились строгим выговором, ради которого мне пришлось ехать куда-то в райком (может быть, выговор выдавали на руки?-уже не помню). Когда ко мне как-то заглянул по делу один мой приятель, совсем из другого мира, он рассказывал, что пока он шел к нам по четвер-тому этажу, двери по одной приоткрывались, и он с любопытством разглядывался: редкие гости вызвали интерес и разнообразили ту-склую жизнь. Гости действительно были редки-потому что внизу сидела вахтерша и строго проверяла пропуска. Это было неслыханно для
О работе Московской лексико-типологической группы, 2011
Хроника X международной конференции по когнитивной лингвистике, 2008
Труды института русского языка им. ВВ Виноградова. – 2020. – №. 4. – С. 168-193., 2020
В статье рассматривается выражение итеративного значения (значения регулярного повторения ситуаци... more В статье рассматривается выражение итеративного значения (значения регулярного повторения ситуации) — в русских письменных текстах носителей казахского языка. В качестве исходных данных выступает казахский подкорпус Русского учебного корпуса, а также результаты специально проведенного опроса носителей.
В ходе исследования система, выявляемая в реальных текстах Учебного корпуса, сравнивается с доминантной казахской и русской системами, на которые сознательно или бессознательно ориентируются авторы текстов. Репрезентациями языковых стандартов для этих систем мы признаем Алматинский корпус казахского языка и Национальный корпус русского языка.
В обеих стандартных системах повтор ситуации может выражаться и глагольной формой (например, НСВ в русском или бивербальными конструкциями в казахском), и находящимся в той же конструкции обстоятельственным показателем: наречием, деепричастием, временным придаточным. Однако в каждом языке имеются свои возможности избежать такого дублирования.
В речи билингвов преодолеваются ограничения, действующие в стандартных системах, и вырабатываются новые принципы оформления итеративного значения. В ряду факторов, которые влияют на образование промежуточной системы (представленной, как мы покажем, в русской речи носителей казахского языка), оказывается как интерференция, так и упрощение билингвами действующих правил, в том числе в точках потенциального варьирования.
Поэтому косвенным результатом исследования можно считать прояснение сложных фрагментов самой системы русского языка и выявление точек ее нестабильности.
Ключевые слова: итератив, интерференция, казахский язык, русский язык, билингвизм, Русский учебный корпус
NRU HSE. Series WP BRP "Linguistics". 2014. No. 11, 2014
The problem of incomplete language acquisition and heritage languages is approached from several ... more The problem of incomplete language acquisition and heritage languages is approached from several perspectives: who are heritage speakers, how are they different from native speakers and L2 learners, is heritage language a particular system? This paper aims at answering these and
other questions focusing on constructional deviations in the output of heritage speakers and linguistic strategies that these speakers perform in their production. The research is corpus-based and offers a thorough comparative analysis of English and Russian constructions.
Keywords: incomplete acquisition, heritage languages, corpus-based study, constructional deviations.
Glossa: A journal of general linguistics, 2016, 1(1), 1-29., 2016
This paper presents and analyzes lexical and syntactic evidence from heritage Russian as spoken b... more This paper presents and analyzes lexical and syntactic evidence from heritage Russian as spoken by bilinguals dominant in American English. The data come from the Russian Learner Corpus, a new resource of spoken and written materials produced by heritage re-learners and L2 learners of Russian. The paper focuses on lexical deviations from baseline Russian at a single-and multi-word level, which we divide further into transfer-based structures and novel creations, showing that the latter are used by heritage speakers, but generally not freely available to L2 learners. In constructing innovative expressions, heritage speakers follow general principles of compositionality. As a result, such innovative expressions are more semantically transparent than their correlates in the baseline or dominant language. We contend that semantically transparent, compositional patterns are based on structures that are universally available across languages. However, L2 speakers resort to these universal strategies for creating novel phrases much less often than heritage speakers. In their linguistic creativity, heritage speakers' utterances parallel those of L1 child learners rather than L2 speakers.
Русский язык за рубежом, 2016, 3, 20-25., 2016
Linköping : LiU Electronic Press, 2016. Ch. 10. P. 1-10., 2016
In this paper we describe an open learner corpus of Russian. The Russian Learner Corpus (RLC) is ... more In this paper we describe an open learner corpus of Russian. The Russian Learner Corpus (RLC) is the first corpus with clear distinction between foreign language learners and heritage speakers. We discuss the structure of the corpus, its development and the annotation principles. This paper describes the platform of the RLC which combines online tools for text uploading, processing, error annotation and corpus search.
Вестник российского университета Дружбы народов, Серия: Лингвистика, 2018, том 22, № 3, С. 581-605., 2018
The paper deals with a well known problem of the distribution of grammatical markers within a cer... more The paper deals with a well known problem of the distribution of grammatical markers within a certain category and whether this distribution is motivated semantically or not. It discusses the choice of singular and plural forms of nouns in Russian texts. Anna Wierzbicka was one of the first to recognize that the rules which regulate the usage of number markers in Russian are language-specific. She compared the Russian system with the systems of other languages, mainly, English and Polish (cf. Wierzbicka 1988). According to her theoretical assumptions, the difference of the linguistic behaviour of singular and plural forms is always semantically motivated, even if the corresponding nouns represent the same taxonomic class and occur in the same context (like different pieces of furniture, or kinds of vegetables, or types of dishes, etc.). The difference is always determined by the semantics of nouns and the typical functions of the extralinguistic objects they encode. This approach has been pursued by a number of scholars (see: Polivanova 1997; Lyashevskaya 2004а and others). Our paper develops this approach further on the basis of very different data. We take our data from texts written by nonstandard speakers of Russian (as defined by Mustajoki, Protassova & Vakhtin 2010) who are bilinguals. In our case these are students of the major universities in Almaty, who speak Russian fluently and acquired it long before entering university, having Kazakh as their native language. We have gathered and tagged a corpus of bilingual texts of this kind containing 60 000 tokens. This is a part of the Russian Learner Corpus (RLC) which facilitates identification of deviations from standard Russian. The analysis of these deviations is of particular interest for linguistic theory, since they provide cases of interference and interaction for languages of very different structure, such as Russian and Kazakh. The main goal of our paper is to show that the deviations in nominal number marking we come across in the texts of bilinguals are not arbitrary but motivated. They follow semantic strategies which are characteristic for speakers appealing to both systems at once. The paper argues that the violation of standard usage observed in the learner corpus can specify the rules governing Russian number usage which have been violated, even though the domain of number has been well described already.
Helsinki: University of Helsinki, 2019. – С.37 – 45., 2019
1. Вводные замечания Итеративность, представляющая собой особый тип глагольной множественности, и... more 1. Вводные замечания Итеративность, представляющая собой особый тип глагольной множественности, имеет весьма широкий спектр способов выражения в разных языках мира, см. (Храковский 1989а; Шлуинский 2005). Предпринимаемое нами описание итеративности, отражающее некоторые аспекты этой категории, отличает то, что оно строится на наблюдениях за речью «нестандартных говорящих»-в нашем случае казахско-русских билингвов, чьи тексты включены в Русский учебный корпус (RLC). Авторы текстов, послуживших источником анализируемого материала, изучали русский язык в школах и, будучи студентами, продолжают изучать его в вузах. Они учатся в городе Алматы, «лингвистический облик» которого определяют два языка-казахский и русский. Однако доминантным языком этих авторов RLC со всей очевидностью является казахский язык. Речь людей, владеющих типологически разными языками, безусловно, заслуживает специального исследования. В ней могут быть обнаружены весьма нетривиальные стратегии и неожиданные контаминации. Однако, помимо этого, обращение к такому «нестандартному» речевому материалу позволяет лучше понять устройство системы языка-цели (в данном случае-русского языка). В частности, непреднамеренные нарушения, допускаемые билингвами, четко очерчивают границы допустимых колебаний на неустойчивых участках русского языка. Именно с этих позиций мы предполагаем рассмотреть здесь выражение итеративности в русской речи казахов-билингвов (см. также нашу статью (Рахилина, Казкенова 2018) с исследованием категории именного числа в той же перспективе). Статья состоит из 6 разделов. В первом и втором разделах рассматриваются основные особенности выражения итеративности, соответственно, в русском и казахском языках. Выражение итеративности в речи казахско-русских билингвов описано в третьем и четвертом разделах на примере двух случаев. Третий раздел посвящен анализу комплексного выражения данного значения с помощью обстоятельственных показателей типа всегда, иногда, часто, редко и глагольных видо-временных форм соответствующей семантики. В четвертом мы рассмотрим кратно-соотносительные конструкции, то есть предложения, осложненные деепричастными оборотами, и сложноподчиненные предложения с придаточными времени. В пятом разделе предлагаются гипотезы, объясняющие причины обнаруженных в билингвальных текстах отклонений от норм стандартного русского языка. В Заключении обобщаются сделанные наблюдения. Фрагменты текстов билингвов сверялись с данными Национального корпуса русского языка, который в контексте нашего исследования представляется как некоторый «эталон» стандартного русского языка. Эпизодически привлекаются и данные Алматинского корпуса казахского языка.
Przegląd Wschodnioeuropejski, Ольштын, 2019, вып.1. – С.389 – 398., 2019
Keywords: Russian language in Kazakhstan, Russian Learner Corpus, bilingualism, inceptivity, verb... more Keywords: Russian language in Kazakhstan, Russian Learner Corpus, bilingualism, inceptivity, verbal prefixation
Abstract: The article describes Russian Learner Corpus as a tool for the study of Russian of bilingual Kazakh students through the example of their written texts. The article is focused on the markers of inceptivity and verbal prefixation patterns in these texts. It examines the deviations from Standard Russian, caused by the influence of Kazakh, as well as by some other strategies of linguistic behavior of Kazakh-Russian bilinguals. The main mismatch between Russian and Kazakh is due to the fact that Kazakh (like other Turkic languages) lacks prefixal verbs, so that the semantic impact of the Russian prefixes is transferred to other means and is expressed with the help of different strategies – mainly, by periphrastic biverbal constructions. On another level, corpus data analysis can specify the semantic differences between similar aspectual units in Russian viewed through linguistic patterns used by Kazakh bilingual speakers.
Вестн. Том. гос. ун-та. Филология. 2021. № 73, 2021
Рассматриваются случаи нестандартного употребления казахско-русскими билингвами предлогов после, ... more Рассматриваются случаи нестандартного употребления казахско-русскими билингвами предлогов после, через и спустя во временны́х контекстах. Доказывается, что отклонения обусловлены грамматическими различиями между родным и русским языками. Анализ отклонений выявил специфические черты предлогов: способность указывать на завершение событий и отрезков времени, как единичных, так и повторяющихся, а также неоднозначность через в составе сочетаний с названиями разных временны́х интервалов.
Voprosy jazykoznanija, 2014, N 3., 2014
SSRN Electronic Journal, 2000
Выражение итеративности в русских текстах казахских билингвов, 2019
1. Вводные замечания Итеративность, представляющая собой особый тип глагольной множественности, и... more 1. Вводные замечания Итеративность, представляющая собой особый тип глагольной множественности, имеет весьма широкий спектр способов выражения в разных языках мира, см. (Храков-ский 1989а; Шлуинский 2005). Предпринимаемое нами описание итеративности, отра-жающее некоторые аспекты этой категории, отличает то, что оно строится на наблюде-ниях за речью «нестандартных говорящих»-в нашем случае казахско-русских билинг-вов, чьи тексты включены в Русский учебный корпус (RLC). Авторы текстов, послужив-ших источником анализируемого материала, изучали русский язык в школах и, будучи студентами, продолжают изучать его в вузах. Они учатся в городе Алматы, «лингвисти-ческий облик» которого определяют два языка-казахский и русский. Однако доминант-ным языком этих авторов RLC со всей очевидностью является казахский язык. Речь людей, владеющих типологически разными языками, безусловно, заслуживает специального исследования. В ней могут быть обнаружены весьма нетривиальные стра-тегии и неожиданные контаминации. Однако, помимо этого, обращение к такому «не-стандартному» речевому материалу позволяет лучше понять устройство системы языка-цели (в данном случае-русского языка). В частности, непреднамеренные нару-шения, допускаемые билингвами, четко очерчивают границы допустимых колебаний на неустойчивых участках русского языка. Именно с этих позиций мы предполагаем рас-смотреть здесь выражение итеративности в русской речи казахов-билингвов (см. также нашу статью (Рахилина, Казкенова 2018) с исследованием категории именного числа в той же перспективе). Статья состоит из 6 разделов. В первом и втором разделах рассматриваются основные особенности выражения итеративности, соответственно, в русском и казахском языках. Выражение итеративности в речи казахско-русских билингвов описано в третьем и чет-вертом разделах на примере двух случаев. Третий раздел посвящен анализу комплекс-ного выражения данного значения с помощью обстоятельственных показателей типа всегда, иногда, часто, редко и глагольных видо-временных форм соответствующей се-мантики. В четвертом мы рассмотрим кратно-соотносительные конструкции, то есть предложения, осложненные деепричастными оборотами, и сложноподчиненные пред-ложения с придаточными времени. В пятом разделе предлагаются гипотезы, объясняю-щие причины обнаруженных в билингвальных текстах отклонений от норм стандарт-ного русского языка. В Заключении обобщаются сделанные наблюдения. Фрагменты текстов билингвов сверялись с данными Национального корпуса рус-ского языка, который в контексте нашего исследования представляется как некоторый «эталон» стандартного русского языка. Эпизодически привлекаются и данные Алматин-ского корпуса казахского языка. 1 Исследование выполнено при поддержке Российского научного фонда (проект №16-18-02071 "Погра-ничный русский: оценка сложности восприятия русского текста в теоретическом, экспериментальном и статистическом аспектах").
Linguistic creativity in heritage speakers, 2016
This paper presents and analyzes lexical and syntactic evidence from heritage Russian as spoken b... more This paper presents and analyzes lexical and syntactic evidence from heritage Russian as spoken by bilinguals dominant in American English. The data come from the Russian Learner Corpus, a new resource of spoken and written materials produced by heritage re-learners and L2 learners of Russian. The paper focuses on lexical deviations from baseline Russian at a single-and multi-word level, which we divide further into transfer-based structures and novel creations, showing that the latter are used by heritage speakers, but generally not freely available to L2 learners. In constructing innovative expressions, heritage speakers follow general principles of compositionality. As a result, such innovative expressions are more semantically transparent than their correlates in the baseline or dominant language. We contend that semantically transparent, compositional patterns are based on structures that are universally available across languages. However, L2 speakers resort to these universal strategies for creating novel phrases much less often than heritage speakers. In their linguistic creativity, heritage speakers' utterances parallel those of L1 child learners rather than L2 speakers.
Русские конструкции со значением чередования ситуаций , 2016
1. Введение Можно с уверенностью сказать, что задача создания «русского конструктикона»-списка ру... more 1. Введение Можно с уверенностью сказать, что задача создания «русского конструктикона»-списка русских конструкций с их подробным комплексным лексико-синтаксическим описанием-была поставлен Натальей Юрьевной Шведовой одной из первых, прежде всего, в ее знаменитой докторской диссертации 1958 года «Синтаксис русской разговорной речи. Строение простого предложения», затем в соответствующей монографии (Шведова 1960) и последней Академической грамматике под её редакцией (АГ 1980). Между тем, поиск новых конструкций-нетривиальная исследовательская задача. Такие единицы не всегда можно выделить «механически», опираясь, например, на данные статистики (частотность n-грамов), так как количество компонентов внутри конструкции, их линейный порядок не обязательно является строго фиксированным. Простого решения здесь нет-нужен творческий подход. Мы предлагаем искать и изучать новые конструкции на материале корпусов ошибок 2. В нашем исследовании мы будем опираться на корпус текстов носителей эритажного русского: так называют эмигрантов второго поколения, выросших за пределами России (Polinsky, Kagan 2007; Выренкова et al. 2014), а сам термин восходит к английскому heritage speakers, букв. 'говорящие на унаследованном языке'. Идиом таких носителей отличается грамматической правильностью-особенно по сравнению с изучающими русский язык как иностранный, но одновременно и большим количеством нестандартных отклонений от привычных норм, прежде всего, в области лексико-синтаксической сочетаемости. Аномальные употребления, связанные с нарушением таких комплексных сочетаемостных правил, выступают маркерами конструкций: анализ причин появления ошибки позволяет выявить как исходную правильную конструкцию, так и конструкции, близкие к ней по семантическим и / или синтаксическим свойствам. В этой статье речь пойдет о целом классе интересных с лингвистической и типологической точки зрения квазиграмматичных конструкций со значением чередования ситуаций. Наше внимание на него обратили несколько «ошибочных» эритажных примеров типа (1-3). С точки зрения языковой нормы, предложение (1) не безупречно, но вполне допустимо в устной речи. Однако примеры (2)-(3) являются аномальными: в (2) более приемлемым кажется двойной союз то-то, а в (3)-конструкция с временным наречием Fиногда-иногда. Скорее всего, нестандартные употребления здесь обусловлены калькированием: может быть…, может быть является прямым переводом финской конструкции ehkä… ehkä (букв. 'возможно…, возможно'), иной раз…, иной раз представляет собой поэлементный перевод наречия manchmal-'иногда' (manch-'иной', mal-'раз'). (1) Когда станет холодно? Я не понимаю как сейчас погода всё ешё как будто лето. Один день холодно, а другой совсем солнечно [RuLeC, английский] (1) Мы были может быть в Кунсткамере, может быть в книжном магазине [RuLeC, финский] (2) Иной раз легко, иной раз не очень так легко, но трудно-нет [Protassova 2007: 320, немецкий] 1 Исследование осуществлено в рамках Программы фундаментальных исследований НИУ ВШЭ в 2015 году. 2 Подробное описание этого подхода описано нами в (Рахилина 2013) и (Рахилина 2015).
О новых инструментах описания русской грамматики: Корпус ошибок , 2016
НАУЧНОЕ НАСЛЕДИЕ Ч. ФИЛЛМОРА И СОВРЕМЕННАЯ ТЕОРИЯ ЯЗЫКА, 2016
Степени сравнения в свете русской грамматики ошибок, 2015
Intelligent information systems of the future are expected to conduct dia logs with the user in ... more Intelligent information systems of the future are expected to conduct dia logs with the user in a natural language. The linguistic aspect of this problem rests primarily on the formalization of the question-answer relation, i.e., on formalizing the procedure generating a response to a query. INTRODUCTORY NOTES This study is concerned with locative questions to the verbs of motion in Russian. It proceeds from the theoretical model of question-answer relation sug gested in [1,2]. The model'is based on a logicosemantic representation of the question. Question with query words (or special questions) in locative semantics are treated as a request by the questioner addressed to the respondent and de scribed by the formula: ?A<{X|XeMM>(*)> — "Do so that I know the value of a certain variable X selected fro^i the set M of its values (this set actually defines the locative semantics of the variable) such that for that this value of the variable the statement P(X) holds," where P is the predicate within the semantic sphere of the action of the query word. The construction of a correct answer to the question, "Where did you get your law degroe?" assumes, first, identifying the predicate group which falls within the sphere of action of the query word "where" (getting a law degree); second, identifying in the semantic structure of this group a variable of locative semantics (Y received a degree at X, where I is a locative variable); third, identifying the set of values of this variable (names of schools granting law degrees); and fourth, selecting from this set, an element that satisfies the condition "listener obtained a law degree at X." It can readily be seen that the key component of the procedure constructing an answer to a question ,is the search for the query .variable,/i.e., the variable linked with the query operator "?" (do so that I know). This procedure is non trivial, as it is applicable only to a detailed description of the predicate lexeme (which is much more detailed than is common in'lexicography): for example, such a description should cover not only all of the obligatory actants, but also at least some of the circumstants of the predicate. The procedure is entirely nontrivial for the verbs of motion, which describe situations where a body (or bodies, in situations with more than one participant) can have several different localizations represented by different locative variabl-s in the semantic de scription of the verb. In each particular question, only one locative variable can be interrogative, i.e., linked by a query operator, but depending on which variable has this function, different query words are selected in the surface expression of the question in the natural-Russian-language. This study is concerned with locative questions to verbs of motion, i.e.,
Linguistic Forum 2020: Language and Artificial Intelligence, Moscow 12-14 November 2020. CEUR Workshop Proceedings, vol. 2852 (2021), 2021
We report a microdiachronic investigation of distributional semantics of two competing Russian co... more We report a microdiachronic investigation of distributional semantics of two competing Russian colour terms (CTs) for 'brown', buryj (12 th cent.) and koričnevyj (17 th cent.), while using Russian subcorpus of Google Books Ngram. By conducting time-series analysis (1800-2009) of bigrams containing either of these terms, we estimated frequency of occurrences of the two "Russian browns" and explored changes in the extent of the terms' combinability with nouns signifying objects (N=259). Results provide evidence that in total frequency of use, koričnevyj overtook buryj at the beginning of 1920s and unequivocally prevails from the beginning of 1960s. Furthermore, the perplexity index indicates significant increase in the scope of objects whose denotations collocate with koričnevyj. This is complemented by the observed increase of the Jensen-Shannon divergence between frequency distributions of buryj and koričnevyj, with both phenomena being particularly manifested from 1960s. The obtained estimates of distributional semantics corroborate the status koričnevyj as the basic CT for 'brown' in modern Russian. The present diachronic corpus analysis provides novel insights into linguistic evolution of an emergent basic CTby revealing the process of it gradually supplanting an old term with a similar colour meaning, the timescale of the new term's increase in usage, and significant expansion in its distributional semantics.
Interdisciplinary multilevel modeling, 2007
New Directions in Colour Studies, 2011
Russian attributive constructions with colour terms are analyzed using the Russian National Corpu... more Russian attributive constructions with colour terms are analyzed using the Russian National Corpus. We focus on recently emerging colour terms and their development through to the early twenty-first century. Terms are considered in a construction-based framework, as syntactic-semantic rule pairs, with the emphasis on dynamics in their taxonomic combinability. This is exemplified by constructions denoting the brown category: names for objects, having similar referential meaning, collocate exclusively with one of the ...
New directions in colour studies., 2011
М.: Языки славянской культуры, 2014., 2014
Исследуя современную языковую ситуацию, необходимо учитывать речевую практику носителей языка, св... more Исследуя современную языковую ситуацию, необходимо учитывать речевую практику носителей языка, связанную с коммуникацией в интернетпространстве. В этой книге собраны статьи специалистов, анализирующих интернет-тексты как новый языковой ресурс. Рассматриваются особенности структуры текста, лексика и синтаксис поискового запроса, коммуникативная направленность интернет-высказывания и влияние этого нового
речевого пласта на современный русский язык. Одновременно анализируются изменения, которые касаются самого русского языка: возникающие грамматические формы, сдвиги в глагольном управлении, лексические неологизмы. Для них интернет выступает «камерой», быстро и точно отражающей мельчайшие новации. Книга адресована всем интересующимся русским языком, в том числе и профессионалам: преподавателям и лингвистам — грамматистам и лексикографам. Она будет полезна и разработчикам контента интернет-сайтов или редакторам порталов для профилактики нарушений цельности, связности, завершенности текста, и пользователям для решения задач по оптимизации поисковых запросов.