Алексей Кретов | Voronezh State University (original) (raw)

Papers by Алексей Кретов

Research paper thumbnail of Связующие маркемы в британской прозе второй половины XIX в

Research paper thumbnail of Индекс морфонем И. Б. Иткина и фонемы русского языка

Вестник Воронежского государственного университета, Sep 25, 2020

Аннотация: в статье дается сопоставление Индекса русских морфонем по И. Б. Иткину с составом фоне... more Аннотация: в статье дается сопоставление Индекса русских морфонем по И. Б. Иткину с составом фонем, представленных в исконных русских морфемах, выделяемых Казанской фонемологической школой (КФШ). Вначале выявляется совпадение 21 морфонемы с 21 (из 23) фонемой КФШ, а затем обсуждаются расхождения в трактовке глайдов {И/Й}, {У/В}; заимствованных звуков /ф/ (в исконных морфемах согласный /ф/ находится в отношениях дополнительного распределения с неслоговым вариантом сонанта {У/В}); корреляции по твердости-мягкости-она признается позиционно обусловленной, т. е. нефонематичной; шипящих и аффрикат-они являются либо аллофонами (позиционно обусловленными вариантами) заднеязычных фонем, либо полифонами (представителями двух и более фонем одновременно), а также в трактовке казусов и аномалий: /к/, чередующегося с /т'/ (ср. пускать-пустить) и беглого ударного /е/, чередующегося с /'о/ (ср. Лев-Льва-Лёва). Предлагается устанавливать фонемный состав исконной подсистемы на основании минимальных пар исконных слов (минимальная пара, содержащая заимствованное слово или состоящая из заимствованных слов, позволяет установить фонемный состав интернациональной подсистемы фонем), а также учитывать иерархию языковых уровней: приоритет интересов лексики над интересами морфологии и фонетики, а интересов морфологии-над интересами фонетики.

Research paper thumbnail of Варьирование гласных в русском корне (по данным «Словаря морфем русского языка» А. И. Кузнецовой И Т. Ф. Ефремовой)

Вестник Воронежского государственного университета, Sep 2, 2021

Аннотация: статья посвящена рассмотрению ряда типичных случаев чередований гласных в исконном рус... more Аннотация: статья посвящена рассмотрению ряда типичных случаев чередований гласных в исконном русском корне. «Словарь морфем русского языка» А. И. Кузнецовой и Т. Ф. Ефремовой, в котором представлены (в орфографической записи) корневые морфы, сведенные в морфемы, является объектом исследования. Предмет исследования-позиционное варьирование вокализма исконных русских корней. Рассмотрены позиции, в которых происходит фонетическое варьирование гиперфонемы {Е/О/Ø}. Также делается вывод о том, что в ряде корней гиперфонема {Е/О/Ø} может быть представлена частично, а не полностью: парой или одной из ступеней чередования. Рассматриваются чередования {Е/О/Ø}, {Е/О} и {Ē/Ō}, {О/Ø}, {Е}, {О}, {Ø = ъ/ь}, а также сочетания частей этой гиперфонемы с сонантами Р-Л-М-Н-В-Й. Чередование гласных в исконных корнях является наследием морфологизированного еще в и.-е. праязыке чередования {Е/О/Ø}, осложняемого фонетическим взаимодействием с последующими сонантами, а также «удлиняющим воздействием» последующих суффиксов =А/ЫВА и лабиализацией под ударением перед твердым согласным гласного [Е]: /Е/ > /'O/. Гиперфонема {Е/О/Ø} может быть представлена не полностью, а комбинацией частей или отдельными своими частями. Сочетания частей этой гиперфонемы с сонантами приводит к образованию бифонов: 'A ьн , А ьн , А ьм , У ou. Постсонантное (по южнославянскому типу) выделение вокалического пазвука сонантами Р, Л приводит к реализации фонем {О}, {Е} в «удлиненном» варианте-в виде фонов /А о>ō /, /ҍ e>ē /. Эпентезы /j/ и /n/ на приставочном стыке, не являясь частью корня, устраняют зияние и прикрывают корневую морфему. Практика отождествления корней в «Словаре морфем русского языка» показывает, что расширители корня не нарушают тождества корневых морфем и не меняют их семантики, а следовательно, могут трактоваться как эпентезы-только не пред-корневые (на приставочном стыке), а за-корневые (на суффиксальном стыке). Ключевые слова: русский корень, гиперфонема, чередования фонов, вокализм корня, правила трансформации букв в фоны и фонов в фонемы.

Research paper thumbnail of Data Mining Methods to Compare Englishes

Proceedings of the Institute for System Programming of the RAS

The paper presents the results of the corpus-based research of noun cryptotypes in 20 varieties o... more The paper presents the results of the corpus-based research of noun cryptotypes in 20 varieties of English (Englishes). The data for this research collected from Mark Davies’ corpora GloWbE and NOW enabled us to focus on variation in the covert classification of nouns in modern Englishes. A noun cryptotype introduced by Whorf is approached as ‘a covert type of classification of nouns, marked by lexical selection in a syntactical classifier rather than a morphological tag’. The purpose of the study has been to compare and contrast the covert classification of basic 23 emotions in 20 Englishes (64,702 tokens). 20 Englishes have been clustered with the help of Data Mining methods (such as k-means clustering and a self-organizing Kohonen map). There are six clusters that appeared to be corresponding to geographic areas: American cluster (American and Canadian Englishes); Australian cluster (Australian and New Zealand Englishes); European cluster (British and Irish Englishes); Asian clus...

Research paper thumbnail of On some models in linguistics

Итоги науки и техники. Серия, Современные проблемы математики, фундаментальные направления, 2022

Research paper thumbnail of Binding Function of Syllable and Place of the Lombard Dialect in the Italian Dialect Continuum

Вестник Воронежского государственного университета, 2022

Research paper thumbnail of Parametric Analysis of Abazin Dictionary

Вестник Воронежского государственного университета, 2022

Research paper thumbnail of Markeme Analysis of F. M. Dostoyevsky’s Writing

Вестник ВГУ Серия Лингвистика и межкультурная коммуникация

Research paper thumbnail of Russian Verbs with Power Suffix =I

Вестник ВГУ Серия Лингвистика и межкультурная коммуникация

Research paper thumbnail of Linking markemes in British prose of the latter half of the Nineteenth century

Yazyk i kul'tura, 2018

Аннотация. Целью предлагаемого исследования являются выявление и анализ маркемных связей прозаиче... more Аннотация. Целью предлагаемого исследования являются выявление и анализ маркемных связей прозаических текстов британских писателей второй половины XIX в. В соответствии с этой целью решаются следующие задачи: 1) установить предпочтительные маркемные связи авторов; 2) содержательно исследовать маркемные связи максимальной силы. Актуальность обсуждаемой проблемы объясняется необходимостью поиска способов формализации содержательного анализа текста. Исследование маркемных связей представляет собой один из способов формализованного содержательного анализа текста. Выделенные учеными закономерности, которым подчиняются тексты на естественных языках, позволили применить математический аппарат в лингвистических исследованиях. В статье предлагается исследовать маркемные связи максимальной силы, образуемые в парах авторов при сравнении «каждый с каждым». Для решения поставленных задач был использован метод маркемного анализа, предложенный А.А. Кретовым. Он дает возможность получить полную картину маркемного состава языка литературных произведений любого хронологического среза или исторического периода, позволяя, при этом, исследовать тексты практически любого объема. Метод маркемного анализа дает возможность исследовать маркемный состав языка литературных (преимущественно художественных) произведений отдельных авторов или групп авторов, специфику маркем, установить маркемные связи авторов, принадлежащих одному или нескольким хронологическим срезам, проследить динамику маркем в нескольких хронологических срезах, изучить влияние социокультурных процессов на динамику маркем, установить литературно-генетические связи авторов, принадлежащих одному или разным хронологическим срезам. Решение данных задач не исчерпывает потенциал, которым обладает маркемология-развиваемое А.А. Кретовым и его коллегами направление в лингвистике. Составляющий ее основу маркемный анализ-это метод компьютерного выделения ключевых слов-маркем-с последующим вычислением Индекса их Текстуальной Маркированности (ИнТеМа). Используемая для его вычисления формула выражает функциональную зависимость между весом словоформы по частоте и ее весом по длине. Поскольку вес словоформы по длине есть величина постоянная, определяемая только длиной слова в буквах или звуках, именно величина веса словоформы по частоте определяет величину ИнТеМа. При превышении порога стандартной частоты распределения отдельной словоформы в тексте, величина ИнТеМа приобретает положительные значения, показывая тем самым меру существенности словоформы для конкретного текста. Обработка текстов и вычисление ИнТеМа каждой

Research paper thumbnail of Возможный алгоритм вычисления предельного размера словаря писателя

Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2021

В работе предлагается метод оценивания предельного размера словаря писателя с помощью экстраполяц... more В работе предлагается метод оценивания предельного размера словаря писателя с помощью экстраполяции эмпирически задаваемой функции, выражающей зависимость коэффициента лексического разнообразия от объема текстового корпуса. Обсуждаются возникающие проблемы адекватности выбираемого способа экстраполяции. На примере творчества Л. Н. Толстого произведены расчеты с помощью логарифмических базисных функций для аппроксимации и экстраполяции.

Research paper thumbnail of Динамика маркем в русской литературе XVIII начала XX веков как отражение социокультурных процессов

The paper deals with the dynamics of markemes, i.e. the most significant words, in the texts of R... more The paper deals with the dynamics of markemes, i.e. the most significant words, in the texts of Russian Literature of 18 beginnig of the 20-th cc. The connection of dynamics of markemes with the social and cultural processes is investigated.

Research paper thumbnail of Формальный анализ процесса плюрализации существительных по данным национального корпуса русского языка

Вестник ВГУ. Серия: Системный анализ и информационные технологии

В статье рассматривается процесс плюрализации существительных по данным Национального корпуса рус... more В статье рассматривается процесс плюрализации существительных по данным Национального корпуса русского языка. Устанавливается зависимость между частотой падежных форм множественного числа и семантикой существительных. Выявляются устойчивый словосочетания и конструкции, влияющие на частоту падежных форм. Аргументируется необходимость их исключения из дальнейшего рассмотрения в целях улучшения результатов семантической классификации слов.

Research paper thumbnail of Лексические приметы религиозного стиля русского языка

Studia Rossica Gedanensia

Исследование текстов профессора Московской Духовной Академии,Алексея Ильича Осипова объёмом в 159... more Исследование текстов профессора Московской Духовной Академии,Алексея Ильича Осипова объёмом в 159.613 сл/уп позволило установить, что обнаруженные в них 3.325 конфессионализмов составляют 1/3 словника. Предложена классификация конфессионализмов, определена доля и показано примерное наполнение каждого таксона: фидеизмы – 75%, теологизмы – 13%, ортодоксизмы – 8% и церковнославянизмы – 4%. выделенных групп конфессионализмов. Выдвинута идея создания электронного корпуса русских религиозных текстов. Предложены алгоритмы автоматического выделения стилистически окрашенной лексики: декларативный, апостериорный, процедурный и словообразовательный. Намечены перспективы экстенсивной и интенсивной разработки проекта «Живой стилистический словарь» русского языка.

Research paper thumbnail of Некоторые аспекты реконструкции индоевропейских гуттуральных

Research paper thumbnail of Некоторые аспекты реконструкции индоевропейских гуттуральных

Research paper thumbnail of Связующие маркемы в британской прозе второй половины XIX в

Research paper thumbnail of Индекс морфонем И. Б. Иткина и фонемы русского языка

Вестник Воронежского государственного университета, Sep 25, 2020

Аннотация: в статье дается сопоставление Индекса русских морфонем по И. Б. Иткину с составом фоне... more Аннотация: в статье дается сопоставление Индекса русских морфонем по И. Б. Иткину с составом фонем, представленных в исконных русских морфемах, выделяемых Казанской фонемологической школой (КФШ). Вначале выявляется совпадение 21 морфонемы с 21 (из 23) фонемой КФШ, а затем обсуждаются расхождения в трактовке глайдов {И/Й}, {У/В}; заимствованных звуков /ф/ (в исконных морфемах согласный /ф/ находится в отношениях дополнительного распределения с неслоговым вариантом сонанта {У/В}); корреляции по твердости-мягкости-она признается позиционно обусловленной, т. е. нефонематичной; шипящих и аффрикат-они являются либо аллофонами (позиционно обусловленными вариантами) заднеязычных фонем, либо полифонами (представителями двух и более фонем одновременно), а также в трактовке казусов и аномалий: /к/, чередующегося с /т'/ (ср. пускать-пустить) и беглого ударного /е/, чередующегося с /'о/ (ср. Лев-Льва-Лёва). Предлагается устанавливать фонемный состав исконной подсистемы на основании минимальных пар исконных слов (минимальная пара, содержащая заимствованное слово или состоящая из заимствованных слов, позволяет установить фонемный состав интернациональной подсистемы фонем), а также учитывать иерархию языковых уровней: приоритет интересов лексики над интересами морфологии и фонетики, а интересов морфологии-над интересами фонетики.

Research paper thumbnail of Варьирование гласных в русском корне (по данным «Словаря морфем русского языка» А. И. Кузнецовой И Т. Ф. Ефремовой)

Вестник Воронежского государственного университета, Sep 2, 2021

Аннотация: статья посвящена рассмотрению ряда типичных случаев чередований гласных в исконном рус... more Аннотация: статья посвящена рассмотрению ряда типичных случаев чередований гласных в исконном русском корне. «Словарь морфем русского языка» А. И. Кузнецовой и Т. Ф. Ефремовой, в котором представлены (в орфографической записи) корневые морфы, сведенные в морфемы, является объектом исследования. Предмет исследования-позиционное варьирование вокализма исконных русских корней. Рассмотрены позиции, в которых происходит фонетическое варьирование гиперфонемы {Е/О/Ø}. Также делается вывод о том, что в ряде корней гиперфонема {Е/О/Ø} может быть представлена частично, а не полностью: парой или одной из ступеней чередования. Рассматриваются чередования {Е/О/Ø}, {Е/О} и {Ē/Ō}, {О/Ø}, {Е}, {О}, {Ø = ъ/ь}, а также сочетания частей этой гиперфонемы с сонантами Р-Л-М-Н-В-Й. Чередование гласных в исконных корнях является наследием морфологизированного еще в и.-е. праязыке чередования {Е/О/Ø}, осложняемого фонетическим взаимодействием с последующими сонантами, а также «удлиняющим воздействием» последующих суффиксов =А/ЫВА и лабиализацией под ударением перед твердым согласным гласного [Е]: /Е/ > /'O/. Гиперфонема {Е/О/Ø} может быть представлена не полностью, а комбинацией частей или отдельными своими частями. Сочетания частей этой гиперфонемы с сонантами приводит к образованию бифонов: 'A ьн , А ьн , А ьм , У ou. Постсонантное (по южнославянскому типу) выделение вокалического пазвука сонантами Р, Л приводит к реализации фонем {О}, {Е} в «удлиненном» варианте-в виде фонов /А о>ō /, /ҍ e>ē /. Эпентезы /j/ и /n/ на приставочном стыке, не являясь частью корня, устраняют зияние и прикрывают корневую морфему. Практика отождествления корней в «Словаре морфем русского языка» показывает, что расширители корня не нарушают тождества корневых морфем и не меняют их семантики, а следовательно, могут трактоваться как эпентезы-только не пред-корневые (на приставочном стыке), а за-корневые (на суффиксальном стыке). Ключевые слова: русский корень, гиперфонема, чередования фонов, вокализм корня, правила трансформации букв в фоны и фонов в фонемы.

Research paper thumbnail of Data Mining Methods to Compare Englishes

Proceedings of the Institute for System Programming of the RAS

The paper presents the results of the corpus-based research of noun cryptotypes in 20 varieties o... more The paper presents the results of the corpus-based research of noun cryptotypes in 20 varieties of English (Englishes). The data for this research collected from Mark Davies’ corpora GloWbE and NOW enabled us to focus on variation in the covert classification of nouns in modern Englishes. A noun cryptotype introduced by Whorf is approached as ‘a covert type of classification of nouns, marked by lexical selection in a syntactical classifier rather than a morphological tag’. The purpose of the study has been to compare and contrast the covert classification of basic 23 emotions in 20 Englishes (64,702 tokens). 20 Englishes have been clustered with the help of Data Mining methods (such as k-means clustering and a self-organizing Kohonen map). There are six clusters that appeared to be corresponding to geographic areas: American cluster (American and Canadian Englishes); Australian cluster (Australian and New Zealand Englishes); European cluster (British and Irish Englishes); Asian clus...

Research paper thumbnail of On some models in linguistics

Итоги науки и техники. Серия, Современные проблемы математики, фундаментальные направления, 2022

Research paper thumbnail of Binding Function of Syllable and Place of the Lombard Dialect in the Italian Dialect Continuum

Вестник Воронежского государственного университета, 2022

Research paper thumbnail of Parametric Analysis of Abazin Dictionary

Вестник Воронежского государственного университета, 2022

Research paper thumbnail of Markeme Analysis of F. M. Dostoyevsky’s Writing

Вестник ВГУ Серия Лингвистика и межкультурная коммуникация

Research paper thumbnail of Russian Verbs with Power Suffix =I

Вестник ВГУ Серия Лингвистика и межкультурная коммуникация

Research paper thumbnail of Linking markemes in British prose of the latter half of the Nineteenth century

Yazyk i kul'tura, 2018

Аннотация. Целью предлагаемого исследования являются выявление и анализ маркемных связей прозаиче... more Аннотация. Целью предлагаемого исследования являются выявление и анализ маркемных связей прозаических текстов британских писателей второй половины XIX в. В соответствии с этой целью решаются следующие задачи: 1) установить предпочтительные маркемные связи авторов; 2) содержательно исследовать маркемные связи максимальной силы. Актуальность обсуждаемой проблемы объясняется необходимостью поиска способов формализации содержательного анализа текста. Исследование маркемных связей представляет собой один из способов формализованного содержательного анализа текста. Выделенные учеными закономерности, которым подчиняются тексты на естественных языках, позволили применить математический аппарат в лингвистических исследованиях. В статье предлагается исследовать маркемные связи максимальной силы, образуемые в парах авторов при сравнении «каждый с каждым». Для решения поставленных задач был использован метод маркемного анализа, предложенный А.А. Кретовым. Он дает возможность получить полную картину маркемного состава языка литературных произведений любого хронологического среза или исторического периода, позволяя, при этом, исследовать тексты практически любого объема. Метод маркемного анализа дает возможность исследовать маркемный состав языка литературных (преимущественно художественных) произведений отдельных авторов или групп авторов, специфику маркем, установить маркемные связи авторов, принадлежащих одному или нескольким хронологическим срезам, проследить динамику маркем в нескольких хронологических срезах, изучить влияние социокультурных процессов на динамику маркем, установить литературно-генетические связи авторов, принадлежащих одному или разным хронологическим срезам. Решение данных задач не исчерпывает потенциал, которым обладает маркемология-развиваемое А.А. Кретовым и его коллегами направление в лингвистике. Составляющий ее основу маркемный анализ-это метод компьютерного выделения ключевых слов-маркем-с последующим вычислением Индекса их Текстуальной Маркированности (ИнТеМа). Используемая для его вычисления формула выражает функциональную зависимость между весом словоформы по частоте и ее весом по длине. Поскольку вес словоформы по длине есть величина постоянная, определяемая только длиной слова в буквах или звуках, именно величина веса словоформы по частоте определяет величину ИнТеМа. При превышении порога стандартной частоты распределения отдельной словоформы в тексте, величина ИнТеМа приобретает положительные значения, показывая тем самым меру существенности словоформы для конкретного текста. Обработка текстов и вычисление ИнТеМа каждой

Research paper thumbnail of Возможный алгоритм вычисления предельного размера словаря писателя

Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2021

В работе предлагается метод оценивания предельного размера словаря писателя с помощью экстраполяц... more В работе предлагается метод оценивания предельного размера словаря писателя с помощью экстраполяции эмпирически задаваемой функции, выражающей зависимость коэффициента лексического разнообразия от объема текстового корпуса. Обсуждаются возникающие проблемы адекватности выбираемого способа экстраполяции. На примере творчества Л. Н. Толстого произведены расчеты с помощью логарифмических базисных функций для аппроксимации и экстраполяции.

Research paper thumbnail of Динамика маркем в русской литературе XVIII начала XX веков как отражение социокультурных процессов

The paper deals with the dynamics of markemes, i.e. the most significant words, in the texts of R... more The paper deals with the dynamics of markemes, i.e. the most significant words, in the texts of Russian Literature of 18 beginnig of the 20-th cc. The connection of dynamics of markemes with the social and cultural processes is investigated.

Research paper thumbnail of Формальный анализ процесса плюрализации существительных по данным национального корпуса русского языка

Вестник ВГУ. Серия: Системный анализ и информационные технологии

В статье рассматривается процесс плюрализации существительных по данным Национального корпуса рус... more В статье рассматривается процесс плюрализации существительных по данным Национального корпуса русского языка. Устанавливается зависимость между частотой падежных форм множественного числа и семантикой существительных. Выявляются устойчивый словосочетания и конструкции, влияющие на частоту падежных форм. Аргументируется необходимость их исключения из дальнейшего рассмотрения в целях улучшения результатов семантической классификации слов.

Research paper thumbnail of Лексические приметы религиозного стиля русского языка

Studia Rossica Gedanensia

Исследование текстов профессора Московской Духовной Академии,Алексея Ильича Осипова объёмом в 159... more Исследование текстов профессора Московской Духовной Академии,Алексея Ильича Осипова объёмом в 159.613 сл/уп позволило установить, что обнаруженные в них 3.325 конфессионализмов составляют 1/3 словника. Предложена классификация конфессионализмов, определена доля и показано примерное наполнение каждого таксона: фидеизмы – 75%, теологизмы – 13%, ортодоксизмы – 8% и церковнославянизмы – 4%. выделенных групп конфессионализмов. Выдвинута идея создания электронного корпуса русских религиозных текстов. Предложены алгоритмы автоматического выделения стилистически окрашенной лексики: декларативный, апостериорный, процедурный и словообразовательный. Намечены перспективы экстенсивной и интенсивной разработки проекта «Живой стилистический словарь» русского языка.

Research paper thumbnail of Некоторые аспекты реконструкции индоевропейских гуттуральных

Research paper thumbnail of Некоторые аспекты реконструкции индоевропейских гуттуральных