Larisa N Belyaeva | РГПУ им. Герцена (original) (raw)
Papers by Larisa N Belyaeva
Современное состояние технологического развития определяются уровнем разработки и общим потенциал... more Современное состояние технологического развития определяются уровнем разработки и общим потенциалом процессов автоматизации в промышленности (Промышленность 4.0), а также способами представления и качеством информации, которая предназначена для автоматизации работ над проектами (Информация 4.0). Актуальные стандарты характера и качества информации во многом определяются относительно новой областью знания – технической коммуникацией. В ее растущем поле наблюдается спрос на профессионалов – «технических коммуникаторов», квалификационные требования к которым растут вместе с увеличением сфер внедрения технической коммуникации. В статье оценивается необходимость подготовки специалистов – лингвотехнологов, готовых решать задачи переработки текстов на этом новом уровне развития техники и технологии, рассматриваются особенности подхода к этой специализации в России и за рубежом, а также концепция разработки специальных направлений обучения для профессиональной подготовки лингвотехнолога на базе классического филологического / лингвистического образования.
PNRPU Linguistics and Pedagogy Bulletin, 2019
Описываются особенности современного процесса работы с практической системой машинного перевода (... more Описываются особенности современного процесса работы с практической системой машинного перевода (МП) в рамках технологической цепочки обработки и перевода научных и технических текстов. Системы машинного перевода рассматриваются в составе автоматизированного рабочего места переводчика, при этом учитывается современная парадигма 4.0 (Промышленность 4.0 и Информация 4.0), диктующая условия, при которых состояние технологии и науки определяются потенциалом процессов автоматизации в промышленности и соответствующими способами представления информации к разрабатываемым проектам. Раскрывается понятие авторской разработки структурированного контента; излагаются требования к представлению информации в рамках нового подхода. Приведены наборы стандартных и дополнительных компетенций, которыми должны сегодня обладать специалисты в области разработки технической документации. Работа с системами машинного перевода представлена как поэтапный процесс, который имеет объективные ограничения, обусловленные технически вынужденным переводом по предложениям, необходимостью обработки лексики, отсутствующей в словаре системы, терминологической вариативностью исходного текста, повышенной длиной предложений, линейностью распознавания коллокаций. Ряд ограничений успешно преодолевается за счет особого алгоритма предредактирования (введение артиклей и союзов, синтаксическое упрощение, устранение эллиптических построений и т.д.). Представлена структура автоматического словаря системы машинного перевода. Описаны основные действия по постредактированию машинного перевода, предполагающие как изменения в переводе отдельных лексических единиц, так и синтаксические преобразования. Показано, что перевод на базе системы МП должен завершаться перенастройкой лингвистических ресурсов. Ключевые слова: машинный перевод, автоматический словарь, предредактирование, постредактирование, автоматическое рабочее место переводчика, компетенции переводчика, техническая коммуникация.
Journal of Siberian Federal University. Humanities & Social Sciences, 2019
This study focuses on technical writer competences and necessary specialized language resources, ... more This study focuses on technical writer competences and necessary specialized language resources, supporting any language worker in the framework of modern natural language processing domain (terminologist, translator, lexicographer, technical writer, grammarian, teaching language specialist etc.). These specialists are new generation professionals with a basic linguistic/philological education, prepared to meet the demands of modern technology and science which are defined by the potential of industrial processes automatization (Industry 4.0) and appropriate presentation of information (Information 4.0). New concept of Information 4.0 reveals that information to be researched and/or created can be presented as a set of information molecules that are examined under the conditions of form, production and curation. Information 4.0 injects new life into the profession of technical communicator (technical writer) and language workers as a whole: those, who are prepared to solve the text processing tasks in this new technology space. The underlying assumption of the paper is that the text is the result of information transfer and the starting point of information mining and extraction.
The article presents a study of some key issues of borrowed terminology in Russian scientific tex... more The article presents a study of some key issues of borrowed terminology in Russian scientific texts. The study presumes that global web academic intercourse and professional bilingualism of actively publishing Russian authors facilitate the process of borrowing new terminology of English origin. The problem addressed is the manner and methods Russian authors accept and use new terms in their research papers. The research methodology applied is that of corpus technologies. The study is based on corpus findings in two original research corpora. It aims at developing a procedure of detecting and describing new English terminology and its presentation in recent Russian scientific texts of a restricted knowledge domain, namely web and linguistic technologies. Section 1 presents an overview of factors influencing the quality of Russian academic writing. Section 2 describes the research corpora and a corpus-based procedure of detecting and extracting loan words. Section 3 focuses on analys...
Journal of Siberian Federal University. Humanities & Social Sciences, 2016
The underlying assumption of the paper is that the text is the result of information transfer and... more The underlying assumption of the paper is that the text is the result of information transfer and the source (starting point) o of information mining and extraction. Thereafter the scientific text content is universal and can be extracted in case of minimum coincidence of the author's and recipient's thesauri. In text translation the proper information extraction is determined with correct interpretation of terms/objects names. The paper focuses that adequacy of text perception and understanding on the lexical level is dictated by the text saturation with noun phrases, the degree of their compression and / or completeness of object nominations and their proper translations based on adequate bilingual dictionaries. Text translation in such a hazardous domain as aseismic construction is a crucial point in information exchange and mining and a safety challenge. For terminology analysis of this domain text a special research text corpus (1 mln tokens) had been created. The analysis results had been used in the specialized automatic dictionary creation for machine translation system WORD + .
The article presents a study of some key issues of borrowed terminology in Russian scientific tex... more The article presents a study of some key issues of borrowed terminology in Russian scientific texts. The study presumes that global web academic intercourse and professional bilingualism of actively publishing Russian authors facilitate the process of borrowing new terminology of English origin. The problem addressed is the manner and methods Russian authors accept and use new terms in their research papers. The research methodology applied is that of corpus technologies. The study is based on corpus findings in two original research corpora. It aims at developing a procedure of detecting and describing new English terminology and its presentation in recent Russian scientific texts of a restricted knowledge domain, namely web and linguistic technologies. Section 1 presents an overview of factors influencing the quality of Russian academic writing. Section 2 describes the research corpora and a corpus-based procedure of detecting and extracting loan words. Section 3 focuses on analys...
The European Proceedings of Social & Behavioural Sciences // PCSF 2019 - 19th Professional Culture of the Specialist of the Future 28-29 November 2019, 2019
The paper considers methodological problems of academic research work in master and postgrad prog... more The paper considers methodological problems of academic research work in master and postgrad programs training. These problems concern a student's awareness in the academic research project choice, their skills and knowledge in definition of its goal, tasks, theory choice and academic writing as it is. Training experience has shown inability of Master program students to define their assignments in research work and necessity of special courses in scientific text structure and academic writing both in Russian and English languages. These courses are to solve training problems for text creation state-of-the-art since modern level of technology and science is now determined by the potential of automation processes in industries (Industry 4.0) and an appropriate presentation of information on the project under development and implementation (Information 4.0). The paper tries to assess the need for educating a new generation of specialists-language workers-those, who are prepared to solve text processing tasks in this new technology space. The paper considers the potential of information technologies and Web resources to be used by various specialists in their practice and studies. It addresses the general problems of modern methodological education caused by the changes in modern educational situation that demand a new understanding of educational process. It also discusses some issues of professional education.
«Вестник ПНИПУ. Проблемы языкознания и педагогики», 2019
В статье описываются особенности современного процесса работы с практической системой машинного п... more В статье описываются особенности современного процесса работы с практической системой машинного перевода в рамках технологической цепочки обработки и перевода научных и технических текстов. Рассматриваются системы машинного перевода в составе автоматизированного рабочего места переводчика, особенности пред-и постредактирования текстов, анализируются особенности ведения пользовательских словарей. Учитывается современная парадигма 4.0 (Промышленность 4.0 и Информация 4.0), диктующая условия, при которых состояние технологии и науки определяются потенциалом процессов автоматизации в промышленности и соответствующими способами представления информации к разрабатываемым проектам. В связи с этим качественно изменяются требования к подготовке переводчиков, чья деятельность сегодня все больше переносится в область технической коммуникации. Ключевые слова: машинный перевод, автоматический словарь, предредактирование, постредактирование, автоматическое рабочее место переводчика, компетенции переводчика, техническая коммуникация The paper presents the peculiarities of using a modern MT system in the technological chain of scientific and technical translation. MT systems are considered as a part of translator's workstation, specifics of both text pre-and postediting and automatic dictionaries management are analyzed. Modern paradigm 4.0 (Industry 4.0 and Information 4.0) dictates a new trend in automation and data exchange in manufacturing, such that will greatly influence both technology and science. That obviously leads to a serious and qualitative change in translator training, since a translator's work today is, to a large extent, in the technical communication domain. Многолетнее использование систем машинного перевода (МП) не только специалистами в различных областях знаний, но и переводчиками научных и технических (специальных) текстов определяет необходимость предварительного подведения итогов, касающихся собственно процедуры работы с такими системами, минимизации объема постредактирования результатов МП, а также связи методов постредактирования с полнотой и точностью автоматического словаря (АС) соответствующей системы. Основными профессиональными пользователями систем МП являются специалисты, получившие в современной англоязычной литературе термин language worker, который приблизительно можно перевести как специалист в области переработки текстов, под этим термином объединяются все лингвисты, работающие в области переработки научных и технических текстов: терминологи, переводчики, технические писатели, специалисты в области передачи технической информации [1; 2]. Современный переводчик специальной литературы является участником технологического процесса
The underlying assumption of the paper is that the text is the result of information transfer and... more The underlying assumption of the paper is that the text is the result of information transfer and the source (starting point) o of information mining and extraction. Thereafter the scientific text content is universal and can be extracted in case of minimum coincidence of the author's and recipient's thesauri. In text translation the proper information extraction is determined with correct interpretation of terms/objects names. The paper focuses that adequacy of text perception and understanding on the lexical level is dictated by the text saturation with noun phrases, the degree of their compression and / or completeness of object nominations and their proper translations based on adequate bilingual dictionaries. Text translation in such a hazardous domain as aseismic construction is a crucial point in information exchange and mining and a safety challenge. For terminology analysis of this domain text a special research text corpus (1 mln tokens) had been created. The analysis results had been used in the specialized automatic dictionary creation for machine translation system WORD + .
This study focuses on technical writer competences and necessary specialized language resources, ... more This study focuses on technical writer competences and necessary specialized language resources, supporting any language worker in the framework of modern natural language processing domain (terminologist, translator, lexicographer, technical writer, grammarian, teaching language specialist etc.). These specialists are new generation professionals with a basic linguistic/philological education, prepared to meet the demands of modern technology and science which are defined by the potential of industrial processes automatization (Industry 4.0) and appropriate presentation of information (Information 4.0). New concept of Information 4.0 reveals that information to be researched and/or created can be presented as a set of information molecules that are examined under the conditions of form, production and curation. Information 4.0 injects new life into the profession of technical communicator (technical writer) and language workers as a whole: those, who are prepared to solve the text processing tasks in this new technology space. The underlying assumption of the paper is that the text is the result of information transfer and the starting point of information mining and extraction.
The paper considers problems and procedures for translation dictionary creation to be done as the... more The paper considers problems and procedures for translation dictionary creation to be done as the result of merging and converting specialized dictionaries and glossaries. These glossaries created as working paper in the seismic construction domain had served as the source material for a special procedure development. Parallel corpus built on these glossaries was the base for English-Russian dictionary creation and additional terms acquisition, converting this dictionary into Russian-English version had shown applicability of the procedure discussed.
Современное состояние технологического развития определяются уровнем разработки и общим потенциал... more Современное состояние технологического развития определяются уровнем разработки и общим потенциалом процессов автоматизации в промышленности (Промышленность 4.0), а также способами представления и качеством информации, которая предназначена для автоматизации работ над проектами (Информация 4.0). Актуальные стандарты характера и качества информации во многом определяются относительно новой областью знания – технической коммуникацией. В ее растущем поле наблюдается спрос на профессионалов – «технических коммуникаторов», квалификационные требования к которым растут вместе с увеличением сфер внедрения технической коммуникации. В статье оценивается необходимость подготовки специалистов – лингвотехнологов, готовых решать задачи переработки текстов на этом новом уровне развития техники и технологии, рассматриваются особенности подхода к этой специализации в России и за рубежом, а также концепция разработки специальных направлений обучения для профессиональной подготовки лингвотехнолога на базе классического филологического / лингвистического образования.
PNRPU Linguistics and Pedagogy Bulletin, 2019
Описываются особенности современного процесса работы с практической системой машинного перевода (... more Описываются особенности современного процесса работы с практической системой машинного перевода (МП) в рамках технологической цепочки обработки и перевода научных и технических текстов. Системы машинного перевода рассматриваются в составе автоматизированного рабочего места переводчика, при этом учитывается современная парадигма 4.0 (Промышленность 4.0 и Информация 4.0), диктующая условия, при которых состояние технологии и науки определяются потенциалом процессов автоматизации в промышленности и соответствующими способами представления информации к разрабатываемым проектам. Раскрывается понятие авторской разработки структурированного контента; излагаются требования к представлению информации в рамках нового подхода. Приведены наборы стандартных и дополнительных компетенций, которыми должны сегодня обладать специалисты в области разработки технической документации. Работа с системами машинного перевода представлена как поэтапный процесс, который имеет объективные ограничения, обусловленные технически вынужденным переводом по предложениям, необходимостью обработки лексики, отсутствующей в словаре системы, терминологической вариативностью исходного текста, повышенной длиной предложений, линейностью распознавания коллокаций. Ряд ограничений успешно преодолевается за счет особого алгоритма предредактирования (введение артиклей и союзов, синтаксическое упрощение, устранение эллиптических построений и т.д.). Представлена структура автоматического словаря системы машинного перевода. Описаны основные действия по постредактированию машинного перевода, предполагающие как изменения в переводе отдельных лексических единиц, так и синтаксические преобразования. Показано, что перевод на базе системы МП должен завершаться перенастройкой лингвистических ресурсов. Ключевые слова: машинный перевод, автоматический словарь, предредактирование, постредактирование, автоматическое рабочее место переводчика, компетенции переводчика, техническая коммуникация.
Journal of Siberian Federal University. Humanities & Social Sciences, 2019
This study focuses on technical writer competences and necessary specialized language resources, ... more This study focuses on technical writer competences and necessary specialized language resources, supporting any language worker in the framework of modern natural language processing domain (terminologist, translator, lexicographer, technical writer, grammarian, teaching language specialist etc.). These specialists are new generation professionals with a basic linguistic/philological education, prepared to meet the demands of modern technology and science which are defined by the potential of industrial processes automatization (Industry 4.0) and appropriate presentation of information (Information 4.0). New concept of Information 4.0 reveals that information to be researched and/or created can be presented as a set of information molecules that are examined under the conditions of form, production and curation. Information 4.0 injects new life into the profession of technical communicator (technical writer) and language workers as a whole: those, who are prepared to solve the text processing tasks in this new technology space. The underlying assumption of the paper is that the text is the result of information transfer and the starting point of information mining and extraction.
The article presents a study of some key issues of borrowed terminology in Russian scientific tex... more The article presents a study of some key issues of borrowed terminology in Russian scientific texts. The study presumes that global web academic intercourse and professional bilingualism of actively publishing Russian authors facilitate the process of borrowing new terminology of English origin. The problem addressed is the manner and methods Russian authors accept and use new terms in their research papers. The research methodology applied is that of corpus technologies. The study is based on corpus findings in two original research corpora. It aims at developing a procedure of detecting and describing new English terminology and its presentation in recent Russian scientific texts of a restricted knowledge domain, namely web and linguistic technologies. Section 1 presents an overview of factors influencing the quality of Russian academic writing. Section 2 describes the research corpora and a corpus-based procedure of detecting and extracting loan words. Section 3 focuses on analys...
Journal of Siberian Federal University. Humanities & Social Sciences, 2016
The underlying assumption of the paper is that the text is the result of information transfer and... more The underlying assumption of the paper is that the text is the result of information transfer and the source (starting point) o of information mining and extraction. Thereafter the scientific text content is universal and can be extracted in case of minimum coincidence of the author's and recipient's thesauri. In text translation the proper information extraction is determined with correct interpretation of terms/objects names. The paper focuses that adequacy of text perception and understanding on the lexical level is dictated by the text saturation with noun phrases, the degree of their compression and / or completeness of object nominations and their proper translations based on adequate bilingual dictionaries. Text translation in such a hazardous domain as aseismic construction is a crucial point in information exchange and mining and a safety challenge. For terminology analysis of this domain text a special research text corpus (1 mln tokens) had been created. The analysis results had been used in the specialized automatic dictionary creation for machine translation system WORD + .
The article presents a study of some key issues of borrowed terminology in Russian scientific tex... more The article presents a study of some key issues of borrowed terminology in Russian scientific texts. The study presumes that global web academic intercourse and professional bilingualism of actively publishing Russian authors facilitate the process of borrowing new terminology of English origin. The problem addressed is the manner and methods Russian authors accept and use new terms in their research papers. The research methodology applied is that of corpus technologies. The study is based on corpus findings in two original research corpora. It aims at developing a procedure of detecting and describing new English terminology and its presentation in recent Russian scientific texts of a restricted knowledge domain, namely web and linguistic technologies. Section 1 presents an overview of factors influencing the quality of Russian academic writing. Section 2 describes the research corpora and a corpus-based procedure of detecting and extracting loan words. Section 3 focuses on analys...
The European Proceedings of Social & Behavioural Sciences // PCSF 2019 - 19th Professional Culture of the Specialist of the Future 28-29 November 2019, 2019
The paper considers methodological problems of academic research work in master and postgrad prog... more The paper considers methodological problems of academic research work in master and postgrad programs training. These problems concern a student's awareness in the academic research project choice, their skills and knowledge in definition of its goal, tasks, theory choice and academic writing as it is. Training experience has shown inability of Master program students to define their assignments in research work and necessity of special courses in scientific text structure and academic writing both in Russian and English languages. These courses are to solve training problems for text creation state-of-the-art since modern level of technology and science is now determined by the potential of automation processes in industries (Industry 4.0) and an appropriate presentation of information on the project under development and implementation (Information 4.0). The paper tries to assess the need for educating a new generation of specialists-language workers-those, who are prepared to solve text processing tasks in this new technology space. The paper considers the potential of information technologies and Web resources to be used by various specialists in their practice and studies. It addresses the general problems of modern methodological education caused by the changes in modern educational situation that demand a new understanding of educational process. It also discusses some issues of professional education.
«Вестник ПНИПУ. Проблемы языкознания и педагогики», 2019
В статье описываются особенности современного процесса работы с практической системой машинного п... more В статье описываются особенности современного процесса работы с практической системой машинного перевода в рамках технологической цепочки обработки и перевода научных и технических текстов. Рассматриваются системы машинного перевода в составе автоматизированного рабочего места переводчика, особенности пред-и постредактирования текстов, анализируются особенности ведения пользовательских словарей. Учитывается современная парадигма 4.0 (Промышленность 4.0 и Информация 4.0), диктующая условия, при которых состояние технологии и науки определяются потенциалом процессов автоматизации в промышленности и соответствующими способами представления информации к разрабатываемым проектам. В связи с этим качественно изменяются требования к подготовке переводчиков, чья деятельность сегодня все больше переносится в область технической коммуникации. Ключевые слова: машинный перевод, автоматический словарь, предредактирование, постредактирование, автоматическое рабочее место переводчика, компетенции переводчика, техническая коммуникация The paper presents the peculiarities of using a modern MT system in the technological chain of scientific and technical translation. MT systems are considered as a part of translator's workstation, specifics of both text pre-and postediting and automatic dictionaries management are analyzed. Modern paradigm 4.0 (Industry 4.0 and Information 4.0) dictates a new trend in automation and data exchange in manufacturing, such that will greatly influence both technology and science. That obviously leads to a serious and qualitative change in translator training, since a translator's work today is, to a large extent, in the technical communication domain. Многолетнее использование систем машинного перевода (МП) не только специалистами в различных областях знаний, но и переводчиками научных и технических (специальных) текстов определяет необходимость предварительного подведения итогов, касающихся собственно процедуры работы с такими системами, минимизации объема постредактирования результатов МП, а также связи методов постредактирования с полнотой и точностью автоматического словаря (АС) соответствующей системы. Основными профессиональными пользователями систем МП являются специалисты, получившие в современной англоязычной литературе термин language worker, который приблизительно можно перевести как специалист в области переработки текстов, под этим термином объединяются все лингвисты, работающие в области переработки научных и технических текстов: терминологи, переводчики, технические писатели, специалисты в области передачи технической информации [1; 2]. Современный переводчик специальной литературы является участником технологического процесса
The underlying assumption of the paper is that the text is the result of information transfer and... more The underlying assumption of the paper is that the text is the result of information transfer and the source (starting point) o of information mining and extraction. Thereafter the scientific text content is universal and can be extracted in case of minimum coincidence of the author's and recipient's thesauri. In text translation the proper information extraction is determined with correct interpretation of terms/objects names. The paper focuses that adequacy of text perception and understanding on the lexical level is dictated by the text saturation with noun phrases, the degree of their compression and / or completeness of object nominations and their proper translations based on adequate bilingual dictionaries. Text translation in such a hazardous domain as aseismic construction is a crucial point in information exchange and mining and a safety challenge. For terminology analysis of this domain text a special research text corpus (1 mln tokens) had been created. The analysis results had been used in the specialized automatic dictionary creation for machine translation system WORD + .
This study focuses on technical writer competences and necessary specialized language resources, ... more This study focuses on technical writer competences and necessary specialized language resources, supporting any language worker in the framework of modern natural language processing domain (terminologist, translator, lexicographer, technical writer, grammarian, teaching language specialist etc.). These specialists are new generation professionals with a basic linguistic/philological education, prepared to meet the demands of modern technology and science which are defined by the potential of industrial processes automatization (Industry 4.0) and appropriate presentation of information (Information 4.0). New concept of Information 4.0 reveals that information to be researched and/or created can be presented as a set of information molecules that are examined under the conditions of form, production and curation. Information 4.0 injects new life into the profession of technical communicator (technical writer) and language workers as a whole: those, who are prepared to solve the text processing tasks in this new technology space. The underlying assumption of the paper is that the text is the result of information transfer and the starting point of information mining and extraction.
The paper considers problems and procedures for translation dictionary creation to be done as the... more The paper considers problems and procedures for translation dictionary creation to be done as the result of merging and converting specialized dictionaries and glossaries. These glossaries created as working paper in the seismic construction domain had served as the source material for a special procedure development. Parallel corpus built on these glossaries was the base for English-Russian dictionary creation and additional terms acquisition, converting this dictionary into Russian-English version had shown applicability of the procedure discussed.