Parallel text (original) (raw)
Corpus paraleloa (ikusi testu corpus) maila batera lerrokaturik dauden bi hizkuntz desberdinetako testu bik osatzen duten duten bat da, normalean, lerrokada, sekzio, orri, edota hitzeko.
Property | Value |
---|---|
dbo:abstract | Paralelní korpus nebo také vícejazyčný korpus obsahuje stejné texty v různých jazycích zobrazené vedle sebe. Slouží jako zdroj dat pro teoretické studie, lexikografii, studentské práce, výuku, zejména výuku cizích jazyků, počítačové aplikace, překladatele i veřejnost. Nejen vytváření korpusů je úkolem korpusové lingvistiky. Paralelní korpus může být zarovnaný manuálně, v tom případě je jistota, že věta odpovídá větě (možné je i zarovnání na úrovni slov, odstavců, …). Zarovnání lze provést také automaticky, avšak v těchto případech není jisté, že v konkordanci bude sedět věta ku větě. Dělí se na korpusy srovnatelné a korpusy překladové. Srovnatelné paralelní korpusy se snaží o to, aby všechny jazyky byly na stejné úrovni, a to jak po stránce kvantitativní, tak po stránce kvalitativní. Překladové paralelní korpusy jsou složeny z originálů a překladů, které jsou vzájemně zarovnány. Mezi takovéto korpusy patří také korpus InterCorp vytvářený v ČNK. (cs) Corpus paraleloa (ikusi testu corpus) maila batera lerrokaturik dauden bi hizkuntz desberdinetako testu bik osatzen duten duten bat da, normalean, lerrokada, sekzio, orri, edota hitzeko. (eu) El corpus paralelo es un recurso lingüístico consistente en textos de dos lenguas (en algún formato electrónico adecuado) que están alineados a cierto nivel de granularidad; generalmente a nivel de párrafo, aunque también a nivel de sección, página o incluso a veces de palabra. Se usa en traducción automática y, principalmente, en memorias de traducción y para el desarrollo de sistemas de . (es) Un concordancier multilingue est un outil informatique permettant de gérer des corpus parallèles. Par métonymie, le concordancier multilingue désigne aussi ces corpus. (fr) A parallel text is a text placed alongside its translation or translations. Parallel text alignment is the identification of the corresponding sentences in both halves of the parallel text. The Loeb Classical Library and the Clay Sanskrit Library are two examples of dual-language series of texts. Reference Bibles may contain the original languages and a translation, or several translations by themselves, for ease of comparison and study; Origen's Hexapla (Greek for "sixfold") placed six versions of the Old Testament side by side. A famous example is the Rosetta Stone, whose discovery allowed the Ancient Egyptian language to begin being deciphered. Large collections of parallel texts are called parallel corpora (see text corpus). Alignments of parallel corpora at sentence level are prerequisite for many areas of linguistic research. During translation, sentences can be split, merged, deleted, inserted or reordered by the translator. This makes alignment a non-trivial task. Parallel texts may be used in language education. (en) 2개 국어 이상의 번역된 문서를 모은 말뭉치를 병렬말뭉치(parallel corpus, 병렬 코퍼스)라 부른다. 병렬말뭉치는 문장 대 문장 혹은 문단 대 문단으로 구축되어 있다. 병렬말뭉치는 언어 간의 대조 분석, 번역 연구에 활용된다. 최초로 구축된 병렬말뭉치 중 하나인 영어-노르웨이어 병렬말뭉치는 3 가지 목적을 가지고 만들어졌다. 1. * 동일 장르 간 영어권과 노르웨이어권의 비교 2. * 영어가 노르웨이어로 번역되면서 어떤 변화가 생기는가 혹은 그 반대의 고찰 3. * 노르웨이어로 쓰인 문학과 노르웨이어로 번역된 문학의 비교. 병렬 말뭉치를 구축할 때의 가장 큰 주의점은 되도록 직역한 것 위주로 모으는 것이 좋으며 원문과 번역문의 표시를 명확하게 해야 한다는 것이다. 병렬말뭉치가 구축되어 있으면 이국어 사전을 만드는 데 도움이 된다. 영영사전을 번역하여 영한사전을 만드는 것과 병렬말뭉치를 활용해 영한사전을 만드는 것은 근본적인 차이가 있기 때문이다. 후자 쪽이 더욱 기술적인 사전이 될 수밖에 없고 실제 언어 생활에 가까운 형태로 나오게 된다. (ko) Tekst równoległy (dwu- bądź wielojęzyczny) – tekst składający się z zestawionych obok siebie tekstów w co najmniej dwóch językach. Najczęściej jeden z tekstów jest oryginałem, a pozostałe jego tłumaczeniami, choć niekiedy nie da się już określić, który tekst był opracowany jako pierwotny, gdyż wszystkie były opracowywane równolegle i wzajemnie do siebie dostosowywane. Dopasowanie tekstów równoległych polega na określaniu odpowiadających sobie zdań w poszczególnych językach. Przykładami tekstów równoległych mogą być opracowana przez Loeba czy Claya, ale również takie teksty jak wielojęzyczna instrukcja obsługi lub strona internetowa oraz niektóre wydania tłumaczeń Biblii zawierające tekst w językach oryginalnych zestawiony z tłumaczeniem na przykład na polski, lub też po prostu kilka różnych tłumaczeń zestawionych w celu łatwiejszego porównania. Jednym z najwcześniejszych przykładów takiej poligloty, czyli "wielojęzycznej Biblii" jest opracowana przez Orygenesa Hexapla, w której zestawił on w równoległych kolumnach sześć wersji Starego Testamentu. Inny słynnym przykładem tekstu równoległego jest Kamień z Rosetty. Teksty równoległe w znaczeniu ogólnym rozumieć można również jako różne teksty o bardzo zbliżonej tematyce, lub formie, których zestawienie na poziomie zdań nie jest możliwe, jednak mimo to ich porównanie może być użyteczne dla językoznawcy, terminologa lub tłumacza. Dobrym przykładem są tu wielojęzyczne hasła Wikipedii, które zawierają podobne informacje w różnych językach. Nawet jeśli początkowo są to tłumaczenia haseł z innego języka, to uzupełniane i rozbudowywane są niezależnie w ramach danej wspólnoty językowej i najczęściej funkcjonują zupełnie niezależnie od siebie. Większe zasoby tekstów równoległych określane są mianem korpusów równoległych (zob. korpus). Dopasowanie korpusów równoległych na poziomie zdań jest niezbędnym warunkiem do prowadzenia badań w wielu dziedzinach językoznawstwa. Należy jednak pamiętać, że dopasowanie poszczególnych segmentów tłumaczenia nie zawsze jest proste, gdyż poszczególne zdania oryginału mogą być przez tłumacza podzielone, złączone, usunięte, przesunięte w inne miejsce lub zastąpione zupełnie nowym elementem. (pl) Um corpus paralelo é um texto colocado ao lado de sua tradução ou traduções. O alinhamento do corpus paralelo é a identificação das sentenças correspondentes em ambas as metades do corpus paralelo. A Loeb Classical Library e a são dois exemplos de séries de textos em duas línguas. As Bíblias de referência podem conter os idiomas originais e uma tradução, ou várias traduções por si mesmas, para facilitar a comparação e o estudo; a Héxapla de Orígenes (grego para 'seis vezes') colocou seis versões do Antigo Testamento lado a lado. Um exemplo famoso é a Pedra de Roseta, cuja descoberta permitiu que a língua egípcia pudesse começar a ser decifrada.Grandes coleções de corpus paralelos são chamados de corpora paralelos (ver ). Alinhamentos de corpora paralelos no nível da frase são pré-requisitos para muitas áreas da pesquisa linguística. Durante a tradução, as frases podem ser divididas, mescladas, excluídas, inseridas ou reordenadas pelo tradutor. Isso torna o alinhamento uma tarefa não trivial. (pt) 平行文本(英語:parallel text,又作平行語料)是与译文并行放置的文本。平行文本对齐 是指确定平行文本中原文和译文的对应句子。洛布古典丛书和克莱梵语丛书就是双语文本的两个例子。圣经参考书中可能会同时包含原文和译文或者多种译文,以便于比较和研究;俄利根的《圣经六国译文合璧》为旧约并排提供了六个版本。另外还要注意的一个最著名例子是罗塞塔石碑。 平行文本的大集合被称为平行语料库 (见语料库)。在句子层面对齐平行语料库是很多语言学研究领域的前提条件。在翻译过程中,翻译人员可以对句子进行拆分、合并、删除、插入或重新排列。这使得对齐任务变得异常重要。 (zh) Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.Большие собрания параллельных текстов называются «параллельным корпусом» (англ. parallel corpora). Выравнивание параллельного корпуса на уровне предложений является необходимой предпосылкой для различных аспектов лингвистических исследований. В процессе перевода предложения могут разделяться, сливаться, удаляться, вставляться или менять последовательность. В связи с этим выравнивание часто становится сложной задачей. (ru) Парале́льний текст (бітекст, білінгвальний текст) — це текст однією мовою разом з його перекладом на іншу мову. Зіставлення паралельних текстів — це ідентифікація відповідних один одному речень в обох половинах паралельного тексту. Великі збірки паралельних текстів називаються паралельним корпусом (англ. parallel corpora). Зіставлення паралельного корпусу на рівні речень є необхідною передумовою для різних аспектів лінгвістичних досліджень. У процесі перекладу речення можуть розділятися, зливатися, видалятися, вставлятися або змінювати свою послідовність. У зв'язку з цим зіставлення часто стає складним завданням. (uk) |
dbo:thumbnail | wiki-commons:Special:FilePath/Rosetta_Stone.jpg?width=300 |
dbo:wikiPageExternalLink | https://web.archive.org/web/20060619034515/http:/langtech.jrc.it/JRC-Acquis.html http://alaginrc.nict.go.jp/WikiCorpus/index_E.html http://champollion.sourceforge.net/ http://olanto.org/ http://phraseotext.univ-grenoble-alpes.fr/webAlignToolkit/ http://www.linguatools.com/ http://www.translationautomation.com/ https://gitlab.cl.uzh.ch/sparcling/hierarchical_alignment_tool https://kontext.korpus.cz/first_form%3Fcorpname=intercorp_v13_en&usesubcorp= https://wiki.korpus.cz/doku.php/en:cnk:intercorp https://bitbucket.org/tiedemann/uplug https://www.sketchengine.eu/eurlex-corpus/ http://www-i6.informatik.rwth-aachen.de/web/Tools/GIZA++.html http://glosbe.com/tmem http://www.statmt.org/europarl/ http://opus.lingfil.uu.se/ http://mokk.bme.hu/resources/hunalign/ http://www.linguateca.pt/COMPARA/ http://langrid.org http://parasolcorpus.org http://www.termsearch.info http://www.tradooit.com https://github.com/braunefe/Gargantua https://github.com/loomchild/maligna https://github.com/riklopfer/YASA https://github.com/rsennrich/Bleualign https://github.com/thompsonb/vecalign https://web.archive.org/web/20040417031546/http:/www.up.univ-mrs.fr/~veronis/biblios/ptp.htm https://web.archive.org/web/20060913013656/https:/www.cs.unt.edu/~rada/wpt/ https://web.archive.org/web/20060913025814/https:/www.cs.unt.edu/~rada/wpt05/ https://web.archive.org/web/20070707091815/http:/www.inuktitutcomputing.ca/NunavutHansard/en/ https://web.archive.org/web/20111004235757/http:/nl.ijs.si/telri/Vanilla/ |
dbo:wikiPageID | 354374 (xsd:integer) |
dbo:wikiPageLength | 12206 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1081336484 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Rosetta_Stone dbr:Natural_language_processing dbr:Bilingual dbr:Bilingual_inscription dbr:Decipherment_of_ancient_Egyptian_scripts dbr:Bible_translations dbr:Reverso_(language_tools) dbr:Computer-assisted_translation dbr:Egyptian_language dbr:Clay_Sanskrit_Library dbr:Computer-assisted_reviewing dbr:Polyglot_(book) dbr:Language_education dbr:Linguee dbr:Linguistics dbr:Loeb_Classical_Library dbr:EUR-Lex dbr:European_Union dbr:Text_corpus dbr:Acquis_Communautaire dbc:Corpus_linguistics dbc:Language_acquisition dbr:Hexapla dbr:Translation dbr:Translation_studies dbr:Monolingual dbr:Origen dbr:XML dbr:Machine_translation dbr:Statistical_machine_translation dbc:Translation_databases dbr:Ruby_character dbr:European_Union_law dbr:Example-based_machine_translation dbr:Translation_Memory_eXchange dbr:File:Rosetta_Stone.JPG |
dbp:wikiPageUsesTemplate | dbt:Natural_language_processing dbt:Anchor dbt:Citation_needed dbt:Distinguish dbt:Main dbt:Refimprove dbt:Reflist dbt:Short_description |
dct:subject | dbc:Corpus_linguistics dbc:Language_acquisition dbc:Translation_databases |
gold:hypernym | dbr:Text |
rdf:type | owl:Thing dbo:Book |
rdfs:comment | Corpus paraleloa (ikusi testu corpus) maila batera lerrokaturik dauden bi hizkuntz desberdinetako testu bik osatzen duten duten bat da, normalean, lerrokada, sekzio, orri, edota hitzeko. (eu) El corpus paralelo es un recurso lingüístico consistente en textos de dos lenguas (en algún formato electrónico adecuado) que están alineados a cierto nivel de granularidad; generalmente a nivel de párrafo, aunque también a nivel de sección, página o incluso a veces de palabra. Se usa en traducción automática y, principalmente, en memorias de traducción y para el desarrollo de sistemas de . (es) Un concordancier multilingue est un outil informatique permettant de gérer des corpus parallèles. Par métonymie, le concordancier multilingue désigne aussi ces corpus. (fr) 2개 국어 이상의 번역된 문서를 모은 말뭉치를 병렬말뭉치(parallel corpus, 병렬 코퍼스)라 부른다. 병렬말뭉치는 문장 대 문장 혹은 문단 대 문단으로 구축되어 있다. 병렬말뭉치는 언어 간의 대조 분석, 번역 연구에 활용된다. 최초로 구축된 병렬말뭉치 중 하나인 영어-노르웨이어 병렬말뭉치는 3 가지 목적을 가지고 만들어졌다. 1. * 동일 장르 간 영어권과 노르웨이어권의 비교 2. * 영어가 노르웨이어로 번역되면서 어떤 변화가 생기는가 혹은 그 반대의 고찰 3. * 노르웨이어로 쓰인 문학과 노르웨이어로 번역된 문학의 비교. 병렬 말뭉치를 구축할 때의 가장 큰 주의점은 되도록 직역한 것 위주로 모으는 것이 좋으며 원문과 번역문의 표시를 명확하게 해야 한다는 것이다. 병렬말뭉치가 구축되어 있으면 이국어 사전을 만드는 데 도움이 된다. 영영사전을 번역하여 영한사전을 만드는 것과 병렬말뭉치를 활용해 영한사전을 만드는 것은 근본적인 차이가 있기 때문이다. 후자 쪽이 더욱 기술적인 사전이 될 수밖에 없고 실제 언어 생활에 가까운 형태로 나오게 된다. (ko) 平行文本(英語:parallel text,又作平行語料)是与译文并行放置的文本。平行文本对齐 是指确定平行文本中原文和译文的对应句子。洛布古典丛书和克莱梵语丛书就是双语文本的两个例子。圣经参考书中可能会同时包含原文和译文或者多种译文,以便于比较和研究;俄利根的《圣经六国译文合璧》为旧约并排提供了六个版本。另外还要注意的一个最著名例子是罗塞塔石碑。 平行文本的大集合被称为平行语料库 (见语料库)。在句子层面对齐平行语料库是很多语言学研究领域的前提条件。在翻译过程中,翻译人员可以对句子进行拆分、合并、删除、插入或重新排列。这使得对齐任务变得异常重要。 (zh) Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.Большие собрания параллельных текстов называются «параллельным корпусом» (англ. parallel corpora). Выравнивание параллельного корпуса на уровне предложений является необходимой предпосылкой для различных аспектов лингвистических исследований. В процессе перевода предложения могут разделяться, сливаться, удаляться, вставляться или менять последовательность. В связи с этим выравнивание часто становится сложной задачей. (ru) Парале́льний текст (бітекст, білінгвальний текст) — це текст однією мовою разом з його перекладом на іншу мову. Зіставлення паралельних текстів — це ідентифікація відповідних один одному речень в обох половинах паралельного тексту. Великі збірки паралельних текстів називаються паралельним корпусом (англ. parallel corpora). Зіставлення паралельного корпусу на рівні речень є необхідною передумовою для різних аспектів лінгвістичних досліджень. У процесі перекладу речення можуть розділятися, зливатися, видалятися, вставлятися або змінювати свою послідовність. У зв'язку з цим зіставлення часто стає складним завданням. (uk) Paralelní korpus nebo také vícejazyčný korpus obsahuje stejné texty v různých jazycích zobrazené vedle sebe. Slouží jako zdroj dat pro teoretické studie, lexikografii, studentské práce, výuku, zejména výuku cizích jazyků, počítačové aplikace, překladatele i veřejnost. Nejen vytváření korpusů je úkolem korpusové lingvistiky. Paralelní korpus může být zarovnaný manuálně, v tom případě je jistota, že věta odpovídá větě (možné je i zarovnání na úrovni slov, odstavců, …). Zarovnání lze provést také automaticky, avšak v těchto případech není jisté, že v konkordanci bude sedět věta ku větě. (cs) A parallel text is a text placed alongside its translation or translations. Parallel text alignment is the identification of the corresponding sentences in both halves of the parallel text. The Loeb Classical Library and the Clay Sanskrit Library are two examples of dual-language series of texts. Reference Bibles may contain the original languages and a translation, or several translations by themselves, for ease of comparison and study; Origen's Hexapla (Greek for "sixfold") placed six versions of the Old Testament side by side. A famous example is the Rosetta Stone, whose discovery allowed the Ancient Egyptian language to begin being deciphered. (en) Tekst równoległy (dwu- bądź wielojęzyczny) – tekst składający się z zestawionych obok siebie tekstów w co najmniej dwóch językach. Najczęściej jeden z tekstów jest oryginałem, a pozostałe jego tłumaczeniami, choć niekiedy nie da się już określić, który tekst był opracowany jako pierwotny, gdyż wszystkie były opracowywane równolegle i wzajemnie do siebie dostosowywane. (pl) Um corpus paralelo é um texto colocado ao lado de sua tradução ou traduções. O alinhamento do corpus paralelo é a identificação das sentenças correspondentes em ambas as metades do corpus paralelo. A Loeb Classical Library e a são dois exemplos de séries de textos em duas línguas. As Bíblias de referência podem conter os idiomas originais e uma tradução, ou várias traduções por si mesmas, para facilitar a comparação e o estudo; a Héxapla de Orígenes (grego para 'seis vezes') colocou seis versões do Antigo Testamento lado a lado. Um exemplo famoso é a Pedra de Roseta, cuja descoberta permitiu que a língua egípcia pudesse começar a ser decifrada.Grandes coleções de corpus paralelos são chamados de corpora paralelos (ver ). Alinhamentos de corpora paralelos no nível da frase são pré-requisit (pt) |
rdfs:label | Paralelní korpus (cs) Corpus paralelo (es) Corpus paralelo (eu) Concordancier multilingue (fr) 병렬말뭉치 (ko) Parallel text (en) Tekst równoległy (pl) Битекст (ru) Corpus paralelo (pt) 平行文本 (zh) Паралельний текст (uk) |
owl:differentFrom | dbr:Parallel_novel |
owl:sameAs | freebase:Parallel text wikidata:Parallel text dbpedia-af:Parallel text dbpedia-cs:Parallel text dbpedia-es:Parallel text dbpedia-eu:Parallel text dbpedia-fr:Parallel text dbpedia-ko:Parallel text dbpedia-pl:Parallel text dbpedia-pt:Parallel text dbpedia-ru:Parallel text dbpedia-sr:Parallel text dbpedia-th:Parallel text dbpedia-uk:Parallel text dbpedia-zh:Parallel text https://global.dbpedia.org/id/NPxP |
prov:wasDerivedFrom | wikipedia-en:Parallel_text?oldid=1081336484&ns=0 |
foaf:depiction | wiki-commons:Special:FilePath/Rosetta_Stone.jpg |
foaf:isPrimaryTopicOf | wikipedia-en:Parallel_text |
is dbo:language of | dbr:The_Israel_Bible |
is dbo:wikiPageRedirects of | dbr:Parallel_text_alignment dbr:Multilingual_text dbr:Bilingual_corpus dbr:Bilingual_text dbr:Paralel_text dbr:Bi-text dbr:Parallel_corpora dbr:Parallel_corpus dbr:Online_bilingual_concordance dbr:Bitext dbr:Aligned_parallel_text |
is dbo:wikiPageWikiLink of | dbr:Caigentan dbr:Caló_language dbr:Schleicher's_fable dbr:Meroitic_language dbr:Decipherment_of_ancient_Egyptian_scripts dbr:Peace_pole dbr:Reverso_(language_tools) dbr:Parallel_text_alignment dbr:Zettel_(Wittgenstein_book) dbr:Orcadian_dialect dbr:Google_Translate dbr:Multilingual_text dbr:Publication_of_Domesday_Book dbr:1912_in_literature dbr:Lord's_Prayer dbr:Chrestomathy dbr:Comparison_of_different_machine_translation_approaches dbr:Polyglot_(book) dbr:Translation_memory dbr:August_Schleicher dbr:Language_education dbr:Linguee dbr:CudaText dbr:EUR-Lex dbr:Britton_(book) dbr:Osteogenesis_imperfecta dbr:Bilingual_corpus dbr:Bilingual_text dbr:List_of_Desert_Island_Discs_episodes_(2001–2010) dbr:The_Klingon_Hamlet dbr:The_king_and_the_god dbr:Bilingual_dictionary dbr:Polydore_Vergil dbr:Illuminations_(poetry_collection) dbr:Microsoft_Translator dbr:Example-based_machine_translation dbr:Multilingual_inscription dbr:Rule-based_machine_translation dbr:Paralel_text dbr:Parallel_translation dbr:The_Poison_of_Polygamy dbr:Paraphrasing_(computational_linguistics) dbr:The_North_Wind_and_the_Sun dbr:Tatoeba dbr:The_Israel_Bible dbr:Bi-text dbr:Parallel_corpora dbr:Parallel_corpus dbr:Online_bilingual_concordance dbr:Bitext dbr:Aligned_parallel_text |
is owl:differentFrom of | dbr:Parallel_novel |
is foaf:primaryTopic of | wikipedia-en:Parallel_text |