Suporte de idiomas do OCR (original) (raw)

A funcionalidade de reconhecimento de texto da Cloud Vision API consegue detetar uma grande variedade de idiomas e pode detetar vários idiomas numa única imagem.

Não é necessário fornecer uma sugestão de idioma ao serviço, mas pode fazê-lo se o serviço tiver problemas em detetar o idioma usado na sua imagem.

Com o lançamento da DG de OCR de escrita manual, as imagens com escrita manual já não requerem uma languageHints flag de escrita manual quando usamDOCUMENT_TEXT_DETECTION.

As sugestões de idiomas opcionais são especificadas noImageContextde um pedido como uma lista de languageHints para um pedido deTEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Normalmente, cada parâmetro de código de idioma consiste num identificador BCP-47. Este parâmetro pode ter o formato _idioma_-região, em que idioma se refere ao idioma principal e a região opcional refere-se a uma região (normalmente, um identificador de país) de um dialeto específico. Por exemplo, o chinês pode ser representado como chinês simplificado, como é escrito na República Popular da China (zh-Hans), ou chinês tradicional, como é escrito em Taiwan (zh-Hant).

Existem três níveis de suporte de idiomas na funcionalidade de reconhecimento de texto:

  1. Os idiomas suportados são aqueles aos quais damos prioridade e em relação aos quais avaliamos regularmente o desempenho.
  2. Os idiomas experimentais são aqueles que estão em desenvolvimento ativo, mas não são avaliados regularmente.
  3. Os idiomas mapeados são os que são suportados através do respetivo mapeamento para outro código de idioma ou para um reconhecedor de carateres geral. Por exemplo, "en-GB" é suportado, mas não é tratado de forma diferente de "en" para efeitos de reconhecimento de texto. Fazemos o nosso melhor para devolver o código do idioma mapeado correto no campo de localidade da entidade, mas é mais provável que os idiomas mapeados do que os idiomas totalmente suportados ou suportados experimentalmente sejam identificados incorretamente como um idioma semelhante.

A lista de idiomas (com códigos languageHint associados) suportados peloTEXT_DETECTION e DOCUMENT_TEXT_DETECTION é apresentada abaixo.

Se a sugestão de idioma for deixada em branco, vamos tentar detetar automaticamente o idioma mais adequado. O ponto final TEXT_DETECTION deteta automaticamente apenas um subconjunto de idiomas suportados, enquanto o ponto final DOCUMENT_TEXT_DETECTION deteta automaticamente o conjunto completo de idiomas suportados.

Idiomas suportados

Os seguintes idiomas são prioritários e avaliados regularmente.

Para filtrar por funcionalidades, escreva ou selecione diretamente o idioma pretendido no menu pendente:

| Idioma | Idioma (nome em inglês) | Código languageHints | Script | Notas | | | --------------------------- | ----------------------- | -------------------- | --------- | ----------------- | | | Afrikaans | Afrikaans | af | Latn | | | | shqip | Albanês | sq | Latn | | | | العربية | Árabe | ar | Arab | Modern Standard | | | Հայ | Arménio | hy | Armn | | | | беларуская | Bielorrusso | be | Cyrl | | | | বাংলা | Bengali | bn | Beng | | | | български | Búlgaro | bg | Cyrl | | | | Català | Catalão | ca | Latn | | | | 普通话 | Chinês | zh | Hans/Hant | | | | Hrvatski | Croata | hr | Latn | | | | Čeština | Checo | cs | Latn | | | | Dansk | Dinamarquês | da | Latn | | | | Nederlands | Neerlandês | nl | Latn | | | | English | Inglês | en | Latn | Americano | | | Eesti keel | Estónio | et | Latn | | | | Filipino | Filipino | fil | Latn | | | | Suomi | Finlandês | fi | Latn | | | | Français | Francês | fr | Latn | Europeu | | | Deutsch | Alemão | de | Latn | | | | Ελληνικά | Grego | el | Grek | | | | ગુજરાતી | Gujarati | gu | Gujr | | | | עברית | Hebraico | iw | Hebr | | | | हिन्दी | Hindi | hi | Deva | | | | Magyar | Húngaro | hu | Latn | | | | Íslenska | Islandês | is | Latn | | | | Bahasa Indonesia | Indonésio | id | Latn | | | | Italiano | Italiano | it | Latn | | | | 日本語 | Japonês | ja | Jpan | | | | ಕನ್ನಡ | Canará | kn | Knda | | | | ភាសាខ្មែរ | Khmer | km | Khmr | | | | 한국어 | Coreano | ko | Kore | | | | ລາວ | Laociano | lo | Laoo | | | | Latviešu | Letão | lv | Latn | | | | Lietuvių | Lituano | lt | Latn | | | | Македонски | Macedónio | mk | Cyrl | | | | Bahasa Melayu | Malaio | ms | Latn | | | | മലയാളം | Malaiala | ml | Mlym | | | | मराठी | Marati | mr | Deva | | | | नेपाली | Nepalês | ne | Deva | | | | Norsk | Norueguês | no | Latn | Bokmål | | | فارسی | Persa | fa | Arab | | | | Polski | Polaco | pl | Latn | | | | Português | Português | pt | Latn | Brasileiro | | | ਪੰਜਾਬੀ | Punjabi | pa | Guru | Gurmukhi | | | Română | Romeno | ro | Latn | | | | Русский | Russo | ru | Cyrl | | | | Русский (старая орфография) | Russo | ru-PETR1708 | Cyrl | Ortografia antiga | | | Српски | Sérvio | sr | Cyrl | | | | Српски (латиница) | Sérvio | sr-Latn | Latn | | | | Slovenčina | Eslovaco | sk | Latn | | | | Slovenščina | Esloveno | sl | Latn | | | | Español | Espanhol | es | Latn | Europeu | | | Svenska | Sueco | sv | Latn | | | | Tagalog | Tagalo | tl | Latn | | | | தமிழ் | Tamil | ta | Taml | | | | తెలుగు | Telugu | te | Telu | | | | ไทย | Tailandês | th | Thai | | | | Türkçe | Turco | tr | Latn | | | | Українська | Ucraniano | uk | Cyrl | | | | Tiếng Việt | Vietnamita | vi | Latn | | | | Yiddish | Iídiche | yi | Hebr | | |

Idiomas experimentais

Os seguintes idiomas estão em desenvolvimento ativo e ainda não são avaliados regularmente.

| Idioma | Idioma (nome em inglês) | Código languageHints | Script | Notas | | | ----------------------- | ----------------------- | -------------------- | ------ | ----------------- | | | አማርኛ | Amárico | am | Ethi | | | | Αρχαία ελληνικά | Grego antigo | grc | Grek | | | | অসমীয়া | Assamês | as | Beng | | | | Azərbaycan | Azeri | az | Latn | | | | Azərbaycan (qədim yazı) | Azeri | az-Cyrl | Cyrl | Ortografia antiga | | | Euskara | Basco | eu | Latn | | | | Bosanski | Bósnio | bs | Latn | | | | မြန်မာ | Birmanês | my | Mymr | | | | Cebuano | Cebuano | ceb | Latn | | | | ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cherokee | chr | Cher | | | | dhivehi, dhivehi-bas | Divehi | dv | Thaa | | | | རྫོང་ཁ | Dzonkha | dz | Tibt | | | | Esperanto | Esperanto | eo | Latn | | | | Galego | Galego | gl | Latn | | | | ქართული | Georgiana | ka | Geor | | | | Kreyòl Ayisyen | Crioulo haitiano | ht | Latn | | | | Gaeilge | Irlandês | ga | Latn | | | | Jawa | Javanês | jv | Latn | | | | Қазақ | Cazaque | kk | Cyrl | | | | Kirghiz | Quirguiz | ky | Cyrl | | | | Latine | Latim | la | Latn | | | | Malti | Maltês | mt | Latn | | | | Монгол | Mongol | mn | Cyrl | | | | ଓଡ଼ିଆ | Oriya | or | Orya | | | | پښتو | Pastó | ps | Arab | | | | संस्कृतम् | Sânscrito | sa | Deva | | | | සිංහල | Cingalês | si | Sinh | | | | Swahili | Suaíli | sw | Latn | | | | leššānā Suryāyā | Siríaco | syr | Syriac | | | | བོད་སྐད་ | Tibetano | bo | Tibt | | | | ትግርኛ | Tigrinya | ti | Ethi | | | | اردو | Urdu | ur | Arab | | | | oʻzbekcha | Usbeque | uz | Latn | Latim | | | oʻzbekcha | Usbeque | uz-Cyrl | Cyrl | Ortografia antiga | | | Cymraeg | Galês | cy | Latn | | | | IsiZulu | Zulu | zu | Latn | | |

Idiomas mapeados

Os seguintes idiomas estão mapeados para outro código de idioma ou para um reconhecedor de carateres geral.

| Idioma | Idioma (nome em inglês) | Código languageHints | Script | Notas | | | ------------------------------------------------- | ------------------------------- | -------------------- | --------- | --------------- | | | بهسا اچيه | Achém | ace | Latn | Modelo latino | | | Lwo | Acholi | ach | Latn | Modelo latino | | | Dangme | Adangme | ada | Latn | Modelo latino | | | Akan | Akan | ak | Latn | Modelo latino | | | Anicinâbemowin | Algonquinian | alg | Latn | Modelo latino | | | Mapudungu | Araucano/mapuche | arn | Latn | Modelo latino | | | Asturianu | Asturiano | ast | Latn | Modelo latino | | | Dene | Athabaskan | ath | Latn | Modelo latino | | | Aymar aru | Aimará | ay | Latn | Modelo latino | | | Bhāṣa Bali | Balinês | ban | Latn | Modelo latino | | | Bamanankan | Bambara | bm | Latn | Modelo latino | | | Narrow Bantu | Bantu | bnt | Latn | Modelo latino | | | башҡорт теле | Bashkir | ba | Cyrl | Modelo cirílico | | | Toba–Batak | Bataque | btk | Latn | Modelo latino | | | Chibemba | Bemba | bem | Latn | Modelo latino | | | Bikol Naga | Bikol | bik | Latn | Modelo latino | | | Bichelamar | Bislama | bi | Latn | Modelo latino | | | Brezhoneg | Bretão | br | Latn | Modelo latino | | | нохчийн мотт / noxçiyn mott | Checheno | ce | Cyrl | Modelo cirílico | | | 汉语 | Chinês (mandarim, simplificado) | zh-Hans | Hans | Modelo chinês | | | 漢語 | Chinês (mandarim, tradicional) | zh-Hant | Hant | Modelo chinês | | | 普通話 | Chinês (mandarim, Hong Kong) | zh-Hant-HK | Hant | Modelo chinês | | | Chahta' | Choctaw | cho | Latn | Modelo latino | | | Чӑвашла | Chuvache | cv | Cyrl | Modelo cirílico | | | Cree–Montagnais–Naskapi | Cree | cr | Latn | Modelo latino | | | Mvskoke | Riacho | mus | Latn | Modelo latino | | | qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh | Latn | Modelo cirílico | | | Dakhótiyapi, Dakȟótiyapi | Dacota | dak | Latn | Modelo latino | | | Douala | Duala | dua | Latn | Modelo latino | | | Ikɔ Efik | Efik | efi | Latn | Modelo latino | | | English (British) | Inglês (Reino Unido) | en-GB | Latn | Modelo latino | | | Èʋegbe | Ewe | ee | Latn | Modelo latino | | | føroyskt mál | Faroé | fo | Latn | Modelo latino | | | Na Vosa Vakaviti | Fijiano | fj | Latn | Modelo latino | | | fɔ̀ngbè | Fon | fon | Latn | Modelo latino | | | Français canadien | Francês (Canadá) | fr-CA | Latn | Modelo latino | | | Fulani, Fulah, Peul | Fula | ff | Latn | Modelo latino | | | Gã | Ga | gaa | Latn | Modelo latino | | | Luganda | Ganda | lg | Latn | Modelo latino | | | Basa Gayo | Gayo | gay | Latn | Modelo latino | | | Kiribati | Gilbertês | gil | Latn | Modelo latino | | | Gothic | Gótico | got | Latn | Modelo latino | | | Guaraní | Guarani | gn | Latn | Modelo latino | | | Harshen/Halshen Hausa هَرْشَن هَوْسَ | Haúça | ha | Latn | Modelo latino | | | ʻŌlelo Hawaiʻi | Havaiano | haw | Latn | Modelo latino | | | Otjiherero | Herero | hz | Latn | Modelo latino | | | Ilonggo | Hiligaynon | hil | Latn | Modelo latino | | | Jaku Iban | Iban | iba | Latn | Modelo latino | | | Asụsụ Igbo | Igbo | ig | Latn | Modelo latino | | | Ilokano | Ilocano | ilo | Latn | Modelo latino | | | Taqbaylit | Cabila | kab | Latn | Modelo latino | | | Jingpho | Kachin | kac | Latn | Modelo latino | | | Kalaallisut | Kalaallisut | kl | Latn | Modelo latino | | | Kikamba | Kikamba | kam | Latn | Modelo latino | | | Kanuri | Kanuri | kr | Latn | Modelo latino | | | Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Caracalpaque | kaa | Cyrl/Latn | Modelo cirílico | | | Ka Ktien Khasi | Khasi | kha | Latn | Modelo latino | | | Gĩkũyũ | Kikuyu | ki | Latn | Modelo latino | | | Kinyarwanda | Kinyarwanda | rw | Latn | Modelo latino | | | коми кыв | Komi | kv | Cyrl | Modelo cirílico | | | Kikongo | Conguês | kg | Latn | Modelo latino | | | Kosraean | Kosraean | kos | Latn | Modelo latino | | | Oshikwanyama | Cuanhama | kj | Latn | Modelo latino | | | Ngala | Lingala | ln | Latn | Modelo latino | | | Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds | Latn | Modelo latino | | | siLozi | Lozi | loz | Latn | Modelo latino | | | Kiluba | Luba-katanga | lu | Latn | Modelo latino | | | Dholuo | Luo | luo | Latn | Modelo latino | | | Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad | Latn | Modelo latino | | | Malagasy | Malgaxe | mg | Latn | Modelo latino | | | Mandinka, لغة مندنكا | Mandingo | man | Latn | Modelo latino | | | Gaelg, Gailck | Manquês | gv | Latn | Modelo latino | | | Te reo Māori | Maori | mi | Latn | Modelo latino | | | Ebon | Marshalês | mh | Latn | Modelo latino | | | Mɛnde yia | Mende | men | Latn | Modelo latino | | | Middle English | Inglês médio | enm | Latn | Modelo latino | | | Mittelhochdeutsch | Alto-alemão médio | gmh | Latn | Modelo latino | | | Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min | Latn | Modelo latino | | | Kanienʼkéha | Mohawk | moh | Latn | Modelo latino | | | Nkundu | Mongo | lol | Latn | Modelo latino | | | Nāhuatl | Nauatle | nah | Latn | Modelo latino | | | Diné bizaad | Navajo | nv | Latn | Modelo latino | | | Ndonga | Ndonga | ng | Latn | Modelo latino | | | ko e vagahau Niuē | Niueano | niu | Latn | Modelo latino | | | Zimbabwe Ndebele | Ndebele do norte | nd | Latn | Modelo latino | | | Sesotho sa Leboa | Soto do Norte | nso | Latn | Modelo latino | | | Chichewa, Chinyanja | Nianja | ny | Latn | Modelo latino | | | Runyankore | Nyankole | nyn | Latn | Modelo latino | | | Chitonga | Nyasa tonga | tog | Latn | Modelo latino | | | Appolo | Nzima | nzi | Latn | Modelo latino | | | Occitan, lenga d'òc, provençal | Occitânico | oc | Latn | Modelo latino | | | Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojíbua | oj | Latn | Modelo latino | | | Ænglisc, Englisc, Anglisc | Inglês antigo | ang | Latn | Modelo latino | | | Franceis, François, Romanz | Francês antigo | fro | Latn | Modelo latino | | | Diutisk, Althochdeutsch | Alto-alemão antigo | goh | Latn | Modelo latino | | | Dǫnsk tunga | Nórdico antigo | non | Latn | Modelo latino | | | Occitan ancian | Provençal antigo | pro | Latn | Modelo latino | | | ирон ӕвзаг | Osseta | os | Cyrl | Modelo cirílico | | | Kapampangan | Pampanga | pam | Latn | Modelo latino | | | Salitan Pangasinan | Pangasinês | pag | Latn | Modelo latino | | | Papiamentu | Papiamento | pap | Latn | Modelo latino | | | Português (Portugal) | Português (europeu) | pt-PT | Latn | Modelo latino | | | Kechua / Runa Simi | Quíchua | qu | Latn | Modelo latino | | | Rumantsch | Romanche | rm | Latn | Modelo latino | | | Romani čhib | Romani | rom | Latn | Modelo latino | | | Ikirundi | Rundi | rn | Latn | Modelo latino | | | Sakha | Sakha | sah | Cyrl | Modelo cirílico | | | Gagana faʻa Sāmoa | Samoano | sm | Latn | Modelo latino | | | yângâ tî sängö | Sango | sg | Latn | Modelo latino | | | (Braid) Scots, Lallans, Doric | Escocês | sco | Latn | Modelo latino | | | Gàidhlig | Gaélico Escocês | gd | Latn | Modelo latino | | | chiShona | Shona | sn | Latn | Modelo latino | | | Songhay | Songai | son | Latn | Modelo latino | | | Sesotho | Sesoto | st | Latn | Modelo latino | | | Español (Latinoamérica) | Espanhol (latino-americano) | es-419 | Latn | Modelo latino | | | ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su | Latn | Modelo latino | | | siSwati | Suazi | ss | Latn | Modelo latino | | | Reo Tahiti | Taitiano | ty | Latn | Modelo latino | | | тоҷикӣ | Tajique | tg | Cyrl | Modelo cirílico | | | татар теле | Tártaro | tt | Cyrl/Latn | Modelo cirílico | | | KʌThemnɛ | Temne | tem | Latn | Modelo latino | | | lea faka-Tonga | Tonga | to | Latn | Modelo latino | | | Xitsonga | Tsonga | ts | Latn | Modelo latino | | | Setswana | Tsuana | tn | Latn | Modelo latino | | | Türkmençe | Turcomenistão | tk | Latn | Modelo cirílico | | | удмурт кыл | Udmurte | udm | Cyrl | Modelo cirílico | | | Tshivenḓa | Venda | ve | Latn | Modelo latino | | | Vod | Vótico | vot | Cyrl/Latn | Modelo cirílico | | | Frysk | Frísico ocidental | fy | Latn | Modelo latino | | | Wolof | Jalofo | wo | Latn | Modelo latino | | | isiXhosa | Xhosa | xh | Latn | Modelo latino | | | Èdè Yorùbá | Iorubá | yo | Latn | Modelo latino | | | Diidxazá | Zapoteca | zap | Latn | Modelo latino | |

Scripts de escrita manual

Os seguintes scripts são suportados para o reconhecimento de escrita manual. Consulte as tabelas de idiomas acima para ver os idiomas que usam cada escrita.

Script Nome Nível de apoio técnico
Beng Bengali Experimental
Cyrl Cirílico Experimental
Deva Devanagari Experimental
Grek Grego Experimental
Hani Chinês Experimental
Jpan Japonês Suportado
Kore Coreano Suportado
Latn Latim Suportado
vi Vietnamita Experimental