Suporte de idiomas do OCR (original) (raw)
A funcionalidade de reconhecimento de texto da Cloud Vision API consegue detetar uma grande variedade de idiomas e pode detetar vários idiomas numa única imagem.
Não é necessário fornecer uma sugestão de idioma ao serviço, mas pode fazê-lo se o serviço tiver problemas em detetar o idioma usado na sua imagem.
Com o lançamento da DG de OCR de escrita manual, as imagens com escrita manual já não requerem uma languageHints flag de escrita manual quando usamDOCUMENT_TEXT_DETECTION.
As sugestões de idiomas opcionais são especificadas noImageContextde um pedido como uma lista de languageHints para um pedido deTEXT_DETECTION e DOCUMENT_TEXT_DETECTION.
Normalmente, cada parâmetro de código de idioma consiste num identificador BCP-47. Este parâmetro pode ter o formato _idioma_-região, em que idioma se refere ao idioma principal e a região opcional refere-se a uma região (normalmente, um identificador de país) de um dialeto específico. Por exemplo, o chinês pode ser representado como chinês simplificado, como é escrito na República Popular da China (zh-Hans), ou chinês tradicional, como é escrito em Taiwan (zh-Hant).
Existem três níveis de suporte de idiomas na funcionalidade de reconhecimento de texto:
- Os idiomas suportados são aqueles aos quais damos prioridade e em relação aos quais avaliamos regularmente o desempenho.
- Os idiomas experimentais são aqueles que estão em desenvolvimento ativo, mas não são avaliados regularmente.
- Os idiomas mapeados são os que são suportados através do respetivo mapeamento para outro código de idioma ou para um reconhecedor de carateres geral. Por exemplo, "
en-GB" é suportado, mas não é tratado de forma diferente de "en" para efeitos de reconhecimento de texto. Fazemos o nosso melhor para devolver o código do idioma mapeado correto no campo de localidade da entidade, mas é mais provável que os idiomas mapeados do que os idiomas totalmente suportados ou suportados experimentalmente sejam identificados incorretamente como um idioma semelhante.
A lista de idiomas (com códigos languageHint associados) suportados peloTEXT_DETECTION e DOCUMENT_TEXT_DETECTION é apresentada abaixo.
Se a sugestão de idioma for deixada em branco, vamos tentar detetar automaticamente o idioma mais adequado. O ponto final TEXT_DETECTION deteta automaticamente apenas um subconjunto de idiomas suportados, enquanto o ponto final DOCUMENT_TEXT_DETECTION deteta automaticamente o conjunto completo de idiomas suportados.
Idiomas suportados
Os seguintes idiomas são prioritários e avaliados regularmente.
Para filtrar por funcionalidades, escreva ou selecione diretamente o idioma pretendido no menu pendente:
| Idioma | Idioma (nome em inglês) | Código languageHints | Script | Notas | | | --------------------------- | ----------------------- | -------------------- | --------- | ----------------- | | | Afrikaans | Afrikaans | af | Latn | | | | shqip | Albanês | sq | Latn | | | | العربية | Árabe | ar | Arab | Modern Standard | | | Հայ | Arménio | hy | Armn | | | | беларуская | Bielorrusso | be | Cyrl | | | | বাংলা | Bengali | bn | Beng | | | | български | Búlgaro | bg | Cyrl | | | | Català | Catalão | ca | Latn | | | | 普通话 | Chinês | zh | Hans/Hant | | | | Hrvatski | Croata | hr | Latn | | | | Čeština | Checo | cs | Latn | | | | Dansk | Dinamarquês | da | Latn | | | | Nederlands | Neerlandês | nl | Latn | | | | English | Inglês | en | Latn | Americano | | | Eesti keel | Estónio | et | Latn | | | | Filipino | Filipino | fil | Latn | | | | Suomi | Finlandês | fi | Latn | | | | Français | Francês | fr | Latn | Europeu | | | Deutsch | Alemão | de | Latn | | | | Ελληνικά | Grego | el | Grek | | | | ગુજરાતી | Gujarati | gu | Gujr | | | | עברית | Hebraico | iw | Hebr | | | | हिन्दी | Hindi | hi | Deva | | | | Magyar | Húngaro | hu | Latn | | | | Íslenska | Islandês | is | Latn | | | | Bahasa Indonesia | Indonésio | id | Latn | | | | Italiano | Italiano | it | Latn | | | | 日本語 | Japonês | ja | Jpan | | | | ಕನ್ನಡ | Canará | kn | Knda | | | | ភាសាខ្មែរ | Khmer | km | Khmr | | | | 한국어 | Coreano | ko | Kore | | | | ລາວ | Laociano | lo | Laoo | | | | Latviešu | Letão | lv | Latn | | | | Lietuvių | Lituano | lt | Latn | | | | Македонски | Macedónio | mk | Cyrl | | | | Bahasa Melayu | Malaio | ms | Latn | | | | മലയാളം | Malaiala | ml | Mlym | | | | मराठी | Marati | mr | Deva | | | | नेपाली | Nepalês | ne | Deva | | | | Norsk | Norueguês | no | Latn | Bokmål | | | فارسی | Persa | fa | Arab | | | | Polski | Polaco | pl | Latn | | | | Português | Português | pt | Latn | Brasileiro | | | ਪੰਜਾਬੀ | Punjabi | pa | Guru | Gurmukhi | | | Română | Romeno | ro | Latn | | | | Русский | Russo | ru | Cyrl | | | | Русский (старая орфография) | Russo | ru-PETR1708 | Cyrl | Ortografia antiga | | | Српски | Sérvio | sr | Cyrl | | | | Српски (латиница) | Sérvio | sr-Latn | Latn | | | | Slovenčina | Eslovaco | sk | Latn | | | | Slovenščina | Esloveno | sl | Latn | | | | Español | Espanhol | es | Latn | Europeu | | | Svenska | Sueco | sv | Latn | | | | Tagalog | Tagalo | tl | Latn | | | | தமிழ் | Tamil | ta | Taml | | | | తెలుగు | Telugu | te | Telu | | | | ไทย | Tailandês | th | Thai | | | | Türkçe | Turco | tr | Latn | | | | Українська | Ucraniano | uk | Cyrl | | | | Tiếng Việt | Vietnamita | vi | Latn | | | | Yiddish | Iídiche | yi | Hebr | | |
Idiomas experimentais
Os seguintes idiomas estão em desenvolvimento ativo e ainda não são avaliados regularmente.
| Idioma | Idioma (nome em inglês) | Código languageHints | Script | Notas | | | ----------------------- | ----------------------- | -------------------- | ------ | ----------------- | | | አማርኛ | Amárico | am | Ethi | | | | Αρχαία ελληνικά | Grego antigo | grc | Grek | | | | অসমীয়া | Assamês | as | Beng | | | | Azərbaycan | Azeri | az | Latn | | | | Azərbaycan (qədim yazı) | Azeri | az-Cyrl | Cyrl | Ortografia antiga | | | Euskara | Basco | eu | Latn | | | | Bosanski | Bósnio | bs | Latn | | | | မြန်မာ | Birmanês | my | Mymr | | | | Cebuano | Cebuano | ceb | Latn | | | | ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | Cherokee | chr | Cher | | | | dhivehi, dhivehi-bas | Divehi | dv | Thaa | | | | རྫོང་ཁ | Dzonkha | dz | Tibt | | | | Esperanto | Esperanto | eo | Latn | | | | Galego | Galego | gl | Latn | | | | ქართული | Georgiana | ka | Geor | | | | Kreyòl Ayisyen | Crioulo haitiano | ht | Latn | | | | Gaeilge | Irlandês | ga | Latn | | | | Jawa | Javanês | jv | Latn | | | | Қазақ | Cazaque | kk | Cyrl | | | | Kirghiz | Quirguiz | ky | Cyrl | | | | Latine | Latim | la | Latn | | | | Malti | Maltês | mt | Latn | | | | Монгол | Mongol | mn | Cyrl | | | | ଓଡ଼ିଆ | Oriya | or | Orya | | | | پښتو | Pastó | ps | Arab | | | | संस्कृतम् | Sânscrito | sa | Deva | | | | සිංහල | Cingalês | si | Sinh | | | | Swahili | Suaíli | sw | Latn | | | | leššānā Suryāyā | Siríaco | syr | Syriac | | | | བོད་སྐད་ | Tibetano | bo | Tibt | | | | ትግርኛ | Tigrinya | ti | Ethi | | | | اردو | Urdu | ur | Arab | | | | oʻzbekcha | Usbeque | uz | Latn | Latim | | | oʻzbekcha | Usbeque | uz-Cyrl | Cyrl | Ortografia antiga | | | Cymraeg | Galês | cy | Latn | | | | IsiZulu | Zulu | zu | Latn | | |
Idiomas mapeados
Os seguintes idiomas estão mapeados para outro código de idioma ou para um reconhecedor de carateres geral.
| Idioma | Idioma (nome em inglês) | Código languageHints | Script | Notas | | | ------------------------------------------------- | ------------------------------- | -------------------- | --------- | --------------- | | | بهسا اچيه | Achém | ace | Latn | Modelo latino | | | Lwo | Acholi | ach | Latn | Modelo latino | | | Dangme | Adangme | ada | Latn | Modelo latino | | | Akan | Akan | ak | Latn | Modelo latino | | | Anicinâbemowin | Algonquinian | alg | Latn | Modelo latino | | | Mapudungu | Araucano/mapuche | arn | Latn | Modelo latino | | | Asturianu | Asturiano | ast | Latn | Modelo latino | | | Dene | Athabaskan | ath | Latn | Modelo latino | | | Aymar aru | Aimará | ay | Latn | Modelo latino | | | Bhāṣa Bali | Balinês | ban | Latn | Modelo latino | | | Bamanankan | Bambara | bm | Latn | Modelo latino | | | Narrow Bantu | Bantu | bnt | Latn | Modelo latino | | | башҡорт теле | Bashkir | ba | Cyrl | Modelo cirílico | | | Toba–Batak | Bataque | btk | Latn | Modelo latino | | | Chibemba | Bemba | bem | Latn | Modelo latino | | | Bikol Naga | Bikol | bik | Latn | Modelo latino | | | Bichelamar | Bislama | bi | Latn | Modelo latino | | | Brezhoneg | Bretão | br | Latn | Modelo latino | | | нохчийн мотт / noxçiyn mott | Checheno | ce | Cyrl | Modelo cirílico | | | 汉语 | Chinês (mandarim, simplificado) | zh-Hans | Hans | Modelo chinês | | | 漢語 | Chinês (mandarim, tradicional) | zh-Hant | Hant | Modelo chinês | | | 普通話 | Chinês (mandarim, Hong Kong) | zh-Hant-HK | Hant | Modelo chinês | | | Chahta' | Choctaw | cho | Latn | Modelo latino | | | Чӑвашла | Chuvache | cv | Cyrl | Modelo cirílico | | | Cree–Montagnais–Naskapi | Cree | cr | Latn | Modelo latino | | | Mvskoke | Riacho | mus | Latn | Modelo latino | | | qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh | Latn | Modelo cirílico | | | Dakhótiyapi, Dakȟótiyapi | Dacota | dak | Latn | Modelo latino | | | Douala | Duala | dua | Latn | Modelo latino | | | Ikɔ Efik | Efik | efi | Latn | Modelo latino | | | English (British) | Inglês (Reino Unido) | en-GB | Latn | Modelo latino | | | Èʋegbe | Ewe | ee | Latn | Modelo latino | | | føroyskt mál | Faroé | fo | Latn | Modelo latino | | | Na Vosa Vakaviti | Fijiano | fj | Latn | Modelo latino | | | fɔ̀ngbè | Fon | fon | Latn | Modelo latino | | | Français canadien | Francês (Canadá) | fr-CA | Latn | Modelo latino | | | Fulani, Fulah, Peul | Fula | ff | Latn | Modelo latino | | | Gã | Ga | gaa | Latn | Modelo latino | | | Luganda | Ganda | lg | Latn | Modelo latino | | | Basa Gayo | Gayo | gay | Latn | Modelo latino | | | Kiribati | Gilbertês | gil | Latn | Modelo latino | | | Gothic | Gótico | got | Latn | Modelo latino | | | Guaraní | Guarani | gn | Latn | Modelo latino | | | Harshen/Halshen Hausa هَرْشَن هَوْسَ | Haúça | ha | Latn | Modelo latino | | | ʻŌlelo Hawaiʻi | Havaiano | haw | Latn | Modelo latino | | | Otjiherero | Herero | hz | Latn | Modelo latino | | | Ilonggo | Hiligaynon | hil | Latn | Modelo latino | | | Jaku Iban | Iban | iba | Latn | Modelo latino | | | Asụsụ Igbo | Igbo | ig | Latn | Modelo latino | | | Ilokano | Ilocano | ilo | Latn | Modelo latino | | | Taqbaylit | Cabila | kab | Latn | Modelo latino | | | Jingpho | Kachin | kac | Latn | Modelo latino | | | Kalaallisut | Kalaallisut | kl | Latn | Modelo latino | | | Kikamba | Kikamba | kam | Latn | Modelo latino | | | Kanuri | Kanuri | kr | Latn | Modelo latino | | | Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Caracalpaque | kaa | Cyrl/Latn | Modelo cirílico | | | Ka Ktien Khasi | Khasi | kha | Latn | Modelo latino | | | Gĩkũyũ | Kikuyu | ki | Latn | Modelo latino | | | Kinyarwanda | Kinyarwanda | rw | Latn | Modelo latino | | | коми кыв | Komi | kv | Cyrl | Modelo cirílico | | | Kikongo | Conguês | kg | Latn | Modelo latino | | | Kosraean | Kosraean | kos | Latn | Modelo latino | | | Oshikwanyama | Cuanhama | kj | Latn | Modelo latino | | | Ngala | Lingala | ln | Latn | Modelo latino | | | Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds | Latn | Modelo latino | | | siLozi | Lozi | loz | Latn | Modelo latino | | | Kiluba | Luba-katanga | lu | Latn | Modelo latino | | | Dholuo | Luo | luo | Latn | Modelo latino | | | Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad | Latn | Modelo latino | | | Malagasy | Malgaxe | mg | Latn | Modelo latino | | | Mandinka, لغة مندنكا | Mandingo | man | Latn | Modelo latino | | | Gaelg, Gailck | Manquês | gv | Latn | Modelo latino | | | Te reo Māori | Maori | mi | Latn | Modelo latino | | | Ebon | Marshalês | mh | Latn | Modelo latino | | | Mɛnde yia | Mende | men | Latn | Modelo latino | | | Middle English | Inglês médio | enm | Latn | Modelo latino | | | Mittelhochdeutsch | Alto-alemão médio | gmh | Latn | Modelo latino | | | Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min | Latn | Modelo latino | | | Kanienʼkéha | Mohawk | moh | Latn | Modelo latino | | | Nkundu | Mongo | lol | Latn | Modelo latino | | | Nāhuatl | Nauatle | nah | Latn | Modelo latino | | | Diné bizaad | Navajo | nv | Latn | Modelo latino | | | Ndonga | Ndonga | ng | Latn | Modelo latino | | | ko e vagahau Niuē | Niueano | niu | Latn | Modelo latino | | | Zimbabwe Ndebele | Ndebele do norte | nd | Latn | Modelo latino | | | Sesotho sa Leboa | Soto do Norte | nso | Latn | Modelo latino | | | Chichewa, Chinyanja | Nianja | ny | Latn | Modelo latino | | | Runyankore | Nyankole | nyn | Latn | Modelo latino | | | Chitonga | Nyasa tonga | tog | Latn | Modelo latino | | | Appolo | Nzima | nzi | Latn | Modelo latino | | | Occitan, lenga d'òc, provençal | Occitânico | oc | Latn | Modelo latino | | | Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojíbua | oj | Latn | Modelo latino | | | Ænglisc, Englisc, Anglisc | Inglês antigo | ang | Latn | Modelo latino | | | Franceis, François, Romanz | Francês antigo | fro | Latn | Modelo latino | | | Diutisk, Althochdeutsch | Alto-alemão antigo | goh | Latn | Modelo latino | | | Dǫnsk tunga | Nórdico antigo | non | Latn | Modelo latino | | | Occitan ancian | Provençal antigo | pro | Latn | Modelo latino | | | ирон ӕвзаг | Osseta | os | Cyrl | Modelo cirílico | | | Kapampangan | Pampanga | pam | Latn | Modelo latino | | | Salitan Pangasinan | Pangasinês | pag | Latn | Modelo latino | | | Papiamentu | Papiamento | pap | Latn | Modelo latino | | | Português (Portugal) | Português (europeu) | pt-PT | Latn | Modelo latino | | | Kechua / Runa Simi | Quíchua | qu | Latn | Modelo latino | | | Rumantsch | Romanche | rm | Latn | Modelo latino | | | Romani čhib | Romani | rom | Latn | Modelo latino | | | Ikirundi | Rundi | rn | Latn | Modelo latino | | | Sakha | Sakha | sah | Cyrl | Modelo cirílico | | | Gagana faʻa Sāmoa | Samoano | sm | Latn | Modelo latino | | | yângâ tî sängö | Sango | sg | Latn | Modelo latino | | | (Braid) Scots, Lallans, Doric | Escocês | sco | Latn | Modelo latino | | | Gàidhlig | Gaélico Escocês | gd | Latn | Modelo latino | | | chiShona | Shona | sn | Latn | Modelo latino | | | Songhay | Songai | son | Latn | Modelo latino | | | Sesotho | Sesoto | st | Latn | Modelo latino | | | Español (Latinoamérica) | Espanhol (latino-americano) | es-419 | Latn | Modelo latino | | | ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su | Latn | Modelo latino | | | siSwati | Suazi | ss | Latn | Modelo latino | | | Reo Tahiti | Taitiano | ty | Latn | Modelo latino | | | тоҷикӣ | Tajique | tg | Cyrl | Modelo cirílico | | | татар теле | Tártaro | tt | Cyrl/Latn | Modelo cirílico | | | KʌThemnɛ | Temne | tem | Latn | Modelo latino | | | lea faka-Tonga | Tonga | to | Latn | Modelo latino | | | Xitsonga | Tsonga | ts | Latn | Modelo latino | | | Setswana | Tsuana | tn | Latn | Modelo latino | | | Türkmençe | Turcomenistão | tk | Latn | Modelo cirílico | | | удмурт кыл | Udmurte | udm | Cyrl | Modelo cirílico | | | Tshivenḓa | Venda | ve | Latn | Modelo latino | | | Vod | Vótico | vot | Cyrl/Latn | Modelo cirílico | | | Frysk | Frísico ocidental | fy | Latn | Modelo latino | | | Wolof | Jalofo | wo | Latn | Modelo latino | | | isiXhosa | Xhosa | xh | Latn | Modelo latino | | | Èdè Yorùbá | Iorubá | yo | Latn | Modelo latino | | | Diidxazá | Zapoteca | zap | Latn | Modelo latino | |
Scripts de escrita manual
Os seguintes scripts são suportados para o reconhecimento de escrita manual. Consulte as tabelas de idiomas acima para ver os idiomas que usam cada escrita.
| Script | Nome | Nível de apoio técnico |
|---|---|---|
| Beng | Bengali | Experimental |
| Cyrl | Cirílico | Experimental |
| Deva | Devanagari | Experimental |
| Grek | Grego | Experimental |
| Hani | Chinês | Experimental |
| Jpan | Japonês | Suportado |
| Kore | Coreano | Suportado |
| Latn | Latim | Suportado |
| vi | Vietnamita | Experimental |