Tesseract (software) (original) (raw)

Το Tesseract (μτφ. τεσσεράκτιο) είναι λογισμικό οπτικής αναγνώρισης χαρακτήρων διαθέσιμο σε διάφορα λειτουργικά συστήματα. Διατίθεται ως ελεύθερο λογισμικό υπό την άδεια έκδοση 2.0 από το 2006 συντηρείται από την Google.Αποτελεί μια από τις πλέον ακριβείς μηχανές αναγνώρισης οπτικών χαρακτήρων και έχει ευρεία χρησιμοποίηση σε πλήθος εφαρμογών.

Property	Value
dbo:abstract	Tesseract ist eine freie Software zur Texterkennung. Schwerpunkt ist die Erkennung von Textzeichen bzw. Textzeilen, aber auch die Zerlegung eines Textes in Textblöcke (Layoutanalyse) kann Tesseract übernehmen. Zur Verbesserung der Erkennungsraten verwendet Tesseract Sprachmodelle wie beispielsweise Wörterbücher. Für weit mehr als 100 Sprachen und Sprachvarianten sind bereits Texterkennungsdaten in Zusatzmodulen vorhanden. Tesseract unterstützt dabei nicht nur lateinische Antiqua-Schriften, sondern auch Fraktur-Schrift, Devanagari (indische Schrift), chinesische, arabische, griechische, hebräische, kyrillische und weitere Schriften. (de) Το Tesseract (μτφ. τεσσεράκτιο) είναι λογισμικό οπτικής αναγνώρισης χαρακτήρων διαθέσιμο σε διάφορα λειτουργικά συστήματα. Διατίθεται ως ελεύθερο λογισμικό υπό την άδεια έκδοση 2.0 από το 2006 συντηρείται από την Google.Αποτελεί μια από τις πλέον ακριβείς μηχανές αναγνώρισης οπτικών χαρακτήρων και έχει ευρεία χρησιμοποίηση σε πλήθος εφαρμογών. (el) Tesseract es un motor de reconocimiento óptico de caracteres para varios sistemas operativos. Es software libre, liberado bajo la licencia Apache, Versión 2.0 y su desarrollo es financiado por Google desde el 2006. Tesseract fue considerado en 2006 como uno de los motores de OCR de código abierto más precisos disponibles. (es) Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache. Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement.Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues. (fr) Dalam perangkat lunak komputer, Tesseract adalah mesin pengenal karakter optik gratis. Tesseract pada awalnya dikembangkan sebagai perangkat lunak berpemilik di Hewlett-Packard antara tahun 1985 hingga 1995. Setelah sepuluh tahun tanpa perkembangan apapun yang terjadi, Hewlett Packard dan merilis Tesseract sebagai sumber terbuka pada tahun 2005. Tesseract saat ini sedang dikembangkan oleh Google dan dirilis di bawah Lisensi Apache, Version 2.0. Tesseract dianggap salah satu perangkat lunak mesin OCR bebas yang paling akurat yang tersedia saat ini. (in) Tesseract is an optical character recognition engine for various operating systems. It is free software, released under the Apache License. Originally developed by Hewlett-Packard as proprietary software in the 1980s, it was released as open source in 2005 and development has been sponsored by Google since 2006. In 2006, Tesseract was considered one of the most accurate open-source OCR engines available. (en) Tesseract è un software libero per il riconoscimento ottico dei caratteri (OCR) . (it) 테서랙트(Tesseract)는 다양한 운영 체제를 위한 광학 문자 인식 엔진이다. 이 소프트웨어는 Apache License, 버전 2.0,에 따라 배포되는 무료 소프트웨어이며 2006년부터 Google에서 개발을 후원했다. 2006년 테서랙트는 당시 가장 정확한 오픈 소스 OCR 엔진 중 하나로 간주되었다. (ko) Tesseract (テッセラクト)は、さまざまなオペレーティングシステム上で動作する光学式文字認識エンジン。名称のTesseractとは四次元超立方体の意である。Apache Licenseの下でリリースされたフリーソフトウェアである。文字認識を行うライブラリと、それを用いたコマンドラインインターフェイスを持つ。もともとは1980年代にプロプライエタリソフトウェアとしてヒューレット・パッカードが開発していたが、2005年にオープンソースとしてリリースされ、開発は2006年からGoogleが後援している。 2006年、Tesseractは当時入手可能な最も正確なオープンソースOCRエンジンの1つと見なされた。 (ja) Tesseract is een vrij computerprogramma voor optical character recognition. Het werd oorspronkelijk ontwikkeld tussen 1985 en 1995 in licentie door Hewlett-Packard. Na tien jaren zonder dat er enige ontwikkeling was, hebben Hewlett Packard en de (Las Vegas) het in 2005 vrijgegeven als open source. Tesseract wordt tegenwoordig ontwikkeld door Google en uitgegeven onder de Apache-licentie 2.0. Tesseract wordt beschouwd als een van de meest nauwkeurige vrije OCR-softwaremachines die tegenwoordig beschikbaar zijn. (nl) Tesseract (с англ. — «тессеракт», от др.-греч. τέσσαρες ἀκτῖνες — «четыре луча») — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей. (ru) Tesseract é um software de reconhecimento ótico de caracteres de código aberto (Licença Apache 2.0), originalmente desenvolvido pela Hewlett-Packard e foi por um tempo mantido pelo Google; atualmente o projeto está hospedado no GitHub. Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna. (pt) Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett-Packard з 1985 до 1994 року, а в наступне десятиріччя залишалася практично без змін. Не так давно Google купив[джерело?] її та відкрив початковий код під ліцензією Apache 2.0 у 2006 році. для продовження розробки. У цей час програма вже працює з UTF-8, розпізнає багато мов, серед яких і українська. (uk) Tesseract是一个光学字符识别引擎，支持多种操作系统。Tesseract是基于Apache许可证的自由软件，自2006 年起由Google赞助开发。 2006年，Tesseract被认为是最精准的开源光学字符识别引擎之一。 (zh)
dbo:author	dbr:Hewlett-Packard
dbo:developer	dbr:Google
dbo:genre	dbr:Optical_character_recognition
dbo:language	dbr:Catalan_language dbr:Romanian_language dbr:Basque_language dbr:Belarusian_language dbr:Bengali_language dbr:Hungarian_language dbr:Lithuanian_language dbr:Ukrainian_language dbr:Afrikaans_language dbr:Croatian_language dbr:Russian_language dbr:English_language dbr:French_language dbr:Galician_language dbr:German_language dbr:Greek_language dbr:Arabic_language dbr:Macedonian_language dbr:Malay_language dbr:Maltese_language dbr:Slovak_language dbr:Slovenian_language dbr:Azerbaijani_language dbr:Bulgarian_language dbr:Turkish_language dbr:Albanian_language dbr:Czech_language dbr:Danish_language dbr:Dutch_language dbr:Esperanto_language dbr:Estonian_language dbr:Finnish_language dbr:Norwegian_language dbr:Hebrew_language dbr:Hindi_language dbr:Italian_language dbr:Japanese_language dbr:Tamil_language dbr:Telugu_language dbr:Thai_language dbr:Cherokee_language dbr:Kannada_language dbr:Latvian_language dbr:Swahili_language dbr:Swedish_language dbr:Tagalog_language dbr:Polish_language dbr:Portuguese_language dbr:Spanish_language dbr:Indonesian_language dbr:Korean_language dbr:Serbian_language dbr:Malayalam_language
dbo:license	dbr:Apache_License_2.0
dbo:operatingSystem	dbr:Linux dbr:MacOS dbr:Microsoft_Windows
dbo:programmingLanguage	dbr:C++ dbr:C_(programming_language)
dbo:thumbnail	wiki-commons:Special:FilePath/Tesseractv411_light.png?width=300
dbo:wikiPageExternalLink	https://github.com/tesseract-ocr
dbo:wikiPageID	6882267 (xsd:integer)
dbo:wikiPageLength	16217 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1123102903 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Catalan_language dbr:Romanian_language dbr:Basque_language dbr:Belarusian_language dbr:Bengali_language dbr:Brewster_Kahle dbr:Hungarian_language dbr:Lithuanian_language dbr:Ubuntu_(operating_system) dbr:Ukrainian_language dbr:University_of_Nevada,_Las_Vegas dbr:Vietnamese_language dbr:Afrikaans_language dbc:Software_using_the_Apache_license dbr:Command-line_interface dbr:Croatian_language dbr:Russian_language dbr:Optical_character_recognition dbr:English_language dbr:French_language dbr:GIMP dbr:Galician_language dbr:German_language dbr:Google dbr:Greek_language dbr:Greeley,_Colorado dbr:Monospaced_font dbr:Apache_License dbr:Arabic_language dbr:Libtiff dbr:Linux dbr:MacOS dbr:Mac_OS_X dbr:Macedonian_language dbr:Malay_language dbr:Maltese_language dbr:Slovak_language dbr:Slovenian_language dbr:Azerbaijani_language dbc:Free_software_programmed_in_C dbr:Bristol,_England dbr:Bulgarian_language dbr:C++ dbr:C_(programming_language) dbr:Turkish_language dbr:HOCR dbr:Linux_Journal dbr:X-height dbr:Albanian_language dbc:Formerly_proprietary_software dbc:Free_software_programmed_in_C++ dbc:HP_software dbr:Czech_language dbr:Danish_language dbr:Dutch_language dbr:Esperanto_language dbr:Estonian_language dbr:Finnish_language dbr:Fraktur dbr:Norwegian_language dbr:Hebrew_language dbr:Hewlett-Packard dbr:Hewlett_Packard dbr:Hindi_language dbr:Internet_Archive dbr:Italian_language dbr:Japanese_language dbr:Tamil_language dbr:Telugu_language dbr:Thai_language dbc:Google_software dbc:Optical_character_recognition_software dbr:Cherokee_language dbr:Kannada_language dbr:Latin_script dbr:Latvian_language dbr:Binary_image dbr:Swahili_language dbr:Swedish_language dbr:Tagalog_language dbr:High-pass_filter dbr:Writing_system dbr:CJK_characters dbr:Polish_language dbr:Portuguese_language dbr:Spanish_language dbr:Free_software dbr:Indonesian_language dbr:Korean_language dbr:Microsoft_Windows dbr:Netpbm dbr:OCRFeeder dbr:OCRopus dbr:Serbian_language dbr:Long_short-term_memory dbr:Screenshot dbr:Image_scaling dbr:Apache_License_2.0 dbr:Malayalam_language dbr:Right-to-left_text dbr:File:Tesseract_on_ocrfeeder.png dbr:Leptonica
dbp:author	Ray Smith, Hewlett-Packard (en)
dbp:caption	Tesseract 4.1.1 reading an image. (en)
dbp:developer	Google and others (en)
dbp:genre	dbr:Optical_character_recognition
dbp:language	Interface: English (en) Recognition: Afrikaans, Albanian, Arabic, Azerbaijani, Basque, Belarusian, Bengali, Bulgarian, Catalan, Czech, Cherokee, Croatian, Danish, Dutch, English, Esperanto, Estonian, Finnish, French, Galician, German, Greek, Hindi, Hebrew, Hungarian, Indonesian, Italian, Japanese, Kannada, Korean, Latvian, Lithuanian, Malayalam, Macedonian, Maltese, Malay, Norwegian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tagalog, Tamil, Telugu, Thai, Turkish, Ukrainian & Vietnamese (en)
dbp:license	dbr:Apache_License_2.0
dbp:logoSize	250 (xsd:integer)
dbp:name	Tesseract (en)
dbp:operatingSystem	Linux, Windows, and macOS (en)
dbp:programmingLanguage	C and C++ (en)
dbp:screenshot	File:Tesseractv411_light.png (en)
dbp:screenshotSize	250 (xsd:integer)
dbp:wikiPageUsesTemplate	dbt:Blockquote dbt:Citation_needed dbt:Commons_category dbt:Infobox_software dbt:Reflist dbt:Short_description dbt:Wikidata dbt:Google_FOSS dbt:OCR
dbp:wordnet_type	http://www.w3.org/2006/03/wn/wn20/instances/synset-software-noun-1
dcterms:subject	dbc:Software_using_the_Apache_license dbc:Free_software_programmed_in_C dbc:Formerly_proprietary_software dbc:Free_software_programmed_in_C++ dbc:HP_software dbc:Google_software dbc:Optical_character_recognition_software
gold:hypernym	dbr:Engine
rdf:type	owl:Thing dbo:Software schema:CreativeWork dbo:Work wikidata:Q386724 wikidata:Q7397 yago:Abstraction100002137 yago:Code106355894 yago:CodingSystem106353757 yago:Communication100033020 yago:Writing106359877 yago:WrittenCommunication106349220 yago:Software106566077
rdfs:comment	Το Tesseract (μτφ. τεσσεράκτιο) είναι λογισμικό οπτικής αναγνώρισης χαρακτήρων διαθέσιμο σε διάφορα λειτουργικά συστήματα. Διατίθεται ως ελεύθερο λογισμικό υπό την άδεια έκδοση 2.0 από το 2006 συντηρείται από την Google.Αποτελεί μια από τις πλέον ακριβείς μηχανές αναγνώρισης οπτικών χαρακτήρων και έχει ευρεία χρησιμοποίηση σε πλήθος εφαρμογών. (el) Tesseract es un motor de reconocimiento óptico de caracteres para varios sistemas operativos. Es software libre, liberado bajo la licencia Apache, Versión 2.0 y su desarrollo es financiado por Google desde el 2006. Tesseract fue considerado en 2006 como uno de los motores de OCR de código abierto más precisos disponibles. (es) Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache. Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement.Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues. (fr) Dalam perangkat lunak komputer, Tesseract adalah mesin pengenal karakter optik gratis. Tesseract pada awalnya dikembangkan sebagai perangkat lunak berpemilik di Hewlett-Packard antara tahun 1985 hingga 1995. Setelah sepuluh tahun tanpa perkembangan apapun yang terjadi, Hewlett Packard dan merilis Tesseract sebagai sumber terbuka pada tahun 2005. Tesseract saat ini sedang dikembangkan oleh Google dan dirilis di bawah Lisensi Apache, Version 2.0. Tesseract dianggap salah satu perangkat lunak mesin OCR bebas yang paling akurat yang tersedia saat ini. (in) Tesseract is an optical character recognition engine for various operating systems. It is free software, released under the Apache License. Originally developed by Hewlett-Packard as proprietary software in the 1980s, it was released as open source in 2005 and development has been sponsored by Google since 2006. In 2006, Tesseract was considered one of the most accurate open-source OCR engines available. (en) Tesseract è un software libero per il riconoscimento ottico dei caratteri (OCR) . (it) 테서랙트(Tesseract)는 다양한 운영 체제를 위한 광학 문자 인식 엔진이다. 이 소프트웨어는 Apache License, 버전 2.0,에 따라 배포되는 무료 소프트웨어이며 2006년부터 Google에서 개발을 후원했다. 2006년 테서랙트는 당시 가장 정확한 오픈 소스 OCR 엔진 중 하나로 간주되었다. (ko) Tesseract (テッセラクト)は、さまざまなオペレーティングシステム上で動作する光学式文字認識エンジン。名称のTesseractとは四次元超立方体の意である。Apache Licenseの下でリリースされたフリーソフトウェアである。文字認識を行うライブラリと、それを用いたコマンドラインインターフェイスを持つ。もともとは1980年代にプロプライエタリソフトウェアとしてヒューレット・パッカードが開発していたが、2005年にオープンソースとしてリリースされ、開発は2006年からGoogleが後援している。 2006年、Tesseractは当時入手可能な最も正確なオープンソースOCRエンジンの1つと見なされた。 (ja) Tesseract is een vrij computerprogramma voor optical character recognition. Het werd oorspronkelijk ontwikkeld tussen 1985 en 1995 in licentie door Hewlett-Packard. Na tien jaren zonder dat er enige ontwikkeling was, hebben Hewlett Packard en de (Las Vegas) het in 2005 vrijgegeven als open source. Tesseract wordt tegenwoordig ontwikkeld door Google en uitgegeven onder de Apache-licentie 2.0. Tesseract wordt beschouwd als een van de meest nauwkeurige vrije OCR-softwaremachines die tegenwoordig beschikbaar zijn. (nl) Tesseract (с англ. — «тессеракт», от др.-греч. τέσσαρες ἀκτῖνες — «четыре луча») — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей. (ru) Tesseract é um software de reconhecimento ótico de caracteres de código aberto (Licença Apache 2.0), originalmente desenvolvido pela Hewlett-Packard e foi por um tempo mantido pelo Google; atualmente o projeto está hospedado no GitHub. Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna. (pt) Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett-Packard з 1985 до 1994 року, а в наступне десятиріччя залишалася практично без змін. Не так давно Google купив[джерело?] її та відкрив початковий код під ліцензією Apache 2.0 у 2006 році. для продовження розробки. У цей час програма вже працює з UTF-8, розпізнає багато мов, серед яких і українська. (uk) Tesseract是一个光学字符识别引擎，支持多种操作系统。Tesseract是基于Apache许可证的自由软件，自2006 年起由Google赞助开发。 2006年，Tesseract被认为是最精准的开源光学字符识别引擎之一。 (zh) Tesseract ist eine freie Software zur Texterkennung. Schwerpunkt ist die Erkennung von Textzeichen bzw. Textzeilen, aber auch die Zerlegung eines Textes in Textblöcke (Layoutanalyse) kann Tesseract übernehmen. Zur Verbesserung der Erkennungsraten verwendet Tesseract Sprachmodelle wie beispielsweise Wörterbücher. (de)
rdfs:label	Tesseract (Software) (de) Tesseract (λογισμικό) (el) Tesseract OCR (es) Tesseract (perangkat lunak) (in) Tesseract (logiciel) (fr) Tesseract (software) (it) 테서랙트 (ko) Tesseract (ソフトウェア) (ja) Tesseract (software) (nl) Tesseract (ru) Tesseract (software) (pt) Tesseract (software) (en) Tesseract (zh) Tesseract (uk)
owl:sameAs	freebase:Tesseract (software) wikidata:Tesseract (software) dbpedia-de:Tesseract (software) dbpedia-el:Tesseract (software) dbpedia-es:Tesseract (software) dbpedia-fa:Tesseract (software) dbpedia-fr:Tesseract (software) http://hi.dbpedia.org/resource/टेसरैक्ट dbpedia-id:Tesseract (software) dbpedia-it:Tesseract (software) dbpedia-ja:Tesseract (software) dbpedia-ko:Tesseract (software) dbpedia-nl:Tesseract (software) dbpedia-pt:Tesseract (software) dbpedia-ru:Tesseract (software) dbpedia-tr:Tesseract (software) dbpedia-uk:Tesseract (software) dbpedia-zh:Tesseract (software) https://global.dbpedia.org/id/5661h
prov:wasDerivedFrom	wikipedia-en:Tesseract_(software)?oldid=1123102903&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Tesseract_on_ocrfeeder.png wiki-commons:Special:FilePath/Tesseractv411_light.png
foaf:isPrimaryTopicOf	wikipedia-en:Tesseract_(software)
foaf:name	Tesseract (en)
is dbo:wikiPageDisambiguates of	dbr:Tesseract_(disambiguation)
is dbo:wikiPageRedirects of	dbr:Google_Tesseract dbr:Tesseract_OCR
is dbo:wikiPageWikiLink of	dbr:Indic_OCR dbr:Timeline_of_optical_character_recognition dbr:Optical_character_recognition dbr:Google_Tesseract dbr:Apache_Tika dbr:Comparison_of_optical_character_recognition_software dbr:HOCR dbr:Advanced_Vector_Extensions dbr:PDF24_Creator dbr:List_of_GTK_applications dbr:Ray_Smith dbr:Audiveris dbr:Tesseract_(disambiguation) dbr:Xena_(software) dbr:Tesseract_OCR dbr:OCRFeeder dbr:OCRopus dbr:OpenALPR dbr:Open_Source_Judaism
is foaf:primaryTopic of	wikipedia-en:Tesseract_(software)