Lucene | это... Что такое Lucene? (original) (raw)
Apache Lucene
![]() |
|
---|---|
Тип | поиск и программирование |
Разработчик | Apache Software Foundation |
Написана на | Java |
Операционная система | кроссплатформный |
Последняя версия | 3.6 (12 апреля 2012) |
Лицензия | Apache Software License |
Сайт | lucene.apache.org |
The Apache Lucene — это свободная библиотека для высокоскоростного полнотекстового поиска, написанная на Java. Может быть использована для поиска в интернете и других областях компьютерной лингвистики (аналитическая философия).
Основные возможности
- Масштабируемая и высокоскоростная индексация
- свыше 95GB в час на современном оборудовании
- требуется малый объем RAM — «heap» всего 1MB
- размер индекса примерно 20-30 % от размера исходного текста
- Мощный, точный и эффективный поисковый алгоритм
- ранжированный поиск — лучшие результаты показываются первыми
- множество мощных типов запросов: запрос фразы, wildcard запросы, поиск интервалов и т. д.
- поиск основанный на «полях» (таких как, заголовок, автор, текст)
- возможность сортировать по различным полям
- multiple-index поиск с возможностью объединения результатов
- возможность одновременного поиска и обновления индекса
- кроссплатформное решение
- исходный код полностью написан на Java
- наличие портов на другие языки программирования
Порты на другие языки
Lucene портирована на другие языки программирования:
- Lucene4c — C
- CLucene — C++
- MUTIS — Delphi
- Plucene — Perl
- Kinosearch — Perl
- PyLucene (Wrapper — not port) — Python
- Ferret и RubyLucene — Ruby
- Zend_Lucene — PHP
- Montezuma — Lisp
- Lucene.Net — C#
Ссылки
- The Apache Lucene
- Lucene API
- Lucene FAQ
- Формат файлов
- Как начать
- Синтаксис запросов
- Scoring
- Lucene Wiki
- Краткий курс на русском
- Solr-Lucene FAQ
Литература
- Erik Hatcher and Otis Gospodnetic, «Lucene in Action», Manning, ISBN 1-932394-28-1
![]() |
|
---|---|
Проекты верхнего уровня | ActiveMQ • Ant • Apache HTTP Server • APR • Beehive • Cassandra • Cayenne • Camel • Commons • Cocoon • CouchDB • DB • Directory • Excalibur • Forrest • Geronimo • Gump • Hadoop • Harmony • HBase • HiveMind • HttpComponents • iBATIS • Jackrabbit • James • JMeter • Lenya • Maven • Mina • mod perl • MyFaces • Nutch • OFBiz • OpenOffice.org • POI • Portals • Santuario • ServiceMix • Shale • Shiro • SpamAssassin • Struts • Subversion • Tapestry • Tcl • Tomcat • Turbine • Velocity • WebWork 2 • Wicket • Xalan • Xerces • XMLBeans |
Подпроекты | Apache Commons BCEL • BSF • JCS Apache Lucene Lucene Java • Lucene4c • Lucy• Solr Apache DB Derby • Torque • DdlUtils • OJB • JDO |
Apache Web Services | Axis • Axis2 • CXF • WS-Commons • EWS • JaxMe • jUDDI • Kandula • Mirae • Muse • Pubscribe • Sandesha • Scout • SOAP • Synapse • TSIK • Tuscany • Woden • WSIF • WSRF • WSS4J • XML-RPC |
Другие проекты | Batik • FOP •Log4j |
Развивающиеся проекты (Incubator) | XAP • River • OpenEJB • OpenJPA • Graffito • Tuscany • Log4Net • Roller • Felix • Abdera • CeltiXfire • FtpServer • Heraldry • Ivy • JuiCE • Kabuki • Lokahi • Lucene.Net • mod_ftp • NMaven • Ode • stdcxx • Woden • WSRP4J • Yoko • WADI • Qpid • stdcxx • TripleSoup • UIMA• Adobe Flex |
Списанные проекты (Attic) | AxKit • Cactus • ECS • Jakarta • ORO • Regexp • Slide • Taglibs |
Лицензия: Лицензия Apache • Сайт: apache.org |
![]() |
|
---|---|
Общие | Ask.com (Ask Jeeves, механизм Teoma) • Blekko • Cuil (закрыт) • DuckDuckGo • Exalead • Gigablast • Google • Bing (Live Search/MSN Search) • Yahoo! Search (Inktomi • AltaVista • Alltheweb) • Яндекс |
Региональные | Accoona (Китай/США) • Alleba (Филиппины) • Ansearch (Австралия/США/Великобритания/Новая Зеландия) • Апорт (Россия) • Daum (Юж. Корея) • Guruji.com (Индия) • Поиск@Mail.Ru (Россия) • Maktoob (Бл. Восток) • Meta.ua (Украина) • Miner.hu (Венгрия) • Najdi.si (Словения) • Onkosh (Бл. Восток) • Рамблер (Россия) • Rediff (Индия) • SAPO (Португалия) • Search.ch (Швейцария) • Sesam (Норвегия/Швеция) • Walla! (Израиль) |
…лидеры | Baidu (Китай) • Naver (Юж. Корея) • Seznam (Чехия) • Yahoo! Japan (Япония) • Яндекс (Россия, СНГ, Турция) |
Тематические | TinEye • Lexxe • Topsy • FindBook.ru |
Метапоиск | AskNet.ru • Brainboost • Clusty • Dogpile • FarSEER • exactus.ru • Excite • HotBot • Info.com • Ixquick • Krozilo • Mamma • Metacrawler • MetaLib • Нигма • Myriad Search • SideStep • Surfwax • Turbo10 • WebCrawler • GlobalFileSearch |
Открытые / свободные | DataparkSearch • Egothor • Gonzui • Grub • Ht://dig • locust • Isearch • Lucene • Lemur Toolkit & Indri Search Engine • mnoGoSearch • Namazu • Nutch • OpenFTS • Sciencenet (научная, на технологии YaCy) • Wikia Search • Sphinx • SWISH-E • Terrier Search Engine • Xapian • YaCy • Zettair |
Детские | AGAKIDS (Россия) • Ask Kids (Великобритания) • Frag Finn (Германия) • Kids AOL (США) • Kids Yahoo! (США) • Quintura Дети (Россия) • Семейный Яндекс (Россия) • Гогуль (Россия) |