Индексация в поисковых системах | это... Что такое Индексация в поисковых системах? (original) (raw)
Индексирование в поисковых системах — процесс добавления сведений (о сайте) роботом поисковой машины в базу данных, впоследствии использующуюся для (полнотекстового) поиска информации на проиндексированных сайтах.
В сведения о сайте чаще всего входят ключевые слова (алгоритм определения ключевых слов зависит от поисковой системы), статьи, ссылки, документы, также могут индексироваться изображения и т. д.
Существуют некоторые ограничения на типы индексируемых данных (java script, flash файлы).
Для управления индексацией (например, запрета индексации той или иной страницы) используется файл robots.txt и такие директивы как Disallow, Allow, User-agent, Crawl-delay и другие. Также, для управления индексацией применяют теги и атрибут , закрывающие содержимое сайта от роботов Яндекса и Google соответственно (Yahoo использует тег ).
Методы
- Латентно-семантическое индексирование
- Вероятностное латентно-семантическое индексирование