Google (поисковая система) | это... Что такое Google (поисковая система)? (original) (raw)

Google (поисковая система)

У этого термина существуют и другие значения, см. Google.

Google (произносится /ˈguːgl/, «гугл») — первая по популярности (77,04 %[1]) в мире поисковая система, обрабатывающей 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %).[2][3]

Поисковой системой Google владеет корпорация Google Inc.

Лидер поисковых машин интернета, Google занимает более 60 % мирового рынка и индексирует более 8 миллиардов веб-страниц. Google может находить информацию на 186 языках (на 15 октября 2009).

Google поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.

Содержание

История создания

Поисковая система Google была создана в качестве учебного проекта студентов Стендфорского университета Лари Пейджа и Сергея Брина. Они в 1995 году работали над поисковой системой BackRub, а в 1998 году на её основе создали поисковую систему Google.

Индексация сайтов

Поисковый робот Google имеет User Agent — Googlebot, робот индексирующий сайты для мобильных устройств — Googlebot-Mobile, поисковой робот нового аппаратно-программного комплекса Search Appliance — Google Search Appliance (Google) gsa-crawler[4].

Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти.

Проблемы с авторскими правами

KaZaA и церковь сайентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах якобы защищённые авторским правом.[5][6] Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.[6]

New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права.[7] Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования через файл robots.txt, который является механизмом, который позволяет операторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска, или через мета-теги, которые позволяют редактору контента указать, можно ли индексировать или архивировать документ, и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field v. Google и Parker v. Google.[8][9]

Алгоритм ранжирования

Мета тег Keywords не учитывается при ранжировании сайтов[10].

Google использует алгоритм расчёта авторитетности страницы PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.

Поисковые запросы

Синтаксис запросов

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» даст все статьи Википедии на всех языках, в заголовке которых встречается слово Google.[11][12][13]

Описание операторов и встроенных функций расширенного поиска: общая страница; операторы и функции расширенного поиска; Advanced Operators (подробное описание операторов на английском); «шпаргалка» по языку поисковых запросов Google;

Поиск в найденном

Для некоторых результатов поиска Google предоставляет повторное поле для поиска, которое позволяет пользователю найти то, что он ищет внутри конкретного вебсайта. Эта идея возникла из того, как пользователи использовали поиск. По словам инженера-программиста Бена Ли (Ben Lee) и менеджера продукта Джека Менцеля (Jack Menzel) «телепортирование» в сети — это как раз то, что помогает пользователям Google завершить свой поиск. Google развил эту концепцию на шаг вперёд, и вместо просто «телепортирования», что значит для поиска нужного сайта пользователю достаточно ввести часть имени вебсайта в Google (необязательно помнить весь адрес), пользователи могут вводить ключевые слова для поиска внутри выбранного сайта.[14] Оказалось, что пользователям часто нелегко найти то, что они ищут внутри корпоративного сайта.

Несмотря на то, что пользователям в новинку этот поисковый инструмент, он вызвал разногласия среди некоторых издательств и дистрибьюторов. На страницах результатов поиска Google отображаются платные (pay per click) рекламные объявления конкурирующих компаний, которые основывают рекламные объявления на брендах.[15] «В то время как сервис мог бы помочь увеличить трафик, некоторые пользователи „сливаются“, так как Google использует известность брендов для продажи рекламных объявлений, как правило, конкурирующим компаниям.»[16] Чтобы сгладить этот конфликт Google предложил отключать эту возможность для желающих компаний.[16]

Примечания

  1. По данным компании Net Applications в декабре 2007 года рыночная доля Google в мире составляла 77,04 %, Yahoo — 12,46 %, MSN — 3,33 %, Microsoft Live Search — 2,57 %, AOL — 2,12 %, Ask — 1,38 %, AltaVista — 0,13 %, Excite — 0,07 %, Lycos — 0,02 %, All the Web — 0,02 %
  2. http://www.comscore.com/press/release.asp?press=2018
  3. http://habrahabr.ru/blog/yandex/34614.html
  4. Роботы Google
  5. Technology News: News: Google Pulls P2P Links Over Kazaa Copyright Claims
  6. 1 2 New Economy; A copyright dispute with the Church of Scientology is forcing Google to do some creative linking. — New York Times
  7. Google cache raises copyright concerns — CNET News.com
  8. Case No. CV-S-04-0413-RCJ-LRL. United States District Court (District of Nevada). Filed on January 19, 2006. Retrieved on July 7, 2006.
  9. Case No. 04-CV-3918. United States District Court (Eastern District of Pennsylvania). March 10, 2006. Retrieved on July 7, 2006.
  10. Google отказался от мета тега Keywords
  11. http://www.google.com/search?q=intitle:google+site:wikipedia.org
  12. Поисковые операторы Google,Таблица операторов Google
  13. Официальный справочник на английском языке
  14. Regan, Keith. "Google's Search-Within-Search Draws Scutiny", E-Commerce Times (2008-03-24).
  15. Stamoulis, Nick. "Why Companies Are Upset With Google's Search-Within-Search", Search Engine Optimization Journal (2008-03-24).
  16. 1 2 Tedeschi, Bob. A New Tool From Google Alarms Sites, New York Times (2008-03-24).

См. также

Ссылки

Google Inc.
Председатель совета директоров/CEO: Эрик ШмидтДиректор/президент по технологиям: Сергей БринДиректор/президент по продуктам компании: Лэрри Пэйдж
Реклама Adscape • AdSense • Advertising Professional • AdWordsAnalyticsCheckout • Click-to-Call • DoubleClick • Insights for Search • Trends
Коммуникации Answers • Calendar • Dodgeball • Friend ConnectGmail (история • интерфейс) • Groups • Joga Bonito • OrkutPanoramioPicasaВопросы и ответыReaderTalkTranslateVoiceWave
ПО Browser SyncChromeDesktopEarthGadgets • Lively • Gmail Mobile • PackPicasaSketchUpTalkToolbar • Updater • Web Accelerator
Платформы Account • AndroidApp EngineApps • Base • BigTable • Chrome OS • Co-op • GearsGFSHealth • Mashup • OpenSocial
Разрабатываемыеинструменты Code • Gadgets API • GData • Googlebot • Guice • GWS • Highly Open Participation Contest • I/O • Image Labeler • KML • MapReduce • Mediabot • Pinyin • SketchUp Ruby • Sitemaps (index) • Summer of Code • TechTalks • Web Toolkit • Website Optimizer
Публикация Alerts • Blogger • Bookmarks • DocsFeedBurneriGoogleJaikuKnol • Library Project • Map Maker • Mashup Editor • Notebook • Page Creator • Sites • Video Marketplace • YouTube
Поиск (PageRank,руководства) Appliance • Audio • Books • Code • Desktop • Finance • GOOG-411 • Images • Maps (Mars • Moon • Ocean • Sky • Street View) • News • Patents • Products • Scholar • SearchWiki • UsenetVideo • Web
См. также Поглощения • Bomb • Цензура • Current • Критика • Earth Outreach • Foundation • Google China • Google.org • Googleplex • История • Hoaxes • I’m Feeling Lucky • Labs • Logo • Lunar X Prize • Список сервисов и инструментов • WiFi • Zeitgeist • Гуглизм
Годовой доход: US$16,59 млрд (▲56 % FY 2007) • Сотрудники: 19 665 (30 сентября 2009) • Биржевой тикер: (NASDAQ: GOOG) • Девиз: Don't be evil • Веб-сайт: google.com

Wikimedia Foundation.2010.