HITS algorithm (original) (raw)
Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte Persönlichkeiten in sozialen Netzwerken und Linkverzeichnisse im World Wide Web.
Property | Value |
---|---|
dbo:abstract | خوارزمية الروابط الفائقة الناجمة عن البحث الموضوعي (HITS algorithm)، هي خوارزمية تقدير لجون كلاينبرغ وترتيب لصفحات الويب تستخدم قيمتين لكل صفحة: قيمة المرجعية (Authority) وقيمة مجمع الواصلات (Hub)، فيما يعرف «بالتكرار متبادل». قيمة المرجعية هي مجموع قيم مجال مجمع الواصلات التي تشير لتلك الصفحة. قيمة المجمع هي مجموع قيم المرجعية للصفحات التي تشير لها. خوارزمية كلاينبرغ مشابهة لخوارزمية ترتيب الصفحة في أنها خوارزمية تكرارية مستندة على ترابط الوثائق والمستندات على الويب، لكن هنالك بعض الاختلافات الرئيسية بينهما: * تنفذ في وقت الاستفسار وليس وقت الفهرسة. * ليست شائعة الاستخدام في محركات البحث. * تحسب (Tow score) عددين لكل مستند (authority وhub) مقابل أن ترتيب الصفحة تحسب عددا وحيدا (single score). * تنجز على مجموعة ثانوية صغيرة من الوثائق «ذات العلاقة» ليس على كل الوثائق كما هو الحال مع ترتيب الصفحة ن. (ar) L'algorisme HITS (acrònim de l'anglès Hypertext Induced Topic Selection) és un algorisme dissenyat per Jon Kleinberg per valorar i classificar la importància d'una pàgina web. HITS utilitza dos indicadors per fer aquesta valoració, definint recursivament cadascun a partir de l'altre: 1. * l'authority, que valora com és de bona la pàgina com a recurs d'informació; pel seu càlcul s'utilitza una suma ponderada de valors hub dels enllaços que apunten cap a aquesta pàgina. 2. * el hub, que diu com és de bona la informació que s'aconsegueix seguint els enllaços que té cap a altres pàgines; es calcula com una suma ponderada de valors authority de les pàgines a les que apunta aquesta. Algunes implementacions de l'algorisme també consideren quina és la rellevància de les pàgines enllaçades. (ca) Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte Persönlichkeiten in sozialen Netzwerken und Linkverzeichnisse im World Wide Web. (de) Hyperlink-Induced Topic Search (HITS; also known as hubs and authorities) is a link analysis algorithm that rates Web pages, developed by Jon Kleinberg. The idea behind Hubs and Authorities stemmed from a particular insight into the creation of web pages when the Internet was originally forming; that is, certain web pages, known as hubs, served as large directories that were not actually authoritative in the information that they held, but were used as compilations of a broad catalog of information that led users direct to other authoritative pages. In other words, a good hub represents a page that pointed to many other pages, while a good authority represents a page that is linked by many different hubs. The scheme therefore assigns two scores for each page: its authority, which estimates the value of the content of the page, and its hub value, which estimates the value of its links to other pages. (en) El algoritmo HITS (acrónimo del inglés Hypertext Induced Topic Selection, también conocido como hubs y autoridades) es un algoritmo de análisis de enlaces que valora las páginas web, desarrollado por Jon Kleinberg. La idea detrás de Hubs y Autoridades surgió de una visión particular de la creación de páginas web cuando Internet se estaba formando originalmente; Es decir, ciertas páginas web, conocidas como hubs, servían como grandes directorios que no eran realmente autoritativos en la información que tenían, sino que se usaban como compilaciones de un amplio catálogo de información que conducía a los usuarios a otras páginas autorizadas. En otras palabras, un buen hub representaba una página que señalaba muchas otras páginas, y una buena autoridad representaba una página que estaba vinculada por muchos hubs diferentes. El esquema asigna dos puntajes para cada página: su autoridad, que estima el valor del contenido de la página, y su valor de concentrador, que estima el valor de sus enlaces a otras páginas. (es) HITS (Hypertext Induced Topic Selection) garatutako algoritmo bat da, web orrialde baten garrantziari balioa eman eta bide batez sailkatzeko. HITS algoritmoak bi indikatzaile erabiltzen ditu balio hori zehazterako orduan, bata bestearekiko errekurtsiboa delarik: 1. * authority delakoa, orrialde hori informazio baliabide bezala nolako ona den baloratzen duena da; berau kalkulatzeko bertara lotura duten hub orrialdeen balioen batuketa ponderatua egiten da. 2. * hub delakoa, bertako loturetan klik eginez lortu daitekeen informazioa nolako ona den baloratzen duena da; berau kalkulatzeko lotura bezala erreferentzia egiten dituen orrialdeen authority balioen batuketa ponderatua egiten da. Algoritmo honen inplementazio batzuek lotutako orrialde horien garrantzia zenbatekoa den ere neurtzen dute. (eu) L'algorithme HITS, pour Hyperlink-Induced Topic Search, est un algorithme qui permet de mesurer l'autorité d'une page Web par rapport à d'autres. Il a été créé en 1999 par Jon Kleinberg. Il est parfois considéré comme précurseur de l'algorithme PageRank qui, comme HITS, a pour but, sur la base d'un graphe, d'assigner un score à celles-ci de façon à identifier les pages ayant le plus d'« importance ». Cet algorithme consiste à calculer deux scores pour chaque sommet appelés score de hub et score d'autorité, calculés uniquement en fonction des liens présents entre les sommets. (fr) Hyperlink-Induced Topic Search (HITS; conosciuta anche come hubs and authorities) è un algoritmo, sviluppato da Jon Kleinberg, di valutazione delle pagine web in funzione dei link. L'idea dell'algoritmo si fonda su una particolare intuizione di come le pagine del web si stavano formando. Infatti, certe pagine web, conosciute come hub, o pagine "concentratrici", fungevano esclusivamente da grandi directory, prive di un contenuto, venendo di fatto utilizzate soltanto come indice. (it) HITS (z ang. Hypertext Induced Topic Selection lub Hyperlink Induced Topic Search) – algorytm opracowany przez w 1998 z myślą o silniku przeszukującym pod nazwą CLEVER, wykorzystywany do oceny relatywności tekstu względem termu. Algorytm HITS zakłada, że dokumenty w zbiorze są ze sobą nawzajem połączone, tworząc pewnego rodzaju graf skierowany. W grafie tym węzłami są dokumenty, a krawędziami odnośniki. Krawędzie są skierowane w taki sposób, aby wskazywały na element cytowany, a wychodziły z elementu cytującego. Same założenia modelu wskazują na naturalne wykorzystanie go odnośnie do dokumentów hipertekstowych jako zawierających odnośniki (w tym także dokumentów w sieci WWW). Algorytm HITS opiera się na dwóch ideach: autorytetu (ang. authority) i koncentratora (ang. hub). Dokumentem autorytatywnym (autorytetem) jest dokument cytowany wskazywany, taki, na który wskazuje wiele dokumentów (wiele dokumentów cytuje ten dokument). Koncentratorem jest dokument cytujący, który wskazuje na dokumenty autorytarne (dokument cytuje wiele ważnych dokumentów). opracował oparty na odnośnikach model nadawania autorytetu i pokazał jak prowadzi to do metody, która konsekwentnie identyfikuje zarazem relewantne i autorytatywne strony dla zapytania o szerokiej tematyce. Model bazuje na związku, który istnieje pomiędzy autorytetem w danym temacie a tymi stronami, które odsyłają do wielu powiązanych tematycznie autorytetów. Ten drugi typ stron został nazwany koncentratorami. Zaobserwowano, że pomiędzy autorytetami i koncentratorami istnieje pewna naturalna równowaga w grafie zdefiniowanym przez strukturę odnośników. Wykorzystano to do rozwinięcia algorytmu, który identyfikuje jednocześnie oba typy stron. Algorytm operuje na skupionym podgrafie, który został skonstruowany z listy wyników wyszukiwania tekstowej wyszukiwarki. Technika konstruowania podgrafu jest zaprojektowana do uzyskania małego zbioru stron, który najprawdopodobniej zawiera najbardziej autorytatywne strony dla danego tematu. W trakcie obserwacji zauważono, że autorytatywne strony relewantne do początkowego zapytania powinny mieć nie tylko dużą liczbę odnośników, ale będąc autorytetami we wspólnym temacie, powinno istnieć znaczne pokrycie w zbiorze stron, które do nich odsyłają. Dlatego oprócz wyszukania wysoce autorytatywnych stron, spodziewano się znaleźć koncentratory, czyli strony, które mają odnośniki do wielu autorytatywnych stron. To właśnie koncentratory trzymają razem autorytety we wspólnym temacie i pozwalają pozbyć się niepowiązanych stron z dużą liczbą odnośników. Koncentratory i autorytety wykazują wzajemny, obopólnie wzmacniający związek (ang. mutually reinforcing relationship). Dobry koncentrator to strona, która wskazuje do wielu dobrych autorytetów. Dobry autorytet to strona, która jest wskazywana przez wiele dobrych koncentratorów. Autor zauważył, że rezultaty uzyskane poprzez czystą analizę struktury odsyłaczy dają o wiele lepsze rezultaty, niż wyszukiwarki oparte na przeszukiwaniu tekstu. W tym przypadku zastąpiono globalną analizę całej struktury odsyłaczy w WWW bardziej lokalną metodą analizy małego skupionego podgrafu. Algorytm skutecznie sprawdza się w szerokim zakresie tematów, gdzie najsilniejsze autorytety świadomie nie zawierają do siebie wzajemnych odnośników. Mogą one być połączone pośrednio przez warstwę relatywnie anonimowych koncentratorów, które są skorelowane i odsyłają do tematycznie powiązanych grup autorytetów. Ten dwupoziomowy wzór powiązań odsłania strukturę pośród obu zbiorów, koncentratorów, które mogą wzajemnie o sobie nie wiedzieć i autorytetów, które mogą nie chcieć pogodzić się z istnieniem innych autorytetów. Ostatecznym wynikiem działania algorytmu jest lista węzłów i autorytetów z największymi współczynnikami poprawności. (pl) Алгоритм HITS (англ. Hyperlink Induced Topic Search), предложенный в 1999 году Джоном Клейнбергом, позволяет находить Интернет-страницы, соответствующие запросу пользователя, на основе информации, заложенной в гиперссылки. Метрика HITS часто используется для ответа на широкую тему запросов и нахождения сообществ документов(англ. Tightly-Knit Community), в Интернете. Идея алгоритма основана на предположении, что гиперссылки кодируют значительное количество скрытых авторитетных страниц. Авторитетный документ (авторитетная страница, автор) — это документ, соответствующий запросу пользователя, имеющий больший удельный вес среди документов данной тематики, то есть большее число документов ссылаются на данный документ. Хаб-документ (хаб-страница, посредник) — это документ, содержащий много ссылок на авторитетные документы. Страница, на которую ссылаются многие другие точки должна быть хорошим «автором». В свою очередь страница, которая указывает на многие другие, должна быть хорошим «посредником». Основываясь на этом, в алгоритме HITS для каждой веб-страницы рассчитываются две оценки: оценка авторитетности и посредническая оценка. То есть для каждой страницы рекурсивно вычисляется её значимость как «автора» и «посредника». (ru) |
dbo:thumbnail | wiki-commons:Special:FilePath/SetsEN.jpg?width=300 |
dbo:wikiPageExternalLink | http://www2002.org/CDROM/refereed/643/ https://web.archive.org/web/20170117191811/http:/www.dupuis.me/node/25 http://www.cs.cornell.edu/home/kleinber/auth.pdf |
dbo:wikiPageID | 1851223 (xsd:integer) |
dbo:wikiPageLength | 11314 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1106804272 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Normalized_vector dbr:Algorithm dbr:Jon_Kleinberg dbr:Internet dbr:Nature_(journal) dbr:Google dbr:MSN dbr:Mutual_recursion dbc:Articles_with_example_pseudocode dbr:Link_analysis dbr:PageRank dbc:Link_analysis dbr:Teoma dbr:Ask.com dbr:Larry_Page dbr:Impact_factor dbr:Sergey_Brin dbr:Yahoo! dbr:Science_(journal) dbr:Iterative_algorithm dbr:Search_engines dbr:Weblink dbr:File:SetsEN.jpg |
dbp:wikiPageUsesTemplate | dbt:Cite_book dbt:Cite_journal dbt:Reflist dbt:US_patent |
dct:subject | dbc:Articles_with_example_pseudocode dbc:Link_analysis |
rdf:type | yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:Algorithm105847438 yago:Code106355894 yago:CodingSystem106353757 yago:Communication100033020 yago:Event100029378 yago:Procedure101023820 yago:Program106568978 yago:PsychologicalFeature100023100 yago:WikicatInternetSearchEngines yago:Writing106359877 yago:WrittenCommunication106349220 yago:YagoPermanentlyLocatedEntity yago:Rule105846932 yago:SearchEngine106578654 yago:Software106566077 yago:WikicatAlgorithms yago:WikicatAlgorithmsOnStrings |
rdfs:comment | Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte Persönlichkeiten in sozialen Netzwerken und Linkverzeichnisse im World Wide Web. (de) L'algorithme HITS, pour Hyperlink-Induced Topic Search, est un algorithme qui permet de mesurer l'autorité d'une page Web par rapport à d'autres. Il a été créé en 1999 par Jon Kleinberg. Il est parfois considéré comme précurseur de l'algorithme PageRank qui, comme HITS, a pour but, sur la base d'un graphe, d'assigner un score à celles-ci de façon à identifier les pages ayant le plus d'« importance ». Cet algorithme consiste à calculer deux scores pour chaque sommet appelés score de hub et score d'autorité, calculés uniquement en fonction des liens présents entre les sommets. (fr) Hyperlink-Induced Topic Search (HITS; conosciuta anche come hubs and authorities) è un algoritmo, sviluppato da Jon Kleinberg, di valutazione delle pagine web in funzione dei link. L'idea dell'algoritmo si fonda su una particolare intuizione di come le pagine del web si stavano formando. Infatti, certe pagine web, conosciute come hub, o pagine "concentratrici", fungevano esclusivamente da grandi directory, prive di un contenuto, venendo di fatto utilizzate soltanto come indice. (it) خوارزمية الروابط الفائقة الناجمة عن البحث الموضوعي (HITS algorithm)، هي خوارزمية تقدير لجون كلاينبرغ وترتيب لصفحات الويب تستخدم قيمتين لكل صفحة: قيمة المرجعية (Authority) وقيمة مجمع الواصلات (Hub)، فيما يعرف «بالتكرار متبادل». قيمة المرجعية هي مجموع قيم مجال مجمع الواصلات التي تشير لتلك الصفحة. قيمة المجمع هي مجموع قيم المرجعية للصفحات التي تشير لها. خوارزمية كلاينبرغ مشابهة لخوارزمية ترتيب الصفحة في أنها خوارزمية تكرارية مستندة على ترابط الوثائق والمستندات على الويب، لكن هنالك بعض الاختلافات الرئيسية بينهما: (ar) L'algorisme HITS (acrònim de l'anglès Hypertext Induced Topic Selection) és un algorisme dissenyat per Jon Kleinberg per valorar i classificar la importància d'una pàgina web. HITS utilitza dos indicadors per fer aquesta valoració, definint recursivament cadascun a partir de l'altre: (ca) Hyperlink-Induced Topic Search (HITS; also known as hubs and authorities) is a link analysis algorithm that rates Web pages, developed by Jon Kleinberg. The idea behind Hubs and Authorities stemmed from a particular insight into the creation of web pages when the Internet was originally forming; that is, certain web pages, known as hubs, served as large directories that were not actually authoritative in the information that they held, but were used as compilations of a broad catalog of information that led users direct to other authoritative pages. In other words, a good hub represents a page that pointed to many other pages, while a good authority represents a page that is linked by many different hubs. (en) HITS (Hypertext Induced Topic Selection) garatutako algoritmo bat da, web orrialde baten garrantziari balioa eman eta bide batez sailkatzeko. HITS algoritmoak bi indikatzaile erabiltzen ditu balio hori zehazterako orduan, bata bestearekiko errekurtsiboa delarik: (eu) El algoritmo HITS (acrónimo del inglés Hypertext Induced Topic Selection, también conocido como hubs y autoridades) es un algoritmo de análisis de enlaces que valora las páginas web, desarrollado por Jon Kleinberg. La idea detrás de Hubs y Autoridades surgió de una visión particular de la creación de páginas web cuando Internet se estaba formando originalmente; Es decir, ciertas páginas web, conocidas como hubs, servían como grandes directorios que no eran realmente autoritativos en la información que tenían, sino que se usaban como compilaciones de un amplio catálogo de información que conducía a los usuarios a otras páginas autorizadas. En otras palabras, un buen hub representaba una página que señalaba muchas otras páginas, y una buena autoridad representaba una página que estaba vincul (es) HITS (z ang. Hypertext Induced Topic Selection lub Hyperlink Induced Topic Search) – algorytm opracowany przez w 1998 z myślą o silniku przeszukującym pod nazwą CLEVER, wykorzystywany do oceny relatywności tekstu względem termu. Ostatecznym wynikiem działania algorytmu jest lista węzłów i autorytetów z największymi współczynnikami poprawności. (pl) Алгоритм HITS (англ. Hyperlink Induced Topic Search), предложенный в 1999 году Джоном Клейнбергом, позволяет находить Интернет-страницы, соответствующие запросу пользователя, на основе информации, заложенной в гиперссылки. Метрика HITS часто используется для ответа на широкую тему запросов и нахождения сообществ документов(англ. Tightly-Knit Community), в Интернете. Идея алгоритма основана на предположении, что гиперссылки кодируют значительное количество скрытых авторитетных страниц. Хаб-документ (хаб-страница, посредник) — это документ, содержащий много ссылок на авторитетные документы. (ru) |
rdfs:label | خوارزمية الروابط الفائقة الناجمة عن البحث الموضوعي (ar) HITS (ca) Hubs und Authorities (de) Algoritmo HITS (es) HITS algoritmoa (eu) Algorithme HITS (fr) HITS algorithm (en) Algoritmo HITS (it) HITS (pl) Алгоритм HITS (ru) |
owl:sameAs | freebase:HITS algorithm yago-res:HITS algorithm wikidata:HITS algorithm dbpedia-ar:HITS algorithm dbpedia-ca:HITS algorithm dbpedia-de:HITS algorithm dbpedia-es:HITS algorithm dbpedia-eu:HITS algorithm dbpedia-fa:HITS algorithm dbpedia-fr:HITS algorithm dbpedia-he:HITS algorithm dbpedia-hu:HITS algorithm dbpedia-it:HITS algorithm dbpedia-pl:HITS algorithm dbpedia-ru:HITS algorithm https://global.dbpedia.org/id/7A9Z |
prov:wasDerivedFrom | wikipedia-en:HITS_algorithm?oldid=1106804272&ns=0 |
foaf:depiction | wiki-commons:Special:FilePath/SetsEN.jpg |
foaf:isPrimaryTopicOf | wikipedia-en:HITS_algorithm |
is dbo:knownFor of | dbr:Jon_Kleinberg |
is dbo:wikiPageDisambiguates of | dbr:Hits |
is dbo:wikiPageRedirects of | dbr:Hubs_and_Authorities dbr:Hubs_and_authorities dbr:Hyperlink-Induced_Topic_Search dbr:Hypertext_Induced_Topic_Selection |
is dbo:wikiPageWikiLink of | dbr:Entity_linking dbr:Ranking_(information_retrieval) dbr:Jon_Kleinberg dbr:Network_theory dbr:Multidimensional_network dbr:SALSA_algorithm dbr:Timeline_of_algorithms dbr:Chinese_animation dbr:Lesley_Ward dbr:Lanczos_algorithm dbr:Learning_to_rank dbr:Eugene_Garfield dbr:PageRank dbr:Hilltop_algorithm dbr:CheiRank dbr:CLEVER_project dbr:Network_science dbr:Authority_(disambiguation) dbr:Ranking dbr:Hits dbr:TrustRank dbr:Spamdexing dbr:Webgraph dbr:Truth_discovery dbr:Hubs_and_Authorities dbr:Hubs_and_authorities dbr:Hyperlink-Induced_Topic_Search dbr:Hypertext_Induced_Topic_Selection |
is dbp:knownFor of | dbr:Jon_Kleinberg |
is foaf:primaryTopic of | wikipedia-en:HITS_algorithm |