Zipf's law (original) (raw)

About DBpedia

قانون زيف (بالإنجليزية Zipf's law) هو قانون تجريبي تم صياغته باستخدام الإحصاءات الرياضية للإشارة إلى حقيقة أن العديد من أنواع البيانات في العلوم الفيزيائية والاجتماعية يمكن أن تتبع توزيع قانون زيف أو واحد من قوانين التوزيعات الاحتمالية من عائلته . سمي القانون تكريما للعالم اللغوي الأمريكي (1902-1950) الذي سعى إلى تفسير القانون ما بين 1935 و 1949. لاحظ الفرنسي القانون قبل زيف. كما لوحظ في عام 1913 من قبل الفيزيائي الألماني فيليكس أورباخ (1856-1933).

thumbnail

Property Value
dbo:abstract قانون زيف (بالإنجليزية Zipf's law) هو قانون تجريبي تم صياغته باستخدام الإحصاءات الرياضية للإشارة إلى حقيقة أن العديد من أنواع البيانات في العلوم الفيزيائية والاجتماعية يمكن أن تتبع توزيع قانون زيف أو واحد من قوانين التوزيعات الاحتمالية من عائلته . سمي القانون تكريما للعالم اللغوي الأمريكي (1902-1950) الذي سعى إلى تفسير القانون ما بين 1935 و 1949. لاحظ الفرنسي القانون قبل زيف. كما لوحظ في عام 1913 من قبل الفيزيائي الألماني فيليكس أورباخ (1856-1933). (ar) La llei de Zipf és una constant estadística que va néixer al camp del vocabulari de les llengües naturals i s'ha aplicat posteriorment a altres camps. Preveia una relació entre les paraules més comunes i el nombre de vegades que apareixien respecte a les altres, de manera que la paraula més freqüent apareix el doble de vegades que la propera, triple de vegades que la tercera, i així successivament en una correlació inversa entre freqüència d'aparició i rang ocupat en l'ordre d'aparicions de la paraula. Aquesta llei de proporcionalitat existeix en la majoria de llengües naturals analitzades, i també en esperanto. El nom prové del seu creador, el lingüista . La llei de Zipf ha tingut aplicacions en fets socials, com la correlació inversa entre el nombre d'habitants de les ciutats d'un país i l'ordre que ocupa la ciutat pel seu volum poblacional. Així, la ciutat més gran té el doble d'habitants que la segona ciutat més poblada, i el triple que la tercera, i així successivament. (ca) Zipfův zákon (anglicky Zipf's law) je označení pro pravidlo matematické analýzy jazyků, které zformuloval americký jazykovědec . Toto pravidlo, používané především v kryptografii, říká, že v každém textu, který je psán v přirozeném jazyce (tj. jazyce vzniklém přirozeným vývojem), existuje jisté rozdělení četnosti výskytu určitých slov a to od slova s nejvyšším výskytem, které má rank 1 až po rank n, který označuje slovo s nejmenším výskytem v daném textu a tyto četnosti mají tvar pravidelně klesající křivky. Za tuto distribuci pravděpodobně může kombinace syntaxe a sémantiky. (cs) La distribuo de Zipf aŭ leĝo de Zipf ricevis sian nomon de George Kingsley Zipf (1902-1950). Ĝi priskribas kiom ofte la diversaj vortoj de ajna lingvo aperas en tekstoj. En tekstoj, atendeble, gramatikaj vortoj kiaj la aŭ de aperas tre ofte. Aliaj vortoj aperas malpli ofte, aŭ eĉ nur unufoje. Zipf konstatis, ke ordigante la vortojn de plej oftaj ĝis plej maloftaj, oni vidas ke la apernombro (aŭ ofto) de vorto estas inverso de ĝia rango. apernombro de n-ranga vorto = (apernombro de 1a-ranga vorto) / n La apernombro de la dua vorto estas proksimume duono de la apernombro de la unua vorto. La apernombro de la tria vorto estas prokimume triono de la apernombro de la unua kaj tiel plu. Ekzemple: rango ofto vorto1 150 la2 90 de3 52 kaj... .. ...771 1 vojaĝoj772 1 volas Sur logaritma grafikaĵo tiu serio aperas kiel rekta dekliva linio. La zipfa distribuo validas nur proksimume, nur en iom longaj tekstoj, sed ĝi aperas en ĉiuj homaj lingvoj. (eo) Das Zipfsche Gesetz (nach George Kingsley Zipf, der dieses Gesetz in den 1930er Jahren aufstellte) ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige Verwendung findet das Gesetz in der Sprachwissenschaft (Linguistik), speziell in der Korpuslinguistik und Quantitativen Linguistik, wo es zum Beispiel versucht, die Häufigkeit von Wörtern in einem Text zur Rangfolge in Beziehung zu setzen. Das Zipfsche Gesetz markierte den Beginn dieses Ansatzes der Quantitativen Linguistik.Ihm liegt ein Potenzgesetz zugrunde, das von der Pareto-Verteilung bzw. Zipf-Verteilung mathematisch beschrieben wird. (de) Zipfen legea errealitate fisiko eta sozialeko fenomeno anitzetan azaltzen den probabilitate-lege bat da, elementu batzuen tamaina eta ordena lotzen dituena. George Kingsley Zipf estatubatuar hizkuntzalariak sortu zuen, hizkuntza baten hitzen maiztasuna ikertzean: maiztasun handieneko lehenengo hitza bigarren hitza bi halakotan agertu ohi da gutxi gorabehera, hirugarren hitza hiru halakotan... Hitzen maiztasunaz gainera, legea hirien tamaina, webguneen bisita eta beste aldagai askotarako egiaztatu izan da, batzuetan doikuntza egokia izan ez bada ere. Zehatzago, i elementu baten tamaina edo maiztasuna honela kalkulatzen da: Hor, oro har, a balioa 1 edo 1 balioaren inguruan ezartzen da. (eu) La llamada ley de Zipf, formulada en la década de 1940 por George Kingsley Zipf, lingüista de la Universidad de Harvard, es una ley empírica según la cual en una determinada lengua la frecuencia de aparición de distintas palabras sigue una distribución que puede aproximarse por donde Pn representa la frecuencia de la n-ésima palabra más frecuente y el exponente a es un número real positivo, en general ligeramente superior a 1.​ Esto significa que el segundo elemento se repetirá aproximadamente con una frecuencia de 1⁄2 de la del primero, el tercer elemento con una frecuencia de 1⁄3 del primero y así sucesivamente. Una ley no empírica, pero más precisa, derivada de los trabajos de Claude Shannon fue descubierta por Benoît Mandelbrot. La ley de Zipf se cumple para la mayoría de las lenguas, inclusive para lenguas planificadas como el esperanto.​ La misma relación existe en muchos otros rankings,​ como la población de ciudades en varios países o regiones (la segunda ciudad del país tiene la mitad de habitantes que la primera, etc.), tamaño de multinacionales, rankings de ingresos, etc. (es) Is éard is Dlí Zipf ann ná dlí eimpíreach foirmlithe trí bhaint a úsáid as staidreamh mhatamaiticiúil, tagraíonn sé don bhfíric gur féidir le cuid mhaith cineálacha shonraí sna heolaíochtaí fisiceacha agus sóisialta a chomhfhogasú leis an dáileachán a fhaightear i nDlí Zipf,atá neasghaolta le dóchúlacht cumhachta de dhlí na cumhachta. Tá an dlí ainmnithe i ndiaidh an teangeolaí George Kingsley Zipf a chéad mhol é (Zipf 1935, 1949), cé go bhfuil fianaise ann gur thug an rialtacht faoi deara roimh Zipf. (ga) La loi de Zipf est une observation empirique concernant la fréquence des mots dans un texte. Elle a pris le nom de son auteur, George Kingsley Zipf (1902-1950). Cette loi a d'abord été formulée par Jean-Baptiste Estoup et a été par la suite démontrée à partir de formules de Shannon par Benoît Mandelbrot. Elle est parfois utilisée en dehors de ce contexte, par exemple au sujet de la taille et du nombre des villes dans chaque pays, lorsque cette loi semble mieux répondre aux chiffres que la distribution de Pareto. (fr) Zipf's law (/zɪf/, German: [ts͡ɪpf]) is an empirical law formulated using mathematical statistics that refers to the fact that for many types of data studied in the physical and social sciences, the rank-frequency distribution is an inverse relation. The Zipfian distribution is one of a family of related discrete power law probability distributions. It is related to the zeta distribution, but is not identical. Zipf's law was originally formulated in terms of quantitative linguistics, stating that given some corpus of natural language utterances, the frequency of any word is inversely proportional to its rank in the frequency table. Thus the most frequent word will occur approximately twice as often as the second most frequent word, three times as often as the third most frequent word, etc. For example, in the Brown Corpus of American English text, the word "the" is the most frequently occurring word, and by itself accounts for nearly 7% of all word occurrences (69,971 out of slightly over 1 million). True to Zipf's Law, the second-place word "of" accounts for slightly over 3.5% of words (36,411 occurrences), followed by "and" (28,852). Only 135 vocabulary items are needed to account for half the Brown Corpus. The law is named after the American linguist George Kingsley Zipf, who popularized it and sought to explain it, though he did not claim to have originated it. The French stenographer Jean-Baptiste Estoup appears to have noticed the regularity before Zipf. It was also noted in 1913 by German physicist Felix Auerbach. The law is similar in concept, though not identical in distribution, to Benford's law. (en) Viene detta legge di Zipf una legge empirica che descrive la frequenza di un evento facente parte di un insieme, in funzione della posizione (detta rango) nell'ordinamento decrescente rispetto alla frequenza stessa di tale evento. dove: * indica il rango * indica l'evento che occupa l'i-esimo rango (ovvero l'i-esimo evento più frequente) * è il numero di volte (frequenza) che si verifica l'evento * è una costante di normalizzazione, pari al valore . Il linguista George Kingsley Zipf la descrisse nel 1949 in Human Behaviour and the Principle of Least-Effort (Comportamento umano e il principio del minimo sforzo). (it) 지프의 법칙(Zipf's law)은 수학적 통계를 바탕으로 밝혀진 경험적 법칙으로, 물리 및 사회 과학 분야에서 연구된 많은 종류의 정보들이 지프 분포에 가까운 경향을 보인다는 것을 뜻한다. 지프 분포는 이산 멱법칙 확률분포와 관계된 확률분포의 하나이다. 미국 하버드대학교 언어학자인 조지 킹슬리 지프(George Kingsley Zipf)가 최초로 이 법칙을 공식 제안(Zipf 1935, 1949)함에 따라 그의 이름을 따 지프의 법칙으로 부르게 되었다. 그러나 실제로는 프랑스의 속기사였던 장바티스트 에스투프(Jean-Baptiste Estoup, 1868~1950)가 지프 이전에 이 법칙을 발견하였다. 또한 독일의 물리학자 펠릭스 아워바흐(Felix Auerbach)도 1913년에 이 법칙에 대해 언급하였다. (ko) ジップの法則(ジップのほうそく、Zipf's law)あるいはジフの法則とは、出現頻度が k 番目に大きい要素が、1位のものの頻度と比較して 1/k に比例するという経験則である。Zipf は「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。 包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はの特殊な形である。 この法則はアメリカの言語学者ジョージ・キングズリー・ジップに帰せられている。ジップ以前に似た観察をしていた先行研究として、などの研究があり、ジップ自身もそのことを1942年の論文で紹介した。 (ja) Prawo Zipfa – prawo empiryczne głoszące, że wiele rodzajów danych tworzonych przez ludzi lub odnoszących się do ich zachowań cechuje charakterystyczny rozkład wartości, w którym dystrybucja częstotliwości występowania poszczególnych wartości jest odwrotnie proporcjonalna do ich rangi statystycznej. Pod koniec XIX wieku francuski stenograf i leksykograf , badając zasady stenografii, ustalił podstawowe zasady statystyczne dotyczące tekstu. Twierdzenia francuskiego badacza zweryfikował i uściślił amerykański lingwista George Kingsley Zipf. (pl) De wet van Zipf is oorspronkelijk de door George Kingsley Zipf (1902-1950) geconstateerde en naar hem genoemde wetmatigheid in de taalkunde, dat in natuurlijke taal de frequentie van voorkomen van een woord ruwweg omgekeerd evenredig is met de rang van het woord in de frequentietabel, en wel zo dat het meest frequente woord ongeveer twee keer zo vaak voorkomt als het op een na frequentste woord, drie keer zo vaak als het derde frequentste, enz. Met de Wet van Zipf worden tegenwoordig kansverdelingen aangeduid die de vorm van een machtswet hebben. De wet kan gekarakteriseerd worden door het lineaire verband tussen de logaritmen van rangnummer en kans of frequentie. In dubbellogaritmische weergave is het verband een rechte lijn. De constatering door Zipf markeert het begin van de kwantitatieve linguïstiek. Buiten de linguïstiek duikt dit verband evenwel ook in uiteenlopende andere domeinen op. Zo blijkt het verband tussen de rang en de bevolking van de grootste steden in de Verenigde Staten en verschillende andere landen overeen te komen met de wet van Zipf. De "wetenschappelijke productiviteit" (aantal publicaties of referenties naar publicaties van wetenschappers) en het aantal maal per maand dat de webpagina's van een website worden bezocht zijn andere voorbeelden van data die de wet van Zipf volgen. Alfred Lotka (1880-1949) vond dat de vorm van deze verdeling weinig of niets zegt over de onderliggende, fysische verbanden: "Frequency distributions of this general type have a wide range of applicability to a variety of phenomena, and the mere form of such a distribution throws little or no light on the underlying physical relations." (nl) Zipfs lag (uttalas zɪfs) är en empiriskt visad statistisk lag som säger att inom många tillämpningsområden inom såväl samhällsvetenskap som naturvetenskap gäller att vid stora mängder diskreta data är rankingfrekvensen (förekomsten av det vanligaste värdet, näst vanligaste värdet, osv) approximativt Zipffördelade. Lagen är bland annat giltig på frekvensen av ord i ett språk eller en längre text, på städers folkmängd i ett land, på massmediers popularitet, på webbplatsers besöksstatistik, på inkomststorlekar, företagsstorlekar, med mera. Lagen återspeglar att det finns några få mycket vanliga ord och många ovanliga, få stora städer och många små, och så vidare. Zipfs lag är uppkallad efter den amerikanske lingvisten (en) som föreslog lagen (Zipf 1935, 1949) för att beskriva förekomsten av olika ord i språk. Emellertid tycks (fr) ha lagt märke till detta mönster innan Zipf. Fördelningen av städers folkmängd studerades av Felix Auerbach redan 1913. Zipfs ursprungliga formulering av lagen säger att frekvensen av, eller sannolikheten för, ett visst ord eller värde är omvänt proportionell mot dess ranking. Det näst vanligaste värdet inträffar således hälften så ofta som det vanligaste värdet och så vidare. Idag är emellertid lagen generaliserad så att frekvensrankingen är upphöjd med en exponent s. Exponentens värde bestäms empiriskt och skiljer mellan olika tillämpningsområden. Lagens ursprungliga formulering motsvaras av s=1, medan s=0 motsvarar likformig sannolikhetsfördelning. Exempelvis vid städers befolkningstal har god matchning visats med s = 1,07. Vid webbplatsers besöksstatistik är s ungefär 2. Zipffördelningen tillhör en familj av besläktade diskreta potenslagsfördelningar, som samtliga karaktäriseras av skalinvarianta egenskaper. (sv) A Lei de Zipf é uma lei empírica formulada utilizando estatísticas matemáticas que se refere ao fato de que para muitos tipos de dados estudados nas ciências físicas e sociais, a distribuição de frequência de classificação é uma relação inversa. A distribuição zipfiana esta inserida dentro da família de leis de distribuições de probabilidades poder discreta relacionadas. Está relacionado com a , mas não é idêntica. A lei de Zipf foi originalmente formulada em termos de , afirmando que, dado algum corpus de expressões linguísticas naturais, a frequência de qualquer palavra é inversamente proporcional à sua classificação na tabela de frequências. Assim, a palavra mais frequente ocorrerá aproximadamente duas vezes mais frequentemente do que a segunda palavra mais frequente, três vezes mais vezes que a terceira palavra mais frequente, e assim sucessivamente. Não há consenso na literatura, porém, sobre o que causa o fenômeno. A lei é nomeada em homenagem à George Kingsley Zipf, linguista da Universidade de Harvard, que a popularizou na década de 1940 por meio de sua obra Human Behaviour and the Principle of Least-Effort ("Comportamento Humano e o Principio do Menor Esforço"). Apesar disso, porém, alguns estudiosos já haviam notado essa regularidade antes de Zipf, como o estenógrafo francês , e o físico alemão Felix Auerbach, em 1913. A Lei de Zipf é semelhante em conceito, embora não idêntico na distribuição, à Lei de Benford. Trata-se de uma lei de potências sobre a distribuição de valores de acordo com o nº de ordem numa lista. Numa lista, o membro n teria uma relação de valor com o 1º da lista segundo 1/n. Por exemplo, numa língua a frequência com que surgem as diversas palavras segue uma distribuição que se pode aproximar por: onde Pn representa a frequência de uma palavra ordenada na n-ésima posição e o expoente a é próximo da unidade. Isto significa que o segundo elemento se repetirá aproximadamente com uma frequência que é metade da do primeiro, e o terceiro elemento com uma frequência de 1/3 e assim sucessivamente. Uma lei não empírica, mas mais precisa, derivada dos trabalhos de Claude Shannon foi descoberta por Benoît Mandelbrot. Os campos de aplicação da lei de Zipf são diversos, e são também várias as tendências de pensamento que a têm proposto como contrapartida à distribuição gaussiana no âmbito das ciências sociais. Na realidade, nas ciências sociais não se segue sempre uma distribuição gaussiana, mas também não se segue sempre a lei de Zipf. (pt) Зако́н Ци́пфа («ранг—частотность») — эмпирическая закономерность распределения частотности слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частотности их использования, то частотность n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и так далее. (ru) 齐夫定律(英語:Zipf's law,IPA/ˈzɪf/)是由哈佛大學的語言學家于1949年发表的实验定律。它可以表述为:在自然语言的語料庫裡,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与冪定律概率分布有关的事物的参考。 (zh) Зако́н Ци́пфа (Зіпфа) — закон, згідно з яким відношення рангу слова в частотному словнику до частотності слова в мові становить постійну величину (константу).Інакше кажучи, якщо всі слова мови (або просто достатньо довгого тексту) впорядкувати за спаданням частоти їхнього використання, то частота n-го слова в такому списку виявиться приблизно обернено пропорційною його порядковому номеру n (так званому рангу цього слова). Наприклад, друге за вживаністю слово трапляється приблизно вдвічі рідше, ніж перше, третє — втричі рідше, ніж перше, і так далі. (uk)
dbo:thumbnail wiki-commons:Special:FilePath/Zipf_distribution_PMF.png?width=300
dbo:wikiPageExternalLink http://1.1o1.in/en/webtools/semantic-depth http://www.worldcomp-proceedings.com/proc/p2011/BIC4329.pdf http://www.nature.com/nature/journal/v474/n7350/full/474164a.html https://ssrn.com/abstract=2918642 https://ssrn.com/abstract=2918642. http://terrytao.wordpress.com/2009/07/03/benfords-law-zipfs-law-and-the-pareto-distribution/ http://pages.stern.nyu.edu/~xgabaix/papers/zipf.pdf http://judson.blogs.nytimes.com/2009/05/19/math-and-the-city/ http://www.gelbukh.com/CV/Publications/2001/CICLing-2001-Zipf.htm http://xxx.arxiv.org/abs/cs.CL/0406015 http://www.lexique.org/listes/liste_mots.txt https://archive.org/details/in.ernet.dli.2015.90211 https://arxiv.org/abs/physics/9901035 https://web.archive.org/web/20021018011011/http:/planetmath.org/encyclopedia/ZipfsLaw.html https://web.archive.org/web/20041024144850/http:/www.hubbertpeak.com/laherrere/fractal.htm https://web.archive.org/web/20070623154627/http:/www.lexique.org/listes/liste_mots.txt https://web.archive.org/web/20081221110750/http:/pages.stern.nyu.edu/~xgabaix/papers/zipf.pdf https://web.archive.org/web/20110408115104/http:/1.1o1.in/en/webtools/semantic-depth https://web.archive.org/web/20150927204318/http:/judson.blogs.nytimes.com/2009/05/19/math-and-the-city/ https://www.academia.edu/40029629 https://www.newscientist.com/article.ns%3Fid=mg18524904.300 https://www.science.org/doi/abs/10.1126/science.1062081 https://www.theatlantic.com/issues/2002/04/rauch.htm http://www.geoffkirby.co.uk/ZIPFSLAW.pdf https://www.academia.edu/24147736/ http://www.hubbertpeak.com/laherrere/fractal.htm
dbo:wikiPageID 43218 (xsd:integer)
dbo:wikiPageLength 35532 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1123126830 (xsd:integer)
dbo:wikiPageWikiLink dbc:Statistical_laws dbr:Power_law dbr:Probability_distribution dbr:English_articles dbr:Entropy_coding dbr:Menzerath's_law dbr:Principle_of_least_effort dbr:Benford's_law dbr:Benoit_Mandelbrot dbc:Empirical_laws dbr:Riemann_zeta_function dbr:Uniform_distribution_(continuous) dbr:Voynich_manuscript dbr:Preferential_attachment dbr:Search_for_extraterrestrial_intelligence dbr:1%_rule_(Internet_culture) dbc:1949_introductions dbc:Discrete_distributions dbc:Tails_of_probability_distributions dbr:SETI_Institute dbr:Musical_note dbr:Zipf–Mandelbrot_law dbr:George_Kingsley_Zipf dbr:Bradford's_law dbc:Eponyms dbr:Linear_equation dbr:Logarithm dbr:Demographic_gravitation dbr:Harmonic_series_(mathematics) dbr:Pareto_distribution dbr:Stigler's_law_of_eponymy dbr:Mathematical_statistics dbr:Data_compression dbr:Heaps'_law dbr:Laurance_Doyle dbr:Linguistics dbr:Yule–Simon_distribution dbr:Esperanto dbr:Felix_Auerbach dbr:Brevity_law dbr:Normal_distribution dbr:Pareto_principle dbc:Power_laws dbr:Diffusion_process dbr:Goodness_of_fit dbr:Graph_of_a_function dbr:Hapax_legomenon dbr:Kolmogorov–Smirnov_test dbr:Text_corpus dbr:Harmonic_number dbr:Inversely_proportional dbr:Taylor_series dbr:Hurwitz_zeta_function dbr:Asymmetric_Numeral_Systems dbc:Computational_linguistics dbc:Corpus_linguistics dbc:Bibliometrics dbc:Quantitative_linguistics dbr:Bit dbr:Jean-Baptiste_Estoup dbr:Zeta_distribution dbr:Empirical_law dbr:Information_theory dbr:Integer dbr:Brown_Corpus dbr:Rank-size_distribution dbr:Real_number dbr:King_effect dbr:Long_tail dbr:Lorenz_curve dbr:Lotka's_law dbr:Social_science dbr:Uniform_distribution_(discrete) dbr:Natural_language dbr:Gibrat's_law dbr:Quantitative_linguistics dbr:Physical_science dbr:Parabolic_fractal_distribution dbr:Vitold_Belevitch dbr:Frequency_list dbr:Frequency_table dbr:Transcriptomes dbr:Statistical_distribution dbr:Rank-frequency_distribution dbr:Generalized_harmonic_number dbr:George_K._Zipf dbr:CICLing dbr:Log-log dbr:Price's_law dbr:File:Zipf_30wiki_en_labels.png dbr:File:Zipf_distribution_CMF.png dbr:File:Zipf_distribution_PMF.png dbr:File:Wikipedia-n-zipf.png
dbp:cdfImage 325 (xsd:integer) (Zipf CDF for N = 10. The horizontal axis is the index k . ) (en)
dbp:date 2004-10-24 (xsd:date) 2007-06-23 (xsd:date) 2011-04-08 (xsd:date)
dbp:id p/z130110 (en)
dbp:name Zipf's law (en)
dbp:parameters (en)
dbp:pdf where HN,s is the Nth generalized harmonic number (en)
dbp:pdfImage 325 (xsd:integer) (Zipf PMF for N = 10 on a log–log scale. The horizontal axis is the index k . ) (en)
dbp:title Zipf law (en)
dbp:type mass (en)
dbp:url https://web.archive.org/web/20041024144850/http:/www.hubbertpeak.com/laherrere/fractal.htm https://web.archive.org/web/20070623154627/http:/www.lexique.org/listes/liste_mots.txt https://web.archive.org/web/20110408115104/http:/1.1o1.in/en/webtools/semantic-depth
dbp:wikiPageUsesTemplate dbt:Springer dbt:= dbt:Authority_control dbt:Cite_journal dbt:Cite_news dbt:Commons_category dbt:Div_col dbt:Div_col_end dbt:For dbt:IPA-de dbt:IPAc-en dbt:ISSN dbt:Math dbt:Mvar dbt:ProbDistributions dbt:Reflist dbt:Sfrac dbt:Short_description dbt:Sub dbt:Webarchive dbt:Isbn dbt:Library_resources_box dbt:Probability_distribution
dct:subject dbc:Statistical_laws dbc:Empirical_laws dbc:1949_introductions dbc:Discrete_distributions dbc:Tails_of_probability_distributions dbc:Eponyms dbc:Power_laws dbc:Computational_linguistics dbc:Corpus_linguistics dbc:Bibliometrics dbc:Quantitative_linguistics
rdf:type owl:Thing yago:WikicatStatisticalLaws yago:Abstraction100002137 yago:Arrangement105726596 yago:Cognition100023271 yago:Collection107951464 yago:Concept105835747 yago:Content105809192 yago:Distribution105729036 yago:Group100031264 yago:Idea105833840 yago:Law105872982 yago:Law108441203 yago:PowerLaw105996110 yago:PsychologicalFeature100023100 yago:Structure105726345 yago:WikicatDiscreteDistributions yago:WikicatEmpiricalLaws yago:WikicatPowerLaws yago:WikicatProbabilityDistributions
rdfs:comment قانون زيف (بالإنجليزية Zipf's law) هو قانون تجريبي تم صياغته باستخدام الإحصاءات الرياضية للإشارة إلى حقيقة أن العديد من أنواع البيانات في العلوم الفيزيائية والاجتماعية يمكن أن تتبع توزيع قانون زيف أو واحد من قوانين التوزيعات الاحتمالية من عائلته . سمي القانون تكريما للعالم اللغوي الأمريكي (1902-1950) الذي سعى إلى تفسير القانون ما بين 1935 و 1949. لاحظ الفرنسي القانون قبل زيف. كما لوحظ في عام 1913 من قبل الفيزيائي الألماني فيليكس أورباخ (1856-1933). (ar) Zipfův zákon (anglicky Zipf's law) je označení pro pravidlo matematické analýzy jazyků, které zformuloval americký jazykovědec . Toto pravidlo, používané především v kryptografii, říká, že v každém textu, který je psán v přirozeném jazyce (tj. jazyce vzniklém přirozeným vývojem), existuje jisté rozdělení četnosti výskytu určitých slov a to od slova s nejvyšším výskytem, které má rank 1 až po rank n, který označuje slovo s nejmenším výskytem v daném textu a tyto četnosti mají tvar pravidelně klesající křivky. Za tuto distribuci pravděpodobně může kombinace syntaxe a sémantiky. (cs) Das Zipfsche Gesetz (nach George Kingsley Zipf, der dieses Gesetz in den 1930er Jahren aufstellte) ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige Verwendung findet das Gesetz in der Sprachwissenschaft (Linguistik), speziell in der Korpuslinguistik und Quantitativen Linguistik, wo es zum Beispiel versucht, die Häufigkeit von Wörtern in einem Text zur Rangfolge in Beziehung zu setzen. Das Zipfsche Gesetz markierte den Beginn dieses Ansatzes der Quantitativen Linguistik.Ihm liegt ein Potenzgesetz zugrunde, das von der Pareto-Verteilung bzw. Zipf-Verteilung mathematisch beschrieben wird. (de) Is éard is Dlí Zipf ann ná dlí eimpíreach foirmlithe trí bhaint a úsáid as staidreamh mhatamaiticiúil, tagraíonn sé don bhfíric gur féidir le cuid mhaith cineálacha shonraí sna heolaíochtaí fisiceacha agus sóisialta a chomhfhogasú leis an dáileachán a fhaightear i nDlí Zipf,atá neasghaolta le dóchúlacht cumhachta de dhlí na cumhachta. Tá an dlí ainmnithe i ndiaidh an teangeolaí George Kingsley Zipf a chéad mhol é (Zipf 1935, 1949), cé go bhfuil fianaise ann gur thug an rialtacht faoi deara roimh Zipf. (ga) La loi de Zipf est une observation empirique concernant la fréquence des mots dans un texte. Elle a pris le nom de son auteur, George Kingsley Zipf (1902-1950). Cette loi a d'abord été formulée par Jean-Baptiste Estoup et a été par la suite démontrée à partir de formules de Shannon par Benoît Mandelbrot. Elle est parfois utilisée en dehors de ce contexte, par exemple au sujet de la taille et du nombre des villes dans chaque pays, lorsque cette loi semble mieux répondre aux chiffres que la distribution de Pareto. (fr) 지프의 법칙(Zipf's law)은 수학적 통계를 바탕으로 밝혀진 경험적 법칙으로, 물리 및 사회 과학 분야에서 연구된 많은 종류의 정보들이 지프 분포에 가까운 경향을 보인다는 것을 뜻한다. 지프 분포는 이산 멱법칙 확률분포와 관계된 확률분포의 하나이다. 미국 하버드대학교 언어학자인 조지 킹슬리 지프(George Kingsley Zipf)가 최초로 이 법칙을 공식 제안(Zipf 1935, 1949)함에 따라 그의 이름을 따 지프의 법칙으로 부르게 되었다. 그러나 실제로는 프랑스의 속기사였던 장바티스트 에스투프(Jean-Baptiste Estoup, 1868~1950)가 지프 이전에 이 법칙을 발견하였다. 또한 독일의 물리학자 펠릭스 아워바흐(Felix Auerbach)도 1913년에 이 법칙에 대해 언급하였다. (ko) ジップの法則(ジップのほうそく、Zipf's law)あるいはジフの法則とは、出現頻度が k 番目に大きい要素が、1位のものの頻度と比較して 1/k に比例するという経験則である。Zipf は「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。 包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はの特殊な形である。 この法則はアメリカの言語学者ジョージ・キングズリー・ジップに帰せられている。ジップ以前に似た観察をしていた先行研究として、などの研究があり、ジップ自身もそのことを1942年の論文で紹介した。 (ja) Prawo Zipfa – prawo empiryczne głoszące, że wiele rodzajów danych tworzonych przez ludzi lub odnoszących się do ich zachowań cechuje charakterystyczny rozkład wartości, w którym dystrybucja częstotliwości występowania poszczególnych wartości jest odwrotnie proporcjonalna do ich rangi statystycznej. Pod koniec XIX wieku francuski stenograf i leksykograf , badając zasady stenografii, ustalił podstawowe zasady statystyczne dotyczące tekstu. Twierdzenia francuskiego badacza zweryfikował i uściślił amerykański lingwista George Kingsley Zipf. (pl) Зако́н Ци́пфа («ранг—частотность») — эмпирическая закономерность распределения частотности слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частотности их использования, то частотность n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и так далее. (ru) 齐夫定律(英語:Zipf's law,IPA/ˈzɪf/)是由哈佛大學的語言學家于1949年发表的实验定律。它可以表述为:在自然语言的語料庫裡,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与冪定律概率分布有关的事物的参考。 (zh) Зако́н Ци́пфа (Зіпфа) — закон, згідно з яким відношення рангу слова в частотному словнику до частотності слова в мові становить постійну величину (константу).Інакше кажучи, якщо всі слова мови (або просто достатньо довгого тексту) впорядкувати за спаданням частоти їхнього використання, то частота n-го слова в такому списку виявиться приблизно обернено пропорційною його порядковому номеру n (так званому рангу цього слова). Наприклад, друге за вживаністю слово трапляється приблизно вдвічі рідше, ніж перше, третє — втричі рідше, ніж перше, і так далі. (uk) La llei de Zipf és una constant estadística que va néixer al camp del vocabulari de les llengües naturals i s'ha aplicat posteriorment a altres camps. Preveia una relació entre les paraules més comunes i el nombre de vegades que apareixien respecte a les altres, de manera que la paraula més freqüent apareix el doble de vegades que la propera, triple de vegades que la tercera, i així successivament en una correlació inversa entre freqüència d'aparició i rang ocupat en l'ordre d'aparicions de la paraula. Aquesta llei de proporcionalitat existeix en la majoria de llengües naturals analitzades, i també en esperanto. El nom prové del seu creador, el lingüista . (ca) La distribuo de Zipf aŭ leĝo de Zipf ricevis sian nomon de George Kingsley Zipf (1902-1950). Ĝi priskribas kiom ofte la diversaj vortoj de ajna lingvo aperas en tekstoj. En tekstoj, atendeble, gramatikaj vortoj kiaj la aŭ de aperas tre ofte. Aliaj vortoj aperas malpli ofte, aŭ eĉ nur unufoje. Zipf konstatis, ke ordigante la vortojn de plej oftaj ĝis plej maloftaj, oni vidas ke la apernombro (aŭ ofto) de vorto estas inverso de ĝia rango. apernombro de n-ranga vorto = (apernombro de 1a-ranga vorto) / n Ekzemple: (eo) La llamada ley de Zipf, formulada en la década de 1940 por George Kingsley Zipf, lingüista de la Universidad de Harvard, es una ley empírica según la cual en una determinada lengua la frecuencia de aparición de distintas palabras sigue una distribución que puede aproximarse por La ley de Zipf se cumple para la mayoría de las lenguas, inclusive para lenguas planificadas como el esperanto.​ (es) Zipfen legea errealitate fisiko eta sozialeko fenomeno anitzetan azaltzen den probabilitate-lege bat da, elementu batzuen tamaina eta ordena lotzen dituena. George Kingsley Zipf estatubatuar hizkuntzalariak sortu zuen, hizkuntza baten hitzen maiztasuna ikertzean: maiztasun handieneko lehenengo hitza bigarren hitza bi halakotan agertu ohi da gutxi gorabehera, hirugarren hitza hiru halakotan... Hitzen maiztasunaz gainera, legea hirien tamaina, webguneen bisita eta beste aldagai askotarako egiaztatu izan da, batzuetan doikuntza egokia izan ez bada ere. (eu) Zipf's law (/zɪf/, German: [ts͡ɪpf]) is an empirical law formulated using mathematical statistics that refers to the fact that for many types of data studied in the physical and social sciences, the rank-frequency distribution is an inverse relation. The Zipfian distribution is one of a family of related discrete power law probability distributions. It is related to the zeta distribution, but is not identical. The law is similar in concept, though not identical in distribution, to Benford's law. (en) Viene detta legge di Zipf una legge empirica che descrive la frequenza di un evento facente parte di un insieme, in funzione della posizione (detta rango) nell'ordinamento decrescente rispetto alla frequenza stessa di tale evento. dove: * indica il rango * indica l'evento che occupa l'i-esimo rango (ovvero l'i-esimo evento più frequente) * è il numero di volte (frequenza) che si verifica l'evento * è una costante di normalizzazione, pari al valore . (it) De wet van Zipf is oorspronkelijk de door George Kingsley Zipf (1902-1950) geconstateerde en naar hem genoemde wetmatigheid in de taalkunde, dat in natuurlijke taal de frequentie van voorkomen van een woord ruwweg omgekeerd evenredig is met de rang van het woord in de frequentietabel, en wel zo dat het meest frequente woord ongeveer twee keer zo vaak voorkomt als het op een na frequentste woord, drie keer zo vaak als het derde frequentste, enz. Met de Wet van Zipf worden tegenwoordig kansverdelingen aangeduid die de vorm van een machtswet hebben. De wet kan gekarakteriseerd worden door het lineaire verband tussen de logaritmen van rangnummer en kans of frequentie. In dubbellogaritmische weergave is het verband een rechte lijn. (nl) A Lei de Zipf é uma lei empírica formulada utilizando estatísticas matemáticas que se refere ao fato de que para muitos tipos de dados estudados nas ciências físicas e sociais, a distribuição de frequência de classificação é uma relação inversa. A distribuição zipfiana esta inserida dentro da família de leis de distribuições de probabilidades poder discreta relacionadas. Está relacionado com a , mas não é idêntica. A Lei de Zipf é semelhante em conceito, embora não idêntico na distribuição, à Lei de Benford. (pt) Zipfs lag (uttalas zɪfs) är en empiriskt visad statistisk lag som säger att inom många tillämpningsområden inom såväl samhällsvetenskap som naturvetenskap gäller att vid stora mängder diskreta data är rankingfrekvensen (förekomsten av det vanligaste värdet, näst vanligaste värdet, osv) approximativt Zipffördelade. Lagen är bland annat giltig på frekvensen av ord i ett språk eller en längre text, på städers folkmängd i ett land, på massmediers popularitet, på webbplatsers besöksstatistik, på inkomststorlekar, företagsstorlekar, med mera. Lagen återspeglar att det finns några få mycket vanliga ord och många ovanliga, få stora städer och många små, och så vidare. (sv)
rdfs:label قانون زيف (ar) Llei de Zipf (ca) Zipfův zákon (cs) Zipfsches Gesetz (de) Leĝo de Zipf (eo) Zipfen legea (eu) Ley de Zipf (es) Dlí Zipf (ga) Loi de Zipf (fr) Legge di Zipf (it) ジップの法則 (ja) 지프의 법칙 (ko) Wet van Zipf (nl) Prawo Zipfa (pl) Lei de Zipf (pt) Закон Ципфа (ru) Zipfs lag (sv) Zipf's law (en) Закон Ципфа (uk) 齊夫定律 (zh)
owl:sameAs freebase:Zipf's law wikidata:Zipf's law dbpedia-ar:Zipf's law dbpedia-az:Zipf's law dbpedia-be:Zipf's law http://bs.dbpedia.org/resource/Zipfov_zakon dbpedia-ca:Zipf's law dbpedia-cs:Zipf's law dbpedia-da:Zipf's law dbpedia-de:Zipf's law dbpedia-eo:Zipf's law dbpedia-es:Zipf's law dbpedia-eu:Zipf's law dbpedia-fa:Zipf's law dbpedia-fi:Zipf's law dbpedia-fr:Zipf's law dbpedia-ga:Zipf's law dbpedia-gl:Zipf's law dbpedia-he:Zipf's law dbpedia-hu:Zipf's law dbpedia-it:Zipf's law dbpedia-ja:Zipf's law dbpedia-ko:Zipf's law dbpedia-nl:Zipf's law dbpedia-pl:Zipf's law dbpedia-pnb:Zipf's law dbpedia-pt:Zipf's law dbpedia-ru:Zipf's law dbpedia-simple:Zipf's law dbpedia-sl:Zipf's law dbpedia-sv:Zipf's law http://ta.dbpedia.org/resource/சிஃபுவின்_விதி dbpedia-tr:Zipf's law dbpedia-uk:Zipf's law http://ur.dbpedia.org/resource/ذف_کا_قانون dbpedia-zh:Zipf's law https://global.dbpedia.org/id/xNQB yago-res:Zipf's law http://d-nb.info/gnd/4190937-9
prov:wasDerivedFrom wikipedia-en:Zipf's_law?oldid=1123126830&ns=0
foaf:depiction wiki-commons:Special:FilePath/Wikipedia-n-zipf.png wiki-commons:Special:FilePath/Zipf_30wiki_en_labels.png wiki-commons:Special:FilePath/Zipf_distribution_CMF.png wiki-commons:Special:FilePath/Zipf_distribution_PMF.png
foaf:isPrimaryTopicOf wikipedia-en:Zipf's_law
is dbo:knownFor of dbr:George_Kingsley_Zipf
is dbo:wikiPageDisambiguates of dbr:Zipf
is dbo:wikiPageRedirects of dbr:Zipf's_Law dbr:Zipf`s_law dbr:Zipfs_law dbr:Zipf's_curve dbr:Zipf's_laws dbr:Zipf_Law dbr:Zipf_distribution dbr:Zipf_law dbr:Zipfian_distribution dbr:Zipf’s_law
is dbo:wikiPageWikiLink of dbr:Power_law dbr:Scientific_law dbr:List_of_eponymous_laws dbr:List_of_examples_of_Stigler's_law dbr:Menzerath's_law dbr:1935_in_science dbr:Benford's_law dbr:Bibliogram dbr:Riemann_zeta_function dbr:Voynich_manuscript dbr:Index_of_linguistics_articles dbr:Inuit_languages dbr:List_of_probability_distributions dbr:List_of_probability_topics dbr:List_of_scientific_laws_named_after_people dbr:Critical_Mass_(book) dbr:Nonsense dbr:Zipf–Mandelbrot_law dbr:Mixture_model dbr:Simon_model dbr:Coleman–Liau_index dbr:George_Kingsley_Zipf dbr:Bradford's_law dbr:Animal_consciousness dbr:Stable_distribution dbr:Communication_with_extraterrestrial_intelligence dbr:Zipf's_Law dbr:Empirical_statistical_laws dbr:Feature_hashing dbr:Pareto_distribution dbr:Timișoara dbr:Wake_(Sawyer_novel) dbr:Document-term_matrix dbr:Head/tail_breaks dbr:Heaps'_law dbr:Laurance_Doyle dbr:Law_(principle) dbr:Lindy_effect dbr:Yule–Simon_distribution dbr:Self-similarity dbr:833_cents_scale dbr:Alfred_J._Lotka dbr:Estate_Khmaladze dbr:Euler's_constant dbr:Felix_Auerbach dbr:Brevity_law dbr:Pareto_principle dbr:Central_place_theory dbr:Hapax_legomenon dbr:Harmonic_number dbr:Inuit_grammar dbr:Hurwitz_zeta_function dbr:Jean-Baptiste_Estoup dbr:Zeta_distribution dbr:Zipf dbr:Zipf`s_law dbr:Zipfs_law dbr:Philip_Ball dbr:Frequency_analysis dbr:Human_migration dbr:Informetrics dbr:Brown_Corpus dbr:Catalog_of_articles_in_probability_theory dbr:Word_list dbr:King_effect dbr:Tf–idf dbr:Long_tail dbr:Lorenz_curve dbr:Lotka's_law dbr:Macmillan_English_Dictionary_for_Advanced_Learners dbr:Minimum_Fisher_information dbr:Scale-free_ideal_gas dbr:Unit_fraction dbr:List_of_statistics_articles dbr:List_of_terms_relating_to_algorithms_and_data_structures dbr:P2P_caching dbr:Supersymmetry dbr:Gibrat's_law dbr:Theory_of_intervening_opportunities dbr:Scientific_phenomena_named_after_people dbr:Most_common_words_in_English dbr:Quantitative_linguistics dbr:Word_frequency_effect dbr:Species_discovery_curve dbr:Parabolic_fractal_distribution dbr:Rank–size_distribution dbr:Vitold_Belevitch dbr:Supersymmetric_theory_of_stochastic_dynamics dbr:Zipf's_curve dbr:Zipf's_laws dbr:Zipf_Law dbr:Zipf_distribution dbr:Zipf_law dbr:Zipfian_distribution dbr:Zipf’s_law
is dbp:knownFor of dbr:George_Kingsley_Zipf
is foaf:primaryTopic of wikipedia-en:Zipf's_law