Gemiddelde (original) (raw)

Uit Wikipedia, de vrije encyclopedie

Bij rekenen en in de wiskunde is het gemiddelde of de gemiddelde waarde een begrip dat veelvuldig voorkomt. Het is een centrummaat. Het bekendste is het rekenkundig gemiddelde: de som van een aantal getallen gedeeld door het aantal getallen.

In de statistiek wordt het begrip gemiddelde veel gebruikt. We moeten hierbij onderscheiden of het om de gehele populatie gaat of om een steekproef daaruit.

In de statistiek wordt het populatiegemiddelde van een kenmerkende grootheid vaak aangeduid met de Griekse letter μ {\displaystyle \mu } {\displaystyle \mu }. Voor een eindige populatie is het populatiegemiddelde niets anders dan het rekenkundig gemiddelde van alle populatiewaarden.

Bij aselecte trekking van een waarde X {\displaystyle X} {\displaystyle X} van die grootheid uit de populatie, is de kansverdeling van X {\displaystyle X} {\displaystyle X} de populatieverdeling, met als gevolg dat de verwachtingswaarde van X {\displaystyle X} {\displaystyle X} gelijk is aan het populatiegemiddelde.

Heeft X {\displaystyle X} {\displaystyle X} een discrete verdeling met kansfunctie p ( x ) {\displaystyle p(x)} {\displaystyle p(x)}, dan is de verwachtingswaarde gedefinieerd door:

μ = E ⁡ ( X ) = ∑ i x i p ( x i ) {\displaystyle \mu =\operatorname {E} (X)=\sum _{i}x_{i}p(x_{i})} {\displaystyle \mu =\operatorname {E} (X)=\sum _{i}x_{i}p(x_{i})}

Als X {\displaystyle X} {\displaystyle X} een continue verdeling heeft met kansdichtheid f ( x ) {\displaystyle f(x)} {\displaystyle f(x)}, dan is de verwachtingswaarde gedefinieerd door:

μ = E ⁡ ( X ) = ∫ x f ( x ) d x {\displaystyle \mu =\operatorname {E} (X)=\int xf(x)\,\mathrm {d} x} {\displaystyle \mu =\operatorname {E} (X)=\int xf(x)\,\mathrm {d} x}

Het is vaak onmogelijk om het populatiegemiddelde te bepalen. Is men bijvoorbeeld geïnteresseerd in het gemiddelde gewicht van de Sumatraanse neushoorn, dan kan men dat gewoon bepalen, omdat er nog maar zo'n 250 van zijn, maar bij steekmuggen ligt dat anders. Er zijn er te veel om ze allemaal te kunnen onderzoeken. In zo'n geval nemen statistici hun toevlucht tot een steekproef om door de berekening van het steekproefgemiddelde een schatting te krijgen van het populatiegemiddelde.

Het steekproefgemiddelde is het rekenkundige gemiddelde van de steekproef. Als de steekproefuitkomst bestaat uit de n {\displaystyle n} {\displaystyle n} elementen x 1 , … , x n {\displaystyle x_{1},\ldots ,x_{n}} {\displaystyle x_{1},\ldots ,x_{n}}, dan is het steekproefgemiddelde het getal:

x ¯ = 1 n ∑ i = 1 n x i {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}} {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}}

In de theorie is men niet zozeer geïnteresseerd in de uitkomsten, maar in het stochastisch gedrag van de steekproef. De steekproef bestaat uit de n {\displaystyle n} {\displaystyle n} stochastische variabelen X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}} {\displaystyle X_{1},\ldots ,X_{n}} en het steekproefgemiddelde is de variabele:

X ¯ = 1 n ∑ i = 1 n X i {\displaystyle {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}} {\displaystyle {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}}

Het steekproefgemiddelde x ¯ {\displaystyle {\bar {x}}} {\displaystyle {\bar {x}}} wordt vaak gebruikt om iets te zeggen over het populatiegemiddelde μ {\displaystyle \mu } {\displaystyle \mu }. Het steekproefgemiddelde is bij een aselecte steekproef een goede benadering, of schatting, van het populatiegemiddelde. De steekproefelementen X i {\displaystyle X_{i}} {\displaystyle X_{i}} zijn bij een aselecte steekproef onderling onafhankelijk en gelijkverdeeld. Mits E ⁡ X {\displaystyle \operatorname {E} X} {\displaystyle \operatorname {E} X} bestaat is:

E ⁡ X ¯ = 1 n ∑ i = 1 n E ⁡ X i = E ⁡ X {\displaystyle \operatorname {E} {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}\operatorname {E} X_{i}=\operatorname {E} X} {\displaystyle \operatorname {E} {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}\operatorname {E} X_{i}=\operatorname {E} X}

Als bovendien var ⁡ X < ∞ {\displaystyle \operatorname {var} X<\infty } {\displaystyle \operatorname {var} X<\infty }, geldt ook:

var ⁡ X ¯ = 1 n 2 ∑ i = 1 n var ⁡ X i = 1 n var ⁡ X {\displaystyle \operatorname {var} {\bar {X}}={\frac {1}{n^{2}}}\sum _{i=1}^{n}\operatorname {var} X_{i}={\frac {1}{n}}\operatorname {var} X} {\displaystyle \operatorname {var} {\bar {X}}={\frac {1}{n^{2}}}\sum _{i=1}^{n}\operatorname {var} X_{i}={\frac {1}{n}}\operatorname {var} X}

Hoe goed deze benadering is, hangt nog van vele factoren af, zoals van de steekproefomvang en de onderliggende verdeling. Wanneer het aantal proeven voldoende is, is daarmee voor de steekproef een wet van de grote aantallen bepaald. Er zijn verdelingen die geen populatiegemiddelde bezitten, omdat de bovenstaande integraal niet bestaat.

Gelukkig kunnen we vaak veronderstellen dat de onderliggende verdeling normaal is. Dan speelt naast de verwachtingswaarde alleen de standaardafwijking een rol, waarvan we de waarde ook uit de steekproef kunnen schatten.