Moyenne (original) (raw)
Construction de différentes moyennes de deux nombres réels positifs dans un trapèze.
Construction de différentes moyennes de deux nombres réels positifs sur un demi-cercle[1].
En mathématiques, la moyenne est un outil de calcul permettant de résumer une liste de valeurs numériques en un seul nombre réel, indépendamment de l’ordre dans lequel la liste est donnée. À défaut de précision supplémentaire, le terme désigne la moyenne arithmétique, qui se calcule comme la somme des termes de la liste divisée par son nombre de termes[2], et s’applique de la même manière aux nombres complexes et aux vecteurs réels. D’autres moyennes peuvent être plus adaptées selon le contexte. Dans tous les cas, la moyenne est intermédiaire entre les valeurs extrêmes de la liste.
La moyenne est un des premiers indicateurs statistiques pour une liste de nombres (une série statistique). Elle est couramment utilisée pour estimer un niveau global, par exemple celui d’une classe, à partir des notes obtenues par les élèves à un examen.
Lorsqu'une certaine quantité est globalement distribuée à une population, la moyenne des quantités reçues individuellement exprime la quantité que chacun reçoit avec une répartition à parts égales.
La notion de moyenne s’étend avec la valeur moyenne d’une fonction intégrable, le barycentre d’un ensemble fini de points en géométrie classique, l’espérance d’une variable aléatoire et la moyenne empirique en théorie des probabilités, la moyenne de Fréchet dans un espace complet.
La notion de moyenne est historiquement reliée à celle de valeur intermédiaire, appelée aussi médiété[3]. Étant donnés deux nombres a et b, comment choisir une valeur c pour que a soit à c ce que c est à b ? La réponse diffère selon l’opération choisie pour aller d’un nombre à l’autre.
Par exemple, pour aller de 2 à 18, on peut ajouter deux fois 8, avec une étape en 10, ou multiplier deux fois par 3, avec une étape en 6. Le premier cas décrit une moyenne arithmétique, qui s’obtient par la fraction 2 + 18 2 = 10 {\displaystyle {\frac {2+18}{2}}=10} . Le second cas est une moyenne géométrique qui s’obtient avec la racine carrée 2 × 18 = 6 {\displaystyle {\sqrt {2\times 18}}=6}
.
Un tel procédé est caractéristique des moyennes quasi-arithmétiques, que l’on définit sur les nombres d’un intervalle I à l’aide d’une fonction réelle f continue sur I et strictement monotone (donc admettant une réciproque) :
m ( a , b ) = f − 1 ( f ( a ) + f ( b ) 2 ) {\displaystyle m(a,b)=f^{-1}\left({\frac {f(a)+f(b)}{2}}\right)}
En particulier, la fonction logarithme fournit la moyenne géométrique, la fonction inverse donne la moyenne harmonique et les fonctions puissances d’exposant p > 0 définissent les moyennes d’ordre p, dont la moyenne quadratique (pour p = 2).
Une autre manière de définir une moyenne de deux nombres est de disposer d'une opération de cumul et de chercher comment obtenir le même résultat en cumulant plusieurs fois la même valeur. Avec une addition, on trouve 2+18=20, qu’on aurait pu obtenir en posant 10+10=20. Avec une multiplication, on trouve 2×18=36, qu’on aurait pu obtenir avec 6×6=36.
Pour un aller-retour à vélo sur une distance d avec une vitesse moyenne v1 à l’aller et v2 au retour, la fonction de cumul peut être le temps total
d v 1 + d v 2 = d v 1 + v 2 v 1 v 2 {\displaystyle {\frac {d}{v_{1}}}+{\frac {d}{v_{2}}}=d{\frac {v_{1}+v_{2}}{v_{1}v_{2}}}}
ce qui donne comme vitesse moyenne la moyenne harmonique
H ( v 1 , v 2 ) = 2 v 1 v 2 v 1 + v 2 {\displaystyle H(v_{1},v_{2})={\frac {2v_{1}v_{2}}{v_{1}+v_{2}}}}
Le cadre général de cette méthode est celui d’une moyenne de Chisini (en), déterminé par une fonction de cumul c : I × I → R {\displaystyle c:I\times I\to \mathbb {R} } symétrique ( c ( a , b ) = c ( b , a ) {\displaystyle c(a,b)=c(b,a)}
), monotone de même sens en chaque variable et dont la diagonale Δ c : I → R {\displaystyle \Delta c:I\to \mathbb {R} }
définie par Δ c ( x ) = c ( x , x ) {\displaystyle \Delta c(x)=c(x,x)}
est continue et injective (donc admet une réciproque), ce qui permet de définir
m ( a , b ) = ( Δ c ) − 1 ( c ( a , b ) ) {\displaystyle m(a,b)=(\Delta c)^{-1}(c(a,b))}
Les moyennes conjuguées rentrent toujours dans ce cadre avec un cumul défini par c ( a , b ) = f ( a ) + f ( b ) {\displaystyle c(a,b)=f(a)+f(b)} .
La méthode peut être généralisée pour établir une moyenne de plus de deux nombres, avec des fonctions de cumul qui doivent être compatibles.
La moyenne peut aussi être concrétisée par le point d'équilibre d’un ensemble fini de masses ponctuelles positionnées le long de la droite numérique, comme sur un mobile.
Cette approche permet d’introduire naturellement la notion de moyenne pondérée en considérant que les masses peuvent être différentes. Dans ce cas, le point d'équilibre est décalé vers les masses plus importantes. Ce principe apparait également dans les calculs de moyenne scolaire, où la note de devoirs surveillés pèse souvent davantage qu’un devoir oral ou à la maison. Par exemple, une note de 7/20 avec un coefficient 3 et une note de 19/20 avec un coefficient 1 donnera une moyenne de 10/20, trois fois plus proche de 7 que de 19 :
3 × 7 + 1 × 19 3 + 1 = 40 4 = 10 {\displaystyle {\frac {3\times 7+1\times 19}{3+1}}={\frac {40}{4}}=10} .
Dans de nombreux cas, la moyenne d'un _n_-uplet de points x = ( x 1 , … , x n ) {\displaystyle \mathbf {x} =(x_{1},\dots ,x_{n})} dans un intervalle I {\displaystyle I}
est la valeur qui minimise la somme[4],[5]
D ( x ) = ∑ i = 1 n d ( x , x i ) {\displaystyle D(x)=\sum _{i=1}^{n}d(x,x_{i})} ,
pour une semi-distance d définie sur I 2 {\displaystyle I^{2}} (ne vérifiant pas forcément l'inégalité triangulaire). En utilisant la notion d'argument du minimum, on peut alors écrire :
M ( x ) = a r g m i n x ∈ I ∑ i = 1 n d ( x , x i ) {\displaystyle M(\mathbf {x} )=\operatorname {arg\,min} _{x\in I}\sum _{i=1}^{n}d(x,x_{i})} .
Cependant, pour une semi-distance quelconque, la valeur minimale de cette somme peut être atteinte en plusieurs points, voire ne pas être atteinte du tout.
Exemples :
- pour I = ] − ∞ , + ∞ [ {\displaystyle I=]-\infty ,+\infty [} ![{\displaystyle I=]-\infty ,+\infty }, la semi-distance d ( x , y ) = ( x − y ) 2 {\displaystyle d(x,y)=(x-y)^{2}}
donne une somme minimisée en un seul point, la moyenne arithmétique du _n_-uplet (application du théorème de Koenig-Huygens) ; on peut écrire M a ( x ) = a r g m i n x ∈ R ∑ i = 1 n ( x − x i ) 2 {\displaystyle M_{a}(\mathbf {x} )=\operatorname {arg\,min} _{x\in \mathbb {R} }\sum _{i=1}^{n}(x-x_{i})^{2}}
.
- pour I = ] 0 , + ∞ [ {\displaystyle I=]0,+\infty [} ![{\displaystyle I=]0,+\infty }, la semi-distance d ( x , y ) = ( ln x − ln y ) 2 {\displaystyle d(x,y)=(\ln x-\ln y)^{2}}
induit la moyenne géométrique du _n_-uplet
- pour I = ] 0 , + ∞ [ {\displaystyle I=]0,+\infty [} ![{\displaystyle I=]0,+\infty }, la semi-distance d ( x , y ) = ( 1 x − 1 y ) 2 {\displaystyle d(x,y)=\left({\frac {1}{x}}-{\frac {1}{y}}\right)^{2}}
induit la moyenne harmonique du _n_-uplet
- Plus généralement, la semi-distance d ( x , y ) = ( f ( x ) − f ( y ) ) 2 {\displaystyle d(x,y)=\left(f(x)-f(y)\right)^{2}}
induit la moyenne quasi-arithmétique selon f du _n_-uplet.
Tracé de D ( x ) = ∑ i = 1 n | x − x i | {\displaystyle D(x)=\sum _{i=1}^{n}|x-x_{i}|} pour x = ( 0 , 1 , 3 , 6 , 7 , 9 ) {\displaystyle \mathbf {x} =(0,1,3,6,7,9)}
; le minimum est atteint sur [ 3 , 6 ] {\displaystyle [3,6]}
, correspondant aux valeurs médianes.
En revanche, la distance discrète basée sur le symétrique du symbole delta de Kronecker
d ( x , y ) = 1 − δ x y = { 1 s i x ≠ y 0 s i n o n {\displaystyle d(x,y)=1-\delta _{x\,y}={\begin{cases}1&\mathrm {si} \,x\neq y\\0&\mathrm {sinon} \end{cases}}}
ne donne pas une valeur moyenne du _n_-uplet mais ses modes (éléments ayant le plus fort effectif dans le n-uplet), et la distance usuelle d(x,y) = |x – y| renvoie les valeurs médianes (soit x p {\displaystyle x_{p}} si n = 2 p + 1 {\displaystyle n=2p+1}
, ou tout élément de [ x p , x p + 1 ] {\displaystyle [x_{p},x_{p+1}]} ![{\displaystyle [x{p},x{p+1}]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/201db315740e3e585b62fe7ae40ce5a46f8af27b) si n = 2 p {\displaystyle n=2p}
; voir figure).
Pour d'autres moyennes, comme la moyenne logarithmique, le problème reste ouvert car aucune semi-distance associée n'a été déterminée.
On peut aussi évoquer la moyenne de Fréchet dans le cas où la fonctionnelle à minimiser est la variance de Fréchet[6] :
V ( x ) = ∑ i = 1 n d 2 ( x , x i ) . {\displaystyle V(x)=\sum _{i=1}^{n}d^{2}(x,x_{i}).}
On parlera de moyenne de Karcher quand le minimum n'est pas atteint en un unique point, et de moyenne de Fréchet quand ce minimum est en un unique point.
On distingue trois classes de définitions de moyennes numériques sur un intervalle I :
- les moyennes binaires, qui sont définies pour tous les couples de nombres dans I ;
- les moyennes d’arité quelconque, qui sont définies pour toutes les listes finies (non vides) de nombres dans I ;
- les moyennes pondérées, qui sont définies pour toutes les listes finies non vides de couples (xi, wi) où xi ∈ I avec un poids wi ∈ ℝ+, avec une somme des poids non nulle.
Les moyennes répertoriées satisfont toutes les deux propriétés suivantes :
- leur résultat est intermédiaire entre les argument[7] :
min ( x 1 , … , x n ) ⩽ m ( x 1 , … , x n ) ⩽ max ( x 1 , … , x n ) {\displaystyle \min(x_{1},\dots ,x_{n})\leqslant m(x_{1},\dots ,x_{n})\leqslant \max(x_{1},\dots ,x_{n})} - le résultat est invariant par permutation σ des termes de la liste :
m ( x σ ( 1 ) , … , x σ ( n ) ) = m ( x 1 , … , x n ) {\displaystyle m(x_{\sigma (1)},\dots ,x_{\sigma (n)})=m(x_{1},\dots ,x_{n})}
La première propriété implique directement la propriété d’identité : si toutes les valeurs de la liste sont égales, la moyenne doit aussi avoir cette valeur :
m ( a , a , . . . , a ) = a {\displaystyle m(a,a,...,a)=a}
Beaucoup de moyennes satisfont en plus les propriétés suivantes :
- homogénéité de degré 1[8]:
∀ t ∈ R , m ( t x 1 , t x 2 , . . . , t x n ) = t m ( x 1 , x 2 , . . . , x n ) {\displaystyle \forall t\in \mathbb {R} ,\ m(tx_{1},tx_{2},...,tx_{n})=t\,m(x_{1},x_{2},...,x_{n})} - croissance par rapport à chacune des variables[9],[8]
- inégalités strictes :
x = m ( x , y ) ⟹ x = y {\displaystyle x=m(x,y)\Longrightarrow x=y} - continuité par rapport à chacune des variables
Pour les moyennes d’arité quelconque, on peut exiger une condition de compatibilité, stipulant que la moyenne d’une liste est inchangée si on remplace certains termes de la liste par leur moyenne partielle :
m ( x 1 , … , x n ) = m ( μ , … , μ , x k + 1 , … , x n ) {\displaystyle m(x_{1},\dots ,x_{n})=m(\mu ,\dots ,\mu ,x_{k+1},\dots ,x_{n})} où μ = m ( x 1 , … , x k ) {\displaystyle \mu =m(x_{1},\dots ,x_{k})}
Enfin, pour une moyenne pondérée, la condition de compatibilité est décomposée en deux parties :
- la moyenne est inchangée en supprimant les termes de poids nul ;
- la moyenne est inchangée si on remplace certains couples de la liste par un seul couple avec la moyenne pondérée partielle et la somme des poids correspondants :
m ( ( x 1 , w 1 ) , … , ( x n , w n ) ) = m ( ( m ( ( x 1 , w 1 ) , … , ( x k , w k ) ) , ∑ i = 1 k w i ) , ( x k + 1 , w k + 1 ) , … , ( x n , w n ) ) {\displaystyle m((x_{1},w_{1}),\dots ,(x_{n},w_{n}))=m\left(\left(m((x_{1},w_{1}),\dots ,(x_{k},w_{k})),\sum _{i=1}^{k}w_{i}\right),(x_{k+1},w_{k+1}),\dots ,(x_{n},w_{n})\right)}
On[Qui ?] appelle moyenne de deux nombres x et y, une fonctionnelle m : R + × R + ⟹ R + {\displaystyle m:\mathbb {R} _{+}\times \mathbb {R} _{+}\Longrightarrow \mathbb {R} _{+}} continue vérifiant les propriétés suivantes :
- x ⩽ y ⟹ x ⩽ m ( x , y ) ⩽ y {\displaystyle x\leqslant y\Longrightarrow x\leqslant m(x,y)\leqslant y}
- m ( y , x ) = m ( x , y ) {\displaystyle m(y,x)=m(x,y)}
- x = m ( x , y ) ⟹ x = y {\displaystyle x=m(x,y)\Longrightarrow x=y}
Oscar Chisini donne une définition moins restrictive (en) d'une moyenne « substitutive », où la moyenne de x et y par rapport à m est la valeur t telle que[10],[11] :
m ( t , t ) = m ( x , y ) . {\displaystyle m(t,t)=m(x,y).}
Hardy, Littlewood et Pólya, dans leur ouvrage Inequalities définissent la moyenne d'un ensemble discret de nombres (_x_1, ..., xn) à partir d'une fonction φ telle que, avec m = min i x i , M = max i x i {\displaystyle m=\min _{i}x_{i},M=\max _{i}x_{i}} , φ est continue et strictement monotone sur [m , M_], et pour un ensemble de poids (ω1, ..., ω_n) strictement positifs et de somme égale à 1, la moyenne de (_x_1, ..., xn) est la valeur x telle que[12]:
φ ( x ¯ ) = ∑ i = 1 n ω i φ ( x i ) {\displaystyle \varphi ({\bar {x}})=\sum _{i=1}^{n}\omega _{i}\varphi (x_{i})}
Pour toute liste (_x_1, ..., xn) de réels, on définit sa moyenne arithmétique par la formule x ¯ = 1 n ∑ i = 1 n x i {\displaystyle {\overline {x}}={1 \over n}\sum _{i=1}^{n}{x_{i}}} , qui ne dépend pas de l’ordre des termes et est toujours comprise entre les valeurs minimale et maximale de la liste.
Cette moyenne est linéaire, c’est-à-dire que l’addition ou la multiplication par une constante sur les valeurs de la liste se traduit par la même opération sur la moyenne.
Pour calculer une moyenne sur une liste dans laquelle beaucoup de valeurs sont répétées, on peut noter (_x_1, ..., xk) la liste des valeurs (sans répétition) et (_n_1, ..., nk) la liste des effectifs (le nombre de fois qu’apparait chaque valeur dans la liste initiale). La moyenne s’écrit alors x ¯ = 1 ∑ i = 1 k n i ∑ i = 1 k n i x i {\displaystyle {\overline {x}}={1 \over \sum _{i=1}^{k}n_{i}}\sum _{i=1}^{k}{n_{i}x_{i}}} .
On retrouve la notion de moyenne pondérée, dans laquelle les facteurs ni ne représentent pas nécessairement des effectifs, mais des coefficients appelés poids, par exemple pour calculer la moyenne de notes sur un bulletin scolaire dans lequel on souhaite accorder plus d’importance à certaines disciplines ou à certains devoirs, en leur attribuant un coefficient plus grand que les autres.
La moyenne arithmétique est aussi cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.
Étant donnée une liste (_x_1, ..., xn) de réels positifs (voire strictement positifs pour la moyenne harmonique), avec éventuellement une liste (_m_1, ..., mn) de poids associés, positifs et non tous nuls, on définit les moyennes usuelles suivantes.
Expressions des moyennes usuelles
| Nom | Moyenne brute | Moyenne pondérée |
|---|---|---|
| moyenne arithmétique | x ¯ A = 1 n ∑ i = 1 n x i {\displaystyle {\overline {x}}_{\rm {A}}={\frac {1}{n}}\sum _{i=1}^{n}{x_{i}}} |
∑ i = 1 n m i ⋅ x i ∑ i = 1 n m i {\displaystyle {\frac {\sum _{i=1}^{n}{m_{i}\cdot x_{i}}}{\sum _{i=1}^{n}{m_{i}}}}} |
| moyenne harmonique | x ¯ H = n ∑ i = 1 n 1 x i {\displaystyle {\overline {x}}_{\rm {H}}={\frac {n}{\sum _{i=1}^{n}{1 \over x_{i}}}}} |
∑ i = 1 n m i ∑ i = 1 n m i x i {\displaystyle {\frac {\sum _{i=1}^{n}m_{i}}{\sum _{i=1}^{n}{\frac {m_{i}}{x_{i}}}}}} |
| moyenne géométrique | x ¯ G = ∏ i = 1 n x i n {\displaystyle {\overline {x}}_{\rm {G}}={\sqrt[{n}]{\prod _{i=1}^{n}x_{i}}}} |
( ∏ i = 1 n x i m i ) 1 / ∑ i = 1 n m i {\displaystyle \left(\prod _{i=1}^{n}x_{i}^{m_{i}}\right)^{1/\sum _{i=1}^{n}m_{i}}} |
| moyenne quadratique | x ¯ Q = 1 n ∑ i = 1 n x i 2 {\displaystyle {\overline {x}}_{\rm {Q}}={\sqrt {{\frac {1}{n}}\sum _{i=1}^{n}{x_{i}^{2}}}}} |
1 ∑ i = 1 n m i ∑ i = 1 n m i x i 2 {\displaystyle {\sqrt {{\frac {1}{\sum _{i=1}^{n}m_{i}}}\sum _{i=1}^{n}{m_{i}x_{i}^{2}}}}} |
Ces moyennes reprennent certaines propriétés de la moyenne arithmétique :
- la moyenne ne dépend pas de l’ordre des termes ;
- la moyenne est toujours comprise entre la valeur minimale et la valeur maximale de la liste ;
- la moyenne est homogène, c’est-à-dire que si toutes les valeurs de la liste sont multipliées par un même facteur, la moyenne est multipliée par ce même facteur ;
- la moyenne est cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.
- la moyenne est croissante (par rapport à chaque x i {\displaystyle x_{i}}
)
En outre, ces moyennes sont toujours ordonnées par les inégalités suivantes qui prolongent l’inégalité arithmético-géométrique :
x ¯ H ⩽ x ¯ G ⩽ x ¯ ⩽ x ¯ Q {\displaystyle {\overline {x}}_{\rm {H}}\leqslant {\overline {x}}_{\rm {G}}\leqslant {\overline {x}}\leqslant {\overline {x}}_{\rm {Q}}}
Toutes ces moyennes s’obtiennent sous la forme 1 n ∑ i = 1 n x i p p {\displaystyle {\sqrt[{p}]{{\frac {1}{n}}\sum _{i=1}^{n}{x_{i}^{p}}}}} ou comme limite d’expressions sous cette forme, et entrent dans la définition de la moyenne d'ordre p. Plus précisément, on retrouve :
- pour p = 1, la moyenne arithmétique ;
- pour p = 2, la moyenne quadratique ;
- pour p = –1, la moyenne harmonique ;
- lorsque p → 0, la limite de xp est la moyenne géométrique ;
- lorsque p → +∞, la limite de xp est le maximum de la liste;
- lorsque p → –∞, la limite de xp est le minimum de la liste.
Parmi les autres moyennes de deux réels strictement positifs, on trouve :
- la moyenne de Héron : N ( a , b ) = a + a b + b 3 {\displaystyle N(a,b)={\frac {a+{\sqrt {ab}}+b}{3}}}
- la moyenne contre-harmonique : C ( a , b ) = a 2 + b 2 a + b = a + b − H ( a , b ) {\displaystyle C(a,b)={\frac {a^{2}+b^{2}}{a+b}}=a+b-H(a,b)}
où H ( a , b ) {\displaystyle H(a,b)}
est la moyenne harmonique
- la centroidal mean d'un trapèze T ( a , b ) = 2 ( a 2 + a b + b 2 ) 3 ( a + b ) = 2 3 b 3 − a 3 b 2 − a 2 {\displaystyle T(a,b)={\frac {2(a^{2}+ab+b^{2})}{3(a+b)}}={\frac {2}{3}}{\frac {b^{3}-a^{3}}{b^{2}-a^{2}}}}
- la moyenne logarithmique : L ( a , b ) = b − a ln b − ln a {\displaystyle L(a,b)={\frac {b-a}{\ln b-\ln a}}}
- la moyenne de Gini : G ( a , b ) = a a a + b b b a + b {\displaystyle G(a,b)=a^{\frac {a}{a+b}}b^{\frac {b}{a+b}}}
On peut définir la moyenne énergétique de la manière suivante :
x ¯ = 10 log 10 ( 1 n ∑ i = 1 n 10 x i / 10 ) {\displaystyle {\bar {x}}=10\log _{10}\left({\frac {1}{n}}\sum _{i=1}^{n}{10^{x_{i}/10}}\right)\,}
C'est la moyenne de valeurs données en décibels, utilisées par exemple en acoustique.
Cette moyenne n’est pas homogène, mais elle reste cumulative, encadrée par le maximum et le minimum. Elle fait partie de la famille des moyennes quasi-arithmétiques qui s’écrivent sous la forme f − 1 ( f ( x ) ¯ ) = f − 1 ( 1 n ∑ i = 1 n f ( x i ) ) {\displaystyle f^{-1}({\overline {f(x)}})=f^{-1}\left({\frac {1}{n}}\sum _{i=1}^{n}f(x_{i})\right)} , où f est une fonction réelle continue et strictement croissante sur un intervalle contenant les valeurs de la liste, et f −1 est sa fonction réciproque. On retrouve en particulier les moyennes d'ordre p avec les fonctions puissances ou avec la fonction logarithme. La moyenne énergétique s’obtient avec la fonction x ↦ 10 x / 10 {\displaystyle x\mapsto 10^{x/10}}
.
À partir de deux nombres a et b, la moyenne arithmétique et la moyenne géométrique fournissant deux nouveaux nombres, et l’on peut itérer le processus pour obtenir deux suites adjacentes qui convergent vers un réel intermédiaire (parfois noté M(a,b)) appelé moyenne arithmético-géométrique et qui est relié à la longueur d’une ellipse.
Cette définition n’est cependant pas cumulative, et ne s’étend donc pas à plus de deux valeurs.
On peut évoquer, pour deux réels strictement positifs :
- les moyennes de Lehmer[13] :
L p ( a , b ) = a p + b p a p − 1 + b p − 1 {\displaystyle L_{p}(a,b)={\frac {a^{p}+b^{p}}{a^{p-1}+b^{p-1}}}}où p est un réel quelconque.
- les moyennes de Seiffert[16]:
M f = x − y 2 f ( x − y x + y ) {\displaystyle M_{f}={\frac {x-y}{2f\left({\frac {x-y}{x+y}}\right)}}}
Seiffert en personne a étudié les cas :
P = x − y 2 arcsin ( x − y x + y ) , T = x − y 2 arctan ( x − y x + y ) {\displaystyle P={\frac {x-y}{2\arcsin \left({\frac {x-y}{x+y}}\right)}},\ T={\frac {x-y}{2\arctan \left({\frac {x-y}{x+y}}\right)}}}
Étant donnée une liste (a1, … , an) de réels et une liste (x1, … , xn) de réels strictement positifs, la a-moyenne de x est égale à la moyenne arithmétique des monômes de la forme x1_a_ σ(1) × ⋯ × xn_a_ σ(n)lorsque σ décrit l’ensemble des permutations de ⟦1, n⟧.
Cette moyenne est homogène lorsque la somme des exposants ai est égale à 1, et appelée dans ce cas moyenne de Muirhead.
Dans le cas particulier n = 2, cette moyenne est appelée moyenne de Heinz.
Étant donné deux nombres réels a et b, Eves et Chen ont remarqué qu'on pouvait définir plusieurs moyennes par une fonction définie comme le rapport de deux intégrales similaires[17]. Plus précisément, pour une fonction f positive, continue, strictement croissante sur ]0;1] et telle que ∀ s ∈ ] 0 ; 1 [ , s < f ( s ) < 1 {\textstyle \forall s\in ]0;1[,s<f(s)<1} ![{\textstyle \forall s\in ]0;1,s<f(s)<1}, alors
M ( a , b ) = b f ( a b ) {\displaystyle M(a,b)=bf\left({\frac {a}{b}}\right)}
définit bien une moyenne. De plus, en posant, pour une fonction φ positive, continue, strictement croissante sur ]0;1] :
f φ ( s ) = ∫ s 1 x φ ( x ) d x ∫ s 1 φ ( x ) d x {\displaystyle f_{\varphi }(s)={\frac {\int _{s}^{1}x\varphi (x)\mathrm {d} x}{\int _{s}^{1}\varphi (x)\mathrm {d} x}}} ,
on peut définir une moyenne sur le modèle précédent.
Par exemple, pour φ(x) := φt(x) = xt, on peut retrouver plusieurs moyennes définies plus haut :
- le cas t = –3 donne la moyenne harmonique ;
- le cas t = –3/2 donne la moyenne géométrique;
- le cas t = –1 donne la moyenne logarithmique ;
- le cas t = –1/2 donne la moyenne de Héron ;
- le cas t = 0 donne la moyenne arithmétique;
- le cas t = 1 donne la centroid mean.
De plus, la monotonie de f permet de retrouver les résultats d'inégalité entre les différentes moyennes.
Afin de comparer le comportement de deux méthodes de calcul de moyennes, on connait plusieurs résultats d'inégalité entre moyennes, comme la classique inégalité arithmético-géométrique, qui établit que pour deux nombres positifs ou nuls a {\displaystyle a} et b {\displaystyle b}
, on a l'inégalité :
a b ⩽ a + b 2 {\displaystyle {\sqrt {ab}}\leqslant {\frac {a+b}{2}}}
On peut étendre ce résultat à d'autres moyennes : pour deux nombres strictement positifs distincts a {\displaystyle a} et b {\displaystyle b}
, on a les inégalités[18]:
min ( a , b ) < H ( a , b ) < G ( a , b ) < L ( a , b ) < P ( a , b ) < I ( a , b ) < A ( a , b ) < Q ( a , b ) < C ( a , b ) < max ( a , b ) {\displaystyle \min(a,b)<H(a,b)<G(a,b)<L(a,b)<P(a,b)<I(a,b)<A(a,b)<Q(a,b)<C(a,b)<\max(a,b)}
où :
- H désigne la moyenne harmonique ;
- G désigne la moyenne géométrique ;
- L désigne la moyenne logarithmique ;
- P désigne la première moyenne de Seiffert ;
- I désigne la moyenne identrique ;
- A désigne la moyenne arithmétique ;
- Q désigne la moyenne quadratique ;
- C désigne la moyenne contre-harmonique.
Pour deux moyennes _M_1 et _M_2 et une fonction continue strictement monotone φ de ] 0 , + ∞ [ {\displaystyle ]0,+\infty [} ![{\displaystyle ]0,+\infty } dans lui-même, on dit que _M_1 domine _M_2 pour cette fonction si [8]:
M 1 ( φ ( a ) , φ ( b ) ) = φ ( M 2 ( a , b ) ) {\displaystyle M_{1}(\varphi (a),\varphi (b))=\varphi (M_{2}(a,b))} pour tout a , b > 0 {\displaystyle a,b>0}
.
Les moyennes _M_1 et _M_2 sont dites équivalentes pour cette fonction si _M_1 domine _M_2 et _M_2 domine _M_1.
Par exemple, les seules moyennes homogènes équivalentes à la moyenne arithmétique sont les moyennes de Hölder, et la seule moyenne équivalente à la moyenne géométrique est elle-même[8].
La moyenne est beaucoup utilisée en évaluation scolaire. Dans de nombreux systèmes scolaires, une partie de l'évaluation des élèves débouche sur une note chiffrée, par exemple
- en France, en Belgique, en Tunisie, Algérie et au Maroc : de 0 à 10 ou de 0 à 20 (0 étant la plus mauvaise note, 10 ou 20 la meilleure) ;
- en Suisse : de 1 à 6 (1 étant la plus mauvaise note, 6 la meilleure) ;
- en Allemagne : de 6 à 1 (6 étant la plus mauvaise note, 1 la meilleure) ;
- au Canada : de 0 à 100 (0 étant la plus mauvaise note, 100 la meilleure) ;
- au Danemark : de -3 à 12 (-3 étant la plus mauvaise note, 12 la meilleure).
On peut alors calculer la moyenne des notes d'une classe dans une matière, ou la moyenne des notes d'un élève dans une matière. Ces moyennes ont des sens différents :
- la moyenne de la classe est censée représenter un « niveau global », si tant est que cela ait un sens ;
- dans le cas d'un examen de grande ampleur, comme le baccalauréat en France, où de nombreux élèves passent la même épreuve mais sont corrigés par différents professeurs, la différence des moyennes entre les groupes peut indiquer une différence de correction selon le professeur (certains étant plus sévères, d'autres plus tolérants), et l'on peut par exemple effectuer une correction de notes, une « mise en adéquation », afin que les groupes aient tous la même moyenne ; par exemple, si _m_1, _m_2… sont les moyennes des groupes et M la moyenne globale, alors les notes du groupe i seront multipliées par M/mi ;
- dans le cas d'un élève : la moyenne des notes sur une matière permet de niveler les résultats ; ainsi, si les résultats sont fluctuants, les faiblesses d'un moment sont rattrapées par les réussites d'un autre moment ;
- la moyenne des notes d'un élève dans plusieurs matières est une autre manière de niveler les résultats, non plus dans le temps mais selon la matière : les points forts rattrapent les points faibles ; la moyenne est alors un critère de sélection, sachant que ce que l'on demande d'un élève, ce n'est pas qu'il soit bon partout, mais qu'il ait des qualités permettant de rattraper ses défauts ; lorsque certaines matières sont plus importantes que d'autres, on applique des coefficients de pondération (cf. infra).
Dans ces exemples, la moyenne est un lissage des valeurs. On peut bien sûr se demander si la moyenne est un critère pertinent de sélection (voir Évaluation sommative) ; en général, ce n'est pas le seul critère qui entre en compte, à l'exception de certains examens et concours.
La moyenne est la valeur unique que devraient avoir tous les individus d'une population (ou d'un échantillon) pour que leur total soit inchangé. C'est un critère de position.
Dans la plupart des cas, le total formé par les individus d'une population est la somme de leurs valeurs. La moyenne est alors la moyenne arithmétique. Mais si le total représenté par une population ou un échantillon n'est pas la somme de leurs valeurs, la moyenne pertinente ne sera plus la moyenne arithmétique.
Si, par exemple, le total d'un ensemble d'individus est le produit de leurs valeurs, il convient de calculer leur moyenne géométrique.
La moyenne ne peut donc se concevoir que pour une variable quantitative. On ne peut pas faire le total des valeurs d'une variable qualitative. Quand la variable est ordinale, on lui préférera la médiane.
Le barycentre d’un ensemble fini de points du plan ou de l’espace affine (éventuellement munis de poids positifs ou négatifs) est défini par une relation vectorielle et correspond essentiellement à la notion physique de centre de masse.
Les coordonnées cartésiennes de ce barycentre dans un repère sont alors données par la moyenne arithmétique pondérée des coordonnées des différents points.
Le lemme de Cesàro assure que pour toute suite u convergente, la suite des moyennes partielles ( 1 n + 1 ∑ k = 0 n u k ) n ∈ N {\displaystyle \left({\dfrac {1}{n+1}}\sum _{k=0}^{n}u_{k}\right)_{n\in \mathbb {N} }} converge également vers la même limite.
Ce résultat permet d’étendre la notion de limite à des suites divergentes mais pour lesquelles la suite des moyennes partielles converge, comme la suite ((−1)n)n⩾0, dont les moyennes partielles tendent vers 0, ou la série associée, appelée série de Grandi, à laquelle on attribue alors la limite 1/2.
Ce procédé est utilisé par exemple dans la définition de somme de Fejér.
La moyenne empirique d’un échantillon de variables aléatoires réelles (X1, … , Xn) est simplement la moyenne arithmétique de ces variables, notée X ¯ {\displaystyle {\overline {X}}} ou X ¯ n {\displaystyle {\overline {X}}_{n}}
. C’est une variable qui a la même espérance que les variables Xi mais une variance divisée par n (sous condition d'existence). Elle sert notamment comme estimateur (statistique) de l’espérance.
Les règles de conservation sur les différentes grandeurs physiques mènent à l’usage de moyennes différentes.
Ainsi, la capacité électrique moyenne de condensateurs en série est la moyenne harmonique de leurs capacités, comme la résistance (électricité) moyenne de conducteurs ohmiques en parallèle.
L’énergie cinétique dépendant linéairement du carré de la vitesse, la vitesse moyenne d’un ensemble de particules en agitation thermique est la moyenne quadratique des vitesses individuelles.
Au-delà des définitions précédentes de moyenne, il existe d'autres approches plus étendues pour cette notion :
La moyenne glissante est une notion statistique, où la moyenne, au lieu d'être calculée sur les N valeurs fixes d'une liste, est calculée sur les sous-ensembles de n valeurs consécutives de la liste (n<N). On remarquera que pour ce calcul, l'ordre d'apparition des termes dans la liste est essentiel. Cette notion permet par exemple d'exprimer une tendance dans le temps en observant l'évolution le la moyenne (« glissante ») calculée sur quelques mesures successives, dans une liste de mesures.
Ce type de calcul est aussi utilisé en informatique pour minimiser la taille mémoire nécessaire au stockage des valeurs intermédiaires. Différentes formules de moyennes glissantes existent, par exemple pour une moyenne glissante de période n :
x ¯ 0 = x 0 {\displaystyle {\bar {x}}_{0}=x_{0}} (une moyenne glissante de période 0 ne prend qu'un terme)
x ¯ n = x ¯ n − 1 ⋅ ( n − 1 ) + x n n {\displaystyle {\bar {x}}_{n}={\frac {{\bar {x}}_{n-1}\cdot (n-1)+x_{n}}{n}}} (formule de récurrence)
Une moyenne tronquée est un calcul de moyenne arithmétique qui est appliqué après avoir ignoré les valeurs les plus extrêmes des données. L'idée de la troncation, opération dont le résultat s'appelle une troncature de l'ensemble des données, est de ne pas tenir compte des valeurs les plus éloignées, considérées alors comme aberrantes, et ainsi, dans le cas de la moyenne dite tronquée, de ne la calculer que sur un sous-ensemble « central » des données, la troncature. Notons que cette procédure est généralisable à d'autres estimateurs centraux.
Les statistiques tronquées, en anglais trimmed estimators (en), ont été inventées pour pallier la sensibilité des statistiques aux valeurs aberrantes, ce qu'on appelle la robustesse statistique. Leur avantage sur la médiane et sur la moyenne arithmétique est d'allier la robustesse de la médiane, à la définition « collective » de la moyenne arithmétique, la formule de calcul ressemblant fort à celle de cette moyenne arithmétique, lui conférant un avantage psychologique sur la médiane dont le défaut majeur (!) est de ne pas s'écrire avec une formule simplement arithmétique.
Historiquement, cette technique a eu son heure de gloire dans la première moitié du XXe siècle comme méthode de « correction » des valeurs aberrantes, et avec l'apparition des premiers calculateurs, notamment, jusqu'aux travaux plus récents pour mieux cerner la notion de robustesse (Peter Rousseeuw (en)).
La moyenne pondérée est utilisée, en géométrie pour localiser le barycentre d'un polygone, en physique pour déterminer le centre de gravité ou en statistique et probabilité pour calculer une espérance. On la calcule ainsi :
x ¯ = ∑ i = 1 n m i ⋅ x i ∑ i = 1 n m i {\displaystyle {\bar {x}}={\frac {\sum _{i=1}^{n}{m_{i}\cdot x_{i}}}{\sum _{i=1}^{n}{m_{i}}}}}
Dans le cas général le poids mi représente l'influence de l'élément xi par rapport aux autres.
À noter qu'il s'agit ici de la moyenne pondérée arithmétique. Il existe aussi des versions pondérées des autres moyennes, comme la moyenne géométrique pondérée et la moyenne harmonique pondérée.
Pour toute fonction f continue sur un segment [a, b] non dégénéré (i. e. b > a) ou plus généralement intégrable sur ]a, b[, la valeur moyenne de f sur [a, b] est le réel défini par :
m = 1 b − a × ∫ a b f ( x ) d x {\displaystyle m={\frac {1}{b-a}}\times \int _{a}^{b}f(x)\,\mathrm {d} x} .
L’inégalité de la moyenne permet d’encadrer cette valeur moyenne par des bornes de la fonction. Si la fonction est continue, le théorème de la moyenne assure même l’existence d’un réel c ∈ ]a, b[ tel que m = f(c).
Cette notion généralise celle de moyenne d'un nombre fini de réels en l'appliquant à un nombre infini de valeurs prises par une fonction intégrable. Elle sert par exemple dans la décomposition en série de Fourier d'une fonction périodique : c'est la composante constante. En traitement du signal, pour les signaux périodiques, il s'agit de la composante continue (offset).
On peut aussi, par analogie avec les moyennes pondérées d'un nombre fini de réels, affecter « à chacune des valeurs prises par la fonction » un coefficient strictement positif. On utilise alors ce que l'on appelle une fonction poids
w : R ⟶ R + ∗ {\displaystyle w:\,\mathbb {R} \longrightarrow \mathbb {R} ^{+*}}
(w pour l'initiale de weight, « poids » en anglais) :
m w = ∫ a b f ( x ) ⋅ w ( x ) d x ∫ a b w ( x ) d x {\displaystyle m_{w}={\frac {\int _{a}^{b}f(x)\cdot w(x)\,\mathrm {d} x}{\int _{a}^{b}w(x)\,\mathrm {d} x}}} .
Ce procédé peut aussi s'utiliser sur un intervalle ouvert ou semi-ouvert mais borné (i. e. aucune de ses bornes n'est infinie) où la fonction ƒ×w est intégrable. On peut citer l'exemple classique servant à montrer l'orthogonalité de la famille des polynômes de Tchebychev :
2 π ∫ [ 0 ; 1 [ T n ( x ) ⋅ T p ( x ) 1 − x 2 d x {\displaystyle {2 \over \pi }\,\int _{[0;1[}{T_{n}(x)\cdot T_{p}(x) \over {\sqrt {1-x^{2}}}}\,\mathrm {d} x} ![{\displaystyle {2 \over \pi },\int _{[0;1}{T_{n}(x)\cdot T_{p}(x) \over {\sqrt {1-x^{2}}}},\mathrm {d} x}
où la fonction Tn_×_Tp est continue sur le fermé [0,1] et où la fonction poids est
w : R ⟶ R + ∗ , x ↦ 1 1 − x 2 {\displaystyle w:\,\mathbb {R} \longrightarrow \mathbb {R} ^{+*},\;x\mapsto {1 \over {\sqrt {1-x^{2}}}}}
est intégrable sur [0;1[, et dont l'intégrale vaut π 2 {\displaystyle \pi \over 2} .
Note : lorsque la fonction est périodique de période T, elle a la même valeur moyenne sur toute période [a, a + _T_]. Cette valeur commune est appelée valeur moyenne de la fonction. Ainsi la fonction cosinus est de moyenne nulle, son carré de moyenne 1/2.
- ↑ (en) Francisco Javier Garcia Capitan, « Means as Chords », Forum Geometricorum, vol. 8, 2008, p. 99–101 (ISSN 1534-1178).
- ↑ Fabrice Mazerolle, « Moyenne Arithmétique », 2012 (consulté le 13 février 2012).
- ↑ Stella Baruk, « Moyenne », Dictionnaire de mathématiques élémentaires, Éditions du Seuil, 1995.
- ↑ (en) Mowaffaq Hajja, « Some Elementary Aspects of Means », International Journal of Mathematics and Mathematical Sciences, vol. 2013, 2013 (lire en ligne)
- ↑ (en) Frank Deutsch, Best Approximations in Inner Product Spaces, Springer-Verlag, 2001 (lire en ligne), « 2. Best Approximation »
- ↑ (en) Frank Nielsen et Rajendra Bhatia, Matrix Information Geometry, Springer, 2012 (ISBN 9783642302329, lire en ligne), p. 171.
- ↑ (en) David Farnsworth et Richard Orr, « Gini Means », The American Mathematical Monthly, vol. 93, no 8, 1986, p. 603-607 (DOI 10.1080/00029890.1986.11971898, lire en ligne)
- ↑ a b c et d (en) Jonathan M. Borwein et Peter B. Borwein, Pi and the AGM: A Study in Analytic Number Theory and Computational Complexity, 1998 (lire en ligne [PDF]), chap. 8 (« General Means and Iterations »)
- ↑ J.B. Hiriart-Urruty, « Il y a encore du TAF », Losanges, mars 2021, p. 41 (lire en ligne
) - ↑ (it) O. Chisini, « Sul concetto de media », Periodico di Matematiche, vol. 9, no 4, 1929.
- ↑ (en) Edward L. Dodd, « The Substitutive Mean and Certain Subclasses of this General Mean », Ann. Math. Statist., vol. 11, no 2, juin 1940, p. 163-176 (DOI 10.1214/aoms/1177731910).
- ↑ (en) Godfrey Harold Hardy, John Edensor Littlewood et George Pólya, Inequalities, Cambridge University Press, 1952, 324 p. (lire en ligne), chap. III, théorème 82.
- ↑ (en) Handbook of means and their inequalities, Springer, 1987.
- ↑ a et b (en) Horst Alzer et Stephan Ruscheweyh, « On the intersection of two-parameter mean value families », Proceedings of the American Mathematical Society, vol. 129, no 9, 2001, p. 2655–2662 (lire en ligne)
- ↑ (en) Kenneth B. Stolarsky, « Generalizations of the Logarithmic Mean », Mathematics Magazine, vol. 48, no 2, 1975, p. 87–92 (DOI 10.1080/0025570X.1975.11976447)
- ↑ (en) Alfred Witkowski, « On Seiffert-like means », Journal of Mathematical Inequalities, vol. 9, no 4, 2015, p. 1071–1092 (DOI 10.7153/jmi-09-83, lire en ligne)
- ↑ (en) Hongwei Chen, « Means Generated by an Integral », Mathematics Magazine, vol. 78, no 5, décembre 2005, p. 397-399 (DOI 10.2307/30044201)
- ↑ (en) Miao-Kun Wang, Zi-Kui Wang et Yu-Ming Chu, « An optimal double inequality between geometric and identric means », Applied Mathematics Letters, vol. 25, no 3, mars 2012, p. 471-475 (DOI 10.1016/j.aml.2011.09.038)
Sur les autres projets Wikimedia :
moyenne, sur le Wiktionnaire
Charles Antoine, Les Moyennes, Paris : PUF, coll. Que sais-je ? (no 3383), 1998.
Charles Antoine, « Moyenne selon une loi de composition » in Mathématiques et sciences humaines (EHESS)
(en) Mabrock K. Faradj, Which mean do you mean?: an exposition on means, LSU Master's Theses, 2004 (lire en ligne)
Statistiques élémentaires : Critères de position
(en) Eric W. Weisstein, « Mean », sur MathWorld