René DescartesDescartes et les Mathématiques

Statistiques doubles en TES avec Casio FX-9850

Ajustements linéaires et non linéaires en Terminale ES.
Droites de Mayer, des moindres carrés ; régressions exponentielle, logarithmique.

Sommaire

I.    Entrée des données
II.    Ajustement graphique
III.   Calcul des résidus
IV.  Méthode de Mayer
V.    Ajustement par la méthode des moindres carrés
VI.   Régression avec changement de variable
VII.  Régression exponentielle
VIII. Régression logarithmique

Page mobile friendly Mobile friendly

 

Page no 25, réalisée le 15/11/2002
mise à jour le 28/8/2003

Calculatrice TI-92
Index

Casio
Statistiques doubles
en T STT

TI-92
Les probabilités
en T ES

Annales
bac S et ES

I. Entrée des données

Les calculs se font en utilisant les listes dans le mode STAT pour l'enregistrement des données et la lecture des résultats et le mode RUN pour certains calculs.
Remarque : tous les calculs sont à faire avec toute la précision de la machine. Seuls les résultats seront arrondis.

Initialisation : utiliser list 1 pour la variable xi et list 2 pour la variable yi, les fréquences étant bloquées à 1. List 3 est éventuellement utilisée pour le calcul des valeurs y, en fonction de x, des ordonnées de la droite d'ajustement et list 4 pour le calcul des résidus.

En cas de problème vérifier les paramètres dans le menu STAT GRPH SET :
Graph type : Scatter
Xlist : list 1
Ylist : list 2
Frequency  : 1
Mark Type : °

Entrée des données : se placer dans le mode STAT. Il est prudent d'effacer les données avec le deuxième menu des STAT  : 8 DEL-A en se plaçant sur chacune des listes.

Puis dans list 1 et list 2 taper chaque valeur suivie de EXE. Ne faire aucune erreur, ni oubli ni valeur antérieure non effacée et vérifier.

Exemple

Cinéma et télévision (Fractale TES exercice 21 page 24)

Département

Milliers de spectateurs au cinéma

Nombre de téléviseurs

Loire Atlantique

2 294

381 572

Maine et Loire

1 317

240 093

Vendée

741

190 037

Sarthe

735

188 840

Mayenne

346

99 650

II. Ajustement graphique

Dessiner le nuage de points.

Calculer les moyennes x barre et y barre. Menu CALC 2VAR.

x barre= somme/n = 5433/5 ≈1086 ; y barre= somme/n = 1 100 100/5 ≈ 220 038.

Tracer le centre de gravité G(x barre, y barre) et une droite D passant par G traversant le nuage de points « au plus près ». Lire sur le graphique les coordonnées u et v d'un point M de cette droite (assez éloigné de G).

Par exemple M(2000, 320 000).
Calculer le coefficient directeur a = (y-v)/(x-u) = 109 ≈ 109.
Taper STO ALPHA A pour mémoriser a (écran : ans → A)

Puis trouver le coefficient constant sachant que l'équation de la droite passant par G est

yy barre= a (xx barre),

soit b = y barrea x barre = 220 038 − a 1086 = 101 664.

Taper STO ALPHA B pour mémoriser b (écran : ans → B).
La droite a donc pour équation y = 109 x + 101664.

III. Calcul des résidus

Le coefficient directeur ayant été mémorisé dans la variable A et le coefficient constant dans la variable B, en mode RUN placer les valeurs y barre en fonction de x des ordonnées de la droite d'ajustement d'équation y = a x + b dans list 3 (les valeurs de list 3 permettent aussi de tracer la droite).
Avec la touche OPTN choisir LIST (au commencement taper deux fois sur LIST ; menu LIST et mot LIST) :

A list 1 + B → list 3

Calculer les résidus et les ranger dans list 4 :

(list 2 − list 3)2 → list 4

puis calculer leur somme : taper deux fois sur 8 : valider Sum puis 8 List :

Sum List 4

Dans cet exempl,e on trouve que la somme des résidus est égale à somme[(yi-(a xi+b)]² ≈ 2,60 109.

IV. Méthode de Mayer

Cette méthode n'est pas à proprement parler au programme de terminale, mais c'est un bon exercice sur les équations de droites et comme telle e peut être proposée en exercice (Fractale no 13 page 23). Elle n'est malheureusement pas programmée dans la calculatrice Casio.

La série étant ordonnée, la partager en deux parties. Ici les deux départements les plus importants d'une part, et les trois autres d'autre part.

Calculer les coordonnées des points G1 et G2. G1(u, v), correspond au point moyen associé aux points d'abscisses les plus petites, et G2(s, t) correspondant aux autres points du nuage.

Une méthode avec la calculatrice Casio

En mode RUN, après la touche OPTN, recopier list 1 et list 2 dans list 3 et list 4 puis dans list 5 et list 6.

list 1 → list 3
list 2 → list 4
list 1 → list 5
list 2 → list 6

Dans le menu LIST, avec la touche DEL, supprimer les (ici les trois) derniers éléments de list 3 et list 4 et les (ici les deux) premiers de list 5 et list 6

En mode Run, calculer les moyennes (OPTN List 8 Mean)
Mean (List 3) 1805.5 → ALPHA U        Mean (List 5) 607.3 → ALPHA S
Mean (List 4) 310832 → ALPHA V        Mean (List 6) 159509 → ALPHA T

Calculer le coefficient directeur a = (v-t)/(u-s) = 126,3 = 126,3.
Le conserver dans la variable A : taper → ALPHA A ; l'affichage est Ans → A     126.3.

Puis le coefficient constant sachant que l'équation de la droite passant par exemple par G1 est :

y − v = a (x − u) ;

soit b = v − a u = 310832 − A×1805.5 = 82811.
Le conserver dans la variable B : → ALPHA B.

La droite de Mayer a donc pour équation y = 126,3 x + 82811.
Vérifier sur le graphique que cette droite passe bien par le point G.

On peut effectuer, comme ci-dessus chapitre III, le calcul de la somme des résidus.
On trouve alors somme[(yi-(a xi+b)]²≈ 1,24 109. L'équation de la droite de Mayer est donc une bien meilleure approximation que l'ajustement affine précédent.

V. Ajustement par la méthode des moindres carrés

La calculatrice donne les principales valeurs remarquables, le coefficient de corrélation, l'équation de la droite de régression Dy / x. On peut obtenir un graphique et une estimation permettant de prévoir y chapeau en fonction de x ou x chapeau en fonction réciproque de y.

V.a. Calcul des valeurs caractéristiques

Dans le mode STAT, utiliser les options CALC puis 2VAR.

Moyennes

x barre = somme/n = 5433/5 ≈1086    y barre = somme/n = 1 100 100/5 ≈ 220 038.

Variances et écarts-types

Noter les valeurs trouvées sur l'écran de la calculatrice :
V(X) = somme/nx barre2 = 8,206 10^^6/5 − 10862 ≈ … ;
V(Y) = somme/ny barre2 = somme/5 − 2200382 ≈ … ;
x = rac(v(X)) ≈ 678,6 y = rac(v(Y)) ≈ 92 587 (notés par Casio x∑n et y∑n et à ne pas confondre avec x∑n−1 et y∑n−1 où les calculs sont modifiés par une division par n−1.)

Covariance

xy = somme/nx barre y barre= somme/5 − 1086 × 220 038 ≈ …
Pour le calcul des variances et de la covariance, sans éteindre la calculatrice, quitter les STAT avec la touche MENU, choisir le Mode RUN, la touche VARS puis l'option STAT.

Enfin, la variable X et l'écart-type x∑n x2 suivi de EXE. La calculatrice affiche x2 :
x∑ n2     460489,84
à recopier ci-dessus dans V(X) = … ≈ 460 490.

Puis touche EXIT et choisir la variable Y et le calcul de y∑n x2 suivi de EXE. La calculatrice affiche  y2 à recopier ci-dessus dans :
V(Y) = … ≈ 8,572 ×109.

De même, pour le calcul de la covariance utiliser la variable Y puis X, en mémorisant l'effectif n :
∑ xy ÷ 5 − y barre × EXIT X x barre EXE
Casio affiche : ∑ xy ÷ 5 − y barre × x barre     62030747
Soit xy = … ≈ 6,203 × 107

V.b. droite de régression

Revenir au mode STAT, choisir CALC ou GRPH, puis REG et X.

Explications à fournir

La droite de régression a pour coefficient directeur :

a = covariance/sx^2134,7 ≈ 134,7.

La droite passe par le centre de gravité G(x barre, y barre) à représenter sur le graphique ; son équation est :

yy barre= a (xx barre).

Le coefficient constant est b = y barrea x barre ≈ 73667.
La droite de régression de y en x a pour équation : y = 134,7 x + 73677.

Mémorisation des coefficients

Après l'exécution des calculs de la régression avec la touche MENU, choisir le mode calcul RUN. Avec la touche VARS choisir F3 les STAT puis encore F3 le mode GRPH.
Le bas de l'écran affiche les coefficients a et b de la droite que l'on peut mémoriser dans les variables A et B.
Placer le coefficient directeur a dans la variable A : F1 → ALPHA A

a → A

et le coefficient constant b dans la variable B : F2 → ALPHA B

b → B

Il est aussi possible de mémoriser l'équation dans l'éditeur de fonction avec le menu GRPH et, après le calcul de régression REG et X, utiliser la l'option COPY.

V.c. Coefficient de corrélation

Le coefficient de corrélation r est un nombre compris entre −1 et 1. Le voisinage de 1 ou de −1 indique en principe une bonne corrélation, sans que l'on puisse directement en dire plus. On ne peut conclure à la validité d'une corrélation qu'en fonction du contexte statistique.

r = covariance/(σx σy)0,987 ≈ 0,987.

Très bon taux de corrélation. Ce qui montre qu'actuellement en France, contrairement à une idée reçue, le développement du Cinéma va de pair avec celui de la télévision.

Mémorisation du coefficient

Après l'exécution des calculs de la régression avec la touche MENU, choisir le mode calcul RUN. Avec la touche VARS choisir F3 les STAT puis encore F3 le mode GRPH.
Le bas de l'écran affiche les coefficients a, b, c … des courbes. Taper sur F6 8 pour obtenir l'écran suivant.
S'affiche le coefficient de corrélation r que l'on peut mémoriser dans la variable R :

F1 → ALPHA R
r → R

Estimation

Lorsque r est voisin de 1 ou de −1 on peut effectuer des estimations avec, en fonction du contexte, une bonne fiabilité.

Dans le mode RUN avec la touche OPTN choisir les STAT :

taper : 1000 y chapeau      208372
permet d'estimer à 208 000 le nombre de téléviseurs d'un département ou il y 1000 milliers d'entrées au cinéma.

De même : 500 000 x chapeau     3164,9
permet d'estimer 3 200 000 séances de cinéma dans un département ayant 500 000 postes de télévision.

V.d. Calcul de la somme des résidus

Comme au chapitre III on va placer dans list 3 les valeurs y chapeau calculées en fonction de x des ordonnées des points de la droite d'ajustement d'équation y = a x + b.
Dans le mode STAT, après l'exécution des calculs de la régression, revenir à l'écran affichant les listes (avec, entre autres, la touche EXIT).

Avec les flèches de direction se placer sur le titre list 3 qui apparaît en inversion vidéo.
Pour le coefficient directeur a avec la touche VARS choisir F3 les STAT puis encore F3 le mode GRPH, taper F1 : affichage en bas à gauche de l'écran : a
Avec la touche OPTN choisir menu LIST et mot List et taper 1 : affichage : a list 1
taper + : affichage : a list 1 +
Pour le coefficient constant b avec la touche VARS choisir F3 les STAT puis encore F3 le mode GRPH, taper F2 : affichage : a list 1 + b
Valider avec EXE le tableau list 3 se remplit automatiquement avec les valeurs y chapeau.

Pour les résidus, carrés des écarts, se placer avec les flèches de direction sur le titre list 4 qui apparaît en inversion vidéo.

  affichage
taper une parenthèse ouvrante : (
Avec la touche OPTN choisir menu LIST et mot List et taper 2 : (list 2
Taper le signe de soustraction − : (list 2 −
enfin F1 mot List et taper 3 : (list 2 − list 3
fermer la parenthèse, calculer le carré touche x2 et valider avec EXE : (list 2 − list 3)2

list 4 contient alors les résidus.

Se placer sur une case vierge, par exemple, dans list 5 et calculer leur somme : taper deux fois sur 8 : valider Sum puis 8 List et enfin taper 4 et terminer par EXE : affichage : Sum List 4

On calcule ainsi la somme des résidus égale à :

somme[(yi-(a xi+b)]²≈ 1,08 109.

La droite Dy / x est donc une meilleure approximation que les ajustements précédents.
Par définition, il n'est pas possible de trouver une droite admettant un résidu moindre.

VI. Régression avec changement de variable

VI.a. Fonction inverse : valeur d'une voiture d'occasion

Voici, en 1999, la cote Argus d'un type de voiture d'occasion :

Année de mise en circulation

1998

1997

1996

1995

1994

1993

1992

Cote Argus en milliers de francs

58

48

38

32

24

19

15

Le but de ce problème est d'estimer le prix d'une voiture de ce type non cotée mise en circulation en 1990.

Ajustement classique

On note x l'âge de la voiture (en années) et y la cote Argus (en milliers de francs).

1.a. Représenter graphiquement la série (xi, yi).

b. Déterminer une équation de la droite de régression de y en x et tracer cette droite. (Effectuer les calculs avec trois chiffres significatifs).

c. Calculer le coefficient de corrélation linéaire r1de y en x.

d. Peut-on estimer la valeur d'une voiture mise en circulation en 1990 ? Expliquer.

Calculs des inverses

2. Les spécialistes pensent qu'on aura un meilleur ajustement en remplaçant les sept valeurs yi par les valeurs zi=1/yi.

a. Présenter dans un tableau la série double (xi, zi), i variant de 1 à 7.

b. Calculer le coefficient de corrélation linéaire r2 de z en x. Comparer r1 et r2.

c. Déterminer, à l'aide de la calculatrice, l'équation de la droite de régression de z en x sous la forme z = mx + p (m et p étant arrondis à 10− 6 près).

d. À l'aide de cette équation peut-on estimer la valeur d'une voiture mise en circulation en 1990 ? Donner le résultat et expliquer.

Indications de correction

Dans la première partie introduire, en mode STAT, xi dans list 1 et yi dans list 2. La séquence CALC REG X permet de trouver l'équation y = − 7,17 x + 62,1.
Bien que le coefficient de corrélation r = − 0,988 soit très proche de − 1 pour x = 9 une valeur négative, ce qui est absurde, permet de rejeter la méthode dans ce cas.

Pour la deuxième partie conserver list 1 pour la variable xi ;

Transférer la variable yi de list 2 vers list 3 (list 2 → list 3) :
avec les flèches de direction se placer sur le titre list 3 qui apparaît en inversion vidéo. Après la touche OPTN choisir LIST (au commencement taper deux fois sur LIST : menu LIST et mot List) ; taper 2 et valider avec EXE.

Puis faire le changement de variable zi dans list 2 (en calculant 1/list 3 → list 2) ;
avec les flèches de direction se placer sur le titre list 2 qui apparaît en inversion vidéo.
Taper 1 ÷ puis sur F1 après le mot List taper 3. Valider 1 ÷ list 3 avec EXE.

En tapant deux fois sur EXIT, le retour au mode CALC REG X permet de trouver le coefficient r2 = 0,973 et l'équation z = m x + p avec m = 8,115 10– 3 et p = 4,197 10– 3.

Le coefficient r2 est en principe moins pertinent que r1 mais son voisinage de 1 indique une bonne corrélation :
pour x = 9, on trouve z = 0,0772 donc y = 12,9 permet d'estimer la valeur d'une voiture de 1990 à 13 000 francs.

VI.b. Fonction racine : distance de freinage

Au cours d'une séance d'essai, un pilote d'automobile doit, quand il reçoit un signal sonore dans son casque, arrêter le plus rapidement possible son véhicule.

Au moment du top sonore, on mesure la vitesse de l'automobile puis la distance nécessaire pour arrêter le véhicule.

Pour six expériences, on a obtenu les résultats suivants :

Vitesse vi en km/h

21

43

62

77

98

115

Distance d'arrêt yi en m

8

20

33

55

102

137

1. Calculer, à l'aide d'une calculatrice, le coefficient de corrélation linéaire r1de y en v.

2. Les spécialistes pensent qu'on aura un meilleur ajustement en remplaçant les six valeurs vi par les valeurs xi = vi2.
Présenter dans un tableau la série double (xi, yi), i variant de 1 à 6.
Calculer le coefficient de corrélation linéaire r2 de y en x. Comparer r1et r2.

3. Dans un repère orthogonal, construire le nuage de points associé à cette nouvelle série double :
les xi en abscisses avec 1 cm pour 1000,
les yi en ordonnées avec 1 cm pour 10.

4. a. Déterminer, à l'aide de la calculatrice, l'équation de la droite de régression de y en x sous la forme y = mx + p (m et p étant arrondis à 10– 2 près).
Tracer cette droite dans le repère précédent.

b. Quelle est la distance d'arrêt estimée correspondant à une vitesse de 150 km/h ?

c. À l'aide de cette équation, déterminer la valeur estimée de x correspondant à une distance d'arrêt de 180 m, puis la vitesse correspondante du véhicule.

d. Le manuel du Code de la route donne, pour calculer la distance d'arrêt (en mètres), la méthode suivante :
« prendre le carré de la vitesse exprimée en dizaines de kilomètres par heure. »
Comparer le résultat obtenu au c. à celui que l'on obtiendrait par cette méthode.

Indications de correction

Pour la première question introduire, en mode STAT, vi dans list 1 et yi dans list 2. La séquence CALC REG X permet de trouver r1 = 0,96. L'équation d'ajustement, non demandée, y = 1,4 v − 37,6 qui donne des valeurs négatives pour les vitesses inférieures à 27 km/h et des distances de freinage sous-évaluées pour les grandes vitesses n'est pas satisfaisante.

Pour la suite, conserver list 2 pour la variable yi ;

Transférer la variable xi de list 1 vers list 3 (list 2 → list 3) :
avec les flèches de direction se placer sur le titre list 3 qui apparaît en inversion vidéo. Après la touche OPTN choisir LIST (au commencement taper deux fois sur LIST : menu LIST et mot List) ; taper 1 et valider avec EXE.

Puis faire le changement de variable xi dans list 1 (en calculant le carré : list 32 → list 1) :
avec les flèches de direction se placer sur le titre list 1 qui apparaît en inversion vidéo.
Taper F1 pour List et taper 3. Calculer le carré avec la touche x2, valider list 32 avec EXE.

En tapant deux fois sur EXIT, le retour au mode CALC REG X permet de calculer r2 = 0,996 ce qui est une très bonne corrélation.

L'équation y = m x + p avec m = 0,0104 et p = − 1,09 donne la distance de freinage ne fonction de la vitesse : y = 0,0104 v2 − 1,09.

Pour v = 150 on peut estimer la distance de freinage à 232 mètres.

On peut prévoir qu'une voiture s'arrêtant sur 180 m ferait du 132 km/h.

La prévention routière utilise la fonction y = 0,01 v2 qui donne une très bonne approximation et permet de prévoir 225 m de freinage pour 150 km/h ou 134 km/h pour 180 m de freinage.

VII. Régression exponentielle

Lors d'une épidémie, on a relevé toutes les semaines xi le nombre de cas yi.

xi

1

2

3

4

yi

94

221

446

1050

1. Représenter le nuage de points dans un repère convenable. Un ajustement affine paraît-il justifié ?

2. On pose zi = ln yi (ln désigne le logarithme népérien). Calculer l'équation de la droite de régression de z en x par la méthode des moindres carrés.

3. Trouver une relation entre x et y de la forme y = α βx.

4. Combien de malades peut-on prévoir pour la cinquième semaine ?

Indications de correction

Question 2. Introduire xi dans list 1 et yi dans list 3.

Faire le changement de variable zi (ln list 3 → list 2) :
avec les flèches de direction se placer sur le titre list 2 qui apparaît en inversion vidéo. Calculer le logarithme avec la touche ln, dans le menu OPTN choisir List et taper 3. valider ln list 3 avec EXE.

En tapant deux fois sur EXIT, le mode CALC REG X permet de trouver l'équation ln y = b x + a avec b = 0,7941 et a = 3,764.

Question 3. Transférer la variable yi de list 3 vers list 2 (list 3 → list 2) ;
avec les flèches de direction se placer sur le titre list 2. Avec la touche F1 choisir List, taper 3 et valider avec EXE.

De nouveau le mode CALC REG EXP permet de trouver :
α = e3,76 = 43,12 et β = e0,794 = 2,213.

Question 4. On a une bonne corrélation, avec r = 0,9992 donc on peut prévoir pour la cinquième semaine α β5 = 2287 malades.

VIII. Régression logarithmique

La marge brute d'autofinancement (M.B.A.) d'une entreprise de 1996 à 2001 en pourcentage de son chiffre d'affaires est donnée par le tableau suivant où xi représente le rang de l'année et yi la M.B.A. en pourcentage :

xi

1

2

3

4

5

6

yi

8,13

8,51

8,79

9

9,15

9,31

1. Représenter le nuage de points dans un repère convenable.

2. On pose zi = eyi. Calculer l'équation de la droite de régression de z en x par la méthode des moindres carrés.

3. En déduire une relation entre x et y.

4. En quelle année la marge brute d'autofinancement devrait dépasser 10 % ?

Indications de correction

Introduire xi dans list 1 et yi dans list 3.

Faire le changement de variable zi (ex list 3 → list 2) :
avec les flèches de direction se placer sur le titre list 2 qui apparaît en inversion vidéo.
Frapper la touche ex pour l'exponentielle, dans le menu OPTN choisir List et taper 3.
Valider ex list 3 avec EXE.

Le mode CALC REG X permet de trouver l'équation ey = a x + b avec a = 1518 et b = 1933 ; r = 0,9996 indiquant une très bonne corrélation.

On a donc la relation ey = 1518 x + 1933 soit y = ln(1518 x + 1933).
Cet ajustement permet de prévoir 10 % en 2014 au bout de 19 ans.

Utilisation du programme de la calculatrice

Le programme d'ajustement par régression logarithmique effectue un ajustement linéaire entre les variables ti = ln xi et yi.

Transférer la variable yi de list 3 vers list 2 :
se placer sur le titre list 2 et valider List 3.

De nouveau dans le mode STAT, CALC REG LOG permet de trouver :
y = a + b ln x avec a = 8,094 et b = 0,6575.

On a alors la relation y = 0,6575 ln x + 8,094. Avec une moins bonne corrélation, on prévoit 10 % en 2009 au bout de 14 ans.
Ces prévisions, à trop long terme, ne sont certainement pas fiables.