Sauter à un chapitre clé
En statistiquesa>, il y a aussi des contraintes. Les tests du chi carré utilisent les degrés de liberté pour décrire la liberté d'un test en fonction des contraintes qui lui sont imposées. Lis ce qui suit pour découvrir à quel point le test du khi-deuxa> est vraiment libre !
Signification des degrés de liberté
De nombreux tests utilisent des degrés de liberté, mais ici, tu verras les degrés de liberté en rapport avec les tests du khi-deux. En général, les degrés de liberté permettent de mesurer le nombre de statistiques de test que tu as calculées à partir des données. Plus tu as calculé de statistiques de test à partir de ton échantillon, moins tu as de liberté pour faire des choix avec tes données. Bien sûr, il existe aussi une façon plus formelle de décrire ces contraintes.
Une contrainte, également appelée restriction, est une exigence imposée aux données par le modèle des données.
Prenons un exemple pour voir ce que cela signifie en pratique.
Supposons que tu fasses une expérience dans laquelle tu lances un dé à quatre faces \(200\) fois. La taille de l'échantillon est donc de \(n=200\). Une contrainte est que ton expérience nécessite que la taille de l'échantillon soit égale à \(200\).
Le nombre de contraintes dépend également du nombre de paramètres dont tu as besoin pour décrire une distribution, et du fait que tu connaisses ou non ces paramètres.
Voyons maintenant comment les contraintes sont liées aux degrés de liberté.
Formule des degrés de liberté
Dans la plupart des cas, la formule
degrés de liberté = nombre de fréquences observées - nombre de contraintes
peut être utilisée. Si tu reviens à l'exemple du dé à quatre faces ci-dessus, il y avait une contrainte. Le nombre de fréquences observées est \(4\) (le nombre de faces du dé). Les degrés de liberté seraient donc \(4-1 = 3\).
Il existe une formule plus générale pour les degrés de liberté :
degrés de liberté = nombre de cellules (après combinaison) - nombre de contraintes.
Tu te demandes sans doute ce qu'est une cellule et pourquoi tu pourrais la combiner. Prenons un exemple.
Tu envoies un sondage à \(200\) personnes pour leur demander combien d'animaux de compagnie ils ont. Tu reçois le tableau de réponses suivant.
Tableau 1. Réponses à l'enquête sur la possession d'animaux de compagnie.
Animaux | \(0\) | \(1\) | \(2\) | \(3\) | \(4\) | \(>4\) |
Attendu | \(60\) | \(72\) | \(31\) | \(20\) | \(7\) | \(10\) |
Cependant, le modèle que tu utilises n'est qu'une bonne approximation si aucune des valeurs attendues n'est inférieure à \(15\). Tu peux donc combiner les deux dernières colonnes de données (appelées cellules) dans le tableau ci-dessous.
Tableau 2. Réponses à l'enquête sur la possession d'animaux de compagnie avec des cellules combinées.
Animaux | \(0\) | \(1\) | \(2\) | \(3\) | \(>3\) |
Attendu | \(60\) | \(72\) | \(31\) | \(20\) | \(17\) |
Il y a donc 5 cellules et une contrainte (le total des valeurs attendues est de 200). Les degrés de liberté sont donc \(5 - 1= 4\).
En général, tu ne combineras que des cellules contiguës dans tes tableaux de données. Ensuite, voyons la définition officielle des degrés de liberté avec la distribution du Khi-deux.
Définition des degrés de liberté
Si tu as une variable aléatoire \(X\) et que tu veux faire une approximation de la statistique \(X^2\), tu utiliseras la famille de distributions \(\chi^2\). Cela s'écrit comme suit
\N- [\N- Début{align} X^2 &= \sum \frac{(O_t - E_t)^2}{E_t} \N- &= \sum \Nfrac{O_t ^2}{E_t} -N \N- & \sim \Nchi^2, \Nend{align}\N]
où \(O_t\) est la fréquence observée, \(E_t\) est la fréquence attendue, et \(N\) est le nombre total d'observations. N'oublie pas que les tests du Khi-deux ne sont qu'une bonne approximation si aucune des fréquences attendues n'est inférieure à \(5\).
Pour un rappel sur ce test et la façon de l'utiliser, voir Tests du chi carré.
Les distributions \(\chi^2\) sont en fait une famille de distributions qui dépendent des degrés de liberté. Les degrés de liberté pour ce type de distribution sont écrits à l'aide de la variable \(\nu\). Comme tu peux avoir besoin de combiner des cellules lorsque tu utilises les distributions \(\chi^2\), tu dois utiliser la définition ci-dessous.
Pour la distribution \(\chi^2\), le nombre de degrés de liberté, \(\nu\) est donné par
\[ \nu = \text{nombre de cellules après combinaison}-1.\n]
Il y aura des cas où les cellules ne seront pas combinées, et dans ce cas, tu peux simplifier un peu les choses. Si tu reviens à l'exemple du dé à quatre faces, il y a \(4\) possibilités qui peuvent apparaître sur le dé, et ce sont les valeurs attendues. Donc, pour cet exemple, \(\nu = 4 - 1 = 3\n) même si tu utilises une distribution du Khi-deux pour la modéliser.
Pour être sûr de savoir combien de degrés de liberté tu as lorsque tu utilises la distribution du Khi-deux, on l'écrit en indice : \(\chi^2_\nu \N).
Tableau des degrés de liberté
Une fois que tu sais que tu utilises une distribution du Khi-deux avec \(\nu\) degrés de liberté, tu dois utiliser une table de degrés de liberté pour pouvoir effectuer des tests d'hypothèse. Voici une section d'une table du Khi-deux.
Tableau 3. Tableau du khi-deux.
degrés de liberté | \(0.99\) | \(0.95\) | \(0.9\) | \(0.1\) | \(0.05\) | \(0.01\) |
\(2\) | \(0.020\) | \(0.103\) | \(0.211\) | \(4.605\) | \(5.991\) | \(9.210\) |
\(3\) | \(0.155\) | \(0.352\) | \(0.584\) | \(6.251\) | \(7.815\) | \(11.345\) |
\(4\) | \(0.297\) | \(0.711\) | \(1.064\) | \(7.779\) | \(9.488\) | \(13.277\) |
La première colonne du tableau contient les degrés de liberté, et la première ligne du tableau sont les zones à droite de la valeur critique.
La notation pour une valeur critique de \(\chi^2_\nu\) qui est dépassée avec une probabilité de \(a\%\) est \(\chi^2_\nu(a\%)\) ou \ (\chi^2_\nu(a/100)\).
Prenons un exemple en utilisant le tableau du Khi-deux.
Trouve la valeur critique de \(\chi^2_3(0,01)\).
Solution :
La notation de \(\chi^2_3(0,01)\) indique qu'il y a \(3\) degrés de liberté et que tu es intéressé par la colonne \(0,01\) du tableau. En regardant l'intersection de la ligne et de la colonne dans le tableau ci-dessus, tu obtiens \(11,345\). Donc
\N- [\Nchi^2_3(0,01) = 11,345 . \N]
Le tableau a une deuxième utilité, comme le montre l'exemple suivant.
Trouve la plus petite valeur de \(y\) telle que \(P(\chi^2_3 > y) = 0,95\).
Solution :
Rappelle-toi que le niveau de signification est la probabilité que la distribution dépasse la valeur critique. Par conséquent, demander la plus petite valeur \(y\N) où \N (P(\chi^2_3 > y) = 0,95\N) revient à demander ce qu'est \N(\chi^2_3(0,95)\N). En utilisant le tableau du Khi-deux, tu peux voir que \N(\chi^2_3(0,95) =0,352 \N), donc \N(y=0,352 \N).
Bien sûr, un tableau ne peut pas énumérer toutes les valeurs possibles. Si tu as besoin d'une valeur qui ne figure pas dans le tableau, il existe de nombreux logiciels de statistiques ou calculatrices qui peuvent te donner les valeurs du tableau du Khi-deux.
Test t des degrés de liberté
Les degrés de liberté d'un test t sont calculés en fonction de l'utilisation ou non d'échantillons appariés. Pour plus d'informations sur ces sujets, consulte les articles Distribution en T et Test t par paires.
Degrés de liberté - Points clés
- Une contrainte, également appelée restriction , est une exigence imposée aux données par le modèle des données.
- Dans la plupart des cas, les degrés de liberté = nombre de fréquences observées - nombre de contraintes.
- Une formule plus générale pour les degrés de liberté est : degrés de liberté = nombre de cellules (après combinaison) - nombre de contraintes.
Pour la distribution \(\chi^2\), le nombre de degrés de liberté, \(\nu\) est donné par
\[ \nu = \text{nombre de cellules après combinaison}-1.\n]
Apprends plus vite avec les 12 fiches sur Degrés de liberté
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Degrés de liberté
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus