Sauter à un chapitre clé
Définition du test du chi-deux pour l'homogénéité
Lorsque tu veux savoir si deux variables catégorielles suivent la même distribution de probabilité (comme dans la question sur les préférences cinématographiques ci-dessus), tu peux utiliser le test d'homogénéité du khi-deux.
Le test d'homogénéité du khi-deux est un test non paramétrique du khi-deux de Pearson que tu appliques à une seule variable catégorielle provenant de deux ou plusieurs populations différentes afin de déterminer si elles ont la même distribution.
Dans ce test, tu collectes au hasard des données d'une population pour déterminer s'il existe une association significative entre \(2\) ou plusieurs variables catégorielles.
Conditions d'un test du chi carré pour l'homogénéité
Tous les tests du khi-deux de Pearson partagent les mêmes conditions de base. La principale différence réside dans la façon dont ces conditions s'appliquent dans la pratique. Un test du Khi-deux pour l'homogénéité nécessite une variable catégorielle provenant d'au moins deux populations, et les données doivent être le nombre brut de membres de chaque catégorie. Ce test permet de vérifier si les deux variables suivent la même distribution.
Pour pouvoir utiliser ce test, les conditions d'un test d'homogénéité du Khi-deux sont :
Les variables doivent être catégoriques.
Comme tu testes l'homogénéité des variables, elles doivent avoir les mêmes groupes. Ce test du Khi-deux utilise des tableaux croisés, en comptant les observations qui entrent dans chaque catégorie.
Référence de l'étude : "Arrêt cardiaque extrahospitalier dans les immeubles de grande hauteur : Delays to Patient Care and Effect on Survival "1 - qui a été publiée dans le Journal de l'Association médicale canadienne (JAMC) le 5 avril 2016.
Cette étude a comparé le mode de vie des adultes (maison ou maison de ville, appartement à \(1^{st}\) ou \(2^{nd}\) étage, et appartement à \(3^{rd}\) ou étage supérieur) avec leur taux de survie à une crise cardiaque (a survécu ou n'a pas survécu).
Ton objectif est de savoir s'il existe une différence dans les proportions des catégories de survie (c'est-à-dire, as-tu plus de chances de survivre à une crise cardiaque selon l'endroit où tu vis ?) pour les populations de \(3\N) :
- les victimes de crises cardiaques qui vivent dans une maison ou une maison de ville,
- les victimes de crises cardiaques qui vivent au 1er ou au 2e étage d'un immeuble d'habitation, et
- les victimes de crises cardiaques qui vivent à l'étage (3^{rd}\) ou à un étage supérieur d'un immeuble d'habitation.
Les groupes doivent s'exclure mutuellement, c'est-à-dire que l'échantillon est sélectionné au hasard.
Chaque observation ne peut faire partie que d'un seul groupe. Une personne peut vivre dans une maison ou dans un appartement, mais elle ne peut pas vivre dans les deux.
Table de contingence | |||
---|---|---|---|
Mode de vie | Survécu | N'a pas survécu | Total des rangées |
Maison ou maison en rangée | 217 | 5314 | 5531 |
Appartement au1er ou2e étage | 35 | 632 | 667 |
Appartement au3ème étage ou plus | 46 | 1650 | 1696 |
Totaux des colonnes | 298 | 7596 | \(n =\) 7894 |
Tableau 1. Tableau de contingence, test du chi-deux pour l'homogénéité.
Les effectifs attendus doivent être au moins égaux à \(5\).
Cela signifie que la taille de l'échantillon doit être suffisamment grande, mais il est difficile de déterminer à l'avance quelle est cette taille. En général, il suffit de s'assurer qu'il y a plus de \(5\) dans chaque catégorie.
Les observations doivent être indépendantes.
Cette hypothèse est liée à la façon dont tu recueilles les données. Si tu utilises un échantillonnage aléatoire simple, il sera presque toujours statistiquement valide.
Test du chi carré pour l'homogénéité : hypothèse nulle et hypothèse alternative
La question sous-jacente à ce test d'hypothèse est la suivante : Ces deux variables suivent-elles la même distribution ?
Les hypothèses sont formées pour répondre à cette question.
- L'hypothèse nulle est que les deux variables sont issues de la même distribution.\[ \i1{align}H_{0} : p_{1,1} &= p_{2,1} \text{ AND } \\N-p_{1,2} &= p_{2,2} \N-text{ AND } \ldots \text{ AND } \\N-p_{1,n} &= p_{2,n}\N- end{align} \]
L'hypothèse nulle exige que chaque catégorie ait la même probabilité entre les deux variables.
The alternative hypothesis is that the two variables are not from the same distribution, i.e., at least one of the null hypotheses is false.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\N-p_{1,2} &\neq p_{2,2} \text{ OR } \ldots \text{ OR } \\N-p_{1,n} &\neq p_{2,n}\N- end{align} \]
Si même une seule catégorie est différente d'une variable à l'autre, alors le test renverra un résultat significatif et fournira la preuve du rejet de l'hypothèse nulle.
Les hypothèses nulle et alternative de l'étude sur la survie après une crise cardiaque sont les suivantes :
La population est constituée des personnes qui vivent dans des maisons, des maisons en rangée ou des appartements et qui ont eu une crise cardiaque.
- Hypothèse nulle\N( H_{0} : \N) Les proportions dans chaque catégorie de survie sont les mêmes pour tous les groupes de personnes.
- Hypothèse alternative\N( H_{a} : \N) Les proportions dans chaque catégorie de survie ne sont pas les mêmes pour tous les groupes de personnes.
Fréquences attendues pour un test du khi-deux pour l'homogénéité
Tu dois calculer les fréquences attendues pour un test du Khi-deux pour l'homogénéité individuellement pour chaque population à chaque niveau de la variable catégorielle, comme indiqué par la formule :
\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
où ,
\(E_{r,c}\) est la fréquence attendue pour la population \(r\) au niveau \(c\) de la variable catégorielle,
\(r\) est le nombre de populations, qui est également le nombre de lignes dans un tableau de contingence,
\(c\) est le nombre de niveaux de la variable catégorielle, qui est également le nombre de colonnes d'un tableau de contingence,
\(n_{r}\) est le nombre d'observations de la population \(r\),
\(n_{c}\) est le nombre d'observations du niveau \(c\) de la variable catégorielle, et
\(n\) est la taille totale de l'échantillon.
Poursuis avec l'étude sur la survie après une crise cardiaque :
Ensuite, tu calcules les fréquences attendues à l'aide de la formule ci-dessus et du tableau de contingence, en plaçant tes résultats dans un tableau de contingence modifié pour que tes données restent organisées.
- \( E_{1,1} = \frac{5531 \cdot 298}{7894} = 208.795 \)
- \( E_{1,2} = \frac{5531 \cdot 7596}{7894} = 5322.205 \N-)
- \( E_{2,1} = \frac{667 \cdot 298}{7894} = 25.179 \N-)
- \( E_{2,2} = \frac{667 \cdot 7596}{7894} = 641.821 \N-)
- \N- E_{3,1} = \Nfrac{1696 \cdot 298}{7894} = 64.024 \N- E_{3,1} = \Nfrac{1696 \cdot 298}{7894} = 64.024 \N
- \( E_{3,2} = \frac{1696 \cdot 7596}{7894} = 1631.976 \N-)
Tableau 2. Tableau de contingence avec les fréquences observées, test du chi-deux pour l'homogénéité.
Tableau de contingence avec les fréquences observées (O) et les fréquences attendues (E) | |||
---|---|---|---|
Mode de vie | A survécu | N'a pas survécu | Total des rangées |
Maison ou maison en rangée | O1,1: 217E1,1: 208.795 | O1,2: 5314E1,2: 5322.205 | 5531 |
Appartement au1er ou2ème étage | O2,1: 35E2,1: 25.179 | O2,2: 632E2,2: 641.821 | 667 |
Appartement au3ème étage ou plus | O3,1: 46E3,1: 64.024 | O3,2: 1650E3,2: 1631.976 | 1696 |
Totaux des colonnes | 298 | 7596 | \(n =\) 7894 |
Les décimales du tableau sont arrondies à \(3\) chiffres.
Degrés de liberté pour un test d'homogénéité du khi-deux
Il y a deux variables dans un test du khi-deux pour l'homogénéité. Par conséquent, tu compares deux variables et tu as besoin que le tableau de contingence s'additionne dans les deux dimensions.
Puisque tu as besoin que les lignes et les colonnes s'additionnent, les degrés de liberté se calculent comme suit :
\[ k = (r - 1) (c - 1) \]
où,
\N(k\N) est le degré de liberté,
\(r\) est le nombre de populations, qui est également le nombre de lignes dans un tableau de contingence, et
\(c\) est le nombre de niveaux de la variable catégorielle, qui est également le nombre de colonnes d'un tableau de contingence.
Test du chi carré pour l'homogénéité : Formule
La formule (également appelée statistique de test) d'un test du khi-deux pour l'homogénéité est :
\[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \]
où ,
\(O_{r,c}\) est la fréquence observée pour la population \(r\) au niveau \(c\), et
\(E_{r,c}\) est la fréquence attendue pour la population \(r\) au niveau \(c\).
Comment calculer la statistique de test pour un test d'homogénéité du khi-deux ?
Étape 1 : Créer un tableau
En commençant par ton tableau de contingence, supprime la colonne "Totaux des lignes" et la ligne "Totaux des colonnes". Ensuite, sépare tes fréquences observées et attendues en deux colonnes, comme suit :
Tableau 3. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées et attendues | |||
---|---|---|---|
Mode de vie | Statut | Fréquence observée | Fréquence attendue |
Maison ou maison de ville | Survivant | 217 | 208.795 |
N'a pas survécu | 5314 | 5322.205 | |
Appartement du1er ou du2e étage | A survécu | 35 | 25.179 |
N'a pas survécu | 632 | 641.821 | |
Appartement du3ème étage ou plus | A survécu | 46 | 64.024 |
N'a pas survécu | 1650 | 1631.976 |
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape \(2\) : Soustraire les fréquences attendues des fréquences observées
Ajoute une nouvelle colonne à ton tableau, intitulée "O - E". Dans cette colonne, inscris le résultat de la soustraction de la fréquence attendue à la fréquence observée :
Tableau 4. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées, attendues et O - E | |||||
---|---|---|---|---|---|
Mode de vie | Statut | Fréquence observée | Fréquence attendue | O - E | |
Maison ou maison de ville | Survivant | 217 | 208.795 | 8.205 | |
N'a pas survécu | 5314 | 5322.205 | -8.205 | ||
Appartement du1er ou2ème étage | A survécu | 35 | 25.179 | 9.821 | |
N'a pas survécu | 632 | 641.821 | -9.821 | ||
Appartement du3ème étage ou plus | A survécu | 46 | 64.024 | -18.024 | |
N'a pas survécu | 1650 | 1631.976 | 18.024 |
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape \N(3\N) : Élever au carré les résultats de l'étape \N(2\N)Ajoute une nouvelle colonne à ton tableau, appelée "(O - E)2". Dans cette colonne, inscris le résultat de la mise au carré des résultats de la colonne précédente :
Tableau 5. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées, attendues, O - E et (O - E)2 | |||||||
---|---|---|---|---|---|---|---|
Mode de vie | Statut | Fréquence observée | Fréquence attendue | O - E | (O - E)2 | ||
Maison ou maison de ville | Survivant | 217 | 208.795 | 8.205 | 67.322 | ||
N'a pas survécu | 5314 | 5322.205 | -8.205 | 67.322 | |||
Appartement du1er ou2ème étage | Survivant | 35 | 25.179 | 9.821 | 96.452 | ||
N'a pas survécu | 632 | 641.821 | -9.821 | 96.452 | |||
Appartement du3ème étage ou plus | Survivant | 46 | 64.024 | -18.024 | 324.865 | ||
N'a pas survécu | 1650 | 1631.976 | 18.024 | 324.865 |
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape \(4\) : Diviser les résultats de l'étape \(3\) par les fréquences attenduesAjoute une nouvelle colonne à ton tableau appelée "(O - E)2/E". Dans cette colonne, inscris le résultat de la division des résultats de la colonne précédente par leurs fréquences attendues :
Tableau 6. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées, attendues, O - E, (O - E)2, et (O - E)2/E | |||||||||
---|---|---|---|---|---|---|---|---|---|
Mode de vie | Statut | Fréquence observée | Fréquence attendue | O - E | (O - E)2 | (O - E)2/E | |||
Maison ou maison de ville | Survivant | 217 | 208.795 | 8.205 | 67.322 | 0.322 | |||
N'a pas survécu | 5314 | 5322.205 | -8.205 | 67.322 | 0.013 | ||||
Appartement du1er ou du2e étage | Survivant | 35 | 25.179 | 9.821 | 96.452 | 3.831 | |||
N'a pas survécu | 632 | 641.821 | -9.821 | 96.452 | 0.150 | ||||
Appartement du3ème étage ou plus | Survivant | 46 | 64.024 | -18.024 | 324.865 | 5.074 | |||
N'a pas survécu | 1650 | 1631.976 | 18.024 | 324.865 | 0.199 |
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape 5 : Additionne les résultats de l'étape \N(4\N) pour obtenir la statistique du test du khi-deuxEnfin, additionne toutes les valeurs de la dernière colonne de ton tableau pour calculer la statistique de ton test du khi-deux :
\[ \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N-{r,c} - E_{r,c})^{2}}{ E_{r,c}} \N-&= 0.322 + 0.013 + 3.831 + 0.150 + 5.074 + 0.199 \N-&= 9.589.\N- end{align} \]
La statistique du test du Khi-deux pour l'homogénéité dans l'étude sur la survie aux crises cardiaques est:
\[ \chi^{2} = 9.589. \]
Étapes à suivre pour effectuer un test du khi-deux pour l'homogénéité
Pour déterminer si la statistique du test est suffisamment importante pour rejeter l'hypothèse nulle, tu compares la statistique du test à une valeur critique tirée d'une table de distribution du khi-deux. Cette comparaison est au cœur du test d'homogénéité du khi-deux.
Suis les étapes ci-dessous pour effectuer un test d'homogénéité du khi-deux.
Les étapes \(1, 2\) et \(3\) sont décrites en détail dans les sections précédentes : "Test du khi-deux pour l'homogénéité : hypothèse nulle et hypothèse alternative", "Fréquences attendues pour un test du khi-deux pour l'homogénéité", et "Comment calculer la statistique de test pour un test du khi-deux pour l'homogénéité".
Étape \(1\) : Énoncer les hypothèses
- L'hypothèse nulle est que les deux variables sont issues de la même distribution.\N-[ \N-{align}H_{0} : p_{1,1} &= p_{2,1} \N-{text{ AND }]. \\N-p_{1,2} &= p_{2,2} \N-text{ AND } \ldots \text{ AND } \\N-p_{1,n} &= p_{2,n}\N- end{align} \]
The alternative hypothesis is that the two variables are not from the same distribution, i.e., at least one of the null hypotheses is false.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\N-p_{1,2} &\neq p_{2,2} \text{ OR } \ldots \text{ OR } \\N-p_{1,n} &\neq p_{2,n}\N- end{align} \]
Étape \(2\) : Calculer les fréquences attendues
Fais référence à ton tableau de contingence pour calculer les fréquences attendues à l'aide de la formule :
\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
Étape \N(3\N) : Calculer la statistique du test du khi-deux
Utilise la formule du test d'homogénéité du khi-deux pour calculer la statistique du test du khi-deux :
\N[ \NChi^{2} = \Nsomme \Nfrac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \N].
Étape \N(4\N) : Trouver la valeur critique du Khi-deux
Pour trouver la valeur critique du khi-deux, tu peux soit :
utiliser un tableau de distribution du khi-deux, ou
utiliser une calculatrice de valeur critique.
Quelle que soit la méthode choisie, tu as besoin de \(2\) informations :
les degrés de liberté, \(k\), donnés par la formule :
\[ k = (r - 1) (c - 1) \]
et le niveau de signification, \(\alpha\), qui est généralement \(0,05\).
Trouve la valeur critique de l'étude sur la survie en cas de crise cardiaque.
Pour trouver la valeur critique :
- Calcule les degrés de liberté.
- En utilisant le tableau de contingence, remarque qu'il y a \(3\) lignes et \(2\) colonnes de données brutes. Therefore, the degrees of freedom are:\[ \begin{align}k &= (r - 1) (c - 1) \\&= (3-1) (2-1) \\&= 2 \text{ degrees of freedom}\end{align} \]
- Choisis un niveau de signification.
- En général, sauf indication contraire, le niveau de signification de \( \alpha = 0,05 \) est celui que tu veux utiliser. Cette étude a également utilisé ce niveau de signification.
- Détermine la valeur critique (tu peux utiliser un tableau de distribution du khi-deux ou une calculatrice). Un tableau de distribution du khi-deux est utilisé ici.
- D'après le tableau de distribution du khi-deux ci-dessous, pour \N( k = 2 \N) et \N( \Nalpha = 0,05 \N), la valeur critique est :\N[ \Nchi^{2} \Ntext{ valeur critique} = 5,99. \N].
Tableau 7. Tableau des points de pourcentage, test du khi-deux pour l'homogénéité.
Points de pourcentage de la distribution du khi-deux | |||||||||
---|---|---|---|---|---|---|---|---|---|
Degrés de liberté(k) | Probabilité d'une valeur plus grande de X2; niveau de signification (α). | ||||||||
0.99 | 0.95 | 0.90 | 0.75 | 0.50 | 0.25 | 0.10 | 0.05 | 0.01 | |
1 | 0.000 | 0.004 | 0.016 | 0.102 | 0.455 | 1.32 | 2.71 | 3.84 | 6.63 |
2 | 0.020 | 0.103 | 0.211 | 0.575 | 1.386 | 2.77 | 4.61 | 5.99 | 9.21 |
3 | 0.115 | 0.352 | 0.584 | 1.212 | 2.366 | 4.11 | 6.25 | 7.81 | 11.34 |
Étape \(5\) : Comparer la statistique du test du khi-deux à la valeur critique du khi-deux
La statistique de ton test est-elle suffisamment grande pour rejeter l'hypothèse nulle ? Pour le savoir, compare-la à la valeur critique.
Compare la statistique de ton test à la valeur critique dans l'étude sur la survie des victimes de crises cardiaques :
La statistique du test du khi-deux est : \N( \Nchi^{2} = 9,589 \N)
La valeur critique du khi-deux est : \( 5.99 \)
La statistique du test du khi-deux est supérieure à la valeur critique.
Étape \(6\) : Décider de rejeter ou non l'hypothèse nulle
Enfin, décide si tu peux rejeter l'hypothèse nulle.
Si la valeur du khi-deux est inférieure à la valeur critique, la différence entre les fréquences observées et attendues n'est pas significative, c'est-à-dire que p > alpha.
Cela signifie que tu ne rejettes pas l'hypothèse nulle.
Si la valeur du Khi-deux est supérieure à la valeur critique, il y a une différence significative entre les fréquences observées et les fréquences attendues, c'est-à-dire \( p < \alpha \).
Cela signifie que tu as suffisamment de preuves pour rejeter l'hypothèse nulle.
Tu peux maintenant décider de rejeter l'hypothèse nulle pour l'étude sur la survie en cas de crise cardiaque :
La statistique du test du Khi-deux est supérieure à la valeur critique, c'est-à-dire que la valeur de \(p\) est inférieure au seuil de signification.
- Tu as donc des preuves solides que les proportions dans les catégories de survie ne sont pas les mêmes pour les groupes \(3\).
Tu conclus qu'il y a moins de chances de survie pour les personnes victimes d'une crise cardiaque et vivant au troisième étage ou plus d'un appartement, et tu rejettes donc l'hypothèse nulle.
Valeur P d'un test du khi-deux pour l'homogénéité
La valeur P d'un test du Khi-deux pour l'homogénéité est la probabilité que la statistique du test, avec \(k\) degrés de liberté, soit plus extrême que sa valeur calculée. Tu peux utiliser une calculatrice de distribution du khi-deux pour trouver la valeur \(p\) d'une statistique de test. Tu peux aussi utiliser un tableau de distribution du khi-deux pour déterminer si la valeur de la statistique de ton test du khi-deux est supérieure à un certain seuil de signification.
Test du chi-deux pour l'homogénéité VS l'indépendance
À ce stade, tu peux te demander quelle est la différence entre un test du khi-deux pour l'homogénéité et un test du khi-deux pour l'indépendance.
Tu utilises le test du Khi-deux pour l'homogénéité lorsque tu n'as que \(1) variable catégorielle provenant de \(2) (ou plus) populations.
Dans ce test, tu collectes au hasard des données d'une population pour déterminer s'il existe une association significative entre \(2\) variables catégorielles.
Lorsque tu interroges les élèves d'une école, tu peux leur demander quelle est leur matière préférée. Tu poses la même question à des populations d'élèves différentes :
- les étudiants de première année et
- étudiants de première année et à ceux de terminale.
Tu utilises un test d'homogénéité du khi-deux pour déterminer si les préférences des étudiants de première année diffèrent significativement de celles des étudiants de terminale.
Tu utilises le test du khi-deux pour l'indépendance lorsque tu as \Ndes variables catégorielles provenant de la même population.
Dans ce test, tu recueilles au hasard les données de chaque sous-groupe séparément afin de déterminer si le nombre de fréquences diffère de manière significative entre les différentes populations.
Dans une école, les élèves peuvent être classés en fonction de :
- leur orientation (gaucher ou droitier) ou par
- leur domaine d'études (mathématiques, physique, économie, etc.).
Tu utilises un test d'indépendance du khi-deux pour déterminer si le fait d'être gaucher ou droitier est lié au choix des études.
Exemple de test du khi-deux pour l'homogénéité
En reprenant l'exemple de l'introduction, tu décides de trouver une réponse à la question suivante : les hommes et les femmes ont-ils des préférences différentes en matière de films ?
Tu choisis un échantillon aléatoire de \(400\) étudiants de première année d'université : \N(200\N) hommes et \N(300\N) femmes. On demande à chaque personne lequel des films suivants elle préfère : The Terminator ; The Princess Bride ; ou The Lego Movie. Les résultats sont présentés dans le tableau de contingence ci-dessous.
Tableau 8. Tableau de contingence, test du chi carré pour l'homogénéité.
Tableau de contingence | |||
---|---|---|---|
Film | Hommes | Femmes | Totaux des rangées |
Le Terminator | 120 | 50 | 170 |
La Princesse Mariée | 20 | 140 | 160 |
Lego Movie | 60 | 110 | 170 |
Totaux des colonnes | 200 | 300 | \(n =\) 500 |
Solution:
Étape \(1\) : Énonce les hypothèses.
- Hypothèse nulle: la proportion d'hommes qui préfèrent chaque film est égale à la proportion de femmes qui préfèrent chaque film. Ainsi,\N-[ \N-{align}H_{0} : p_{{text{hommes aiment Le Terminator}} &= p_{{text{femmes aiment Le Terminator}} \text{ AND} \\N-H_{0} : p_{text{hommes aiment The Princess Bride} &= p_{text{femmes aiment The Princess Bride}} \text{ AND} \\N-H_{0} : p_{text{hommes aiment Le Lego Movie} &= p_{text{femmes aiment Le Lego Movie}\N- [\N-] [\N-] [\N-] [\N-] [\N-] [\N-] \]
- Hypothèse alternative: Au moins une des hypothèses nulles est fausse. So,\[ \begin{align}H_{a}: p_{\text{men like The Terminator}} &\neq p_{\text{women like The Terminator}} \text{ OR} \\N-H_{a} : p_{text{hommes aiment La Princesse Bride} &\neq p_{text{femmes aiment La Princesse Bride}} \text{ OR} \\N-H_{a} : p_{text{hommes aiment The Lego Movie} &\neq p_{text{femmes aiment The Lego Movie}}\end{align} \]
Étape \(2\) : Calculer les fréquences attendues.
- En utilisant le tableau de contingence ci-dessus et la formule des fréquences attendues :\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n}, \]créer un tableau des fréquences attendues.
Tableau 9. Tableau des données pour les films, test du khi-deux pour l'homogénéité.
Film | Hommes | Femmes | Totaux des rangées |
Terminator | 68 | 102 | 170 |
La princesse mariée | 64 | 96 | 160 |
Lego Movie | 68 | 102 | 170 |
Totaux des colonnes | 200 | 300 | \(n =\) 500 |
Étape \(3\) : Calcule la statistique du test du khi-deux.
- Crée un tableau pour conserver les valeurs calculées et utilise la formule :\[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \]pour calculer la statistique de ton test.
Tableau 10. Tableau des données pour les films, test du Khi-deux pour l'homogénéité.
Film | Personne | Fréquence observée | Fréquence attendue | O-E | (O-E)2 | (O-E)2/E |
Terminator | Hommes | 120 | 68 | 52 | 2704 | 39.767 |
Les femmes | 50 | 102 | -52 | 2704 | 26.510 | |
Princess Bride | Les hommes | 20 | 64 | -44 | 1936 | 30.250 |
Les femmes | 140 | 96 | 44 | 1936 | 20.167 | |
Lego Movie | Les hommes | 60 | 68 | -8 | 64 | 0.941 |
Les femmes | 110 | 102 | 8 | 64 | 0.627 |
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
- Add all the values in the last column of the table above to calculate the Chi-square test statistic:\[ \begin{align}\chi^{2} &= 39.76470588 + 26.50980392 \\&+ 30.25 + 20.16667 \\&+ 0.9411764706 + 0.6274509804 \\&= 118.2598039.\end{align} \]
La formule ici utilise les nombres non arrondis du tableau ci-dessus pour obtenir une réponse plus précise.
- La statistique du test du Khi-deux est la suivante :\[ \chi^{2} = 118.2598039. \]
Étape \N(4\N) : Trouve la valeur critique du khi-deux et la valeur \(P\)-Valeur.
- Calculate the degrees of freedom.\[ \begin{align}k &= (r - 1) (c - 1) \\&= (3 - 1) (2 - 1) \\&= 2\end{align} \]
- À l'aide d'un tableau de distribution du khi-deux, regarde la ligne des degrés de liberté (2) et la colonne de la signification (0,05) pour trouver la valeur critique de 5,99.
- Pour utiliser une calculatrice de la valeur de \(p\), tu as besoin de la statistique du test et des degrés de liberté.
- Entre les degrés de liberté et la valeur critique du Khi-deux dans la calculatrice pour obtenir :[P(\chi^{2} > 118,2598039) = 0. \N].
Étape \N(5\N) : Comparer la statistique du test du khi-deux à la valeur critique du khi-deux.
- La statistique du test de \N(118.2598039\N) est significativement plus grande que la valeur critique de \N(5.99\N).
- La valeur de \(p\) est également bien inférieure au niveau de signification.
Étape 6 : Décider de rejeter ou non l'hypothèse nulle.
- Parce que la statistique du test est plus grande que la valeur critique et que la valeur de \(p\)est inférieure au seuil de signification, tu as suffisamment de preuves pour rejeter l'hypothèse nulle,
tu as suffisamment de preuves pour rejeter l'hypothèse nulle.
Test du chi-deux pour l'homogénéité - Principaux enseignements
- Le test du Khi-deux pour l'homogénéité est un test du Khi-deux qui s'applique à une seule variable catégorielle provenant de deux ou plusieurs populations différentes afin de déterminer si elles ont la même distribution.
- Ce test a les mêmes conditions de base que tout autre test du chi carré de Pearson;
- Les variables doivent être catégoriques.
- Les groupes doivent être mutuellement exclusifs.
- Les effectifs attendus doivent être au moins égaux à \(5\).
- Les observations doivent être indépendantes.
- L'hypothèse nulle est que les variables proviennent de la même distribution.
- L'hypothèse alternative est que les variables n'appartiennent pas à la même distribution.
- Les degrés de liberté d'un test du Khi-deux pour l'homogénéité sont donnés par la formule :\[ k = (r - 1) (c - 1) \].
- La fréquence attendue pour la ligne \(r\) et la colonne \(c\) d'un test du Khi-deux pour l'homogénéité est donnée par la formule :\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
- La formule (ou statistique de test) d'un test du Khi-deux pour l'homogénéité est donnée par la formule suivante :\[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \].
Références
- https://pubmed.ncbi.nlm.nih.gov/26783332/
Apprends plus vite avec les 7 fiches sur Test du khi-deux pour l'homogénéité
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Test du khi-deux pour l'homogénéité
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus