Photosynthesis is the process by which plants, algae, and some bacteria convert light energy into chemical energy stored as glucose. Investigating photosynthesis helps us understand how organisms produce oxygen and food, supporting nearly all life on Earth.
Get started for freeCe type de variable peut être mesuré à l'aide d'unités.
Les variables catégorielles sont également connues sous le nom de ____.
Lesquelles des variables suivantes sont des variables quantitatives ?
Supposons que tu jettes un coup d'œil à une bouteille de soda. Lesquels des éléments suivants ne sont pas des variables quantitatives ?
Vrai/Faux : Le coefficient de corrélation de Pearson peut être égal à \(2\).
Vrai/Faux : Tu peux attribuer une ligne de meilleur ajustement à n'importe quel nuage de points.
Vrai/Faux : Tu peux utiliser le coefficient de corrélation de Pearson pour mesurer la corrélation de données à corrélation exponentielle.
Les données quantitatives bivariées sont des données qui se composent de ____.
Les diagrammes de dispersion sont utilisés pour représenter ____.
Supposons que tu regardes une boîte de thon. Lesquelles des variables suivantes sont quantitatives ?
Supposons que tu cherches les informations du dernier single d'un musicien célèbre. Parmi les variables suivantes, lesquelles ne sont pas quantitatives ?
Content creation by StudySmarter Biology Team.
Published: 26.06.2024. Last updated: 01.01.1970.
Aujourd'hui, j'avais très faim et je suis allée à un buffet à volonté. Il y a une grande variété de plats et de desserts, mais ce qui a vraiment attiré mon attention, c'est le tableau des prix pour les enfants de moins de 15 ans. Plus ils sont jeunes, moins ils sont facturés.
Après y avoir réfléchi un moment, j'ai trouvé cela tout à fait logiquea>. Comme les tout-petits ne mangent pas autant que les adolescents, il est normal de les faire payer moins cher. Il semble qu'il y ait une relation entre l'âge et la quantité de nourriture qu'une personne mange. Comment étudier cette relation ? Tu pourrais peut-être mener une enquête pour cette recherche !
Chaque fois que tu étudies la relation entre deux variables que tu peux mesurer, tu as affaire à deux variables quantitatives. Tu apprendras ici comment étudier leur relation et les techniques utilisées pour les représenter.
Avant de poursuivre, il est important de revoir la différence entre les variables quantitatives et les variables catégorielles.
Une variable quantitative est une variable qui peut être mesurée à l'aide d'unités.
Le type d'unités que tu utilises n'a pas d'importance, tant que tu peux mesurer une variable, il s'agit d'une variable quantitative. Qu'en est-il des variables catégorielles ?
Une variable catégorielle, également appelée variable qualitative, est une variable dont les propriétés sont décrites plutôt que mesurées.
Les variables catégorielles sont généralement des choses comme les couleurs, les noms, les repas préférés, etc.
Supposons que tu fasses une enquête dans ton quartier et que tu demandes les données suivantes :
Quelles sont les variables quantitatives et celles qui sont catégoriques ?
Solution :
Pour savoir quelles variables sont quantitatives, tu dois te demander quelles variables peuvent être mesurées. Dans la liste donnée, l'âge est généralement mesuré en années, tandis que tu peux mesurer la taille en pieds, en pouces, en mètres ou en d'autres unités. Les variables quantitatives sont donc :
Les autres variables seront exprimées par des mots plutôt que par des nombres, il est donc plus facile de les considérer comme des étiquettes (dans le cas du nom de famille) ou comme une description d'elles-mêmes (comme le sexe et l'activité préférée). Les variables catégorielles sont donc les suivantes :
Généralement, une enquête est réalisée dans le but de recueillir des données pour son inspection. Les décisions sont prises en fonction des conclusions tirées des données, il est donc important d'analyser la relation entre les variables.
Lorsque tu compares deux variables quantitatives, tu peux avoir une image plus claire des données en les organisant en fonction des valeurs numériques qui sont représentées. Ce n'est pas le cas pour les variables catégorielles, comme tu le verras dans l'exemple suivant.
Supposons que tu veuilles faire un graphique pour étudier la relation entre ces deux paires de variables :
Lorsque tu fais un graphique de deux variables quantitatives, comme dans le cas de la taille et du poids des élèves, tu peux disposer les données par ordre numérique. Autrement dit, chaque axe représentera une droite numérique, de sorte qu'avant de le remplir avec des données, ton graphique ressemblera à ceci :
Figure 1. Graphique vide de la taille par rapport au poids
Le graphique comparant deux variables quantitatives est plus perspicace car si tu te déplaces vers la droite, tu observes des personnes plus grandes, et si tu te déplaces vers le haut, tu observeras des personnes dont le poids est plus élevé. Tu peux le constater même si le graphique est vide !
Si tu devais utiliser un graphique pour représenter deux variables catégorielles, comme dans le cas du sport et de la couleur préférés, il n'y a pas d'arrangement clair pour les données. Tu les organiseras peut-être par ordre alphabétique, ou tu les classeras peut-être selon tes préférences, mais cet arrangement ne te dit rien à l'avance.
Il est important de garder à l'esprit le contexte de l'enquête afin de classer correctement une variable comme quantitative ou catégorielle. Par exemple, tu pourrais penser qu'un code postal est une variable quantitative parce qu'il s'agit d'un nombre, mais comme il s'agit simplement d'une étiquette, il s'agit plutôt d'une variable catégorielle.
Si tu veux savoir comment analyser les variables catégorielles, consulte notre article Deux variables catégorielles.
La question qui se pose naturellement lorsqu'on te donne deux variables est la suivante : Ces deux variables sont-elles liées l'une à l'autre ?
Prends le cas de la taille et du poids. Plus une personne est grande, plus elle pèsera. Cela ne signifie pas qu'une personne plus grande pèsera toujours plus qu'une personne plus petite, mais cela t'indique plutôt qu'il existe une relation entre ces variables.
Il est également possible d'avoir deux variables non liées, comme l'âge et la taille d'une population d'hommes adultes. Chaque fois que tu as affaire à deux variables, qu'elles soient liées ou non, tu as affaire à des données bivariées.
Les donnéesbivariées sont des données qui sont données sous forme de paires de variables.
Dans l'exemple de la taille et du poids, lorsque tu feras une enquête, tu demanderas à la fois la taille et le poids de chaque individu, donc chacune de ces valeurs sera appariée. Il s'agit d'un exemple de données à deux variables.
Les donnéesquantitatives à deux variables sont des données à deux variables qui se composent de deux variables quantitatives.
Les données quantitatives à deux variables peuvent être représentées de plusieurs façons. Par exemple, tu peux utiliser un tableau de valeurs, où chaque colonne représente l'une des variables.
Supposons que tu veuilles étudier s'il existe une relation entre les habitudes de consommation et l'âge. Pour cette raison, tu te rends au centre commercial de ton quartier et tu demandes poliment à chaque personne qui part si elle est partante pour un sondage. Dans cette enquête, tu leur demandes simplement leur âge et le nombre d'articles qu'ils ont achetés, le cas échéant. Tes données peuvent être organisées dans un tableau comme celui-ci :
Âge (années) | Nombre d'articles achetés |
\[12\] | \[0\] |
\[36\] | \[4\] |
\[21\] | \[12\] |
\[24\] | \[5\] |
\[15\] | \[2\] |
\[23\] | \[7\] |
\[45\] | \[2\] |
\[67\] | \[1\] |
\[11\] | \[1\] |
À partir du tableau ci-dessus, tu peux commencer à noter quelques tendances. On dirait que les enfants ont tendance à acheter moins de choses, peut-être parce qu'ils manquent d'argent. D'un autre côté, les jeunes adultes semblent aimer mettre la main sur beaucoup de choses. Bien sûr, de nombreux autres facteurs entrent en jeu dans les habitudes de consommation, mais c'est un bon début !
Tu peux réorganiser le tableau ci-dessus en classant les données par âge, auquel cas tu dois t'assurer que tu associes correctement chaque entrée.
Âge (années) | Nombre d'articles achetés |
\[11\] | \[1\] |
\[12\] | \[0\] |
\[15\] | \[2\] |
\[21\] | \[12\] |
\[23\] | \[7\] |
\[24\] | \[5\] |
\[36\] | \[4\] |
\[45\] | \[2\] |
\[67\] | \[1\] |
N'oublie pas que le tableau peut aussi être écrit horizontalement, auquel cas chaque ligne représentera une enquête.
Une autre façon de représenter des données quantitatives à deux variables consiste à dessiner des points dans un plan, comme tu le verras dans la section suivante.
Il existe de nombreuses façons de représenter des données quantitatives. Par exemple, si tu souhaites réaliser une enquête sur l'âge des lycéens, tu peux utiliser un histogramme, un diagramme en points ou un diagramme en tiges et feuilles. Cependant, tous ces graphiques sont utilisés pour afficher une seule variable ainsi que sa fréquence.
Supposons que l'on te donne un ensemble de données quantitatives à deux variables, ce qui signifie que les deux variables sont des variables quantitatives, et que tu as donc affaire à une paire de nombres. La représentation graphique de données quantitatives bivariées est donc une tâche simple, car tu peux représenter les données par des points sur le plan . Pour ce faire, tu dois assigner un axe à chaque variable.
Prends l'exemple de notre centre commercial. Tu peux assigner l'une ou l'autre variable à l'un ou l'autre axe, mais tu assigneras généralement l'axe \(x\) à des variables telles que l'âge et la taille, qui évoluent à un rythme constant ou qui sont moins susceptibles d'évoluer.
En revanche, les variables telles que le poids, le nombre d'articles achetés ou de bouteilles d'eau bues en une semaine sont plus susceptibles d'être assignées à l'axe \(y\).
Figure 2. L'âge des clients se trouve sur l'axe \(x) et le nombre d'articles achetés se trouve sur l'axe \(y).
Note que l'âge des clients est compris entre 11 et 67 ans, et que l'axe des x est donc modifié en conséquence. De même, l'axe \(y\) est compris entre \(0) et \(12).
Maintenant que le plan est étiqueté de façon représentative, il est temps de dessiner un grand nombre de points. Ici, chaque point représente une enquête.
Figure 3. Diagramme de dispersion de l'âge des clients par rapport au nombre d'articles achetés dans un centre commercial.
Le graphique présenté dans l'exemple précédent est connu sous le nom de diagramme de dispersion, et c'est l'une des façons les plus courantes d'afficher des données quantitatives bivariées.
Pour plus d'informations sur ces diagrammes, consulte notre article sur les diagrammes de dispersion !
L'une des raisons pour lesquelles les diagrammes de dispersion sont souvent utilisés pour représenter des données quantitatives bivariées est qu'il est possible d'identifier des modèles dans les données. Considère le diagramme de dispersion suivant.
Figure 4. Diagramme de dispersion de l'âge des enfants entre 4 et 12 ans en fonction de leur taille.
À partir du diagramme de dispersion ci-dessus, tu as peut-être trouvé un modèle dans lequel, en général, plus l'âge des enfants augmente, plus ils sont grands, ce qui est parfaitement logique. Dans ce cas, nous disons que les deux variables sont corrélées.
Lacorrélation est une mesure du degré d'association entre deux variables quantitatives.
Il convient de noter que la corrélation ne s'applique qu'à deux variables quantitatives. Si tu as affaire à des données bivariées où l'une ou les deux variables sont catégoriques, tu ne dois pas rechercher de corrélation.
Lorsque deux variables sont corrélées, tu peux tracer une ligne droite qui décrit plus ou moins le comportement des données. Cette ligne est connue sous le nom de ligne de meilleur ajustement, qui est obtenue au moyen de la régression linéaire.
Consulte notre article sur la régression linéaire pour plus d'informations sur ce sujet !
Si deux variables sont corrélées, tu t'attends à ce que le changement de l'une ait un impact significatif sur l'autre. Pour cette raison, si les variables sont corrélées, la ligne de meilleur ajustement sera soit une ligne croissante, soit une ligne décroissante.
Figure 5. Graphique de données bivariées fortement corrélées avec sa ligne de meilleur ajustement.
En revanche, si deux variables ne sont pas du tout corrélées, tu dois t'attendre à ce que la ligne de meilleur ajustement soit horizontale, car le changement d'une variable n'a aucun impact sur l'autre. Dans ce scénario, les données seront dispersées sur tout le pourtour.
Figure 6. Graphique de données bivariées faiblement corrélées et ligne d'ajustement optimale.
Pour mesurer le degré de corrélation entre deux variables, tu dois examiner le coefficient de corrélation de Pearson.
Le coefficient de corrélation de Pearson, également connu sous le nom de coefficient de Pearson, ou simplement de coefficient de corrélation, est un nombre compris entre \(-1\) et \(1\), qui est utilisé pour mesurer la corrélation de données bivariées.
Pour plus d'informations sur le coefficient de corrélation et la façon dont il est obtenu, jette un coup d'œil à notre article sur la corrélation linéaire.
Il y a certaines choses à garder à l'esprit lorsqu'on parle de corrélation, qui peuvent être abordées à l'aide du coefficient de corrélation.
La corrélation fait généralement référence à l'association linéaire entre deux variables, mais il est également possible de constater que certaines variables sont liées par d'autres types de relations, comme la quadratique ou l'exponentielle.
Figure 7. Diagramme de dispersion avec corrélation exponentielle
Ces autres types de corrélation ne seront pas abordés plus avant dans cet article.
Le coefficient de corrélation de Pearson ne s'applique qu'aux données bivariées à corrélation linéaire !
Dans les exemples précédents, tu as vu que dans le cas de deux variables corrélées, lorsque l'une augmente, l'autre augmente aussi. Il s'agit d'un type particulier de corrélation, appelé corrélation positive.
Deux variables sont positivement corrélées si le coefficient de corrélation de Pearson est positif.
Lorsque deux variables sont positivement corrélées, la ligne de meilleur ajustement a une pente positive. Cependant, il est également possible d'avoir des variables négativement corrélées.
Deux variables sont négativement corrélées si le coefficient de corrélation de Pearson est négatif.
De même, lorsque deux variables sont négativement corrélées, la ligne d'ajustement optimal a une pente négative.
Figure 8. Diagramme de dispersion de données négativement corrélées avec sa ligne de meilleur ajustement.
Rappelle-toi qu'une corrélation négative signifie que les données sont corrélées . Le mot négatif est utilisé pour parler de la pente de la ligne de meilleur ajustement.
Tu remarqueras parfois qu'un diagramme de dispersion ressemble fortement à un graphique linéaire, tandis que d'autres présentent des données si dispersées qu'elles semblent presque aléatoires ! La valeur absolue du coefficient de corrélation de Pearson te donnera un aperçu de la question.
Soit \(r\) le coefficient de corrélation de Pearson d'un ensemble de données quantitatives à deux variables. Plus \(|r|\) est proche de \(1,\), plus la corrélation est forte. Un coefficient de corrélation de Pearson exactement égal à \(1\) ou \(-1\) signifie que les données sont complètement linéaires, ce qui est un scénario si parfait qu'il est peu probable qu'il se produise.
En revanche, si le coefficient de corrélation de Pearson est proche de \(0\), les données suggèrent que les variables ne sont pas corrélées, ou qu'elles le sont faiblement.
Ici, tu peux regarder quelques exemples de diagrammes de dispersion de deux variables quantitatives et dire s'ils représentent des données corrélées ou non.
Une enquête a été réalisée auprès de femmes adultes sur leurs habitudes de lecture, ce qui a permis d'obtenir le nuage de points suivant.
Figure 9. Diagramme de dispersion du nombre moyen de livres lus en un an en fonction de la taille des femmes adultes.
Solution :
Tu peux trouver des corrélations même dans ton épicerie !
Supposons que tu sois au régime et qu'on te recommande d'éviter le sucre ajouté dans les boissons en boîte comme les jus et les sodas.
Tu es sceptique quant à cette suggestion, alors tu décides d'étudier s'il existe une relation entre le sucre ajouté et les calories par portion.
Pour ce faire, tu vas à l'épicerie et tu vérifies la valeur nutritive de \(20\) différents produits que tu vas consommer. De retour à la maison, tu réalises le diagramme de dispersion suivant.
Figure 10. Diagramme de dispersion des sucres ajoutés par rapport aux calories par portion sur les boissons en conserve.
Devrais-tu suivre la recommandation ?
Solution :
En examinant les données, tu peux constater que plus la quantité de sucre ajouté augmente, plus la quantité de calories par portion de ces boissons en boîte augmente.
Tu peux en conclure qu'il existe une corrélation positive entre la quantité de sucre moyenne et les calories des boissons en boîte. Comme tu es au régime, tu dois limiter les calories que tu consommes, tu dois donc suivre cette recommandation.
At StudySmarter, we have created a learning platform that serves millions of students. Meet the people who work hard to deliver fact based content as well as making sure it is verified.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models' (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
StudySmarter is a global EdTech platform helping millions of students learn faster and succeed in exams like GCSE, A Level, SAT, ACT, and Abitur. Our expert-reviewed content, interactive flashcards, and AI-powered tools support learners across STEM, Social Sciences, Languages, and more.
Access subjects, mock exams, and features to revise more efficiently. All 100% free!
Get your free account!