D1. Littératie statistique
Contenus d’apprentissage
Collecte et organisation des données
D1.1
expliquer pourquoi des pourcentages sont utilisés pour représenter la distribution d’une variable provenant d’une population ou d’un échantillon dans de grands ensembles de données, et fournir des exemples.
- Grand ensemble de données dans un tableau de fréquences
- Grand ensemble de données dans un tableau de fréquences relatives
- Grand ensemble de données dans un diagramme circulaire
- Il est plus facile de comparer des catégories d’une population en faisant la comparaison des valeurs relatives (p. ex., pourcentages) plutôt que des valeurs absolues. Imaginons par exemple que, dans un sondage effectué auprès de 45 896 personnes, 36 572 personnes ont répondu « oui », et 592 personnes ont répondu « peut‑être ». Ces données sont plus faciles à interpréter si l’on compare des pourcentages, en disant que 80 % des personnes ont répondu « oui » et 1 % ont répondu « peut‑être ».
Présentez aux élèves un tableau de fréquences illustrant la distribution des données pour une population plus grande. Demandez-leur ensuite de décrire les relations qu’elles et ils observent entre les données. Ensuite, donnez aux élèves un tableau de fréquences relatives présentant la même distribution dans lequel les fréquences relatives sont exprimées sous forme de pourcentage. Demandez-leur de décrire les relations qu’elles et ils observent dans cette étape. Discutez avec les élèves la façon dont les pourcentages peuvent les aider à mieux analyser des données et comment elles et ils peuvent s’en servir pour faire des prédictions.
Demandez aux élèves de consulter des données qu’elles et ils ont collectées lors d’un récent exercice et de les représenter de nouveau sous forme de pourcentage. Discutez des nouvelles observations relatives à ces données faites par les élèves.
D1.2
collecter des données qualitatives et des données quantitatives discrètes et continues pour répondre à des questions d’intérêt, et organiser les ensembles de données de façon appropriée, y compris en utilisant des pourcentages.
- Questions d’intérêt nécessitant la collecte de données discrètes
- Combien de billets ont été vendus quotidiennement pour le ciné-parc le mois passé?
- Combien de fois les cinq principaux genres cinématographiques se retrouvent-ils dans la liste des 50 meilleurs films à chacune des cinq dernières années?
- Questions d’intérêt nécessitant la collecte de données continues
- Est-ce que c’est le plant de tomate ou le plant de tournesol qui a poussé le plus au cours du dernier mois? Comment le savez-vous?
- À quel moment du film le personnage principal fait-il son apparition?
- Questions d’intérêt nécessitant la collecte de données qualitatives
- Quels sont les trois genres de films les plus populaires auprès des jeunes de 12 à 16 ans?
- Si un ciné-parc devait proposer deux films de deux genres différents, quelle combinaison de genres devrait attirer le plus de clients?
- Tableau de fréquences relatives avec des pourcentages
- Les données primaires sont des données recueillies directement à partir d’une source originale (p. ex., sondage, expérience).
- Les données secondaires sont des données qui ont été déjà recueillies (p. ex., données publiées par Statistique Canada, données du registre des élèves d’une école).
- Dans un tableau de fréquences relatives, le total des fréquences doit être égal à 100 % si les fréquences sont exprimées en pourcentages, et doit être égal à 1 si elles sont exprimées en nombres décimaux.
- Les angles nécessaires à la construction d’un diagramme circulaire peuvent être déterminés en calculant le pourcentage de 360 degrés pour chaque secteur du diagramme.
Le tableau suivant montre les genres cinématographiques qui figuraient dans la liste des 50 meilleurs films l’an dernier. Demandez aux élèves de présenter les données de deux façons différentes, en utilisant des pourcentages.
Présentez à des dyades d’élèves une copie du tableau suivant, qui a été découpé. Leur tâche est d’organiser les bandes de papier dans les rubriques « Données qualitatives », « Données quantitatives (discrètes) », « Données quantitatives (continues) ». Après que les élèves ont fait cette classification, discutez des questions relatives à plusieurs sujets.
Fournissez aux élèves des questions d’intérêt possibles et demandez-leur de déterminer :
- si les données devraient être collectées à partir d’une source primaire ou secondaire;
- des populations appropriées à partir desquelles collecter des données;
- des techniques d’échantillonnage possibles;
- des méthodes de collecte de données pour éviter ou réduire les biais.
Visualisation des données
D1.3
choisir le diagramme le plus approprié pour représenter divers ensembles de données, y compris des diagrammes circulaires; représenter ces données à l’aide de diagrammes comprenant des sources, des titres, des étiquettes et des échelles appropriés; et justifier son choix.
- Types de diagrammes
- Ligne de dénombrement
- Diagramme à bandes
- Diagramme bandes multiples
- Diagramme à bandes empilées
- Histogramme
- Diagramme à ligne brisée
- Diagramme circulaire
- Diagramme circulaire
- Les diagrammes circulaires sont utilisés pour représenter la proportion de chaque catégorie au sein d’un ensemble.
- Les histogrammes présentent des données continues organisées en intervalles.
- Les diagrammes à ligne brisée servent à représenter une évolution dans le temps.
- Les diagrammes à pictogrammes, les lignes de dénombrement, les diagrammes à bandes, les diagrammes à bandes multiples et les diagrammes à bandes empilées peuvent être utilisés pour présenter des données qualitatives et des données discrètes.
Fournissez aux élèves les données présentées dans un tableau de fréquences ou un tableau de fréquences relatives et demandez-leur de créer un diagramme circulaire. Avant de commencer, demandez-leur d’ordonner les catégories de la plus grande à la plus petite en fonction de ce qu’elles et ils anticipent être la taille de chaque section du cercle. Voici ci-après un exemple de données relatives à la liste des « 50 meilleurs films » représentées dans un tableau de fréquences relatives, avec des mesures d’angle au degré le plus proche qui sont nécessaires pour créer le diagramme circulaire, et le diagramme circulaire ainsi obtenu.
D1.4
créer une infographie pour représenter un ensemble de données de façon appropriée, y compris à l’aide de tableaux et de diagrammes circulaires, ainsi qu’en incorporant d’autres renseignements pertinents qui permettent de raconter une histoire au sujet des données.
- Infographie « Nettoyage du jour de la Terre »
- Les infographies sont utilisées dans la vie quotidienne afin de présenter des données et des renseignements sur un sujet de façon attrayante.
- Le style et le format de la présentation du contenu d’une infographie doivent être choisis minutieusement pour que l’information présentée soit claire et concise.
- Une infographie présente de façon virtuelle des données pertinentes à un public cible précis.
- Les infographies contiennent différentes représentations, telles que des tableaux et des diagrammes. Elles comportent peu de texte.
Remarque(s) :
- Les infographies peuvent être utilisées pour les projets STIM.
Afin qu’elles et ils approfondissent leur compréhension de ce qu’est une infographie et de son objectif, fournissez aux élèves une infographie qui a été déjà créée, comme « Nettoyage du jour de la Terre », se trouvant dans les exemples du contenu d’apprentissage D1.4. Posez des questions comme :
- À votre avis, à quel public l’infographie est-elle destinée?
- Selon vous, quels messages l’auteur essaie-t-il de communiquer?
- Quelles représentations de données l’auteur a-t-il utilisées? Selon vous, pourquoi ont-elles été choisies?
- Comment pourriez-vous modifier l’infographie pour accroître son impact?
Demandez aux élèves de collecter des infographies et, avec la classe, de dresser une liste des caractéristiques qu’elles et ils observent dans les infographies. Discutez les façons dont ces caractéristiques peuvent changer en fonction du public cible et de l’histoire qu’elles et ils veulent dire au sujet des données.
Demandez aux élèves de créer une infographie pour représenter des données qu’elles et ils ont déjà recueillies. Demandez-leur d’élaborer un aperçu du message qu’elles et ils aimeraient transmettre à un public cible particulier, tel le conseil des élèves. Demandez aux élèves de donner et de recevoir une rétroaction sur leur plan, leur technique de visualisation et de représentation des données et sur les éléments de conception graphique.
Analyse des données
D1.5
déterminer l’incidence de l’ajout ou de la suppression de données sur les mesures de tendances centrales et décrire comment ces changements modifient la représentation et la distribution des données.
Taille (en cm) du groupe H avec les cinq membres d’origine |
Taille (en cm) du groupe H avec deux membres supplémentaires |
156 | 156 |
149 | 149 |
160 | 160 |
168 | 168 |
160 | 160 |
231 | |
231 | |
Mode : 160 | Mode : 160 and 231 |
Médiane : 160 | Médiane : 160 |
Moyenne : 158,6 | Moyenne : 179,2 |
- Incidence sur les mesures de la tendance centrale
- Alors que l’ensemble de données d’origine a un mode, le deuxième ensemble de données a deux modes.
- La médiane reste la même pour les deux ensembles de données.
- La moyenne augmente de plus de 20 centimètres dans le deuxième ensemble de données parce que les deux membres additionnels du groupe ont une taille bien plus grande que les cinq membres fondateurs du groupe.
- L’ajout ou la suppression de données qui n’est pas la valeur la plus fréquente de l’ensemble n’affectera pas le mode.
- La suppression des valeurs de données regroupées à une extrémité ou à l’autre d’un ensemble de données ordonné peut avoir un impact significatif sur les mesures des tendances centrales.
- Les données aberrantes sont des valeurs extrêmes qui peuvent affecter les mesures de la tendance centrale. Par conséquent, la distribution et la forme des données présentées dans les diagrammes peuvent changer.
Demandez aux élèves d’ajouter des données à un ensemble de données qualitatives qu’elles et ils ont déjà recueillies. Demandez-leur de déterminer l’incidence de l’ajout de nouvelles données en cherchant des similitudes et des différences entre les deux ensembles de données.
Par exemple, les données ci-dessous représentent les genres des « 50 meilleurs films » :
D’autres données sont ajoutées ensuite pour montrer les « 100 meilleurs films » :
Demandez aux élèves ce qu’elles et ils remarquent et ce qu’elles et ils questionnent lorsqu’elles et ils comparent les deux ensembles de données. Par exemple :
- Quelle est l’incidence de l’ajout de nouvelles données sur le mode?
- Quels films sont les plus populaires après l’ajout de nouvelles données? Comment cela se compare-t-il aux données initiales?
- Quels nouveaux genres apparaissent après l’ajout de nouvelles données?
- Comment le diagramme circulaire a-t-il changé avec l’ajout des nouvelles données?
Présentez aux élèves un ensemble de données quantitatives comprenant des données aberrantes. Demandez-leur de déterminer la moyenne, la médiane et le mode pour l’ensemble de données comportant des données aberrantes et pour celui sans données aberrantes, puis de les comparer.
Par exemple, demandez aux élèves de travailler en groupes de cinq. Demandez-leur de mesurer leur taille en centimètres, puis de trouver la moyenne, la médiane et le mode pour cet ensemble de données. Demandez ensuite aux élèves d’ajouter les données correspondant aux joueurs ayant la plus grande taille de l’histoire de la NBA (la National Basketball Association) à leur ensemble de données :
- Gheorghe Mureșan, 231 cm;
- Manute Bol, 231 cm.
Demandez aux élèves de recalculer la moyenne, la médiane et le mode à l’aide de ces données supplémentaires et de noter comment chacune de ces mesures a été touchée par l’ajout de nouvelles données.
Expliquez pourquoi il est important de tenir compte des données aberrantes et introduisez la notion qu’elles doivent être considérées selon le contexte. Dans cette mise en situation, les données aberrantes ne nous aident pas à connaître la taille moyenne des élèves de la 7e année et devraient donc être écartées.
D1.6
examiner divers ensembles de données présentées de différentes façons, y compris à l’aide de diagrammes circulaires et de diagrammes trompeurs, en se posant des questions au sujet des données, en y répondant, en remettant en question des idées reçues et en tirant des conclusions, et ensuite formuler des arguments persuasifs et prendre des décisions éclairées.
- Différentes formes de représentations de données
- Tableaux de fréquences, diagrammes de Venn, diagrammes de Carroll, diagrammes à pictogrammes, lignes de dénombrement, diagrammes à bandes, histogrammes, diagrammes à ligne brisée, diagrammes circulaires
- Question nécessitant de lire et d’interpréter des données se trouvant dans un diagramme ou un tableau
- Quel pourcentage des 100 meilleurs films les comédies représentent-elles?
- Quels genres figurent seulement parmi les 100 meilleurs films et non parmi les 50 meilleurs films?
- Question nécessitant d’extraire des données d’un diagramme ou d’un tableau et de les utiliser dans un calcul
- Le diagramme circulaire montre la proportion d’élèves qui ont travaillé dans les parcs 1, 2 et 3 pour le nettoyage du jour de la Terre. S’il y a 500 élèves dans l’école, combien d’élèves de plus ont travaillé dans le parc 2 que dans le parc 3?
- Combien y avait-il de comédies de plus parmi les 100 meilleurs films comparativement aux 50 meilleurs films?
- Question nécessitant de faire une déduction ou une prédiction à partir de données
- Selon vous, pourquoi les films d’aventure étaient-ils les plus nombreux parmi les 50 meilleurs films?
- Pourquoi plus d’élèves ont-ils été affectés au parc 1 qu’au parc 3?
- Diagramme circulaire trompeur
- Dans le diagramme trompeur ci-dessous, les proportions ne sont pas représentatives des pourcentages fournis :
- Lors de l’interprétation d’un diagramme circulaire, la taille des secteurs vous aidera à savoir quelle catégorie est la plus grande ou la plus petite.
- Tous les secteurs d’un diagramme circulaire doivent totaliser 100 %.
- L’amplitude de l’angle d’un secteur peut aider à estimer le pourcentage qu’un secteur occupe.
- Les fractions peuvent également servir à décrire les secteurs d’un diagramme circulaire, par exemple, si un secteur occupait la moitié du cercle, cela représenterait la moitié du total des données.
- Parfois, les diagrammes présentent les données de manière inappropriée, ce qui pourrait influencer les conclusions que nous en tirons. Par conséquent, il est important de toujours interpréter de façon critique les données présentées.
Remarque(s) :
- Les élèves doivent acquérir et démontrer trois niveaux de compréhension d’un diagramme :
- La lecture des données consiste à trouver de l’information clairement indiquée dans le diagramme. Aucune interprétation n’est nécessaire.
- La lecture entre les données consiste à interpréter les relations mathématiques représentées dans le diagramme. Il faut être capable de comparer des quantités (p. ex. la plupart, le plus, le moins) et de mettre en pratique d’autres compétences et concepts en mathématiques, comme l’addition et la soustraction.
- La lecture au-delà des données consiste à faire des déductions à partir des données. Il faut être capable de mettre en pratique ses connaissances préalables afin d’interpréter l’information qui n’est pas clairement indiquée dans le diagramme.
Fournissez aux élèves, ou demandez-leur d’apporter des diagrammes trompeurs trouvés dans les médias d’information ou dans la publicité, notamment des diagrammes à bandes, des histogrammes et des diagrammes circulaires. Discutez la raison pour laquelle ils sont utilisés et la manière dont ils sont utilisés, et qui pourrait être favorisé ou désavantagé par la représentation. Par exemple, demandez aux élèves de discuter des façons dont un diagramme circulaire à trois dimensions peut être trompeur :