Commerciaux, gouvernementaux et universitaires activités exigent presque toujours la collecte et l'analyse des données. Une des façons de représenter des données numériques est à travers des graphiques, histogrammes et diagrammes. Ces techniques de visualisation permettent aux gens d'acquérir une meilleure connaissance des problèmes et trouver des solutions. Les lacunes, les grappes et les valeurs aberrantes sont caractéristiques des ensembles de données qui influent sur l'analyse mathématique et sont facilement visibles sur les représentations visuelles.
Des trous dans les données
Lacunes se rapportent aux zones manquantes dans un ensemble de données. Par exemple, si une expérience scientifique recueille des données de température de l'ordre de 50 degrés Fahrenheit à 100 degrés Fahrenheit, mais rien entre 70 et 80 degrés, cela représenterait une lacune dans l'ensemble de données. Une parcelle de ligne de cet ensemble de données aurait «x» pour des températures comprises entre 50 et 70 et à nouveau entre 80 et 100, mais il n'y aurait rien entre 70 et 80. Les chercheurs peuvent creuser plus profondément et découvrir pourquoi certains points de données ne se présentent pas dans un échantillon prélevé.
Les groupes isolés
Les clusters sont des groupes isolés de points de données. Tracés linéaires, qui sont l'une des façons de représenter des ensembles de données, sont des lignes avec «x» placés au-dessus des chiffres précis pour décrire leur fréquence d'apparition dans le jeu de données. Un cluster est dépeint comme une collection de ces marques "x" dans un petit intervalle ou les données sous-ensemble. Par exemple, si les résultats d'examen pour une classe de 10 étudiants sont 74, 75, 80, 72, 74, 75, 76, 86, 88 et 73, le plus «x» sur un terrain de ligne serait dans le 72- à 76 intervalle de score. Cela représenterait un cluster de données. Notez la fréquence de 74 et 75 est de deux, mais pour tous les autres scores, il est l'un.
Dans les cas extrêmes
Les valeurs aberrantes sont des valeurs extrêmes - les points de données qui se trouvent nettement en dehors d'autres valeurs dans un ensemble de données. Une valeur aberrante doit être nettement inférieure ou supérieure à la majorité des numéros dans un ensemble de données. La définition de «extrême» dépend de la circonstance et un consensus des analystes impliqués dans la recherche. Les valeurs aberrantes peuvent être des points de données mauvaises, aussi connu comme le bruit, ou ils peuvent contenir des informations précieuses sur le phénomène étudié et la méthode de collecte des données elle-même. Par exemple, si les scores de classe sont pour la plupart dans la gamme de 70 à 80, mais un couple de scores sont faibles dans les années 50, ceux qui pourraient représenter les valeurs aberrantes.
Mettre le tout ensemble
Lacunes, les valeurs aberrantes et les grappes dans les ensembles de données peuvent influer sur les résultats de l'analyse mathématique. Les lacunes et les grappes pourraient représenter des erreurs dans la méthode de collecte de données. Par exemple, si un téléphone sondages de l'enquête que certains codes de la région, tels que les complexes à faible revenu ou zones résidentielles de banlieue haut de gamme, et pas un large échantillon de la population, les chances sont, il y aura des lacunes et des grappes dans les données . Les valeurs aberrantes peuvent fausser la valeur moyenne ou moyenne d'un ensemble de données. Par exemple, la moyenne ou la valeur moyenne d'un ensemble de données constitué de quatre nombres - 50, 55, 65 et 90 - est 65. Sans la valeur aberrante 90, cependant, la moyenne est d'environ 57.