Objectif de la Statistique

From MM*Stat International

Jump to: navigation, search

Objectifs de la Statistique

Objectif de la Statistique  • Etudes statistiques  • Individus et Populations  • Variables statistiques  • Echelles de mesure  • Variables qualitatives  • Variables quantitatives  • Groupement de données continues  • Série statistique et Fréquence  • Questions à choix multiples
English
Português
Français
‎Español
Italiano
Nederlands


Définition de la Statistique

La Statistique est la science de la collecte, de la description et de l’interprétation des données. Elle s’intéresse à ce titre à la boîte à outils dont fait usage toute activité de recherche empirique. En analysant des données, les scientifiques ont pour objectif d’obtenir une description effective de notre perception du monde. Certaines descriptions basées sur la mise en évidence de relations stables entre des phénomènes observables sont parfois qualifiées d’explicatives, quand bien même il est possible d’objecter que l’activité scientifique, entendue comme pourvoyeuse d’explications, s’attache plus au Comment ? qu’au Pourquoi ? des choses. L’invention d’une Théorie est un processus créatif impliquant la restructuration de l’information contenue dans des théories existantes (et acceptées) et/ou l’obtention d’une information exploitable à partir des phénomènes réels (nous faisons ici abstraction des théories purement axiomatiques obtenues par déduction logique). Une première approche exploratoire d’un ensemble de phénomènes est typiquement effectuée en utilisant des méthodes de description statistique.

Statistique descriptive

On rassemble sous le vocable de un ensemble d’outils mis au point pour organiser et représenter des données de façon accessible; autrement dit, d’une manière qui ne requière pas des capacités d’association supérieures à celles de l’esprit humain. Elle fait intervenir une quantification de phénomènes récurrents, que ce soit par le biais d’un dénombrement ou par l’observation de variables caractéristiques quantifiables sur des objets identifiables et ’récurrents’. Divers résumés statistiques, essentiellement des moyennes, sont calculés. Les données et les statistiques calculées sont visualisées par des tableaux et des graphiques. La description statistique peut parfois mettre en évidence d’importantes régularités dans la réalisation de phénomènes isolés et révéler des associations entre ces même phénomènes. Est-il pour autant possible, dans un cadre scientifique, de qualifier les résultats qu’elle fournit de lois ? La Statistique est un moyen de traiter des variations de grandeurs caractéristiques mesurées sur des objets distincts. Ces variations peuvent trouver leur origine dans le fait que les objets considérés ne sont pas représentatifs de la population d’objets sur laquelle il est possible de mesurer cette grandeur ou dans les variations (aléatoires ou contrôlées) d’autres variables, qualifiées de sous-jacentes. Alors qu’en Physique, par exemple, on s’intéresse surtout à l’obtention et à la formalisation mathématique de relations exactes entre différents objets, et qu’on s’intéresse peu aux fluctuations aléatoires, on s’intéresse en Statistique à la modélisation de ces fluctuations, c’est-à-dire à leur description mathématique. Ainsi, les relations statistiques sont des relations dont la validité n’est établie qu’à une proportion de variabilité stochastique, c’est-à-dire inexpliquée, près.

Statistique inductive

Par contraste avec la situation en Sciences Physiques, les relations empiriques mises en évidence en Sciences naturelles, en Sociologie, et en Psychologie, ainsi qu’en Economie, sujet de nature essentiellement éclectique, sont statistiques. Le travail de recherche empirique y est le plus souvent effectué sur la base de plans d’expérience ou de sondages. Il s’agit de situations où la population à laquelle on s’intéresse ne peut être totalement observée - pour des raisons qui peuvent être d’ordre économique ou pratique - et où il est par conséquent nécessaire de tirer des conclusions sur la population entière à partir d’observations effectuées sur un échantillon issue de celle-ci. Le passage des caractéristiques de l’échantillon étudié aux caractéristiques de la population sous-jacente constitue l’objet de la Statistique Inférentielle ou Inductive. Dans le cas d’un sondage, la variabilité est due aux fluctuations des valeurs observées sur l’échantillon, ainsi qu’au procédé d’échantillonnage.

Statistique et démarche scientifique

Aux différents stades d’un processus d’investigation scientifique, les données recueillies sont étudiées avec plus ou moins d’information a priori (préexistante). En effet, les données peuvent être recueillies dans la cadre d’une première approche d’un phénomène, comme elles peuvent servir a tester statistiquement, c’est-à-dire confirmer ou infirmer (vérifier ou falsifier, au sens epistémologique) certaines hypothèses structurelles portant sur les caractéristiques étudiées. La Statistique trouve donc son utilité aux différents stades du processus d’investigation scientifique, lorsqu’il porte sur des phénomènes quantifiables. La notion de quantifiabilité que nous retenons ici est suffisamment générale pour recouvrir l’essentiel des centres d’intérêts de la Science contemporaine. En effet, l’objet de la Science étant de valider ou d’infirmer des assertions, celles-ci n’ayant pas nécessairement un aspect quantitatif, considérons une assertion quelconque. Il est toujours possible de lui associer une quantité en dénombrant ses occurrences (autrement dit en calculant la fréquence avec laquelle l’assertion est vérifié). Ainsi que nous le verrons plus loin, certains phénomènes sont plus riches que d’autres en termes de quantification, en ce sens que celle-ci peut aller au-delà d’un simple dénombrement. La Statistique descriptive est un ensemble de méthodes permettant de résumer et de visualiser des données. Elle ne concerne que des assertions portant sur la structure des échantillons considérés. Les assertions généralisant à une population des résultats obtenus sur un échantillon peuvent être testées en tant qu’hypothèses par des procédés relevant de la Statistique Inférentielle. La table suivante, fournissant la distribution fréquentielle des nombres tirés au Loto, constitue un exemple de résumé utile dont l’utilisation est fréquent en Statistique Descriptive. Un premier examen de la table semble indiquer que certains nombres apparaîssent plus souvent que d’autres. Ceci signifie-t-il qu’il existe un biais systématique du procédé de tirage ? Les outils de la Statistique Inférentielle permettront de tester la validité de cette hypothèse.

Fréquences absolues des nombre tirés au Loto
1 2 3 4 5 6 7
311 337 345 316 321 335 322
8 9 10 11 12 13 14
309 324 331 315 302 276 310
15 16 17 18 19 20 21
322 319 337 331 326 312 334
22 23 24 25 26 27 28
322 319 304 325 337 323 285
29 30 31 32 33 34 35
321 311 333 378 340 291 330
36 37 38 39 40 41 42
340 320 357 326 329 335 335
43 44 45 46 47 48 49
311 314 304 327 311 337 361