Objectif de la Statistique
From MM*Stat International
English |
Português |
Français |
Español |
Italiano |
Nederlands |
Définition de la Statistique
La Statistique est la science de la collecte, de la description et de l’interprétation des données. Elle s’intéresse à ce titre à la boîte à outils dont fait usage toute activité de recherche empirique. En analysant des données, les scientifiques ont pour objectif d’obtenir une description effective de notre perception du monde. Certaines descriptions basées sur la mise en évidence de relations stables entre des phénomènes observables sont parfois qualifiées d’explicatives, quand bien même il est possible d’objecter que l’activité scientifique, entendue comme pourvoyeuse d’explications, s’attache plus au Comment ? qu’au Pourquoi ? des choses. L’invention d’une Théorie est un processus créatif impliquant la restructuration de l’information contenue dans des théories existantes (et acceptées) et/ou l’obtention d’une information exploitable à partir des phénomènes réels (nous faisons ici abstraction des théories purement axiomatiques obtenues par déduction logique). Une première approche exploratoire d’un ensemble de phénomènes est typiquement effectuée en utilisant des méthodes de description statistique.
Statistique descriptive
On rassemble sous le vocable de un ensemble d’outils mis au point pour organiser et représenter des données de façon accessible; autrement dit, d’une manière qui ne requière pas des capacités d’association supérieures à celles de l’esprit humain. Elle fait intervenir une quantification de phénomènes récurrents, que ce soit par le biais d’un dénombrement ou par l’observation de variables caractéristiques quantifiables sur des objets identifiables et ’récurrents’. Divers résumés statistiques, essentiellement des moyennes, sont calculés. Les données et les statistiques calculées sont visualisées par des tableaux et des graphiques. La description statistique peut parfois mettre en évidence d’importantes régularités dans la réalisation de phénomènes isolés et révéler des associations entre ces même phénomènes. Est-il pour autant possible, dans un cadre scientifique, de qualifier les résultats qu’elle fournit de lois ? La Statistique est un moyen de traiter des variations de grandeurs caractéristiques mesurées sur des objets distincts. Ces variations peuvent trouver leur origine dans le fait que les objets considérés ne sont pas représentatifs de la population d’objets sur laquelle il est possible de mesurer cette grandeur ou dans les variations (aléatoires ou contrôlées) d’autres variables, qualifiées de sous-jacentes. Alors qu’en Physique, par exemple, on s’intéresse surtout à l’obtention et à la formalisation mathématique de relations exactes entre différents objets, et qu’on s’intéresse peu aux fluctuations aléatoires, on s’intéresse en Statistique à la modélisation de ces fluctuations, c’est-à-dire à leur description mathématique. Ainsi, les relations statistiques sont des relations dont la validité n’est établie qu’à une proportion de variabilité stochastique, c’est-à-dire inexpliquée, près.
Statistique inductive
Par contraste avec la situation en Sciences Physiques, les relations empiriques mises en évidence en Sciences naturelles, en Sociologie, et en Psychologie, ainsi qu’en Economie, sujet de nature essentiellement éclectique, sont statistiques. Le travail de recherche empirique y est le plus souvent effectué sur la base de plans d’expérience ou de sondages. Il s’agit de situations où la population à laquelle on s’intéresse ne peut être totalement observée - pour des raisons qui peuvent être d’ordre économique ou pratique - et où il est par conséquent nécessaire de tirer des conclusions sur la population entière à partir d’observations effectuées sur un échantillon issue de celle-ci. Le passage des caractéristiques de l’échantillon étudié aux caractéristiques de la population sous-jacente constitue l’objet de la Statistique Inférentielle ou Inductive. Dans le cas d’un sondage, la variabilité est due aux fluctuations des valeurs observées sur l’échantillon, ainsi qu’au procédé d’échantillonnage.
Statistique et démarche scientifique
Aux différents stades d’un processus d’investigation scientifique, les données recueillies sont étudiées avec plus ou moins d’information a priori (préexistante). En effet, les données peuvent être recueillies dans la cadre d’une première approche d’un phénomène, comme elles peuvent servir a tester statistiquement, c’est-à-dire confirmer ou infirmer (vérifier ou falsifier, au sens epistémologique) certaines hypothèses structurelles portant sur les caractéristiques étudiées. La Statistique trouve donc son utilité aux différents stades du processus d’investigation scientifique, lorsqu’il porte sur des phénomènes quantifiables. La notion de quantifiabilité que nous retenons ici est suffisamment générale pour recouvrir l’essentiel des centres d’intérêts de la Science contemporaine. En effet, l’objet de la Science étant de valider ou d’infirmer des assertions, celles-ci n’ayant pas nécessairement un aspect quantitatif, considérons une assertion quelconque. Il est toujours possible de lui associer une quantité en dénombrant ses occurrences (autrement dit en calculant la fréquence avec laquelle l’assertion est vérifié). Ainsi que nous le verrons plus loin, certains phénomènes sont plus riches que d’autres en termes de quantification, en ce sens que celle-ci peut aller au-delà d’un simple dénombrement. La Statistique descriptive est un ensemble de méthodes permettant de résumer et de visualiser des données. Elle ne concerne que des assertions portant sur la structure des échantillons considérés. Les assertions généralisant à une population des résultats obtenus sur un échantillon peuvent être testées en tant qu’hypothèses par des procédés relevant de la Statistique Inférentielle. La table suivante, fournissant la distribution fréquentielle des nombres tirés au Loto, constitue un exemple de résumé utile dont l’utilisation est fréquent en Statistique Descriptive. Un premier examen de la table semble indiquer que certains nombres apparaîssent plus souvent que d’autres. Ceci signifie-t-il qu’il existe un biais systématique du procédé de tirage ? Les outils de la Statistique Inférentielle permettront de tester la validité de cette hypothèse.
1 | 2 | 3 | 4 | 5 | 6 | 7 |
311 | 337 | 345 | 316 | 321 | 335 | 322 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
309 | 324 | 331 | 315 | 302 | 276 | 310 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
322 | 319 | 337 | 331 | 326 | 312 | 334 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
322 | 319 | 304 | 325 | 337 | 323 | 285 |
29 | 30 | 31 | 32 | 33 | 34 | 35 |
321 | 311 | 333 | 378 | 340 | 291 | 330 |
36 | 37 | 38 | 39 | 40 | 41 | 42 |
340 | 320 | 357 | 326 | 329 | 335 | 335 |
43 | 44 | 45 | 46 | 47 | 48 | 49 |
311 | 314 | 304 | 327 | 311 | 337 | 361 |