Agrupando Dados Contínuos

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Consideremos dados sobre a altura de 100 estudantes. A fim de ter uma visão geral sobre a distribuição das alturas, deve-se começar “lendo” os dados puros. Mas logo descobre-se que a análise de mais do que, diga-se, 10 observações sem algum processo de simplificação não é de muita utilidade. Intuitivamente começa-se a agrupar os indivíduos com alturas similares. Focando-se no tamanho destes agrupamentos ao invés dos dados puros em si, é possível ter uma visão geral dos dados. Apesar de desprezar-se informações detalhadas sobre alturas exatas, pode-se criar uma clara visão geral dos dados. Dados retirados de variáveis aleatórias contínuas ou quase-contínuas podem ser condensados através da separação do espaço amostral em classes mutuamente excludentes. A contabilização do número de realizações ocorrendo em cada uma destas classes é um meio de proporcionar um resumo descritivo dos dados. Agrupando dados em classes pode aumentar consideravelmente sua habilidade de “ver” a estutura dos dados, ou seja, a distribuição das realizações sobre o espaço amostral. Classes são intervalos não sobrepostos especificados por seus limites superior e inferior (limites de classe). Perda de informação surge através da substituição de valores verdadeiros pelos tamanhos e localizações das classes em que os dados se encontram. Caso utilize-se poucas classes, então padrões importantes podem ser negligenciados. Muitas classes podem inibir o valor expositivo do agrupamento. Limites de classe Os valores superior e inferior de uma classe são denominados limites de classe. Uma classe é especificada completamente pelo limite inferior e pelo limite superior , onde , ou seja, o limite superior da classe e o limite inferior da classe coincidem. ou , ou seja, o limite da classe pode ser atribuído à qualquer uma das classes que ele separa. Exemplo

menor que 10 menor ou igual a 10
de 10 a menor que 12 maior que 10 a menor ou igual a 12
de 12 a menor que 15 maior que 12 a menor ou igual a 15
maior ou igual a 15 maior que 15

Quando medições de variáveis não limitadas (de forma teórica) estão sendo classificadas, as classes mais à esquerda e mais à direita estendem-se para e , respectivamente, ou seja, elas formam um intervalo semi-aberto. Amplitude de classe A diferença entre os limites de uma classe nos dá a amplitude da classe (algumas vezes denominado tamanho de classe): Classes não precisam ser de mesma amplitude. Ponto médio da classe O ponto médio da classe pode ser interpretado como um valor representativo para a classe, se as medições incidentes sobre ela são simetricamente distribuídas. Políticos e cientistas políticos estão interessados na distribuição de renda. Na Alemanha, uma grande parte da população tem renda tributável. Os dados de 1986, compilados de várias fontes oficiais, demonstram a concentração em agrupamentos pequenos e médios. Relativamente poucos indivíduos genharam mais que um milhão de marcos. Maiores amplitudes de classe foram escolhidas para agrupamentos com maior renda para assegurar uma exposição compacta, apesar da inclinação dos dados.

Fonte: Datenreport 1992, p. 255; Statistisches Jahrbuch der Bundesrepublik Deutschland 1993, S. 566
Pessoas Consolidado
(1000) Renda bruta
(mil. marcos)
1 4000 1445.2 2611.3
4000 8000 1455.5 8889.2
8000 12000 1240.5 12310.9
12000 16000 1110.7 15492.7
15000 25000 2762.9 57218.5
25000 30000 1915.1 52755.4
30000 50000 6923.7 270182.7
50000 75000 3876.9 234493.1
75000 100000 1239.7 105452.9
100000 250000 791.6 108065.7
250000 500000 93.7 31433.8
500000 1 Mil. 26.6 17893.3
1 Mil. 2 Mil. 8.6 11769.9
2 Mil. 5 Mil. 3.7 10950.8
5 Mil. 10 Mil. 0.9 6041.8
0.5 10749.8