Teoria da Estimação

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Assuma uma dada população com função de distribuição . Em geral, a distribuição e suas características ou parâmetros não são conhecidos. Suponha que nós estejamos interessados no valor esperado e na variância . (Alternativamente, se os dados forem binários, nós podemos estar interessados na proporção da população ). Como destacado previamente, nós podemos aprender sobre a população ou equivalentemente sobre sua função de distribuição , através de amostragem (aleatória) . Os dados podem então ser usados para inferir propriedades da população, portanto, usa-se o termo inferência indireta. Em princípio, é importante enfatizar que conclusões retiradas podem ser incorretas, particularmente se a amostra for pequena ou não representativa em relação à população considerada. As ferramentas da probabilidade podem ser usadas para fornecer medidas de precisão ou exatidão das estimativas ou conclusões. Nós iremos focar na estimação de parâmetros ou características desconhecidas. Assuma que seja o objeto de interesse; então diferenciar-se-ia dois tipos de procedimento: estimação de ponto e estimação de intervalo.

Estimação de Ponto

A determinação de uma simples estimativa usando uma amostra aleatória é referida como estimação de ponto. É desejável que esta estimativa forneça a melhor aproximação possível para o parâmetro desconhecido.

O Estimador ou Função de Estimação

Nós iremos retirar observações independentes da população. Neste caso, são variáveis aleatórias distribuídas identicamente e independentemente. O estimador é definido como sendo uma função de . Nós iremos escrever: como sendo o estimador de , que neste caso é uma variável aleatória. O símbolo irá representar também uma estimativa específica para o conjunto de dados em análise. De acordo com o contexto ficará claro qual utilização se aplica. Uma estimação de ponto depende, logo, do tamanho amostral e das realizações que forem retiradas. A estimação de ponto irá raramente corresponder ao valor verdadeiro do parâmetro desconhecido. Além disto, diferentes amostragens irão geralmente gerar estimativas diferentes. Se o tamanho amostral for grande, nós podemos esperar que este seja próximo do verdadeiro valor do parâmetro. Um problema crucial da estimação de ponto é a seleção do melhor estimador. Em alguns casos, o parâmetro população ou a característica de interesse tem uma amostra análoga natural. Por exemplo, tipicamente se usa a média amostral para estimar a média da população, a proporção amostral para estimar a proporção da população e a variância amostral para estimar a variância da população (Veja discussão na seção 7.1). Assuma uma dada população de pessoas para as quais nós obervamos duas variáveis, = idade (em anos) e = renda líquida (em marcos alemães (DM)). O valor esperado e a variância de ambas as variáveis são desconhecidos. Você pode retirar amostras aleatórias sem reposução desta população. Na primeira janela, especifique

  • o tamanho amostral e
  • variável (idade ou renda líquida).

Para estimar resp. o seguinte estimador é usado: Para estimar resp. o seguinte estimador é usado: Como resultado se tem e como estimativas de ponto de e . Através de repetidas amostragens você pode observar variações nas estimativas de ponto.

Pt s2 40 f 5.gif

Dada uma suposta população de domicílios, seja a variável aleatória ser a renda líquida do domicílio (em DM). A renda líquida média desta população, ou seja, o valor esperado é desconhecido e o objeto de nossa estimação. A média amostral é usada. Uma amostra aleatória de tamanho fornece os valores amostrais .

  1. Amostras aleatórias de tamanho  Uma amostral aleatória de domicílios privados gera os seguintes valores:

    Tabela 1: Dados sobre renda líquida de domicílios

    Renda líquida dos domicílios (DM) Renda líquida dos domicílios (DM)
    1 800 11 2500
    2 1200 12 2500
    3 1400 13 2500
    4 1500 14 2700
    5 1500 15 2850
    6 1500 16 3300
    7 1800 17 3650
    8 1800 18 3700
    9 2300 19 4100
    10 2400 20 4300

    A partir dos dados obtém-se DM. Como pode ser facilmente visto, o cálculo é idêntico à média aritmética, uma medida que nós já usamos em estatística descritiva. Um objeto importante da estatística indutica é fornecer uma medida de precisão deste resultado como uma estimativa da média da população em análise.

    Para ilustrar o ponto, nós obtermos outras 24 amostras aleatórias de tamanho . A Tabela 2 demonstra a média amostral para as 25 amostras.

    Tabela 2: Média da renda líquida dos domicílios (DM)

    Amostra Amostra Amostra
    1 1884.90 10 2241.15 18 2395.25
    2 1915.30 11 2243.15 19 2413.40
    3 2060.90 12 2267.75 20 2415.00
    4 2062.15 13 2298.80 21 2567.50
    5 2110.30 14 2317.00 22 2607.25
    6 2126.50 15 2319.55 23 2635.00
    7 2163.10 16 2361.25 24 2659.00
    8 2168.50 17 2363.50 25 2774.30
    9 2203.85

    Na Tabela 2 as amostras são reordenadas de forma que as médias amostrais sejam dispostas em ordem crescente. Evidentemente existe uma variação consideável na médias amostrais, que ilustram o caráter aleatório da estimação, em particular que o estimador é uma variável aleatória.

    Conseqüentemente, estimações de ponto precisam ser suplementadas com uma medida de sua precisão (por exemplo, informando o desvio padrão do estimador).

    O gráfico seguinte demonstra os valores estimados das 25 amostras. Para que se descreva o desvio dos valores estimados da média verdadeira da população, o valor atual é ilustrado como uma linha tracejada.

    Fig. 1: Valores Estimados de 25 amostras aleatórias de tamanho

    Pt s2 40 f 3.gif

  2. Amostras aleatórias de tamanho 100 amostras aleatórias de tamanho foram retiradas da mesma população e as médias da renda líquida dos domicílios foram calculadas. Os resultados são demonstrados no gráfico seguinte. O valor atual aparece como uma linha tracejada.

    Fig. 2: Valores Estimados de 100 amostras aleatórias de tamanho

    Pt s2 40 f 4.gif