Testando a Proporção em uma População Binária

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Assuma que uma variável aleatória tenha apenas dois resultados possíveis. Nós chamamos esta população estatística de binário. Se é uma variável indicadora armazenando informações sobre a existência (ou não existência) de uma característica, nós podemos realizar inferências estatísticas sobre a proporção de elementos dentro da população possuindo a probriedade de interesse () ou não (). Como em outros testes paramétricos, a inferência relaciona-se ao valor hipotético, aqui , que representa uma proporção hipotética de elementos da população possuindo a propriedade de interesse. Nós iremos introduzir procedimentos de teste estatístico baseados em uma amostra aleatória simples de tamanho . Isto garante que as variáveis amostrais , que são variáveis indicadoras com resultados medidos ou como ou , têm distribuição Bernoulli e são distribuídas independente e identicamente. Como de praxe, o nível de significância é denotado por .

Hipóteses

Dependendo da aplicação em uso, testes de um ou dois lados são formulados: 1) 2) 3) Nossas observações anteriores sobre a escolha das hipóteses nula e alternativa na seção sobre teste da média da população também valem neste contexto.

Teste estatístico e sua distribuição; regiões de decisão

A mesma proporção é um estimador adequado do parâmetro da população . O estimador é uma transformação simples de (), que contém todas as informações importantes. Ele conta o número de elementos na amostra possuindo a propriedade de interesse. Como já mostrado, segue uma distribuição Binomial com parâmetros e : . Como é escolhido pelo tomador de decisões, é o único parâmetro remanescente necessário para especificar completamente a distribuição Binomial. Seguindo a lógica aplicada em todos os problemas de teste paramétrico de hioóteses, nós assumimos como sendo , ou seja, nós determinamos a distribuição do teste estatístico dado que a proporção hipotética é a prevalescente na população: . Logo, o estimador se torna nosso uma vez que ele tem uma distribuição Binomial com parâmetro e sob : A região de rejeição da hipótese nula contém todas as realizações de para qual as probabilidades acumuladas não excedem o . Os valores críticos podem ser lidos a partir da tabela numérica da função de distribuição cumulativa of seguindo estas regras: 1) O valor crítico inferior é a realização de para qual a cumulativa apenas excede o valor : e . O valor crítico superior é o argumento da cumulativa que retorna uma probabilidade igual ou maior que : e . A região de rejeição para é dada por , de forma que . Para a região de não-rejeição para nós temos, de forma que . 2) O valor crítico é a menor realização do teste estatístico que ocorre com probabilidade cumulativa de pelo menos : e . A região de rejeição para é, então, tal que . A região de não-rejeição para é, tal que . 3) O valor crítico é determinado como a menor realização do teste estatístico que ocorre com probabilidade cumulativa de pelo menos : e . A região de rejeição para é , tal que . A região de não-rejeição para é dada por, tal que . Como é uma variável aleatória discreta, o nível de significância dado geralmente não irá ser totalmente utilizado (esgotado). O irá apenas por acaso alcançar este nível e irá normalmente ser menor. Os testes acima são, logo, conservativos em relação à utilização da permissão para a probabilidade máxima do erro de tipo I. Dado que o tamanho amostral é suficientemente grande, o estimador pode ser estandardizado para gerar o teste estatístico Logo é o desvio padrão da função de estimação under . Sob , tem aproximadamente distribuição Normal estandardizada (ou seja, média 0 e variância 1). Valores críticos para níveis de significância dados podem ser encontrados na tabela de distribuição Normal cumulativa. Regiões de decisão para testes de um ou dois lados são determinados da mesma maneira que aqueles para testes da média aproximada da população para desconhecido: de fato, a hipótese sobre a proporção é a hipótese sobre um valor esperado (de uma variável indicadora binária): .

Amostragem e cálculo do teste estatístico

Uma vez que uma amostra de tamanho tenha sido retirada, nós temos as realizações das variáveis amostrais e podemos computar o valor realizado do teste estatístico .

Decisão do teste e interpretação

Veja as observações para o teste para .

Curva de Poder

A curva de poder do teste de amostras grandes baseado em pode ser calculada explicitamente para todas as situações do teste da mesma maneira que a curva de poder para os testes da média da população. A curva de poder do teste exato baseada em é computada usando a distribuição Binomual (uma vez que esta é a distribuição do teste estatístico) para todos e fixo. Da definição segue que 1) para testes de dois lados 2) para testes de lado direito 3) para testes de lado esquerdo Dados os valores críticos respectivos, as probabilidades podem ser procuradas na tabela numérica da função de distribuição Binomial cumulativa. Para , a curva de poder iguala o atual . Imagine que em uma “população binária” de estudantes de economia exista uma proporção desconhecida de estusiastas de estatística. Nós definimos a variável aleatória para assumir o valor um se o elemento estatístico (“estudante de economia”) gosta de estatística, e para assumir o valor zero se ele não gosta. Nós acreditamos que metade dos estudantes estão aprendendo conceitos estatísticos (nossa proporção hipotética é, então, ) e queremos testar se esta suposição é verdadeira em termos estatísticos, em um nível de significância de com base em uma amostra aleatória de tamanho : Neste exemplo interativo você pode repetir este teste quantas vezes quiser. Em cada tentativa é simulada (retirada) uma nova amostra. Você pode interagir decidindo sobre e em cada repetição. Em particular, você pode testar as seguintes combinações:

  • mantenha o nível de significância e tamanho amostral constantes;
  • varie o nível de significância e mantenha o tamanho amostral constante;
  • ajuste para um novo nível e mantenha constante; ou
  • mude ambos o e o tamanho amostral .

Pt s2 52 e 5.gif

Uma das raison d’etres de intermediários financeiros é sua habilidade em avaliar eficientemente o crédito (capacidade de solvência) de potenciais tomadores de empréstimo. Os gerentes do banco ABC decidem introduzir um esquema aprimorado para checar o crédito se a proporção de clientes com irregularidades no pagamento não for menor que porcento. Requer-se dos estatísticos do banco que conduzem o teste estatístico que se mantenha a probabilidade de não decidir melhorar o procedimento de ranking de crédito mesmo se a proporção for “realmente” maior que porcento (ou seja, manter baixo). A variável aleatória “evento de crédito” ou “problemas de pagamento” é definida como uma variável-indicador assumindo o valor zero (não) ou um (sim). A proporção atual de clientes tendo problemas em pagar o débito é desconhecida. O valor limite hipotético para testar a proporção desta população é .

Hipóteses

Desvios do parâmetro hipotétido em uma direção são de interesse; logo, um teste de um lado irá ser empregado. Como o banco espera que se prove que o processo de avaliação em andamento é suficiente, ou seja, a proporção de devedores com irregularidades no pagamento de seus empréstimos é menor que porcento, esta afirmação é formulada como a hipótese alternativa: As propriedades do teste em relação aos requerimentos dos gerentes do banco tem que ser avaliadas para afirmar que o teste realmente satisfaze suas necessidades. O erro de tipo I, que pode ser feito se a hipótese nula for rejeitada, é aqui: Se teste resultar na não-rejeição da hipótese nula, um erro de tipo II pode ocorrer: O erro de tipo I representa o risco que os gerentes do banco ABC querem evitar. Seu nível máximo é dado pelo nível de significância, que foi ajustado para um nível suficientemente baixo de . O erro de tipo II representa o risco de uma introdução custosa de novos processos de avaliação de crédito sem necessidade de aprovação dos gerentes. O impacto deste cenário na profitabilidade do banco é difícil de se avaliar, uma vez que o novo processo irá levar à uma nova determinação de taxas para os créditos e, logo, pode também gerar economias de custos. As duas alternativas seguintes não baseadas no teste acima. Uma amostra aleatória é retirada de uma população de devedores sem reposição. Isto é razoável se , onde a amostra aleatória pode ser considerada como “simples”.

Primeira alternativa

Para cortar custos, um tamanho amostral de é escolhido. O requerimento teórico de amostragem é preenchido.

Teste estatístico e sua distribuição; regiões de decisão

O estimador “número de clientes com irregularidades no pagamento do débito na amostra de tamanho 30” pode servir diretamente para nosso teste estatístico . Sob , tem distribuição Binomial . Um pequeno suporta a . O valor crítico é a menor realização de para a qual é igual ou maior que , ou seja, ele tem que satisfazer: e . Na tabela numérica da cumulativa de nós encontramos , e, logo, nós temos as seguintes regiões de decisão: Região de rejeição para :, com . Região de não-rejeição para :, com . Porque é uma variável aleatória discreta, o nível de significância dado não está esgotado, ou seja,

Amostragem e cálculo do teste estatístico

devedores escolhidos aleatoriamente são investigados em relação à confiabilidade do pagamento da dívida. Assuma que deles nunca tenham preenchidos suas obrigações contratuais: .

Decisão do teste e interpretação

Como pertence à região de não-rejeição para , a hipótese nula não é rejeitada. Mesmo se a proporção amostral for menor que a proporção limite hipotética que deveria favorecer , nós não podemos concluir que é falso: em um de , a diferença não pode ser considerada como estatisticamente significante. Em outras palavras: é muito improvável que a diferença tenha sido originada da variabilidade da amostragem devido ao pequeno tamanho amostral que poderia rejeitar a hipótese nula. É importante observar que ele não é meramente o valor do estimador de ponto comparado com o valor hipotético que leva à não-rejeição ou rejeição da hipótese nula, mas intervalos que consideram o caráter aleatório do estimador (ou seja, a diferença é comparada à um parêmetro estatístico apropriado, de caso específico, para determinar o que é estatisticamente significantemente grande e, logo, pequeno). Baseado em amostras aleatórias de tamanho e um nível de significância , nós seríamos incapazes de mostrar estatisticamente que a proporção de devedores problemáticos é significativamente menor que 20 porcento. Conseqüentemente, o banco ABC irá revisar e tentar melhor o crédito dos procedimentos de aprovação.

Poder

Tendo não rejeitado a hipótese nula, nós somos vulneráveis à um erro de tipo II, que ocorre quando a hipótese alternativa for um enunciado verdadeiro: . Vamos calcular a probabilidade do erro de tipo II para um valor verdadeiro do parâmetro : qual é a probabilidade de não rejeitar a hipótese nula em um teste de lado esquerdo com , , e , dado que a proporção da população é e, logo, a hipótese nula é, na verdade, falsa? Nós calculamos onde é tomada da tabela da função de distribuição cumulativa para , ou seja, . Interpretação: dada que a proporção verdadeira é , de todas as amostras de tamanho não serão capazes de discriminar entre os parâmetros verdadeiro e o hipotético , induzindo o banco a realizar melhoramentos sub-ótimos dos processos de avaliação do crédito com probabilidade . Ao decidir controlar a probabilidade máxima do erro I o banco está aceitando probabilidades de erro II de tal magnitude que os estatísticos podem prover os gerentes com gráficos de função de poder para qualquer valor do parâmetro verdadeiro . Claro que não rejeitar a hipótese nula pode também ser a decisão correta: . Suponha, por exemplo, que a proporção verdadeira de devedores não confiáveis seja . A probabilidade de não rejeitar a hipótese nula e, logo, tomar (sem saber) a decisão correta dados os nossos parâmetros do teste (de lado esquerdo com , , e, logo, ) é Nós temos onde pode ser procurado em uma tabela numérica de como a probabilidade cumulativa para valores menor ou iguais que , ou seja, . Estes cálculos podem ser realizados para qualquer valor do parâmetro desejado dentro do espaço total do parâmetro (aqui: ). Dependendo da qual hipótese adere-se o parâmetro individual, a curva de poder ou retorna probabilidades para tomar a decisão correta ou de cometer um erro de tipo I ou de tipo II.

Hipótese verdadeira

O display seguinte mostra o gráfico da curva de poder no teste de lado esquerdo com parâmetros , , e .

Pt s2 52 e 4.gif

Segunda alternativa

Agora os estatísticos tentam satisfazer o parâmetro selecionado pelos gerentes para conter a probabilidade do crucial erro de tipo I e manter o erro de tipo II o mais baixo possível. Eles estão atentos ao dilema entre os erros e e focam nas possibilidades de reduzir as probabilidades associadas simultaneamente ao aumentar o tamanho amostral e, logo, tornando a decisão em uma decisão econômica. Projeções de custo em conjunto com uma avaliação dos benefícios de maior confiabilidade levam à escolha de , ainda pequeno o suficiente para satisfazer como base para amostragem aleatória simples sem reposição.

Teste estatístico e sua distribuição; regiões de decisão

O teste estatístico estandardizado é usado. Sob , ele é aproximadamente Normalmente distribuído com parâmetros e . A teoria das grandes amostras sugere que a aproximação é suficientemente precisa para um tamanho amostral de . A partir da tabela de distribuição Normal estandardizada cumulativa nós podemos assumir que satisfaz . Por simetria segue-se que , e nós temos como a aproximada para e cp,p a região de não-rejeição aproximada para .

Amostragem e cálculo do teste estatístico

Do universo de devedores, são selecionados aleatoriamente, dos quais com problemas no pagamento da dívida em pelo menos uma vez na história como cliente do banco. Sua proporção dentro da amostra é, portanto, . Plugando este valor no teste estatístico gera

Decisão do teste e interpretação

Como cai dentro da região de não-rejeição para , a hipótese nula não é rejeitada. Com base nesta amostra particular de tamanho , não pode-se afirmar estatisticamente que a proporção de devedores problemáticos é menor que porcento. Os gerentes do banco ABC irão, logo, iniciar uma revisão de seus procedimentos de crédito.

Probabilidade do erro de tipo II

Como os gerentes do banco foram induzidos a não rejeitar o enunciado na hipótese nula, eles podem ter cometido um erro de tipo II, que ocorre se a proporção entre os for na verdade menor que : . Vamos examinar a probabilidade disto acontecer para uma “hipotética” proporção verdadeira da população de ,ou seja, . Primeiramente, nós precisamos determinar a proporção crítica correspondente ao calculado usando a aproximação Normal. A partir de segue que é a probabilidade da função amostral assumir um valor da região de não-rejeição da hipótese nula, dado que o parâmetro verdadeiro pertence à hipótese alternativa: Para determinar esta probabilidade com base em uma tabela numérica para a distribuição Normal estandardizada, nós precisamos estandardizar usando e : Na tabela de distribuição Normal estandardizada nós encontramos , e temos portanto Logo, comparado a da primeira alternativa, o aumento no tamanho amostral resultou em uma redução considerável na probabilidade do erro de tipo II para uma proporção verdadeira da população de .

Pt s2 52 f 2.gif

Um professor de estatística tem a impressão de que no ano passado a biblioteca da universidade emprestou proporcionalmente menos livros novos de estatística que no ano anterior. Nos últimos anos o montante relativo de livros de estatística entre novas compras tem sido consistentemente maior que porcento. Ele pergunta a seus assistentes para investigar se isto aconteceu em benefício de outros departamentos. Agindo em nome dos estudantes, para os quais ele quer assugurar o maior número possível de livros, ele pede a seus assistentes para minimizar o risco de não ter reclamado para o chefe da biblioteca quando a proporção de livros de estatística houver diminuído. Os assistentes decidem ter uma amostra de livros retirados dos arquivos contendo as novas compras nos últimos meses. Ele quer descobrir quantos destes são livros de estatística. Eles estão, portanto, dicotomizando a variável aleatória “assunto” em dois resultados: “estatística” e “não-estatística”. Claro que se você considerar as compras como um resultado de um processo de tomada de decisão conduzido pelos bibliotecários, isto não é um processo aleatório. Mas para os estatístico que confiam em amostras porque eles não têm acesso à todas as informações relevantes, este parece ser um processo aleatório. Os assistentes querem inferir a proporção de livros de estatística na população de todos os novos livros comprados usando um teste estatístico que permite desvios da proporção na amostra daquelas da população. Em particular, eles querem verificar se a proporção realmente diminuiu para um patamar abaixo dos porcento. Eles querem portanto testar a proporção da população e escolhem um nível de significância “padrão” de .

Hipóteses

Como os assistentes querem verificar se a proporção diminuiu para um nível abaixo de eles empregam um teste de um lado. Eles relembram que o professor quer que eles minimizem a probabilidade de não revelar que a proporção diminui para abaixo de . Eles optam portanto por um teste de lado direito, ou seja, colocam o requerimento do professor como hipótese nula na esperança de não rejeitá-la. Os assistentes realizam uma investigação nas propriedades deste teste em relação à intenção do professor de minimizar a probabilidade de não detectar uma diminuição relativa no suprimento de livros de estatística. Uma diminuição no mundo real pode apenas não ter sido detectada se a hipótese nula tiver sido rejeitada mesmo se ela for verdadeira. Esta situação é chamada de erro de tipo I: A probabilidade máxima desta situação é dada pelo nível de significância , que foi escolhido como . Logo, o risco que o professor queria “minimizar” está sob controle. Se a hipótese nula não for rejeitada, então um erro de tipo II pode ocorrer: A probabilidade disto acontecer (condicional à hipótese nula não ter sido rejeitada) , é desconhecida, porque a proporção verdadeira (que é elemento do conjunto de parâmetros especificado pela ) é desconhecida. Como nós já vimos em outros exemplos, as prioridades do professor podem ser substanciais, mas baseiam-se no dilema de cometer o erro II ao invés do erro I, que está sob controle.

Teste estatístico e sua distribuição; regiões de decisão

O estimador : "número de livros de estatística em uma amostra de livros@ pode servir como o teste estatístico . Sob , tem uma distribuição Binomial com parâmetro e : . Um número relativamente alto de livros de estatística em uma amostra suporta a hipótese alternativa, de que a proporção de livros de estatística não diminuiu. O valor crítico é a realização de , para o qual iguala ou excede , ou seja, nós requeremos e . Na tabela da função de distribuição cumulativa de você irá encontrar . A região de rejeição para é portanto , de forma que . Como é uma variável aleatória discreta, o nível de significância dado é completamente utilizado: A região de não-rejeição para é dada por , de forma que .

Amostragem e cálculo do teste estatístico

Um sub-conjunto de livros é selecionado aleatoriamente da lista de novas compras do ano passado e categorizados em livros de estatística e não-estatística. Como a quantidade total de livros novos é suficientemente grande de um ponto de vista teórico, uma amostra aleatória simples é retirada, ou seja, a amostragem é realizada sem reposição. A quantidade de livros de estatística na amostra é contada como sendo , o que irá servir como o valor realizado do teste estatístico .

Decisão do teste e interpretação

Como cai dentro da região de não-rejeição para , a hipótese nula não pode ser rejeitada. Com base em uma amostra aleatória de tamanho e um nível de significância de , os assistentes não puderam verificar estatisticamente que a proporção de livros de estatística ainda está acima de pocento. Este resultado do teste significa que uma reclamação para a biblioteca parece fazer sentido.

Poder

Dados nossos parâmetros do teste (, , e ), qual é a probabilidade de não rejeitar a hipótese nula se a proporção verdadeira de livros de estatística é ? Ou seja, nós queremos calcular a probabilidade do erro de tipo II, dado um elemento específico do conjunto de parâmetros associado à hipótese alternativa, : Na tabela da distribuição Binomial cumulativa nós encontramos esta probabilidade como sendo . Infelizmente, se a proporção verdadeira aumentou para porcento, ainda existe uma chance de porcento de não descobrir um desvio significante da proporção limite hipotética de porcento. Esta é a probabilidade de uma reclamação não justificada do professor, dado que a proporção aumentou para —um aumento relativo substancial. A probabilidade de se cometer um erro de tipo II dependendo de proporções alternativas verdadeiras pode ser calculada através da curva de poder. Níveis de e para diversos valores de são listados na seguinte tabela.

Hipótese verdadeira

Por exemplo, se a proporção verdadeira (e portanto valor absoluto) de livros de estatística for a amostra não pode conter nenhum livro de estatística e nós iremos esperar e não rejeitar a hipótese nula. A rejeição da hipótese nula () é um evento impossível com uma probabilidade associada de zero. O poder é a probabilidade condicional de rejeitar a hipótese nula dado que a quantidade relativa é zero: Se, por outro lado, a proporção verdadeira de livros de estatística for , o poder é calculado como onde pode ser procurado na tabela da cumulativa como o valor de para . é a probabilidade de rejeitar corretamente a hipótese nula . As probabilidades de rejeitar a hipótese nula e não rejeitá-la devem sempre ter soma igual a um para qualquer valor do parâmetro dado dentro do alcance especificado pela hipótese alternativa: Para uma proporção verdadeira de , o resultado da amostragem anterior equivale a cometer um erro de tipo II, probabilidade esta que é denotada por . Logo, nós podemos escrever ou Como é o valor do poder no ponto , nós podemos calcular a probabilidade de se cometer um erro de tipo II como Se a proporção verdadeira de livros de estatística for porcento, porcento de todas as amostras de tamanho irão levar à não rejeição da hipótese nula, ou seja, não detectarão a diferença significante entre e . O display seguinte mostra o gráfico da curva de poder para o teste de lado direito que nós acabamos de discutir: , , e .

Pt s2 52 f 1.gif