Glossary/pt

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands

A

Junção de observações iguais ou similares de algumas variáveis em um grupo ou classe. Veja também limites de classe. Suconjunto do espaço amostral; os elementos que foram escolhidos para a investigação estatística. Amostra aleatória consistindo de variáveis aleatórias distribuídas identicamente X_1, \dots, X_n que não tem que ser independente. Amostra aleatória composta por variáveis aleatórias independentes e identicamente distribuídas X_1, \dots, X_n. “Distribuídas identicamente” significa que as variáveis aleatórias têm funções de distribuição comuns F(x). que ficam durante todo o tempo no mesmo estado. O conjunto de todos os elementos estatísticos com características espaciais, definidas e temporais correspondentes. Método de escolha de elemento do espaço amostral. Cada elemento tem probabilidade não-zero de ser selecionado. As probabilidades não têm que ser iguais. Método de amostragem aleatória. Cada elemento tem a mesma probabilidade de ser escolhido. Método de amostragem aleatória. Cada elemento do conjunto tem probabilidade igual de ser escolhido e os elementos são selecionados independentemente. Procedimento de amostragem. Cada elemento selecionado é retornado antes da escolha do próximo elemento. Corresponde à amostra aleatória simples. Amostragem e investigação de todos os elementos do espaço amostral. Procedimento de amostragem. Os elementos selecionados são retirados do espaço amostral antes da escolha do próximo alemento. Corresponde à amostra aleatória representativa.

  • Análise amostral Suconjunto do espaço amostral; os elementos que foram escolhidos para a investigação estatística.

Investiga várias maneiras de selecionar e/ou agrupar certos elementos. É muito importante para a teoria de probabilidade. Veja também permutação, variação e combinação. Sob certas suposições é permitido substituir algumas distribuições simples bem conhecidas (tipicamente a Normal) pela verdadeira e mais complicada. [B]

B

[C]

C

Características de interesse na investigação estatística e cujos valores (variáveis) são observados em todos os elementos estatísticos do espaço amostral.

  • Censo Amostragem e investigação de todos os elementos do espaço amostral.

Veja Modo. Mede a intensidade da relação entre duas variáveis aleatórias nominais. É calculado usando contingência quadrática e seu valor localiza-se entre 0 e 1, onde 0 significa independência estatística. O coeficiente de contingência é praticamente nunca igual à 1 (dependência completa). Então, o coeficiente de contingência ajustado foi introdizido. Mede a força e a direção da dependência entre duas variáveis aleatórias metricamente distribuídas. É a proporção da covariância (variabilidade comum) e o produto dos desvios padrões (variabilidade das variáveis). Seu valor está sempre entre -1 e 1.

  • Coeficiente de correlação de Kendall O coeficiente de correlação de rankings de Kendall é baseado na comparação da ordem de todos os pares possíveis de valores observados. Os pares de observações com a mesma (ou oposta) ordem são chamados de concordantes (resp. discordantes). Aparte disto, alguns pares podem ter valores iguais. Coeficientes de correlação de Kendall é a proporção da diferença entre o número de pares concordantes e discordantes e a soma de pares concordantes e discordantes.
  • Coeficiente de correlação de Spearman Mede a força da dependência linear entre duas variáveis aleatórias ordinais. Corresponde ao coeficiente de correlação de Bravais-Pearson e seu valor está sempre entre -1 e 1.

O coeficiente de determinação mede a qualidade e a idoneidade da função de regressão escolhida para determinados dados. Ele é definido como a razão da variabilidade explicada pela função de regressão e a variabilidade total dos regressores, ou seja, ele pode ser interpretado como uma proporção da variabilidade explicada pelo modelo de regressão. Este valor situa-se entre 0 e 1, valores maiores significam que o modelo explica melhor os dados. Em regressão linear, o coeficiente de determinação é igual ao quadrado do coeficiente de correlação.

Veja flutuações periódicas. Nós distinguimos os componentes sistemáticos (tendência, flutuações periódicas) e flutuações residuais aleatórias irregulares. Uma propriedade de um estimador de alguns parâmetros desconhecidos. Com um número crescente de observações, o valor esperado do estimador consistente converge para o valor verdadeiro do parâmetro desconhecido e sua variância converge para zero. Variável auxiliar usada no cálculo de coeficientes de contingência de variáveis nominais. É a soma dos desvios quadráticos das freqüências absolutas (relativas) observadas a partir das freqüências absolutas (relativas) esperadas sob a suposição de independência. Uma medidade de variabilidade conjunta de um par de variáveis metricamente escaladas. Mede tanto a força quando a direção da dependência. O coeficiente de correlação pode ser usado para comparar diferentes covariâncias. [D]

D

Dados coletados no mesmo tempo ou pelo mesmo período de tempo em diferentes elementos. Para dados agrupados: a proporção das freqüências absoluta ou relativa de um certo grupo e a extensão do grupo.

Dispositivo meio-gráfico dos valores de séries observadas da variável aleatória metricamente escalada.

Distribuição da função amostral. Distribuição de uma variável aleatória discreta: número de ocorrências de um evento em n repetições do experimento se a probabilidade de ocorrência do evento em uma tentativa é p. A distribuição Binomial tem parâmetros n e p. A distribuição de uma soma de n variáveis aleatórias independentes e distribuídas identicamente com distribuições Normais estandardizadas. O parâmetro n é chamado de graus de liberdade. Em relação à distribuição de freqüências bi-dimensionais, ela é a distribuição da variável X (respectivamente Y) para valores fixados (resultados) da variável Y (respec. X).

  • Distribuição de freqüência Resultados escolhidos de um experimento junto com suas freqüências absolutas são chamados de distribuição de freqüência da variável investigada. Dependendo do número de variáveis, nós podemos distinguir distribuições de freqüência uni- e multi-dimensionais. Tabelas de freqüência fornecem informações sistemáticas e acessíveis sobre os dados.

É obtida determinando-se probabilidades para os valores selecionados de variáveis aleatórias (distribuição de probabilidade discreta). Uma distribuição de uma variável aleatória contínua. Tem parâmetro \lambda e representa a distribuição de probabilidades da distância de dois eventos subseqüentes em um processo Poisson. Uma distribuição de uma variável aleatória contínua que é uma proporção de duas variáveis aleatórias independentes com distribuição Chi-quadrado com f_1 e f_2 graus de liberdade. A distribuição tem dois parâmetros, os acima mencionados graus de liberdade f_1 e f_2. Distribuição discreta com parâmetros M, N e n. Descreve a probabilidade de ocorrência de um evento em n repetições de um experimento aleatório sob as suposições de independência e probabilidade constante de sucessos em uma tentativa simples. Para distribuições de freqüência bi-dimensionais, a distribuição marginal é a distribuição uni-dimensional da variável X (ou Y) que não contém nenhuma informação sobre a distribuição da outra variável aleatória Y (ou X). Uma distribuição em forma de sino de uma variável aleatória contínua com parâmetros \mu e \sigma. O parâmetro \mu determina o valor esperado e o parâmetro \sigma o desvio padrão da variável aleatória normalmente distribuída. Distribuição Normal de uma variável aleatória contínua com valor esperado \mu = 0 e variância \sigma = 1. Distribuição de uma variável aleatória discreta descrevendo número de ocorrências de um evento; o evento ocorre repetidamente, mas aleatoriamente e independentemente em um período fixo de tempo. A distribuição Poisson tem parâmetro \lambda. Distribuição de uma variável aleatória contínua com parâmetro f (graus de liberdade). Variáveis aleatórias com distribuição “t” podem ser obtidas como uma proporção de duas variáveis aleatórias independentes com distribuições Normal estandardizada e Chi-quadrado. Versão discreta: cada valor possível da variável aleatória tem probabilidade igual de ocorrer. Versão contínua: variável aleatória com densidade constante.

  • Dotplot Dispositivo gráfico bi-dimensional para dados uni-dimensionais. No eixo horizontal você encontra o valor observado. O valor no eixo vertical é arbitrário (normalmente escolhido aleatoriamente).

[E]

E

Uma propriedade do estimador imparcial (unbiased estimator). Um estimador é chamado de eficiente se sua variância for menor que a variância de qualquer outro estimador imparcial do mesmo parâmetro.

  1. Valor esperado dos desvios quadráticos do estimador e o valor verdadeiro do parâmetro estimado.

Rejeição da hipótese nula se for verdadeiro. Aceitação da hipótese nula se for falso. Projeção de alguns conjuntos numéricos (escala) no conjunto de elementos estatísticos investigados. Veja também gllinkescala nominalnom.sca, escala ordinal, escala métrica, intervalo de escala, proporção de escala, e escala absoluta. Escala métrica contendo unidades naturais de medida e o ponto natural zero. Veja também escala. Veja escala métrica. Nós podemos medir e interpretar diferenças entre os valores de variáveis aleatórias que são medidas na escala de intervalo. Tais variáveis não têm nenhum zero natural e nenhuma unidade natural de medida (veja também escala).

  • Escala métrica (também escala cardinal). A escala métrica é usada se caso se possa selecionar as realizações da variável naturalmente e medir as diferenças entre elas. Veja também escala, escala de intervalo, escala proporcional e escala absoluta.
  • Escala nominal Diz-se que a escala é nominal quando apenas a equivalência dos resultados puder ser determinada, ou seja, os vários resultados do experimento não podem ser selecionados. Veja também escala.
  • Escala ordinal A escala é ordinal se os resultados do experimento puderem ser representados por números naturais, se nós pudermos determinar a equivalência de dois elementos e os resultados puderem ser naturalmente selecionados. Atenção: usando uma escala ordinal você não pode interpretar o tamanho de diferenças entre as classes. Veja também escala.

A escala proporcional é caracterizada pelo fato de que proporções de nossas observações têm interpretação natural. Variáveis com uma escala proporcional têm zero natural mas não têm unidade de medida natural. Um conjunto de eventos possíveis de um experimento aleatório. O evento impossível é o conjunto vazio, o evento certo é o espaço amostral completo.

  • Estatística Ciência que permite investigar informações empíricas objetivas de experimentos (aleatórios) e questionários, para construir modelos teóricos para esta informação e para analizá-la e interpretá-la.

Função dos valores observados que é usada no teste estatístico.

  1. De acordo com a Teoria da Probabilidade, estes são os métodos que permitem fazer, com certa precisão, enunciados sobre a população baseados na informação da amostra aleatória

Realização do estimador. O parâmetro desconhecido é estimado por um intervalo que cobre o valor verdadeiro do parâmetro com probabilidade prescrita. Realização do estimador de algum parâmetro desconhecido, calculado a partir da amostra aleatória realizada. Função das variáveis amostrais que é apropriada para estimar alguns parâmetros desconhecidos da distribuição investigada. Um evento é qualquer resultado possível de um experimento aleatório. Evento elementar é um evento que não pode ser separado em alguns eventos parciais; eventos elementares são disjuntos. Evento complementar é um conjunto de todos os eventos elementares do espaço amostral S que não estão contidos no evento investigado. Eventos são sub-conjuntos do espaço amostral e, portanto, nós não podemos usar aqui relações e operações comuns de conjuntos. (Veja também implicação, gllinkequivalênciaequ, união, interseção e diferença lógica). Veja espaço amostral. Veja evento. Veja evento. Veja espaço amostral. Veja interseção Este é um experimento real ou construído que pode ser repetido arbitrariamente muitas vezes sob as mesmas condições e cujo resultado não pode ser determinado com antecedência. [F]

F

  • Filtro Um conjunto de pesos que são usados para calcular médias em movimento para uma certa série temporal. A escolha do filtro depende do tipo de flutuações sazonais e do nível desejado de alisamento (smoothing). Filtros simétricos são freqüentemente usados.

(também flutuações sazonais) Influência de curto prazo que em padrões regulares afeta o comportamente de uma série temporal. O comprimento deste período em dados econômicos é freqüentemente 1 ano.

  • Freqüência absoluta Número de occorrências de um certo valor ou combinação de certos valores da variável investigada.
  • Freqüência acumulada Freqüência de observações menor ou igual à um valor dado ou, para variáveis agrupadas, o limite superior da classe em que este valor se localiza. É definido por pelo menos uma variável ordinal. Nós podemos ter freqüências acumuladas absolutas ou relativas.

A proporção de freqüência absoluta e o número total de observações. Média aritmética de algumas variáveis amostrais dicotômicas (0-1) X_1, \dots, X_n. Variável aleatória, função das variáveis aleatórias (observada nos elementos da amostra) X_1, \dots, X_n. A função de distribuição F(x) da variável aleatória X é igual à probabilidade de que a variável aleatória seja menor ou igual a x. Função que determina, em relação às observações, valores (probabilidade ou densidade) para todos os valores possíveis do parâmetro estimado. Função que dá a dependência da probabilidade de rejeitar a hipótese nula sobre o valor verdadeiro do parâmetro testado. Descrição de uma dependência da variável explicada (variável dependente) sobre uma ou mais variáveis explanatórias (variáveis independentes, regressores) via uma função (normalmente linear) baseada em n observações. A função de regressão determina para os valores das variáveis explanatórias algum valor médio (valor ajustado) que pode ser bem diferente do valor que foi realmente observado. A diferença entre o valor ajustado e a observação é chamada de resíduo. Função dando a probabilidade de que uma variável aleatória X seja igual ao valor x_j. [G]

G

Intervalo de alguns valores de variáveis metricamente escaladas (veja também agrupamento) [H]

H

A hipótese oposta à hipótese nula (teste de hipótese). Formulação estatística em relação ao espaço amostral que pode ser testada (e rejeitada) por um teste estatístico.

[I]

I

Propriedade de um estimador. O valor esperado do estimador é igual ao valor verdadeiro do parâmetro estimado. Propriedade de um estimador. Com um crescente número de observações, o valor esperado do estimador converge para o valor verdadeiro do parâmetro estimado. Relação entre eventos: se o evento A ocorrer, então o evento B também tem que ocorrer. Isto é o mesmo que dizer que A é sub-conjunto de B (veja também equivalência). Limita a probabilidade de que a variável aleatória caia fora de um intervalo ao redor do valor esperado.

  • Interpolação Métodos para calcular valores de funções desconhecidas a partir de valores “fechados” desta função.

Parâmetro de escala, é a diferença da maior e da menor observação (para dados classificados é a diferença entre o maior e o menor limite de grupos). Intervalo com limites dados x_l e x_u (x_l \leq x_u) tal que a variável aleatória caia dentro deste intervalo com probabilidade 1 - \alpha.

  • Interseção (de eventos) Um conjunto de todos os eventos elementares que pertencem à todos os eventos sob consideração (ou seja, os eventos envolvidos na interseção). Dois eventos com uma interseção vazia são chamados de eventos disjuntos.

Intervalo aleatório, resultado de uma estimativa de intervalo de alguns parâmetros desconhecidos. Um intervalo com limites fixados x_u e x_o (x_u \leq x_o) tal que a probabilidade de que uma variável aleatória caia dentro deste intervalo seja igual à 1 - \alpha e que ambos os intervalos fora do intervalo de probabilidade central tenham probabilidade igual \alpha/2.

  • Intervalo interquartil É a diferença entre os quartis superior e inferior. É a largura (tamanho) de uma região onde se localizam 50 % dos valores obervados centrais.

[J]

J

K

L

O limite de classe de uma variável metricamente escalada é um valor que delimita uma certa classe por cima (limite superior) ou por baixo (limite inferior). A diferença entre os limites superior e inferior é chamada de largura do grupo. [M]

M

Média aritmética das variáveis amostrais X_1, \dots, X_n. Este valor é obtido pela dispersão da soma de todas as realizações observadas uniformemente através dos elementos estatísticos. A média aritmética faz sentido apenas para variáveis escaladas metricamente Pode ser usada para calcular a média para (pelo menos) variáveis aleatórias de escala proporcional com valores positivos, que são multiplicativamente inter-relacionadas. O logaritmo da média geométrica é igual à média aritmética dos logaritmos dos valores observados.

  • Média harmônica Um tipo especial de média aritmética para variáveis de escala proporcional. É usada sempre que nós calculamos uma média de proporções e temos uma informação adicional g_j que é relacionada ao numerador da proporção x_j.
  • Mediana O valor que separa as realizações selecionadas de variáveis aleatórias (pelo menos ordinais) em duas partes iguais. É robusta no que diz respeito aos valores extremos (outliers) e corresponde ao segundo quartil.
  • Modo São as realizações mais freqüentemente observadas da variável. Pode ser determinada para qualquer escala. Para variáveis nominais representa o único valor médio razoável. O modo não é sensitivo no que diz respeito à observações extremas.

[N]

N

Probabilidade de que o intervalo de confiância calculado dos dados cubra o verdadeiro valor desconhecido do parâmetro estimado. Probabilidade de que a estatística de teste caia em uma região crítica se a hipótese nula for verdadeira. [O]

O

[P]

P

O valor representando o grupo que é obtido como média aritmética de seus limites superior e inferior.

  • População Conjunto de todos os elementos estatísticos relevantes para a investigação estatística de pelo menos uma característica escolhida.

Princípio geral para a construção de estimadores de parâmetros desconhecidos. O estimador é o valor que maximiza a probabilidade (ou densidade) da amostra realizada.

Probabilidade de ocorrência de um certo evento sob a condição de que alguns outros eventos também ocorram. Veja nível de confiança. Proporção do número de amostras n e o número de elementos no espaço amostal N. [Q]

Q

  1. Princípio para a construção de estimadores de um parâmetro desconhecido baseado na minimilização da soma das diferenças quadráticas entre valores amostrais e alguma função do parâmetro.

O quantil x_p é o valor que separa as realizações selecionadas para cima das variáveis (pelo menos ordinais) na razão p : (1 - p), onde p localiza-se entre 0 e 1. Casos especiais são quartis, quintise decis. Caso especial do quantil para p = 0.25, p = 0.5 e p = 0.75. As observações selecionadas são separadas por quartis em quatro partes de igual tamanho. O quartil x_{0,25} é o quartil inferior, x_{0,75} o quartil superior e x_{0,5} é a mediana. Caso especial do quantil para p = 0.2, 0.4, 0.6 e 0.8. As observações selecionadas são separadas pelos quintis em cinco partes de igual tamanho. [R]

R

Valores da estatística de teste que leva à rejeição da hipótese nula. de uma hipótese nula é um conjunto para a estatística de teste que não leva à rejeição da hipótese nula. A variável independente no modelo de regressão. Também: variável explanatória. Veja também função de regressão. [S]

S

Exibição gráfica dos valores observados de um par de variáveis aleatórias metricamente escaladas. Os valores são demonstrados como pontos em um sistema cartesiano de coordenadas. Permite visualizar a dependência entre as variáveis. Scatterplot em três dimensões podem ser usados para 3 variáveis.

  • Seqüência estatística As séries de valores observados (dados). As séries podem ser classificadas ou não-classificadas.

Seqüência estatística cujos valores são obtidos em uma seqüência em diferentes pontos no tempo ou períodos de tempo. Veja também componentes de uma série temporal. [T]

T

Veja tabela de contingência. A tabela de contingência bi-dimensional (ou tabela cruzada) é usada para demontrar a freqüência de distribuição conjunta de duas variáveis aleatórias nominais ou ordinais. Tabelas de correlação bi-dimensionais mostram a distribuição de freqüência conjunta de duas variáveis aleatórias metricamente escaladas. Veja distribuição de freqüências. Número de elementos na amostra.

  • Tendência O desenvolvimento de longo prazo da série temporal observada. A tendência é normalmente estimada pelo método de médias móveis (moving averages) ou pelo método do Menor Quadrado (Least Squares) (veja também filtros).

O teorema centra-se na aproximação da soma de variáveis aleatórias pela distribuição Normal para um número suficientemente grande de somandos. Teoria concentrada em modelos quantitativos de experimentos com resultados aleatórios (experimentos aleatórios). Teste estatístico destinado à hipótese de que a distribuição verdadeira desconhecida seja igual à distribuição especificada. Teste estatístico. A hipótese nula é que a função de distribuição verdadeira dos dados observados seja igual à uma função de distribuição dada. A estatística de teste tem uma distribuição Chi-quadrado. Teste estatístico. A hipótese nula diz que duas variáveis aleatórias são independentes. A estatística de teste tem distribuição Chi-quadrado. Um método que permite tirar conclusões acerca da distribuição desconhecida ou alguns parâmetros desta distribuição desconhecida baseado nos resultados de amostras aleatórias desta distribuição. Teste estatístico sobre hipóteses acerca de algum parâmetro desconhecido da amostra. [U]

U

A união de dois eventos A e B é um conjunto de todos os eventos elementares que pertencem à A ou à B ou à ambos A e B. [V]

V

O valor médio da variável dependente que está situado na função de regressão para certos valores das variáveis explanatórias (regressor). Veja também função de regressão. Veja Mediana. Valor(es) de estatística de teste separando as regiões crítica e de aceitação da hipótese nula. Depende da distribuição de probabilidade da estatística de teste e do nível de significância escolhido. O valor esperado da variável aleatória que nós esperamos obter antes de que o experimento aleatório seja realizado. Corresponde à média aritmética da distribuição de freqüências. Característica da localização da distribuição de freqüência. Cada valor médio é um valor da propriedade investigada, ou seja, é medido na mesma escala. Valores médios comumente usados são o modo, a mediana e a média aritmética. Veja valor ajustado. Realizações (valores) das variáveis aleatórias observadas X_1, \dots, X_n (após amostragem de n elementos).

  • Variações Cada seleção de k elementos de um total de n elementos, onde se leva o ordenamento dos elementos em conta, é chamada de variação de classe k de um total de n elementos. Distingüe-se variações com e sem repetição. Veja também análise combinatória.

Variáveis de interesse na investigação estatística e cujos valores (variáveis) são observados em todos os elementos estatísticos do espaço amostral. Característica que define claramente o espaço amostral e que identifica elementos estatísticos (de forma que nós sabemos se eles pertencem ao espaço amostral em investigação). Seu valor é o mesmo para todos os elementos estatísticos no espaço amostral e não muda durante a investigação. Variável aleatória é um número (real) que é determinado para cada evento elementar. Variável aleatória X_i que é definida como o valor da variável aleatória X que irá ser observado no elemento i do espaço amostral. (também variável dicotômica) Variável aleatória cujo resultado é sempre um dentre dois valores distintos, freqüentemente “0”,“1” ou “verdadeiro”,“falso”.

A variável dependente no modelo de regressão. É freqüentemente chamada de variável explicada. Veja também função de regressão. Veja variável binária.

A variância é o erro quadrático médio de todos os valores observados de sua média aritmética. Variância empírica das variáveis amostrais X_1,\dots,X_n. [W]

W

X

Y

Z