Glossary/es

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands

A

La unión de valores de iguales o similares de una variable en un grupo o clase. Ver límites de un grupo. bajo ciertos supuestos, se nos permite substituir alguna distribución bien conocida (normalmente la Normal) por la distribución de verdad, normalmente más complicada. [B]

B

  • Boxplot Representación gráfica de estadísticos de ersumen seleccionados que contiene información sobre la de una variable aleatoria medida métricamente. Ofrece una idea de como es la forma de la distribución y sobre la estructura de los datos.

[C]

C

Característic que claramente define el espacio muestral en el que se identifican los elementos estadísticos (por lo que sabemos si pertenece al espacio muestral que se estudia). Su valor es el mismo para todos los elementos estadísticos en el espacio muestral y no cambia a lo largo de la investigación. Caracteríisticas de interés en la investigación estadística cuyos valores son observados para todos elementos estadísticos del espacio muestral.

  • Censo Muestreo e investigación de todos los elementos del espacio muestral

Mide la intensidad de la relación entre dos variables aleatorias nominales. Se calcula usando el cuadrado de la contingencia y su valor está entre 0 y 1, donde 0 indica la independencia estadística. El coeficiente de contingencia practicamente nunca es igual a 1 (dependencia completa). Por lo tanto, se introduce el coeficiente de contingencia ajustado. Mide la fortaleza y la dirección de la dependencia entre dos variable aleatorias con escala métrica. Es el cociente entre la covarianza (variabilidad común) y el producto de las desviaciones típicas (variabilidad de las variables). Su valor está entre -1 y 1. El coeficiente de correlación de rangos de Kendall se basa en la comparación del orden de todos los posibles pares de valores observados. Los pares de observaciones con el mismo (o opuesto) orden se llaman concordantes (resp. discordantes). Además de esto, algunos pares pueden tener valores iguales. El coeficiente de correlación de Kendall es el cociente entre la diferencia entre los pares concordantes y discordantes y la suma de de pares discordantes y concordantes. Mide la fortaleza de la dependencia lineal entre dos variables aleatorias ordinales. Se corresponde con el coeficiente de correlación de Bravais-Pearson y su valor está siempre entre -1 y 1. El coeficiente de determinación mide la calidad e idoneidad de la función de regresión elegida para unos determinados datos. Se define como el cociente entre la variabilidad explicada por la función de regresión entre la variabilidad total, es decir, se puede interpretar como la proporción de la variabilidad explicada por el modelo de regresión. Su valor está comprendido entre 0 y 1, valores altos indican que el modelo explica los datos bastante bien. En la regresión lineal, el coeficiente de determinación es igual al cuadrado del coeficiente de correlación. Medida relativa de dispersión, es el cociente entre la desviación típica y la media aritmética. Permite comparar la dispersión de diferentes distribuciones.

  • Combinación La elección de elemento de un total de elementos si el orden no tiene importancia se denomina combinación de orden -esima de elementos. Diferenciamos entre combinaciones con reemplazamiento y sin el. Ver también combinatoria.

Investiga las distintas formas de ordenar y/o agrupar un determinado grupo de elementos. Es muy importante para la teoría de probabilidad. Ver también permutación, variación, combinación. Ver fluctuaciones periódicas. Diferenciamos entre componentes sistemáticos (tendencia, fluctuaciones periódicas) y fluctuaciones aleatorias irregulares al que llamamos residuo. Propiedad e un estimador de un parámetro desconocido. Incrementando el número de observaciones, el valor esperado del estimador converge hacia el verdadero valor del parámetro desconocido y su varianza converge a cero. Variable auxiliar utilizada en el cálculo del coeficiente de contingencia de variables nominales. Es la suma de las desviaciones al cuadrado de las frecuenicas absolutas (relativas) observadas respecto a las frecuencias absolutas (relativas) esperadas bajo el supuesto de independencia. Contraste estadístico diseñado para la hipotesisi nula de que la verdadera distribución es igual a la distribución especificada. Contraste estadístico. La hipótesis nula es que la función de distribución de los datos observados es igual a una determinada función de distribución. El estadístico de contraste tiene una distribución Chi-cuadrado. Contraste estadístico. La hipótesis nula dice que dos variables aleatorias son independientes. El estadístico de contraste tiene una distribución Chi-cuadrado. Método que permite obtener conclusiones sobre la distribución desconocida de parámetros basandose en los resultados de una muestra aleatoria de esa distribución. Contraste estadístico sobre una hipótesis concerniente a algún parámetro desconocido de la muestra. Una medida de la variabilidad conjunta de un par de variables escaladas métricamente. Mide tanto la fortaleza como la dirección de la dependencia. El coeficiente de correlación se puede usar para comparar diferentes covarianzas. cuantil es el valor que divide las realizaciones ordenadas de una variable (al menos ordinal) en el ratio p : (1 - p), donde p está entre 0 y 1. Casos especiales son los cuartiles, y deciles. Caso especial de un cuantil para p = 0.25, p = 0.5, y p = 0.75. Las observaciones ordenadas están divididas por cuartiles en cuatro partes de igual tamaño. El cuartil es el cuartil menor, es el cuartil mayor, y es la mediana. [D]

D

Límite para la probabilidad de que una variable aleatoria esté fuera del intervalo que contiene el valor esperado. La media aritmética de las desviaciones absolutas de las observaciones respecto a un punto fijo, que es normalmente el valor medio (los más habituales son la mediana y la media aritmética). Raiz cuadrada de la varianza. Representación gráfica de los valores observados de un par de variables aleatorias con escala métrica. Los valores están representados mediante un punto en un sistema de ejes cartesianos. Nos permite visalizar la dependencia entre las variables. Para 3 variables se puede utilizar el diagrama de dispersión 3D. Representación gráfica del valor de las series observadas de una variable aleatoria con escala métrica. La diferencia entre dos sucesos A y B es el suceso de observar A y no observar B. Para datos agrupados: El ratio de la frecuencia absoluta o relativa de un determinado grupo y el rango de ese grupo. Distribución de una variable aleatoria discreta: "número de ocurrencias de un suceso en repeticiones del experimento si la probabilidad de ocurrencia del suceso en un intento es . La distribución binomial tiene parámetros y . Una distribución de la suma de variables aleatorias independientes e identicamente distribuidas como una nomal estandarizada. El parámetro se denomina los grados de libertad. En el entorno de la distribución de frecuencia bidimensional, es la distribución de la variable X (resp. Y) para un valor fijo de la variable Y (resp. X). Una distribución de una variable continua. Tiene un parámetro y representa la distribución de probabilidad de la distancia entre dos sucesos consecutivos en un proceso de Poisson. Resultados ordenados de un experimento junto con sus frecuencias absolutas se denomina distribución de frecuencia de la variable investigada. Dependiendo del número de variables, se diferencia entre distribuciones de frecuencia unidimensionales o de más dimensiones. La tabla de frecuencia suministra de forma sistemática la información sobre los datos. Distribución de una variable aleatoria continua que es el cociente de dos variables aleatorias independientes con distribución Chi-cuadrado con y grados de libertad. la distribución tiene dos parámetros, los anteriormente mencionados grados de libertad y . Distribución discreta de parámetros M,N, y n. Describe la probabilidad de la ocurrencia de un suceso en n repeticiones de un experimento aleatorio bajo los supuestos de independencia y probabilidad constante de éxito en un único intento. Para una bidimensional, la distribución marginal es la distribución unidimensional de la variable X (o Y) que no contiene ninguna información de la distribuci’on de la otra variable aleatoria Y (o X). Distribución de la función muestral. Una distribución con forma de campana de una variable aleatoria continua de parámetros y . El parámetro determina el valor esperado y la desviación típica de la variable aleatoria normal estandarizada. Distribución normal de una variable aleatoria continua con valor esperado y varianza . Distribución de una variable aleatoria discreta que describe las ocurrencias de un suceso; el suceso ocurre repetidamente, pero aleatoria e independientemente en un periodo de tiempo fijo. La distribución de Poisson tiene el parámetro . Se obtiene asignando probabilidades a los valores ordenados de una variable aleatoria (con distribución de probabilidad discreta). Distribución de una variable aleatoria continua de parámetro f (grados de libertad). Se puede obtener una variable aleatoria con una distribución t como el cociente entre dos variables independientes una con distribución normal y la otra con una distribución Chi-cuadrado. Versión discreta: cada posible valor de la variable aleatoria tiene la misma probabilidad de ocurrencia. Versión continua: variable aleatoria con densidad constante. [E]

E

Propiedad de un estimador insesgado. Se dice que un estimador es eficiente si su varianza es menor que la varianza de cualquier otro estimador insesgado de ese parámetro. Un objeto de la investigación estadística. Contiene la información de interés del experimento. La equivalencia de sucesos significa su igualdad. Esto significa que si observamos A, observamos tambiéno B y viceversa. En este caso A es un subconjunto de B y B es un subconjunto de A.

  1. Valor esperado de las desviaciones al cuadrado de un estimador y el verdadero valor del parámetro.

Rechazo la hipótesis nula cuando es cierta. Acepto la hipótesis nula cuando es falsa. Proyección de un conjunto numérico (escala) en el conjunto de elementos estadísticos investigados, de forma que se guarden las realizaciones. Ver también escala nominal, escala ordinal, escala métrica, escala de porcentaje, y escala absoluta. Escala métrica Unidad de medida continua que contiene el cero natural. Ver también escala. Ver escala métrica. Podemos medir e interpretar diferencias entre los valores de vaiables aleatorias que están medidas en una escala de intervalo. Estas variable no tienen una unidad de medida natural (ver también escala). (también escala cardinal). La escala métrica se usa si las realizaciones de la variable tienen una medida y ordenación natural que las diferencia entre si. Ver también escala, intervalo de escala, y escala de porcentaje. Decimos que la escala es nominal si sólo la equivalencia de los resultados puede ser determinada, es decir, los diferentes resultados de un experimento no pueden ser ordenados. Ver también escala. La escala es ordinal si los resultados del experimento pueden ser representados por números naturales, podemos determinar la equivalencia de dos elementos y los resultados pueden ser ordenados de forma natural. Atención: si se usa la escala ordinal, no se puede interpretar el tamaño de las diferencias entre clases. Ver también escala. La escala de porcentaje está caracterizada por el hecho de que los porcentajes de nuestras observaciones tienen una interpretación natural. Variables con la escala de proporciones tienen el cero naturall, pero no tienen una unidad de medida natural. Conjunto de todos los posibles sucesos de un experimento aleatorio. Cada suceso es en si mismo un subconjunto del espacio muestral. El suceso imposible es el conjunto vacio, el conjunto seguro es el espacio muestral completo. Ciencia que permite investigar información empírica obtenida de experimentos o cuestionarios, para construir modelos teóricos para esta información, y analizarla e interpretarla Métodos estadísticos orientados hacia la recogida de datos y su descripción básica. Se centra sólo en el conjunto de datos investigado. Función de los valores observados que es usada en el contraste estadístico. Realización de un estimador. El parámetro desconocido es estimado mediante un intervalo que cubre el valor del parámetro con una determinada probabilidad. Realización del estimador de un parámetro desconocido, calculado de una muestra aleatoria. Función de las variables muestrales que es adecuada para estimar algún parámetro desconocido de la distribución investigada. Este es un experimento real o construido que puede ser repetido arbitrariamente las veces que se quiera bajo las mismas condiciones y cuyo resultado no puede ser determinado por adelantado. [F]

F

  • Filtro Conjunto de pesos que se utilizan para el cálculo de medias móviles para una serie temporal. La elección del filtro depende del tipo de fluctuaciones estacioenales y del grado de alisado deseado. Se suelen usar filtros simétricos.

(también fluctuaciones estacionales)Influencia a corto plazo que con un patrón regular afecta al comportamiento de una serie temporal. La longitud de este periodo en datos económicos es normalmente de 1 año. Número de ocurrencias de un determinado valor o combinación de valores de la variable investigada. Frecuencia de las observaciones que son menores o igual que un determinado valor o, para una variable agrupada, el límite superior de la clase en la que ese valor se encuentra. Está definido para vairables que son al menos ordinales. Podemos tener la frecuencia acumulada relativa o absoluta. El porcentaje entre la frecuencia absoluta y el número total de observaciones. Media aritmética de variables muestrales dicotómicas (0-1). La función de distribución de una variable aleatoria es igual a la probabilidadpro de que la variable aletoria sea menor o igual que . Función que da la probabilidad de que una variable aleatoria sea igual al valor . Variable aleatoria, función de variables aleatorias (observadas en los elementos de la muestra) . Función que da la dependencia de la probabilidad de rechazar la hipótesis nula en el valor verdadero del parámetro contrastado. Descripción de una dependencia de las variables explicada (variable dependiente) en una o más variables explicativas (variables independientes, regresores) mediante una función (normalmente lineal) basada en n observaciones. La función de regresión a los valores de la variable explicativa algún valor promedio (valor ajustado) que puede ser muy diferente del valor que se observa realmente. La diferencia entre el valor ajustado y las observaciones se llama residuo. Función que asigna, con respecto a las observaciones, valores (probabilidad o densidad) a todos los posibles valores del parámetro estimado. [G]

G

Represntación gráfica bidimensional de datos unidimensionales. En el eje horizontal se encentran los valores observados, el valor del eje vertical es arbitrario (normalmente se elige aleatoriamente). Intervalo de algunos valores de una variable con escala métrica. [H]

H

La hipótesis opuesta a la hipótesis nula Formulación estadística de alguna afirmación sobre el espacio muestral que puede ser contrastada (y rechazada) mediante un contraste estadístico.

  • Histograma Representación gráfica de las frecuencias de grupos mediante el área de rectangulos cuyas alturas se corresponden con la frecuencia relativa de los grupos. Los histogramas son útiles también representar frecuenicas de variables discretas.

[I]

I

Relación entre sucesos, si ocurre el suceso A, entonces el suceso B también ocurre. Esto es lo mismo que decir que A es un subconjunto de B (ver también equivalencia).

  1. De acuerdo con la teoría de la probabilidad, estos son los métodos que nos permiten hacer afirmaciones de la población basandose en la información de la muestra aleatoria.

Propiedad de un estimador. El valor esperado del estimador es igual al verdadero valor del parámetro estimado. Propiedad de un estimador. Cuando se incrementa el número de observaciones, el valor esperado del estimador converge hacia el verdadero valor del parámetro estimado. Método de cálculo del valor desconocido de una función mediante valores “cercanos” conocidos de la función.

  • Intersección (de sucesos) Conjunto de todos los sucesos elementales que pertenecen a todos los sucesos que se consideran. Dos sucesos cuya intersección está vacia se denominan sucesos disjuntos.

Intervalo aleatorio, resultado de una estimación por intervalo de un parámetro desconocido. Intervalo con extremos dados y () tal que la variable aleatoria está en este intervalo con una probabilidad . Un intervalo con límites fijos y () tal que la probabilidad de que la variable aleatoria esté en el intervalo es igual a y la probabilidad de que se encuentre en alguna de las dos regiones de afuera del intervalo es . [J]

J

K

L

El límite de un grupo de una variable de escala métrica es el valor el valor que separa un determinado grupo del superior (límite superior) o del inferor (límite inferior). La diferencia entre los límites inferior y superior se llama amplitud de un grupo. [M]

M

Principio general para la construcción de de estimadores de un parámetro desconocido. El estimador es el valor que maximiza la probabilidad (o densidad) de la muestra. Se usa para representar gráficamente mas de dos variables con escala métrica. Contiene los diagramas de dispersión de todos los pares de variables. Atención: Con muchas variables, la matriz de diagrama de dispersión resulta difícil de interpretar. Este valor se obtiene poniendo la suma de todas las realizaciones observadas uniformemente a lo largo de todos los elementos estadísticos. La media aritmética tiene sentido sólo para variables con escala métrica. Un caso especial de la media aritmética para variables con escala de porcentaje. Se usa para calcular la media de porcentajes y tenemos la información adiccional que está relacionada con el numerador del ratio . Se puede usar para calcular la media de variables aleatorias (al menos) de escala de porcentaje de valores positivos. El logaritmo de la media geométrica es igual a la media aritmética del logaritmo de los valores observados. Promedio aritmético de las variables muestrales .

  • Mediana El valor que divide a las realizaciones ordenadas de una variable aleatoria (al menos ordinal) en dos partes iguales. Es robusta respecto a valores extremos y se corresponde con el segundo cuartil.
  1. Principio para la construcción de estimadores de un parámetro desconocido basado en la minimización de la suma de cuadrados de la diferencia entre los valores muestrales y la función del parámetro.
  • Moda Es el valor que con más frecuencia se observa en las realizaciones de una variable. Puede estar determinado por una escala. Para variables nominales representa el único valor medio adecuado. La moda no es sensible a valores extremos.

Subconjunto del espacio muestral; los elementos que han sido elegidos para la investigación estadísitica Muestra aleatoria consistente en variables aleatorias de distribución idéntica que no tienen qu ser independientes. Muestra aleatoria consistente en variables aleatorias independientes e identicamente distribuidas . “Identicamente distribuidas” significa que las variables aleatorias tienen una función de distribución común . El conjunto de todos los elementos estadísticos que se corresponden con características de definición, espaciales y temporales. Método de elección de elementos de un espacio muestral. Cada elemento tiene una probabilidad no nula de ser elegido. Las probabilidades no tienen que ser iguales. Método de muestreo aleatorio. Cada elemento tiene la misma probabilidad de ser elegido. Método de muestreo aleatorio. Cada elemento del conjunto tiene la misma probabilidad de ser elegido y los elementos se seleccionan independientemente. Muestreo e investagicón de todos los elementos del espacio muestral. Procedimiento muestral. Cada elemento seleccionado se devuelve antes de elegir el siguiente elemento. Se corresponde con el muestreo aleatorio simple. Procedimiento muestral. Los elementos seleccionados se sacan fuera del espacio muestral antes de realizar la elección del siguient elemento. Se corresponde con la muestra aleatoria representativa. [N]

N

Probabilidad de que el intervalo calculado de los datos cubra el verdadero valor desconocido del parámetro estimado. Probabilidad de que el estadístico de contraste esté en la región crítica si la hipótesis nula es cierta. [O]

O

[P]

P

(también parámetro de dispersión) Expresión numérica de la variabilidad (dispersión) de una variable aleatoria. Estos parámetros se usan para caracterizar varias distribuciones de frecuencia y de probabilidad unidimensionales. Los parámetros más importantes son la varianza, desviación típica, rango, rango intercuartílico, y desviación absoluta media.

  • Permutación Cada clasificación de todos los n elementos contenidos en un conjunto se llama permutación. Diferenciamos entre permutaciones con reemplazamiento,sin reemplazamiento y permutaciones que implican más grupos de elementos idénticos. Ver también combinatoria.

Conjunto de todos los elementos estadísticos relevantes para la investigación estadística de al menos una característica elegida. Porcentaje del tamaño muestal y el número de elementos en la muestra .

Probabilidad de la ocurrencia de un determinado suceso condicionada a que a ocurrido otro suceso. Ver Nivel de confianza. [Q]

Q

Caso especial de un cuantil para p = 0.2, 0.4, 0.6, y 0.8. Las observcaciones ordenadas son separadas por los quintiles en cinco partes de igual tamaño. [R]

R

Escala de un parámetro, es la diferencia de la observación mayor y menor (para datos clasificados es la diferencia entre el límite más grande y pequeño de los grupos). Es la diferencia entre el cuartil mayor y menor. Es la amplitud de la región que contiene el 50% de los valores centrales de los valores observados. de la hipótesis nula es un conjunto para el estadístico de contraste que no lleva a rechazar la hipótesis nula. Valores del estadístico de contraste que llevan a rechazar la hipótesis nula. La variable independiente en el modelo de regresión. También: variable explicativa. Ver también función de regresión. [S]

S

Serie estadística cuyos valores han sido obtenidos en una secuencia en diferentes puntos en el tiempo o en distintos periodos de tiempo. Ver también componentes de una serie temporal. Las series de valores observados (datos). EStas series pueden estar ordenadas o no. Un suceso es un posible resultado de un experimento aleatorio. Elementary event is an event which cannot be split to some partial events; elementary events are disjoint. Complementary event is a set of all elementary events of the sample space which are not contained in the investigated event. Events are subsets of the sample space and therefore we can use here common set relations and operations. (Ver también  gllinkequivalenciaequ, unión, intersección, diferencia.) Ver suceso. Ver intersección Ver suceso. Ver espacio muestral. Ver espacio muestral. [T]

T

La tabla de contingencia bidimensional se usa para mostrar conjuntamente la distribución de frecuencia de dos variables aleatorias nominales o ordinales. La tabla de correlación bidimensional muestra la frecuencia de distribuciónfre.dis conjunta de dos variables aleatorias con . Ver distribución de frecuencia. Número de elementos en la muestra. EL teorema se centra en la aproximación de la suma de variables aleatorias a una distribución normal para un número suficientemente grande de sumandos. El desarrollo a largo plazo de la serie temporal observada. La tendencia es normalmente estimada mediante medias móviles o mediante el método de mínimos cuadrados (ver también filtro). Teoría concentrada en modelos cuantitativos de experimentos con resultados aleatorios (experimentos aleatorios). [U]

U

La unión de dos sucesos A y B es el conjunto de todos los sucesos elementales que pertenecen a A o a B o simultaneamente tanto a A como B. [V]

V

Ver Mediana. Valor(es) del estadístico de contraste que separa(n) la región de aceptación de la de rechazo de la hipótesis nula. Depende de la distribución de probabilidad del estadístico de contraste y del nivel de significación. El valor de la variable aleatoria que esperamos obtener antes de realizar experimento aleatorio. Se corresponde con la media aritmética de la distribución de frecuencia. El valor medio de la variable dependiente que da en la función de regresión para unos determinados valores de las variable explicativas (regresores). Ver también función de regresión. Característica de una localización de la distribución de frecuencia. Cada valor medio es un valor de la caracteristica investigada, es decir, está medido en la misma escala. Valores medios que se usan normalmente son la moda, la mediana, y la media aritmética. Realizaciones (valores) de las variables aleatorias observadas (después de muestrear los n elementos). Ver valor ajustado. La variable aleatoria es un número (real) que es asignado a todos los sucesos elementales. (también variable dicotómica) Variable aleatoria cuyo resultado es siempre uno de entre dos valores, los más habituales “0”,“1” o “verdadero”,“falso”. Variable aleatoria con escala métrica que puede tomar infinitos valores en un intervalo tan pequeño como se quiera. La variable dependiente en un modelo de regresión. También se llama la variable explicada. Ver función de regresión. Ver varible binaria. Decimos que una variable aleatoria con escala métrica es discreta si el conjunto de sus posibles valores es finito o contiene un número contable de elementos. Propiedad del elemento estadístico. Diferenciamos entre características de definición y de investigación. Variable aleatoria que se define como el valor de la variable aleatoria que será observada en el i-esimo elemento del espacio muestral. Cada selección de k elementos de un total de n elementos, donde se tiene en cuenta el orden de los elementos, se denomina variación de k-esima clase de n elementos. Diferenciamos entre variaciones con y sin repetición. Ver también combinatoria. La varianza es el error cuadrático medio de los valores observados respecto a su media aritmética. Varianza empírica de las variables muestrales . [W]

W

X

Y

Z