ESTADÍSTICA DESCRIPTIVA
1. Recopilación de datos
- Fuentes de datos
- Criterios para diseñar una encuesta de investigación
Tema
Problema
Objetivo general y especificos
Justificación
Referencias
- Tipos de datos
Datos cualitativos: corresponden a respuestas categóricas, ejm. El estado civil de una persona
Datos cuantitativos: corresponden a respuestas numéricas, ejm. La edad en años
1) Discretos: Se obtienen mediante conteos
2) Continuos: Se obtienen mediante mediciones
2. Simbologia
N: tamaño de la población
n: Tamaño de la muestra
X: característica de interés
X: (X1, X2, X3, ..., Xn)
x: valor de la característica
X1 = x1
3. Descripción del conjunto de datos
i) Tabla
ii) Gráfica
iii) Números que caracterizan al conjunto de datos
4. Tabla de frecuencias
i) Identificar la unidad de medida de los datos
ii) Obtenga el rango de los datos
R = Xmax - Xmin
iii) Seleccionar el numero de clases o intervalos (k)
iv) longitud de la clase (L)
L=R/k
v) Contra los datos para obtener la frecuencia en cada clase
vi) organizar la información en la tabla de frecuencias
Ejemplo:
Fig. 1. Ejemplo de tabla de frecuencias [1]
Gráficos de frecuencia con formas especiales
DATOS CUALITATIVOS O CATEGÓRICOS
- Gráfico de barras
Fig 2. Diagrama de barras [1]
Fig 3. Diagrama circular [1]
16/05/2016
18/05/2016
Calculo de medidas
1. DE LOCALIZACIÓNMedia muestral (x)
i) Datos individuales
x = (x1+x2+x3+...+xn) / n
ii) Datos individuales con frecuencia
x = (x1f1 + x2f2 + x3f3 + ... + xnfn) / n
iii) Datos agrupado en intervalos
x = (m1f1 + m2f2 + m3f3 + ... + mnfn) / n
Mediana
Es el valor ubicado en el centro de los datos ordenados
i) Datos individuales
Fig 4. Formula para calcular mediana [1]
2. DE DISPERSIÓN
Rango (R)
R = Xmax - Xmin
Varianza (S^2)
i) Datos individuales
Fig 5. Formula para calcular varianza [1]
Desviación estándar (s)
s = (S^2)^1/2
ii) Datos individuales con frecuencia
Moda
Es el valor de la variable que tiene mayor frecuencia
23/05/2016
Datos agrupados
Varianza
Fig 6. Formula para calcular varianza [1]
Coeficiente de variación (CV)
CV = s/X si CV en menor o igual a 1 los datos son homogéneos
si CV en mayor a 1.5 los datos son heterogéneos
DE POSICIÓN
- Percentiles (Pk): Son cada una de las 99 divisiones que dividen a la distribución de datos en 100 partes iguales, cada división cuenta con el 1%.
- Cuartiles (Qk): Son cada una de las 3 divisiones que dividen a la distribución de datos en 4 partes iguales, cada uno con un 25%.
- Deciles (Dk): Son cada una de las 9 divisiones que dividen a la distribución de datos en 10 partes iguales, cada uno con un 10 %.
Diagrama de caja o bigotes
Es un dispositivo gráfico que se usa para expresar en forma resumida, algunas medidas estadísticas de posición.
El diagrama de caja describe gráficamente el rango de los datos, el rango intercuartílico (Q3 – Q1), los valores extremos y la ubicación de los cuartiles. Es una representación útil para comparar grupos de datos.
25/05/2016
MEDIDAS DE FORMA
1. Coeficiente de asimetría (As)
- Si As es mayor a cero, entonces la distribución de datos es asimétrica a la derecha respecto a la media
- Si As es igual a cero la distribución presenta simetría respecto a la media
- Si As es menor a cero, entonces la distribución de datos es asimétrica a la izquierda respecto a la media.
2. Coeficiente de apuntamiento (Ap)
- Si Ap es mayor a cero entonces es una distribución LEPTOCURTICA
- Si Ap es igual a cero entonces es una distribución MESOCURTICA
- Si Ap es menor a cero entonces es una distribución PLATICURTICA
Muestras bivariadas
Es común tener que estudiar muestras con datos que miden dos características, siendo de interés determinar si hay alguna relación entre ellas.
Para determinar si hay esta relación es recomendable seguir ciertos pasos:
Para determinar si hay esta relación es recomendable seguir ciertos pasos:
Diagrama de dispersión
Fig 8. Diagrama dispersión [1]
Correlación
Fig 9. Correlación [1]
Covarianza muestral
Fig 10. Formula covarianza [1]
Coeficiente de correlación
Fig 11. Formula correlacion [1]
Matriz de varianza y covarianza
Es una matriz simétrica con la que se pueden representar ordenadamente las varianzas y las covarianzas entre las variables.
Fig 12. Matriz varianza [1]
Matriz de correlación
Es una matriz simétrica. Los valores en la diagonal principal son iguales a 1
Fig 13. Matriz correlación [1]
30/05/2016
Fundamentos de la teoría de la probabilidad
FORMULAS DE CONTEO
Si un grupo tiene m elementos y otro grupo tiene n elementos, entonces existen mxn formas diferentes de tomar un elemento del primer grupo y otro elemento del segundo grupo.
PERMUTACIONES
Número de permutaciones con n elementos diferentes de un conjunto del cual se toman arreglos conteniendo r elementos
nPr = n(n-1)(n-2). . .(n-r+1)
ARREGLO CIRCULAR
Suponga un grupo conteniendo n elementos diferentes. Un arreglo circular es una permutación con todos los elementos del grupo, tal que el primero y el último elemento están conectados.
Para que los arreglos sean diferentes, se debe fijar un elemento, mientras que los otros pueden ser intercambiados.
(n-1)!
COMBINACIONES
Son los arreglos que se pueden hacer con los elementos de un conjunto considerando que el orden de los elementos en cada arreglo no es de interés.
Cada arreglo se diferencia únicamente por los elementos que contiene, sin importar su ubicación
BIBLIOGRAFIA
[1] OJEDA, L (2007). Probabilidad y estadística básica para ingenieros. Guayaquil.

















No hay comentarios:
Publicar un comentario