UPV



Resultados de la búsqueda By Etiquetas: estadistica


El concepto de variabilidad y sus causas

Vamos a incluir en este blog unos cuantos posts relacionados con la estadística. Es fundamental entender que tanto los modelos predictivos como muchas heurísticas precisan de una buena base estadística para poder explotar sus posibilidades. Empezaremos hoy con el concepto de variabilidad, muy empleado en procesos industriales y en calidad, pero que también sería útil cuando hablamos de heurísticas que emplean mecanismos aleatorios de búsqueda. Empecemos pues.

El enemigo de todo proceso es la variación, siendo la variabilidad inevitable. Cuando se fabrica un producto o se presta un servicio, es materialmente imposible que dos resultados sean exactamente iguales. Ello se debe a múltiples motivos, más o menos evitables. Por un lado existen múltiples causas comunes, aleatorias y no controlables que hacen que el resultado cambie siguiendo habitualmente una distribución de probabilidad normal. Se dice que dicho proceso se encuentra bajo control estadístico, siendo éste el enfoque que sobre el concepto de calidad propugna Deming. Por otra parte, existen unas pocas causas asignables, que ocurren de forma fortuita y que podemos detectarlas y corregirlas. Ocurren de forma errática y, afortunadamente se solucionan fácilmente. Las causas comunes son difíciles de erradicar porque precisan de un cambio del proceso, de la máquina o del sistema que produce los resultados, siendo ese cambio una responsabilidad de la gerencia. Kaouru Ishikawa decía que el 85% de los problemas en un proceso son responsabilidad de la gerencia, siendo mal recibido dicho comentario por parte de la alta dirección de las empresas.

Para aclarar y entender estos conceptos, os dejo un Polimedia explicativo, de poco más de siete minutos, que espero os guste.

Estimación puntual y por intervalos para una muestra de una población normal

El problema de la  estimación puntual y por intervalos para una muestra de una población normal es una actividad muy frecuente en el ámbito de la ingeniería y de la investigación. Supongamos que tenéis una muestra de 5 elementos extraída de una población normal (por ejemplo, de la resistencia a compresión simple de una probeta de hormigón a 28 días procedente de una misma amasada). El objetivo es establecer inferencias estadísticas usando un nivel de significación α=0.05. Deberíais ser capaces de realizar las siguientes actividades:

  1. Calcular el intervalo de confianza para la media, suponiendo que la desviación típica de la población es conocida y vale lo mismo que la desviación típica de la muestra. (Se empleará la distribución normal).
  2. Calcular el intervalo de confianza para la media, suponiendo que la desviación típica de la población es desconocida. (Se empleará la distribución t de Student).
  3. Calcular el intervalo de confianza para la desviación típica de la muestra. (Se empleará la distribución chi-cuadrado).

A continuación os dejo un pequeño tutorial para proceder al cálculo de dichos intervalos utilizando el paquete estadístico Minitab.

 

Os paso unos vídeos explicativos para que entendáis los conceptos. Espero que os gusten:

(más…)

1 Febrero, 2016
 
|   Etiquetas: ,  ,  ,  |  

Análisis estadístico en SPSS

Como el programa básico que vamos a utilizar es el SPSS, os paso unos apuntes de Francisco Parra, Juan Antonio Vicente y Mauricio Beltrán que podéis encontrar en el siguiente enlace: http://econometria.files.wordpress.com/2009/04/curso-basico-de-analisis-estadistico-en-spss.pdf. Espero que os sean útiles.

18 Enero, 2016
 
|   Etiquetas: ,  |  

Diseño de experimentos

El diseño de experimentos (DOE) es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental de forma que con el mínimo número de pruebas se consiga extraer información útil para obtener conclusiones que permitan optimizar la configuración de un proceso o producto.

Aunque el diseño de experimentos comenzó a aplicarse en el campo de la agricultura, hoy en día tiene muchas aplicaciones en otros campos. Por ejemplo en control de calidad y en diseño de productos y procesos industriales y en todo tipo de ciencias experimentales. Se puede decir que el diseño de experimentos ocupa un papel crucial en la industria y en la investigación experimental en nuestros días.

En un diseño experimental se manipulan deliberadamente una o más variables, vinculadas a las causas, para medir el efecto que tienen en otra variable de interés. El diseño experimental prescribe una serie de pautas relativas qué variables hay que manipular, de qué manera, cuántas veces hay que repetir el experimento y en qué orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relación de causa-efecto.

Los pasos básicos a seguir en el diseño de experimentos son los siguientes: (más…)

17 Marzo, 2015
 
|   Etiquetas: ,  |  

Formulario de estadística

13 Febrero, 2015
 
|   Etiquetas: ,  |  

Caracterización estadística de una muestra y prueba de normalidad con SPSS


Una tarea básica en cualquier trabajo científico o tecnológico que requiera el análisis de una muestra de datos es su caracterización estadística y la comprobación de la normalidad de dicha muestra. Dado un conjunto de datos, por ejemplo 20 resultados de rotura a compresión simple de una probeta normalizada de hormigón a 28 días, deberíais ser capaces de calcular lo siguiente:

  1. Calcular la media aritmética muestral, la desviación típica muestral, la varianza muestral , el coeficiente de variación muestral, la mediana y la moda
  2. Determinar el intervalo de confianza para la media muestral y para la desviación típica muestral para un nivel de confianza del 95%.
  3. Determinar las medidas de forma –coeficientes de asimetría y curtosis-.
  4. Determinar el recorrido o rango de la muestra. También el recorrido relativo de la muestra.
  5. Representar el histograma con un número de barras que sea la raíz cuadrada del número de datos
  6. Calcular la desviación media respecto al valor mínimo.
  7. Determinar el primer, segundo y tercer cuartil, así como el rango intercuartílico.
  8. Determinar el cuantil del 5%, del 50% y del 95%.
  9. Dibujar el diagrama de caja y bigotes y determinar los valores atípicos potenciales.
  10. Establecer con un nivel de confianza del 95% si la muestra procede de una población normal mediante la prueba de normalidad de Kolmogorov-Smirnov.

Para ello podéis utilizar cualquier programa estadístico. Para facilitar vuestro aprendizaje, os dejo un vídeo tutorial sobre cómo extraer datos estadísticos básicos con el programa SPSS. Espero que os sea útil

11 Febrero, 2015
 
|   Etiquetas: ,  ,  ,  |  

Instrucciones básicas de Matlab para tratamiento de datos

Os dejo a continuación una serie de instrucciones básicas que podéis utilizar en Matlab para realizar cálculos estadísticos básicos.

Importar datos de un fichero Excel

>> datos=xlsread(‘Ejercicio 4’)

Número de filas y columnas

>> size(datos)

Dimensión más grande de una matriz

>> length(datos)

Ordena los elementos de forma ascendente

>> sort(datos)

Ordena los elementos de forma descendente

>> sort(datos,’descend’)

Suma de los datos

>> sum(datos)

Producto de los datos

>> prod(datos)

Vector de sumas acumuladas

>> cumsum(datos)

Vector de productos acumulados

>> cumprod(datos)

Calcular la media aritmética

>> mean(datos)

Calcular la mediana

>> median(datos)

Calcular la moda de la muestra

>> mode(datos)

Calcular la media aritmética omitiendo el 5% de datos de cada lado

>> trimmean(datos,10)

Calcular la media geométrica de una muestra

>> geomean(datos)

Calcular la media armónica de una muestra

>> harmmean(datos)

Calcular el sesgo de la muestra

>> skewness(datos)

Calcular la curtosis de los datos

>> kurtosis(datos)

Varianza muestral

>> var(datos)

Desviación estándar muestral

>> std(datos)

 

Rango de los datos

>> range(datos)

El menor valor

>> min(datos)

El mayor valor

>> max(datos)

Desviación absoluta respecto a la media

>> mad(datos)

Momento central de orden 3 respecto a la media

>> moment(datos,3)

Rango intercuartílico

>> iqr(datos)

Primer cuartil (percentil 25)

>> prctile(datos, 25)

Percentil del 5%

>> prctile(datos,5)

Dibujar un diagrama de caja

>> boxplot(datos)

Dibujar el histograma de datos

>> hist(datos)

Dibujar la distribución de frecuencia acumulada

>> cdfplot(datos)

Visualización de funciones de probabilidad

>> disttool

Ajuste de modelos de distribución a conjunto de datos

>> dfittool

Matriz 3×3 de números aleatorios entre 0 y 1

>> rand(3)

Matriz 3×2 de números aleatorios entre 0 y 1

>> rand(3,2)

Matriz 3×3 de números aleatorios normales de media 0 y varianza 1

>> randn(3)

Matriz 3×2 de números aleatorios normales de media 0 y varianza 1

>> randn(3,2)

Secuencia de 5 valores aleatorios normales de desviación estándar de 2,5 y media 3

>> rand(1,5)*2.5+3

 

7 Febrero, 2015
 
|   Etiquetas: ,  ,  |  

Universidad Politécnica de Valencia