Usar las Herramientas para análisis para realizar análisis de datos complejos

Importante:  Este artículo se ha traducido con traducción automática; vea la declinación de responsabilidades. Para su referencia, puede encontrar la versión en inglés de este artículo aquí.

En Excel 2010, se han realizado mejoras a muchas de las funciones que usa las herramientas para análisis.
leer una entrada de blog o Pruebe Office 365!

Si tiene que desarrollar análisis estadísticos o técnicos complejos, puede ahorrar pasos y tiempo si utiliza las Herramientas para análisis. Cuando utilice una de estas herramientas, deberá proporcionar los datos y parámetros para cada análisis y la herramienta utilizará las funciones de macros estadísticas o técnicas correspondientes para realizar los cálculos y mostrar los resultados en una tabla de resultados. Algunas herramientas generan gráficos además de tablas de resultados.

Las Herramientas para análisis incluyen las herramientas que se describen a continuación. Para tener acceso a estas herramientas, haga clic en Análisis de datos en el grupo Análisis de la ficha Datos. Si el comando Análisis de datos no está disponible, deberá cargar el programa de complemento Herramientas para análisis.

Cargar Herramientas para análisis

  1. Haga clic en el botón de Microsoft Office Imagen del botón de Microsoft Office y, a continuación, haga clic en Opciones de Excel.

  2. Haga clic en Complementos y, en el cuadro Administrar, seleccione Complementos de Excel.

  3. Haga clic en Ir.

  4. En el cuadro Complementos disponibles, active la casilla de verificación Herramientas para análisis y, a continuación, haga clic en Aceptar.

    Sugerencia    Si Herramientas para análisis no aparece en la lista del cuadro Complementos disponibles, haga clic en Examinar para buscarlo.

    Si se le indica que Herramientas para análisis no está instalado actualmente en el equipo, haga clic en para instalarlo.

Nota: Para incluir funciones de Visual Basic para Aplicaciones (VBA) en las Herramientas para análisis, puede cargar el complemento Herramientas para análisis - VBA de la misma manera que se carga Herramientas para análisis. En el cuadro Complementos disponibles active la casilla de verificación Herramientas para análisis - VBA.

Para obtener una descripción de cada herramienta, haga clic en un nombre de herramienta de la lista siguiente.

Varianza

Las herramientas de análisis de varianza proporcionan distintos tipos de análisis de varianza. La herramienta que debe usar depende del número de factores y el número de muestras que tenga de la población que desee probar.

Varianza de un factor

Esta herramienta realiza un análisis simple de varianza en los datos de dos o más muestras. El análisis proporciona una prueba de la hipótesis de que cada muestra se extrae de la misma distribución subyacente de probabilidades frente a la hipótesis alternativa de que las distribuciones subyacentes de probabilidades no son las mismas para todas las muestras. Si sólo existen dos muestras, puede utilizar la función para hojas de cálculo PRUEBA.T. Con más de dos muestras, PRUEBA.T no es de uso generalizado y en su lugar se puede llamar al modelo Varianza de un factor.

Varianza de dos factores con varias muestras por grupo

Esta herramienta de análisis es útil cuando los datos se pueden clasificar de acuerdo con dos dimensiones diferentes. Por ejemplo, en un experimento para medir el alto de las plantas, las plantas pueden recibir diferentes marcas de fertilizante (por ejemplo, A, B o C) y también estar a temperaturas distintas (por ejemplo, alta o baja). Para cada uno de los seis pares {fertilizante, temperatura} posibles, tenemos un número igual de observaciones de alto de la planta. Con esta herramienta podemos comprobar:

  • Si el alto de las plantas para las diferentes marca de fertilizante se extrae de la misma población subyacente. Las temperaturas no se tienen en cuenta en este análisis.

  • Si el alto de las plantas para los diferentes niveles de temperatura se extrae de la misma población subyacente. Las marcas de fertilizante no se tienen en cuenta en este análisis.

Si habiendo tenido en cuenta los efectos de las diferentes marcas de fertilizante del primer punto con viñeta y las diferencias de temperatura del segundo punto con viñeta, las seis muestras que representan todos los pares de valores {fertilizante, temperatura} se extraen de la misma población. La hipótesis alternativa es que se produzcan efectos debidos a pares {fertilizante, temperatura} específicos más allá de las diferencias basadas sólo en el fertilizante o sólo en la temperatura.

Establecimiento del rango de entrada para la herramienta de análisis de varianza

Varianza de dos factores con una sola muestra por grupo

Esta herramienta de análisis es útil cuando los datos se clasifican en dos dimensiones diferentes, como en el caso de la varianza de dos factores con varias muestras por grupo. No obstante, con esta herramienta se supone que existe una única observación para cada par, por ejemplo, cada uno de los pares {fertilizante, temperatura} del ejemplo anterior.

Correlación

Las funciones COEF.DE.CORREL y PEARSON de la hoja de cálculo calculan el coeficiente de correlación entre dos variables de medida cuando se observan medidas de cada variable para cada uno de los N sujetos. (Cualquier observación que falte de cualquier sujeto hará que dicho sujeto se omita en el análisis). La herramienta de análisis Correlación es especialmente útil cuando existen más de dos variables de medida para cada uno de los N sujetos. Proporciona una tabla de resultados, una matriz de correlación que muestra el valor de COEF.DE.CORREL (o PEARSON) aplicado a cada uno de los pares de variables de medida posibles.

El coeficiente de correlación como la covarianza, que es una medida de la medida en que dos variables de medida "varían juntas". A diferencia de la covarianza, el coeficiente de correlación se escala para que su valor sea independiente de las unidades en que se expresan las dos variables de medida. (Por ejemplo, si las dos variables de medida son peso y alto, el valor del coeficiente de correlación es sin cambios si el peso se convierte de libras a kilogramos.) El valor de cualquier coeficiente de correlación debe estar entre -1 y + 1, ambos inclusive.

Puede utilizar la herramienta de análisis de correlación para examinar cada par de variables de medida a fin de determinar si las dos variables de medida tienden a variar conjuntamente, es decir, si los valores altos de una variable tienden a estar asociados con los valores altos de la otra (correlación positiva), si los valores bajos de una variable tienden a estar asociados con los valores bajos de la otra (correlación negativa) o si los valores de ambas variables tienden a no estar relacionados (correlación con tendencia a 0 (cero)). 

Covarianza

Las herramientas Correlación y Covarianza pueden utilizarse con la misma configuración cuando se han observado N variables de medida diferentes en un grupo de individuos. Cada una de las herramientas Correlación y Covarianza proporciona una tabla de resultados, una matriz que muestra el coeficiente de correlación o covarianza, respectivamente, entre cada par de variables de medida. La diferencia es que los coeficientes de correlación están comprendidos entre -1 y +1, ambos inclusive. Las covarianzas correspondientes no se escalan. Tanto el coeficiente de correlación como la covarianza son medidas del grado en el que dos variables “varían juntas”.

La herramienta Covarianza calcula el valor de la función de hoja de cálculo COVAR para cada pareja de variables de medida. (Usar directamente COVAR en lugar de la herramienta Covarianza es una alternativa razonable cuando hay sólo dos variables de medida, es decir, N = 2). La entrada de la diagonal de la tabla de resultados de la herramienta Covarianza en la fila i, columna i es la covarianza de la variable de medida i-ésima consigo. Esta es la varianza de población para dicha variable calculada mediante la función de hoja de cálculo VARP.

Puede utilizar la herramienta Covarianza para examinar cada uno de los pares de variables de medida a fin de determinar si las dos variables de medida tienden a variar conjuntamente, es decir, si los valores altos de una variable tienden a estar asociados con los valores altos de la otra (correlación positiva), si los valores bajos de una variable tienden a estar asociados con los valores bajos de la otra (correlación negativa) o si los valores de ambas variables tienden a no estar relacionados (correlación con tendencia a 0 (cero)). 

Estadística descriptiva

La herramienta de análisis Estadística descriptiva genera un informe estadístico de una sola variable para los datos del rango de entrada, y proporciona información acerca de la tendencia central y dispersión de los datos.

Suavización exponencial

La herramienta de análisis Suavización exponencial predice un valor que está basado en el pronóstico del período anterior, ajustado al error en ese pronóstico anterior. La herramienta utiliza la constante de suavización a, cuya magnitud determina la exactitud con la que los pronósticos responden a los errores en el pronóstico anterior.

Nota: Los valores de 0,2 a 0,3 son constantes de suavización adecuadas. Estos valores indican que el pronóstico actual debe ajustarse entre un 20% y un 30% del error en el pronóstico anterior. Las constantes mayores generan una respuesta más rápida, pero pueden producir proyecciones erróneas. Las constantes más pequeñas pueden dar como resultado retrasos prolongados en los valores pronosticados.

Prueba t para varianzas de dos muestras

La herramienta de análisis Prueba t para varianzas de dos muestras ejecuta una Prueba t de dos muestras para comparar dos varianzas de población.

Por ejemplo, puede utilizar la Prueba t con muestras de los tiempos realizados por cada uno de los dos equipos de una competición de natación. La herramienta proporciona el resultado de la hipótesis nula de que estas dos muestras provengan de distribuciones con varianzas iguales frente a la alternativa de que las varianzas no sean iguales en las distribuciones subyacentes.

La herramienta calcula el valor f de una estadística F (o proporción F). Un valor de f cercano a 1 proporciona pruebas de que las varianzas de población subyacentes son iguales. En la tabla de resultados, si f < 1, “P(F <= f) de una cola” proporciona la probabilidad de observar un valor de la estadística F menor que f cuando las varianzas de población son iguales, y “Valor crítico de F de una cola” proporciona el valor crítico menor que 1 para el nivel de importancia elegido, Alfa. Si f > 1, “P(F <= f) de una cola” proporciona la probabilidad de observar un valor de la estadística F superior a f cuando las varianzas de población son iguales, y “Valor crítico de F de una cola” proporciona el valor crítico mayor que 1 para Alfa.

Análisis de Fourier

La herramienta Análisis de Fourier resuelve problemas de sistemas lineales y analiza datos periódicos, transformándolos mediante el método de transformación rápida de Fourier (FFT, Fast Fourier Transform). Esta herramienta también realiza transformaciones inversas, en las que el inverso de los datos transformados devuelve los datos originales.

Rangos de entrada y de salida para el análisis de Fourier

Histograma

La herramienta de análisis Histograma calcula las frecuencias individuales y acumulativas de rangos de celdas de datos y de clases de datos. Esa herramienta genera datos acerca del número de apariciones de un valor en un conjunto de datos.

Por ejemplo, en una clase con 20 alumnos, puede determinarse la distribución de calificaciones mediante una categoría de puntuación por letras. Una tabla de histograma presentará los límites de las calificaciones por letras así como el número de calificaciones que haya entre el límite mínimo y el límite actual. La calificación única más frecuente es la moda de los datos.

Media móvil

La herramienta de análisis Media móvil proyecta valores en el período de pronósticos, basándose en el valor promedio de la variable calculada durante un número específico de períodos anteriores. Una media móvil proporciona información de tendencias que se vería enmascarada por una simple media de todos los datos históricos. Utilice esta herramienta para pronosticar ventas, inventario u otras tendencias. Todos los valores de pronóstico están basados en la siguiente fórmula:

Fórmula para calcular medias móviles

donde:

  • N es el número de períodos anteriores que se incluyen en la media móvil

  • Aj es el valor real en la hora j

  • FJ es el valor pronosticado en la hora j

Generación de números aleatorios

La herramienta de análisis de generación de números aleatorios rellena un rango con números aleatorios independientes que se extraen de una de varias distribuciones. Puede caracterizan a los asuntos de una población con una distribución de probabilidad. Por ejemplo, puede utilizar una distribución normal que caracterizan la población de altos de personas, o puede usar una distribución de dos posibles Bernoulli que caracterizan la población de resultados de azar.

Jerarquía y percentil

La herramienta de análisis Jerarquía y percentil crea una tabla que contiene los rangos ordinales y porcentuales de cada valor de un conjunto de datos. Puede analizar la importancia relativa de los valores en un conjunto de datos. Esta herramienta utiliza las funciones JERARQUIA y RANGO.PERCENTIL de la hoja de cálculo. JERARQUIA no explica los valores relacionados. Si desea explicar valores relacionados, utilice la función JERARQUIA de la hoja de cálculo junto con el factor de corrección que se sugiere en el archivo de Ayuda para JERARQUIA.

Regresión

La herramienta de análisis de regresión realiza análisis de regresión lineal utilizando el método de "mínimos cuadrados" para ajustar una línea a través de un conjunto de observaciones. Puede analizar cómo una variable dependiente se ve afectada por los valores de una o más variables independientes. Por ejemplo, puede analizar cómo afecta al rendimiento de un atleta factores como la edad, altura y grosor. Puede por ejemplo en la medida de rendimiento a cada uno de estos tres factores, en función de un conjunto de datos de rendimiento y, a continuación, use los resultados para predecir el rendimiento de un atleta nuevo, ha probado.

La herramienta Regresión utiliza la función ESTIMACION.LINEAL de la hoja de cálculo.

Muestreo

La herramienta de análisis muestreo crea una muestra de una población tratando el rango de entrada como una población. Cuando la población es demasiado grande para el proceso o el gráfico, puede usar un representante de ejemplo. También puede crear un ejemplo que contiene solo los valores de una parte determinada de un ciclo si considera que los datos de entrada son periódicos. Por ejemplo, si el rango de entrada contiene cifras de ventas trimestrales, muestreo con una tasa periódica de cuatro lugares los valores del mismo trimestre en el rango de salida.

Prueba t

Las herramientas de análisis Prueba t de dos muestras permiten comprobar la igualdad de las medias de población que subyacen a cada muestra. Las tres herramientas utilizan diferentes suposiciones: que las varianzas de población son iguales, que las varianzas de población no son iguales y que las dos muestras representan observaciones anteriores y posteriores al tratamiento en los mismos sujetos.

Para las tres herramientas que figuran a continuación, un valor de la estadística T, t, se calcula y se muestra como “t Stat” en las tablas de resultados. Dependiendo de los datos, este valor t puede ser negativo o no negativo. Suponiendo medias de población subyacentes iguales, si t < 0, “P(T <= t) de una cola” proporciona la probabilidad de que se observe un valor de la estadística T que sea más negativo que t. Si t >=0, “P(T <= t) de una cola” proporciona la probabilidad de que se observe un valor de la estadística T que sea más positivo que t. “Valor crítico t de una cola” proporciona el valor de corte para que la probabilidad de observar un valor de la estadística t mayor o igual a “Valor crítico t de una cola” sea Alfa.

“P(T <= t) de dos colas” proporciona la probabilidad de que se observe un valor de la estadística T que sea mayor en valor absoluto que t. “Valor crítico P de dos colas” proporciona el valor de corte para que la probabilidad de una estadística T observada mayor en valor absoluto que “Valor crítico P de dos colas” sea Alfa.

Prueba t para medias de dos muestras emparejadas

Puede utilizar una prueba emparejada cuando existe un par natural de observaciones en las muestras, como cuando un grupo de muestras se somete a prueba dos veces, antes y después de un experimento. Esta herramienta de análisis y su fórmula ejecutan una prueba t de Student de dos muestras emparejadas para determinar si las observaciones realizadas antes y después de un tratamiento proceden probablemente de distribuciones con medias de población iguales. En este tipo de prueba no se supone que las varianzas de ambas poblaciones sean iguales.

Nota: Entre los resultados que se generan con esta herramienta se encuentra la varianza agrupada, una medición acumulada de la distribución de datos en torno a la media, que se deriva de la fórmula siguiente.

Fórmula para calcular la varianza agrupada

Prueba t para dos muestras suponiendo varianzas iguales

Esta herramienta de análisis ejecuta una Prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos proceden de distribuciones con las mismas varianzas. Se conoce con el nombre de Prueba t homoscedástica. Puede utilizar este tipo de prueba para determinar si es probable que las dos muestras procedan de distribuciones con medias de población iguales.

Prueba t para dos muestras suponiendo varianzas desiguales

Esta herramienta de análisis ejecuta una Prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos proceden de distribuciones con varianzas desiguales. Se conoce con el nombre de Prueba t heteroscedástica. Al igual que en el caso anterior suponiendo varianzas iguales, este tipo de prueba puede utilizarse para determinar si es probable que las dos muestras procedan de distribuciones con medias de población iguales. Utilice esta prueba cuando haya sujetos distintos en las dos muestras. Utilice la prueba emparejada, que se describe en el ejemplo que figura más abajo, cuando exista un conjunto único de sujetos y las dos muestras representen las medidas de cada uno de los sujetos antes y después de un tratamiento.

La siguiente fórmula se utiliza para determinar el valor estadístico t.

Fórmula para calcular el valor t

La siguiente fórmula se utiliza para calcular los grados de libertad (grados_de_libertad). Puesto que el resultado del cálculo normalmente no es un entero, el valor de los grados de libertad se redondea al entero más próximo para obtener un valor crítico de la tabla t. La función PRUEBA.T de la hoja de cálculo de Excel utiliza el valor calculado de los grados de libertad sin redondeos, ya que es posible calcular un valor para PRUEBA.T con un valor de grados de libertad no entero. Debido a estos diferentes métodos para determinar los grados de libertad, los resultados de PRUEBA.T y esta herramienta de prueba t variarán en el caso de varianzas desiguales.

Fórmula para aproximar grados de libertad

Prueba z

La herramienta de análisis Prueba z para medias de dos muestras realiza una Prueba z en las medias de dos muestras con varianzas conocidas. Esta herramienta se utiliza para comprobar las hipótesis nulas relativas a que no existen diferencias entre dos medias de población frente a las hipótesis alternativas en uno u otro sentido. Si no se conocen las varianzas, deberá utilizarse la función PRUEBA.Z de la hoja de cálculo.

Al usar la herramienta de prueba z, tenga cuidado en comprender el resultado. "P (Z < = z) una cola" es en realidad P (Z > = ABS, la probabilidad de un valor z más allá de 0 en la misma dirección que el valor z observado cuando no hay ninguna diferencia entre las medias de población. "P (Z < = z) dos colas" es realmente P (Z > = ABS o Z < = - ABS, la probabilidad de un valor z más allá de 0 en cualquier dirección que el valor z observado cuando no hay ninguna diferencia entre las medias de población. El resultado de dos colas es solamente el resultado de una cola multiplicado por 2. La herramienta de prueba z también puede utilizarse para el caso de que la hipótesis nula sea que hay un valor distinto de cero específico para la diferencia entre las dos medias de población. Por ejemplo, puede usar esta prueba para determinar las diferencias entre el rendimiento de dos modelos de automóvil.

Notas: 

  • Las funciones de análisis de datos sólo pueden utilizarse en una única hoja de cálculo a la vez. Cuando se analizan los datos de hojas agrupadas, los resultados aparecerán en la primera hoja, y en las hojas restantes aparecerán tablas con formato vacías. Para analizar los datos del resto de las hojas, actualice la herramienta de análisis para cada una de ellas.

  • Para obtener una lista de libros que proporcionan información detallada sobre los algoritmos o métodos estadísticos que se utilizaron para crear las funciones y herramientas estadísticas de Microsoft Excel, vea bibliografía de respuestas sobre métodos y algoritmos estadísticos.

Nota: Declinación de responsabilidades de traducción automática: Este artículo se ha traducido con un sistema informático sin intervención humana. Microsoft ofrece estas traducciones automáticas para que los hablantes de otros idiomas distintos del inglés puedan disfrutar del contenido sobre los productos, los servicios y las tecnologías de Microsoft. Puesto que este artículo se ha traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática.

¿Le ha sido útil esta información?

De acuerdo. ¿Algún comentario más?

¿Cómo podemos mejorarlo?

¡Gracias por sus comentarios!

×