Utiliser l’Utilitaire d’analyse pour effectuer une analyse de données complexe

Important :  Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Dans Excel 2010, des améliorations ont été apportées à la plupart des fonctions qui utilise l'utilitaire d'analyse.
Lecture un billet de blog ou Essayez Office 365!

Si vous devez développer des analyses statistiques ou techniques complexes, faites appel à l'Utilitaire d'analyse pour éviter certaines étapes et gagner du temps. Vous fournissez les données et les paramètres pour chaque analyse. L'outil utilise les fonctions macro statistiques ou techniques appropriées pour afficher les résultats dans une table de sortie. Certains outils génèrent des graphiques en plus des tables de sortie.

L'Utilitaire d'analyse comprend les outils décrits ci-dessous. Pour y accéder, cliquez sur Analyse des données dans le groupe Analyse de l'onglet Données. Si la commande Utilitaire d'analyse n'est pas disponible, vous devez charger le complément Utilitaire d'analyse.

Charger le complément logiciel Analysis ToolPak

  1. Cliquez sur le bouton Microsoft Office Image du bouton Office , puis sur Options Excel.

  2. Cliquez sur Compléments puis, dans la zone Gérer, sélectionnez Compléments Excel.

  3. Cliquez sur Ok.

  4. Dans la zone Macros complémentaires disponibles, activez la case à cocher Utilitaire d'analyse, puis cliquez sur OK.

    Conseil    Si l’Utilitaire d’analyse ne figure pas dans la zone Macros complémentaires disponibles, cliquez sur Parcourir pour le localiser.

    Si un message s'affiche pour indiquer que l'Utilitaire d'analyse n'est pas installé sur l'ordinateur, cliquez sur Oui pour l'installer.

Remarque : Pour inclure des fonctions VBA (Visual Basic pour Applications) pour l'Utilitaire d'analyse, vous pouvez charger la macro complémentaire Utilitaire d'analyse - VBA en suivant la même procédure que pour l'Utilitaire d'analyse. Dans la zone Macros complémentaires disponibles, activez la case à cocher Utilitaire d'analyse - VBA.

Pour plus d'informations sur chaque outil, cliquez sur le nom d'un outil dans la liste ci-dessous.

Analyse de variance

Les outils d'analyse de variance proposent différents types d'analyse de variance. L'outil que vous devez utiliser dépend du nombre de facteurs et le nombre d'échantillons dont vous disposez de la population que vous souhaitez tester.

Analyse de variance : un facteur

Cet outil effectue une analyse simple de variance sur les données de plusieurs échantillons. L'analyse teste l'hypothèse selon laquelle chaque échantillon provient de la même distribution de probabilité sous-jacente par rapport à l'hypothèse contraire selon laquelle les distributions de probabilité ne sont pas les mêmes pour les échantillons. S'il n'y a que deux échantillons, vous pouvez utiliser la fonction de feuille de calcul TEST.STUDENT. Avec plus de deux échantillons, la généralisation pratique de la fonction TEST.STUDENT est impossible et le modèle Analyse de variance à un facteur peut donc être utilisé à la place.

Analyse de variance : deux facteurs avec répétition d'expérience

Cet outil d'analyse est utile lorsque les données peuvent être classées selon deux dimensions différentes. Prenons l'exemple d'une expérience consistant à mesurer la hauteur d'une série de plantes. Supposons que plusieurs marques d'engrais sont utilisées (par exemple : A, B, C) et que les plantes sont conservées à des températures différentes (par exemple : basse, élevée). Pour chacune des six paires {engrais, température} possibles, vous aurez un nombre égal d'observations de la hauteur de la plante. Cet outil d'analyse de variance vous permet de déterminer :

  • Si les hauteurs de plantes pour les différentes marques d'engrais proviennent de la même population sous-jacente, les températures étant ignorées dans cette analyse.

  • Si les hauteurs de plantes pour les différents niveaux de température proviennent de la même population sous-jacente ; les engrais étant ignorés dans cette analyse.

Si, compte tenu des effets des différences au niveau des marques d'engrais décelées au premier point ci-dessus et les différences au niveau des températures décelées au second point, les six échantillons représentant les valeurs de l'ensemble des paires {engrais, température} proviennent de la même population. L'autre hypothèse est qu'il y a des effets liés à certaines paires {engrais, température} en sus des différences basées sur la marque d'engrais ou sur la température isolément.

Définition de la plage d’entrée pour l’outil Anova

Analyse de variance : deux facteurs sans répétition d'expérience

À l'instar du modèle à deux facteurs avec répétition d'expérience, cet outil d'analyse est utile lorsque les données sont classées selon deux dimensions différentes. Cependant, avec cet outil, nous supposons qu'il n'y a qu'une seule observation pour chaque paire (par exemple : chaque paire {engrais, température} dans l'exemple précédent).

Analyse de corrélation

Les fonctions de feuille de calcul COEFFICIENT.CORRELATION et PEARSON servent toutes les deux à calculer le coefficient de corrélation entre deux variables de mesure lorsque les mesures pour chaque variable sont observées pour chaque sujet N (les sujets pour lesquels il manque une observation sont ignorés dans l'analyse). L'outil d'analyse Corrélation est particulièrement utile lorsqu'il y a plus de deux variables de mesure pour chacun des sujets N. Il fournit une table de sortie, une matrice de corrélation, affichant la valeur de COEFFICIENT.CORRELATION (ou PEARSON) appliquée à chaque paire possible de variables de mesure.

Le coefficient de corrélation, comme la covariance, est une mesure de l'étendue dans laquelle deux variables de mesure « varient conjointement ». Contrairement à la covariance, le coefficient de corrélation est mise à l'échelle afin que sa valeur est indépendante des unités dans lesquelles les deux variables de mesure sont exprimés. (Par exemple, si les deux variables de mesure sont poids et la hauteur, la valeur du coefficient de corrélation est ne change pas si poids doit être comprise entre en kilogrammes.) La valeur du coefficient de corrélation doit être comprise entre -1 et + 1 inclus.

Vous pouvez utiliser l’outil d’analyse de corrélation pour étudier chaque paire de variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les valeurs élevées d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation positive), si les valeurs faibles d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation négative) ou bien enfin, si les valeurs des deux variables ne sont pas liées (corrélation proche de 0 (zéro)).

Analyse de covariance

Les outils Corrélation et Covariance peuvent être appliqués au même cas lorsque vous observez N variables de mesure différentes chez un groupe d'individus. Ces outils fournissent chacun leur propre table de sortie, leur matrice, pour montrer, respectivement, le coefficient de corrélation ou la covariance entre chaque paire de variables de mesure. La différence est que les coefficients de corrélation sont mis à l'échelle pour rester compris entre -1 et +1, alors que les covariances correspondantes ne le sont pas. Le coefficient de corrélation et la covariance sont des mesures du niveau de « variation conjointe » de deux variables.

L'outil Covariance calcule la valeur de la fonction de feuille de calcul COVARIANCE pour chaque paire de variables de mesure. (Utilisation directe de covariance plutôt que l'outil Covariance est la covariance lorsqu'il y a que deux variables de mesure, c'est-à-dire, N = 2). L'entrée de la diagonale de la table de sortie de l'outil de Covariance dans la ligne i, colonne i est la covariance de la i-ème variable telle qu'elle. Il s'agit simplement la variance d'une population pour cette variable, telle que calculée par la fonction de feuille de calcul VARP.

Vous pouvez utiliser l’outil d’analyse de covariance pour étudier chaque paire de variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les valeurs élevées d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation positive), si les valeurs faibles d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation négative) ou bien enfin, si les valeurs des deux variables ne sont pas liées (corrélation proche de 0 (zéro)).

Statistiques descriptives

L'outil d'analyse Statistiques descriptives génère un rapport de statistique univariate pour les données dans la plage d'entrée, ce qui fournit des informations sur la tendance centrale et la variabilité de vos données.

Lissage exponentiel

L'outil d'analyse Lissage exponentiel prévoit une valeur à partir de la prévision effectuée pour la période précédente, corrigée des erreurs commises dans cette prévision. Cet outil utilise la constante de lissage a, dont la grandeur détermine à quel degré les prévisions tiennent compte des erreurs de la prévision précédente.

Remarque : Une constante de lissage comprise entre 0,2 et 0,3 est acceptable. De telles valeurs indiquent que la prévision actuelle doit être corrigée de 20 à 30 pour cent pour tenir compte de l'erreur commise dans la prévision précédente. Des constantes plus élevées donnent une réponse plus rapide, mais peuvent générer des prévisions inégales. Des constantes plus petites peuvent résulter en de longs décalages entre les valeurs de prévision et les valeurs réelles.

Test d'égalité des variances (F-Test)

L'outil d'analyse Test d'égalité des variances (F-Test) effectue un test F à deux échantillons afin de comparer deux variances de population.

Par exemple, vous pouvez utiliser cet outil sur des échantillons de temps réalisés par deux équipes adverses lors d'une compétition de natation. L'outil fournit le résultat du test de l'hypothèse nulle selon laquelle ces deux échantillons proviennent de distributions de variances égales contre l'hypothèse opposée selon laquelle les variances ne sont pas identiques dans les distributions sous-jacentes.

L'outil calcule la valeur f d'une statistique F (ou rapport F). Une valeur f proche de 1 apporte la preuve que les variances de population sous-jacentes sont identiques. Dans la table de sortie, si f < 1, « P(F < f) unilatéral » indique la probabilité d'observer une valeur de la statistique F inférieure à f lorsque les variances de population sont égales et « F unilatéral critique » donne la valeur critique inférieure à 1 pour le seuil de signification sélectionné, Alpha. Si f > 1, « P(F < f) unilatéral » indique la probabilité d'observer une valeur de la statistique F supérieure à f lorsque les variances de population sont identiques et « F unilatéral critique » donne la valeur critique supérieure à 1 pour Alpha.

Transformation de Fourier Rapide (FFT)

L'outil Transformation de Fourier Rapide (FFT) résout des problèmes dans les systèmes linéaires et analyse des données périodiques en utilisant la méthode Fast Fourier Transform (FFT) pour transformer des données. Cet outil prend également en charge les transformations inverses, dans lesquelles l'inverse des données transformées renvoie les données d'origine.

Plages d’entrée et de sortie pour l’analyse de Fourier

Histogramme

L'outil d'analyse Histogramme calcule les fréquences individuelles et cumulées pour une plage de cellules de données et de binaires de données. Cet outil génère des données pour le nombre d'occurrences d'une valeur dans une série de données.

Par exemple, dans une classe de 20 élèves, vous pouvez déterminer la distribution des notes dans un système de notation par lettre. Une table d'histogramme présente les valeurs limites pour chaque lettre ainsi que le nombre de notes obtenues entre la limite inférieure et la limite actuelle. La note la plus fréquente représente le mode des données.

Moyenne mobile

L'outil Moyenne mobile projette des valeurs dans la période de prévision en fonction de la valeur moyenne de la variable sur un nombre spécifique de périodes précédentes. Une moyenne mobile fournit des informations de tendances qu'une simple moyenne de toutes les données historiques masquerait. Utilisez cette fonctionnalité pour prévoir des ventes, inventaires ou autre tendances. Chaque valeur de prévision est basée sur la formule suivante.

Formule de calcul des moyennes mobiles

où :

  • N est le nombre de périodes précédentes à inclure dans la moyenne mobile

  • Aj est la valeur réelle au moment j

  • FJ est la valeur prévisionnelle au moment j

Génération de nombres aléatoires

L'outil d'analyse génération de nombres aléatoires remplit une plage avec des nombres aléatoires indépendants provenant d'une distribution choisie entre plusieurs. Vous pouvez caractérisation l'apparition des objets d'une population avec une distribution de probabilité. Par exemple, vous pouvez utiliser une distribution normale pour caractérisation de la population de hauteurs individus ou vous pouvez utiliser une loi de Bernoulli de deux réponses possibles pour caractérisation de la population de pièces de monnaie retourner des résultats.

Analyse de position

L'outil d'Analyse de position génère une table qui contient le numéro de rang et le rang en pourcentage de chaque valeur d'une série de données. Vous pouvez analyser le rang relatif des valeurs d'une série de données. Cet outil utilise les fonctions de feuille de calcul RANG et RANG.POURCENTAGE. La fonction RANG ne tient pas compte des valeurs liées. Si vous souhaitez tenir compte des valeurs liées, utilisez la fonction RANG en combinaison avec le facteur de correction suggéré dans le fichier d'aide de la fonction RANG.

Régression linéaire

L'outil d'analyse de régression effectue une analyse de régression linéaire à l'aide de la méthode « moindres carrés » pour ajuster une courbe sur une série d'observations. Vous pouvez analyser comment une seule variable dépendante est affectée par les valeurs d'une ou plusieurs variables indépendantes. Par exemple, vous pouvez analyser comment les performances d'un athlète sont affecté par des facteurs tels que l'âge, la hauteur et épaisseur. Vous pouvez répartir la mesure de performance pour chacun de ces trois facteurs, basés sur un jeu de données de performance et puis utiliser les résultats pour prévoir les performances d'un autre athlète non testé.

L'outil Régression linéaire utilise la fonction de feuille de calcul DROITEREG.

Échantillonnage

L'outil d'analyse échantillonnage crée un échantillon à partir d'une population en traitant de la plage d'entrée comme une population. Lorsque la population est trop volumineuse pour processus ou un graphique, vous pouvez utiliser un échantillon représentatif. Vous pouvez également créer un échantillon contenant uniquement les valeurs à partir d'une partie spécifique d'un cycle si vous pensez que les données d'entrée sont périodiques. Par exemple, si la plage d'entrée contient des chiffres de ventes trimestrielles, un échantillonnage avec un taux périodique égal à 4 place les valeurs par rapport au même trimestre dans la plage de sortie.

Test d'égalité des espérances

Les outils d'analyse Test d'égalité des espérances vérifient l'égalité des moyennes de populations de chaque échantillon. Les trois outils utilisent pour ce faire des hypothèses différentes : les variances de population sont égales ; les variances de population ne sont pas égales ; les deux échantillons représentent, avant et après traitement, des observations sur les mêmes sujets.

Pour chacun des trois outils, une valeur statistique t, est calculée et indiquée comme « t Stat » dans les tables de sortie. Cette valeur t peut être négative ou positive en fonction des données. Selon l'hypothèse de moyennes de population égales, si t < 0, « P(T < t) unilatéral » donne la probabilité qu'une valeur de la statistique t plus négative que t serait observée. Si t >= 0, « P(T <= t) unilatéral » donne la probabilité qu'une valeur de la statistique t plus positive que t serait observée. « t unilatéral critique » donne la valeur limite de manière à ce que Alpha représente la probabilité d'observer une valeur de statistique t supérieure ou égale à « t unilatéral critique ».

« P(T <= t) bilatéral » indique la probabilité d'observer une valeur de statistique t supérieure à t en valeur absolue. « P bilatéral critique » représente la valeur limite de sorte que Alpha est la probabilité d'observer une statistique t supérieure à « P critique bilatéral » en valeur absolue.

Test d'égalité des espérances : observations pairées

Vous pouvez utiliser le test t apparié lorsque les observations sur les échantillons sont naturellement appariées, par exemple, lorsqu’un groupe est testé deux fois — avant et après une expérimentation. Cet outil d’analyse et sa formule permettent d’effectuer un test t de Student pour deux échantillons appariés afin de déterminer si les observations relevées avant et après traitement proviennent de distributions avec des moyennes égales de population. Ce test ne suppose pas que les variances des deux populations sont égales.

Remarque : L'un des résultats générés par cet outil est une variable pondérée. Il s'agit d'une mesure consolidée de l'étendue des données dans la moyenne, dérivée de la formule suivante.

Formule pour calculer la variance cumulée

Test d'égalité des espérances : deux observations de variances égales

Cet outil d'analyse effectue un test d'égalité des espérances de Student sur deux échantillons. Ce test, qui suppose que les deux séries de données proviennent de distributions aux variances identiques, est appelé « test d'égalité des espérances homoscédastique ». Vous pouvez l'utiliser pour déterminer si les deux échantillons sont susceptibles de provenir de distributions ayant les mêmes moyennes de population.

Test d'égalité des espérances : deux observations de variances différentes

Cet outil d'analyse effectue un test d'égalité des espérances de Student sur deux échantillons. Ce test, qui suppose que les deux séries de données proviennent de distributions aux variances différentes, est appelé « test d'égalité des espérances hétéroscédastique ». Comme pour le test sur deux échantillons dont les variances sont supposées égales, vous pouvez l'utiliser pour déterminer si les deux échantillons sont susceptibles de provenir de distributions ayant des moyennes de population égales. Utilisez ce test lorsqu'il y a plusieurs sujets dans les deux échantillons. Utilisez le test pairé décrit ci-dessous lorsqu'il y a un groupe unique de sujets et que les deux échantillons représentent des mesures pour chaque sujet avant et après traitement.

La formule suivante permet de déterminer la valeur statistique t.

Formule pour calculer la valeur t

La formule suivante est utilisée pour calculer les degrés de liberté, df. Le résultat du calcul n'étant généralement pas un entier, la valeur de df est arrondie à l'entier le plus proche pour obtenir une valeur critique à partir de la table t. La fonction de feuille de calcul Excel TEST.STUDENT utilise la valeur df calculée sans l'arrondir puisqu'il est possible de calculer une valeur pour TEST.STUDENT avec un df non entier. En raison de ces approches différentes en matière de détermination des degrés de liberté, les résultats obtenus par la fonction TEST.STUDENT et par l'outil Test d'égalité des espérances seront différents dans le cas de variances inégales.

Formule de calcul du degré de liberté

Test de la différence significative minimale

L'outil d'analyse Test de la différence significative minimale effectue un test de la différence sur les moyennes de deux échantillons dont les variances sont connues. Il permet de tester l'hypothèse nulle selon laquelle il n'y a pas de différences entre les moyennes de deux populations contre l'hypothèse soit unilatérale, soit bilatérale contraire. Si les variances sont inconnues, il vaut mieux utiliser la fonction de feuille de calcul TEST.Z.

Lorsque vous utilisez l'outil de Test z, en veillant à ne compréhension des résultats. « P (Z < = z) unilatéral » est véritablement P (Z > = ABS, la probabilité d'une valeur z plus éloignée de 0 dans la même direction que la valeur z observée lorsqu'il n'y a aucune différence entre les moyennes de population. « P (Z < = z) bilatéral » est véritablement P (Z > = ABS ou Z < = - ABS, la probabilité d'une valeur z plus éloignée de 0 dans les deux sens à la valeur z observée lorsqu'il n'y a aucune différence entre les moyennes de population. Le résultat bilatérale est uniquement le résultat unilatérale multiplié par 2. L'outil de Test z peut également être utilisé pour le cas où l'hypothèse nulle est qu'il existe une valeur non nulle spécifique pour la différence entre les deux populations. Par exemple, vous pouvez utiliser ce test pour déterminer les différences entre les performances de deux modèles de voiture.

Remarques : 

  • Les fonctions d'analyse de données peuvent être utilisées uniquement sur une seule feuille de calcul à la fois. Lorsque vous effectuez une analyse des données sur des feuilles de calcul groupées, les résultats s'affichent sur la première feuille de calcul, et des tables vides et non mises en forme apparaissent sur les autres feuilles de calcul. Pour effectuer une analyse des données sur les autres feuilles de calcul, utilisez l'outil d'analyse pour chaque feuille de calcul.

  • Pour une liste d'ouvrages qui fournissent des informations détaillées sur les méthodes statistiques ou les algorithmes utilisés pour créer les outils statistiques Microsoft Excel et les fonctions, voir A bibliographie des méthodes statistiques et des algorithmes.

Remarque : Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.

Ces informations vous ont-elles été utiles ?

Très bien ! Vous avez d’autres commentaires ?

Comment pouvons-nous l’améliorer ?

Nous vous remercions pour vos commentaires.

×