Utiliser l’Utilitaire d’analyse pour effectuer une analyse de données complexe

Important    Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Dans Excel 2010, des améliorations ont été apportées à de nombreuses fonctions qui utilise de l'utilitaire d'analyse.
Lecture un billet de blog ou essayez d'Office 365!

Si vous devez développer des analyses statistiques ou techniques complexes, faites appel à l'Utilitaire d'analyse pour éviter certaines étapes et gagner du temps. Vous fournissez les données et les paramètres pour chaque analyse. L'outil utilise les fonctions macro statistiques ou techniques appropriées pour afficher les résultats dans une table de sortie. Certains outils génèrent des graphiques en plus des tables de sortie.

L'Utilitaire d'analyse comprend les outils décrits ci-dessous. Pour y accéder, cliquez sur Analyse des données dans le groupe Analyse de l'onglet Données. Si la commande Utilitaire d'analyse n'est pas disponible, vous devez charger le complément Utilitaire d'analyse.

Charger le complément logiciel Analysis ToolPak

  1. Cliquez sur le Bouton de Microsoft Office Image du bouton Office, puis cliquez sur Options Excel.

  2. Cliquez sur Compléments puis, dans la zone Gérer, sélectionnez Compléments Excel.

  3. Cliquez sur Ok.

  4. Dans la zone Macros complémentaires disponibles, activez la case à cocher Utilitaire d'analyse, puis cliquez sur OK.

    Conseil    Si l’Utilitaire d’analyse ne figure pas dans la zone Macros complémentaires disponibles, cliquez sur Parcourir pour le localiser.

    Si un message s'affiche pour indiquer que l'Utilitaire d'analyse n'est pas installé sur l'ordinateur, cliquez sur Oui pour l'installer.

Remarque   Pour inclure des fonctions VBA (Visual Basic pour Applications) pour l'Utilitaire d'analyse, vous pouvez charger la macro complémentaire Utilitaire d'analyse - VBA en suivant la même procédure que pour l'Utilitaire d'analyse. Dans la zone Macros complémentaires disponibles, activez la case à cocher Utilitaire d'analyse - VBA.

Pour plus d'informations sur chaque outil, cliquez sur le nom d'un outil dans la liste ci-dessous.

Analyse de variance

Les outils d'analyse de variance proposent différents types d'analyses. C'est le nombre de facteurs et d'échantillons dont vous disposez pour la population testée qui détermine l'outil à utiliser.

Analyse de variance : un facteur

Cet outil effectue une analyse simple de variance sur les données de plusieurs échantillons. L'analyse teste l'hypothèse selon laquelle chaque échantillon provient de la même distribution de probabilité sous-jacente par rapport à l'hypothèse contraire selon laquelle les distributions de probabilité ne sont pas les mêmes pour les échantillons. S'il n'y a que deux échantillons, vous pouvez utiliser la fonction de feuille de calcul TEST.STUDENT. Avec plus de deux échantillons, la généralisation pratique de la fonction TEST.STUDENT est impossible et le modèle Analyse de variance à un facteur peut donc être utilisé à la place.

Analyse de variance : deux facteurs avec répétition d'expérience

Cet outil d'analyse est utile lorsque les données peuvent être classées selon deux dimensions différentes. Prenons l'exemple d'une expérience consistant à mesurer la hauteur d'une série de plantes. Supposons que plusieurs marques d'engrais sont utilisées (par exemple : A, B, C) et que les plantes sont conservées à des températures différentes (par exemple : basse, élevée). Pour chacune des six paires {engrais, température} possibles, vous aurez un nombre égal d'observations de la hauteur de la plante. Cet outil d'analyse de variance vous permet de déterminer :

  • Si les hauteurs de plantes pour les différentes marques d'engrais proviennent de la même population sous-jacente, les températures étant ignorées dans cette analyse.

  • Si les hauteurs de plantes pour les différents niveaux de température proviennent de la même population sous-jacente ; les engrais étant ignorés dans cette analyse.

Si, compte tenu des effets des différences au niveau des marques d'engrais décelées au premier point ci-dessus et les différences au niveau des températures décelées au second point, les six échantillons représentant les valeurs de l'ensemble des paires {engrais, température} proviennent de la même population. L'autre hypothèse est qu'il y a des effets liés à certaines paires {engrais, température} en sus des différences basées sur la marque d'engrais ou sur la température isolément.

Définition de la plage d’entrée pour l’outil Anova

Analyse de variance : deux facteurs sans répétition d'expérience

À l'instar du modèle à deux facteurs avec répétition d'expérience, cet outil d'analyse est utile lorsque les données sont classées selon deux dimensions différentes. Cependant, avec cet outil, nous supposons qu'il n'y a qu'une seule observation pour chaque paire (par exemple : chaque paire {engrais, température} dans l'exemple précédent).

Analyse de corrélation

Les fonctions de feuille de calcul COEFFICIENT.CORRELATION et PEARSON servent toutes les deux à calculer le coefficient de corrélation entre deux variables de mesure lorsque les mesures pour chaque variable sont observées pour chaque sujet N (les sujets pour lesquels il manque une observation sont ignorés dans l'analyse). L'outil d'analyse Corrélation est particulièrement utile lorsqu'il y a plus de deux variables de mesure pour chacun des sujets N. Il fournit une table de sortie, une matrice de corrélation, affichant la valeur de COEFFICIENT.CORRELATION (ou PEARSON) appliquée à chaque paire possible de variables de mesure.

Le coefficient de corrélation, tout comme la covariance, mesure le niveau de « variation conjointe » de deux mesures variables. Contrairement à la covariance, le coefficient de corrélation est mis à l'échelle de manière à ce que sa valeur soit indépendante des unités dans lesquelles les deux variables de mesure sont exprimées (par exemple, si les deux variables de mesure sont le poids et la hauteur, la valeur du coefficient de corrélation reste inchangée si le poids est converti de livres en kilos). La valeur du coefficient de corrélation doit être comprise entre -1 et +1.

Vous pouvez utiliser l’outil d’analyse de corrélation pour étudier chaque paire de variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les valeurs élevées d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation positive), si les valeurs faibles d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation négative) ou bien enfin, si les valeurs des deux variables ne sont pas liées (corrélation proche de 0 (zéro)).

Analyse de covariance

Les outils Corrélation et Covariance peuvent être appliqués au même cas lorsque vous observez N variables de mesure différentes chez un groupe d'individus. Ces outils fournissent chacun leur propre table de sortie, leur matrice, pour montrer, respectivement, le coefficient de corrélation ou la covariance entre chaque paire de variables de mesure. La différence est que les coefficients de corrélation sont mis à l'échelle pour rester compris entre -1 et +1, alors que les covariances correspondantes ne le sont pas. Le coefficient de corrélation et la covariance sont des mesures du niveau de « variation conjointe » de deux variables.

L'outil Covariance calcule la valeur de la fonction de feuille de calcul COVARIANCE pour chaque paire de variables de mesure (l'utilisation directe de la fonction COVARIANCE est une alternative raisonnable lorsqu'il n'y a que deux variables de mesure, à savoir quand N = 2). L'entrée sur la diagonale de la table de sortie de l'outil Covariance à l'intersection de la ligne i et de la colonne i est la covariance de la i-ème variable de mesure avec elle-même. Il s'agit simplement de la variance de population pour cette variable telle qu'elle est calculée par la fonction de feuille de calcul VAR.P.

Vous pouvez utiliser l’outil d’analyse de covariance pour étudier chaque paire de variables numériques et déterminer si elles corrèlent — c’est-à-dire, si les valeurs élevées d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation positive), si les valeurs faibles d’une variable ont tendance à suivre les valeurs élevées de l’autre variable (on parle de corrélation négative) ou bien enfin, si les valeurs des deux variables ne sont pas liées (corrélation proche de 0 (zéro)).

Statistiques descriptives

L'outil d'analyse Statistiques descriptives génère un rapport de statistique univariate pour les données dans la plage d'entrée, ce qui fournit des informations sur la tendance centrale et la variabilité de vos données.

Lissage exponentiel

L'outil d'analyse Lissage exponentiel prévoit une valeur à partir de la prévision effectuée pour la période précédente, corrigée des erreurs commises dans cette prévision. Cet outil utilise la constante de lissage a, dont la grandeur détermine à quel degré les prévisions tiennent compte des erreurs de la prévision précédente.

Remarque   Une constante de lissage comprise entre 0,2 et 0,3 est acceptable. De telles valeurs indiquent que la prévision actuelle doit être corrigée de 20 à 30 pour cent pour tenir compte de l'erreur commise dans la prévision précédente. Des constantes plus élevées donnent une réponse plus rapide, mais peuvent générer des prévisions inégales. Des constantes plus petites peuvent résulter en de longs décalages entre les valeurs de prévision et les valeurs réelles.

Test d'égalité des variances (F-Test)

L'outil d'analyse Test d'égalité des variances (F-Test) effectue un test F à deux échantillons afin de comparer deux variances de population.

Par exemple, vous pouvez utiliser cet outil sur des échantillons de temps réalisés par deux équipes adverses lors d'une compétition de natation. L'outil fournit le résultat du test de l'hypothèse nulle selon laquelle ces deux échantillons proviennent de distributions de variances égales contre l'hypothèse opposée selon laquelle les variances ne sont pas identiques dans les distributions sous-jacentes.

L'outil calcule la valeur f d'une statistique F (ou rapport F). Une valeur f proche de 1 apporte la preuve que les variances de population sous-jacentes sont identiques. Dans la table de sortie, si f < 1, « P(F < f) unilatéral » indique la probabilité d'observer une valeur de la statistique F inférieure à f lorsque les variances de population sont égales et « F unilatéral critique » donne la valeur critique inférieure à 1 pour le seuil de signification sélectionné, Alpha. Si f > 1, « P(F < f) unilatéral » indique la probabilité d'observer une valeur de la statistique F supérieure à f lorsque les variances de population sont identiques et « F unilatéral critique » donne la valeur critique supérieure à 1 pour Alpha.

Transformation de Fourier Rapide (FFT)

L'outil Transformation de Fourier Rapide (FFT) résout des problèmes dans les systèmes linéaires et analyse des données périodiques en utilisant la méthode Fast Fourier Transform (FFT) pour transformer des données. Cet outil prend également en charge les transformations inverses, dans lesquelles l'inverse des données transformées renvoie les données d'origine.

Plages d’entrée et de sortie pour l’analyse de Fourier

Histogramme

L'outil d'analyse Histogramme calcule les fréquences individuelles et cumulées pour une plage de cellules de données et de binaires de données. Cet outil génère des données pour le nombre d'occurrences d'une valeur dans une série de données.

Par exemple, dans une classe de 20 élèves, vous pouvez déterminer la distribution des notes dans un système de notation par lettre. Une table d'histogramme présente les valeurs limites pour chaque lettre ainsi que le nombre de notes obtenues entre la limite inférieure et la limite actuelle. La note la plus fréquente représente le mode des données.

Moyenne mobile

L'outil Moyenne mobile projette des valeurs dans la période de prévision en fonction de la valeur moyenne de la variable sur un nombre spécifique de périodes précédentes. Une moyenne mobile fournit des informations de tendances qu'une simple moyenne de toutes les données historiques masquerait. Utilisez cette fonctionnalité pour prévoir des ventes, inventaires ou autre tendances. Chaque valeur de prévision est basée sur la formule suivante.

Formule de calcul des moyennes mobiles

où :

  • N est le nombre de périodes précédentes à inclure dans la moyenne mobile

  • Aj est la valeur réelle au moment j

  • FJ est la valeur prévue au moment j

Génération de nombres aléatoires

L'outil d'analyse Génération de nombres aléatoires remplit une plage avec des nombres aléatoires indépendants provenant d'une distribution choisie entre plusieurs. Une distribution de probabilité vous permet de caractériser les sujets d'une population. Par exemple, vous pouvez utiliser une distribution normale pour caractériser la population des tailles d'individus ou avoir recours à une loi de Bernoulli à deux issues possibles pour caractériser la population des résultats du jeu pile ou face.

Analyse de position

L'outil d'Analyse de position génère une table qui contient le numéro de rang et le rang en pourcentage de chaque valeur d'une série de données. Vous pouvez analyser le rang relatif des valeurs d'une série de données. Cet outil utilise les fonctions de feuille de calcul RANG et RANG.POURCENTAGE. La fonction RANG ne tient pas compte des valeurs liées. Si vous souhaitez tenir compte des valeurs liées, utilisez la fonction RANG en combinaison avec le facteur de correction suggéré dans le fichier d'aide de la fonction RANG.

Régression linéaire

L'outil d'analyse Régression linéaire effectue une analyse de régression linéaire en utilisant la méthode des « moindres carrés » pour tracer une droite sur un ensemble d'observations. Vous pouvez analyser l'incidence d'une ou plusieurs variables indépendantes sur une seule variable dépendante. Par exemple, vous pouvez analyser l'incidence de facteurs tels que l'âge, la taille et le poids, sur les performances d'un athlète. Vous pouvez répartir la mesure des performances entre chacun de ces trois facteurs, à partir d'une série de données de performances, puis utiliser les résultats pour prévoir les performances d'un nouvel athlète non testé.

L'outil Régression linéaire utilise la fonction de feuille de calcul DROITEREG.

Échantillonnage

L'outil d'analyse Échantillonnage crée un échantillon à partir d'une population, en considérant la plage d'entrée comme une population. Lorsque celle-ci est trop importante pour être traitée ou représentée sous forme graphique, vous pouvez utiliser un échantillon représentatif. Si vous pensez que les données d'entrée sont périodiques, il vous est également possible de créer un échantillon ne contenant que les valeurs d'une phase particulière d'un cycle. Par exemple, si la plage d'entrée contient des chiffres de ventes trimestrielles, un échantillonnage avec un taux périodique égal à 4 place les valeurs correspondant au même trimestre dans la plage de sortie.

Test d'égalité des espérances

Les outils d'analyse Test d'égalité des espérances vérifient l'égalité des moyennes de populations de chaque échantillon. Les trois outils utilisent pour ce faire des hypothèses différentes : les variances de population sont égales ; les variances de population ne sont pas égales ; les deux échantillons représentent, avant et après traitement, des observations sur les mêmes sujets.

Pour chacun des trois outils, une valeur statistique t, est calculée et indiquée comme « t Stat » dans les tables de sortie. Cette valeur t peut être négative ou positive en fonction des données. Selon l'hypothèse de moyennes de population égales, si t < 0, « P(T < t) unilatéral » donne la probabilité qu'une valeur de la statistique t plus négative que t serait observée. Si t >= 0, « P(T <= t) unilatéral » donne la probabilité qu'une valeur de la statistique t plus positive que t serait observée. « t unilatéral critique » donne la valeur limite de manière à ce que Alpha représente la probabilité d'observer une valeur de statistique t supérieure ou égale à « t unilatéral critique ».

« P(T <= t) bilatéral » indique la probabilité d'observer une valeur de statistique t supérieure à t en valeur absolue. « P bilatéral critique » représente la valeur limite de sorte que Alpha est la probabilité d'observer une statistique t supérieure à « P critique bilatéral » en valeur absolue.

Test d'égalité des espérances : observations pairées

Vous pouvez utiliser le test t apparié lorsque les observations sur les échantillons sont naturellement appariées, par exemple, lorsqu’un groupe est testé deux fois — avant et après une expérimentation. Cet outil d’analyse et sa formule permettent d’effectuer un test t de Student pour deux échantillons appariés afin de déterminer si les observations relevées avant et après traitement proviennent de distributions avec des moyennes égales de population. Ce test ne suppose pas que les variances des deux populations sont égales.

Remarque   L'un des résultats générés par cet outil est une variable pondérée. Il s'agit d'une mesure consolidée de l'étendue des données dans la moyenne, dérivée de la formule suivante.

Formule pour calculer la variance cumulée

Test d'égalité des espérances : deux observations de variances égales

Cet outil d'analyse effectue un test d'égalité des espérances de Student sur deux échantillons. Ce test, qui suppose que les deux séries de données proviennent de distributions aux variances identiques, est appelé « test d'égalité des espérances homoscédastique ». Vous pouvez l'utiliser pour déterminer si les deux échantillons sont susceptibles de provenir de distributions ayant les mêmes moyennes de population.

Test d'égalité des espérances : deux observations de variances différentes

Cet outil d'analyse effectue un test d'égalité des espérances de Student sur deux échantillons. Ce test, qui suppose que les deux séries de données proviennent de distributions aux variances différentes, est appelé « test d'égalité des espérances hétéroscédastique ». Comme pour le test sur deux échantillons dont les variances sont supposées égales, vous pouvez l'utiliser pour déterminer si les deux échantillons sont susceptibles de provenir de distributions ayant des moyennes de population égales. Utilisez ce test lorsqu'il y a plusieurs sujets dans les deux échantillons. Utilisez le test pairé décrit ci-dessous lorsqu'il y a un groupe unique de sujets et que les deux échantillons représentent des mesures pour chaque sujet avant et après traitement.

La formule suivante permet de déterminer la valeur statistique t.

Formule pour calculer la valeur t

La formule suivante est utilisée pour calculer les degrés de liberté, df. Le résultat du calcul n'étant généralement pas un entier, la valeur de df est arrondie à l'entier le plus proche pour obtenir une valeur critique à partir de la table t. La fonction de feuille de calcul Excel TEST.STUDENT utilise la valeur df calculée sans l'arrondir puisqu'il est possible de calculer une valeur pour TEST.STUDENT avec un df non entier. En raison de ces approches différentes en matière de détermination des degrés de liberté, les résultats obtenus par la fonction TEST.STUDENT et par l'outil Test d'égalité des espérances seront différents dans le cas de variances inégales.

Formule de calcul du degré de liberté

Test de la différence significative minimale

L'outil d'analyse Test de la différence significative minimale effectue un test de la différence sur les moyennes de deux échantillons dont les variances sont connues. Il permet de tester l'hypothèse nulle selon laquelle il n'y a pas de différences entre les moyennes de deux populations contre l'hypothèse soit unilatérale, soit bilatérale contraire. Si les variances sont inconnues, il vaut mieux utiliser la fonction de feuille de calcul TEST.Z.

L'utilisation de l'outil d'analyse Test de la différence doit se faire en pleine compréhension des résultats. « P(Z <= z) unilatéral » est véritablement P(Z >= ABS(z)), la probabilité d'une valeur z plus éloignée de 0 dans la même direction que la valeur z observée lorsque les moyennes de population sont égales. « P(Z <= z) bilatéral » est véritablement P(Z >= ABS(z) ou Z <= -ABS(z)), la probabilité d'une valeur z plus éloignée de 0 dans les deux directions que la valeur z observée lorsque les moyennes de population sont égales. Le résultat bilatéral équivaut simplement au résultat unilatéral multiplié par 2. L'outil d'analyse Test de la différence significative minimale peut également être utilisé dans le cas où l'hypothèse nulle est la présence d'une valeur non nulle spécifique pour la différence entre les moyennes de deux populations. Par exemple, vous pouvez l'utiliser pour étudier les différences existant entre les performances de deux modèles de voitures.

Remarques   

  • Les fonctions d'analyse de données peuvent être utilisées uniquement sur une seule feuille de calcul à la fois. Lorsque vous effectuez une analyse des données sur des feuilles de calcul groupées, les résultats s'affichent sur la première feuille de calcul, et des tables vides et non mises en forme apparaissent sur les autres feuilles de calcul. Pour effectuer une analyse des données sur les autres feuilles de calcul, utilisez l'outil d'analyse pour chaque feuille de calcul.

  • Pour obtenir une liste d'ouvrages fournissant des informations détaillées sur les méthodes statistiques ou les algorithmes qui ont servi à créer les outils et les fonctions statistiques de Microsoft Excel, consultez la rubrique Bibliographie des méthodes statistiques et des algorithmes.

Remarque   Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.

S’applique à : Excel 2007



Ces informations vous ont-elles été utiles ?

Oui Non

Comment pouvons-nous nous améliorer ?

255 caractères restants

Afin de protéger votre vie privée, n’indiquez aucune information de contact dans vos commentaires. Lisez notre déclaration de confidentialité.

Nous vous remercions pour vos commentaires.

Changer la langue