Les dix meilleures solutions pour nettoyer vos données

Remarque : Nous faisons de notre mieux pour vous fournir le contenu d’aide le plus récent aussi rapidement que possible dans votre langue. Cette page a été traduite automatiquement et peut donc contenir des erreurs grammaticales ou des imprécisions. Notre objectif est de faire en sorte que ce contenu vous soit utile. Pouvez-vous nous indiquer en bas de page si ces informations vous ont aidé ? Voici l’article en anglais à des fins de référence aisée.

Les mots mal orthographiés, Stubborn les espaces de fin, les préfixes indésirables, les cas incorrects et les caractères non imprimables constituent une première impression incorrecte. Et il ne s'agit pas d'une liste complète des façons dont vos données peuvent être modifiées. ReMontez vos manches. Il est temps de procéder à un nettoyage des clés de vos feuilles de calcul à l'aide de Microsoft Excel.

Vous ne contrôlez pas toujours le format et le type des données que vous importez à partir d'une source de données externe, telle qu'une base de données, un fichier texte ou une page Web. Avant de pouvoir analyser les données, vous devez souvent les nettoyer. Heureusement, Excel propose de nombreuses fonctionnalités pour vous aider à obtenir des données dans le format précis que vous souhaitez. Parfois, la tâche est simple et propose une fonctionnalité spécifique qui fait la tâche à votre place. Par exemple, vous pouvez facilement utiliser le vérificateur d'orthographe pour supprimer les mots mal orthographiés dans les colonnes qui contiennent des commentaires ou des descriptions. Si vous voulez supprimer les lignes en double, vous pouvez le faire rapidement à l'aide de la boîte de dialogue supprimer les doublons.

Dans d'autres cas, vous devrez peut-être manipuler une ou plusieurs colonnes à l'aide d'une formule pour convertir les valeurs importées en nouvelles valeurs. Par exemple, si vous voulez supprimer les espaces de fin, vous pouvez créer une nouvelle colonne pour nettoyer les données à l'aide d'une formule, en remplissant la nouvelle colonne, en convertissant les formules de la nouvelle colonne en valeurs, puis en supprimant la colonne d'origine.

Les étapes de base de nettoyage des données sont les suivantes:

  1. ImPortez les données à partir d'une source de données externe.

  2. Créez une copie de sauvegarde des données d'origine dans un classeur distinct.

  3. Vérifiez que les données sont sous la forme d'un tableau de lignes et de colonnes, avec: des données similaires dans chaque colonne, de toutes les colonnes et des lignes visibles et aucune ligne vide dans la plage. Pour obtenir de meilleurs résultats, utilisez un tableau Excel.

  4. Effectuez d'abord certaines tâches qui ne nécessitent pas de manipulation de colonnes, telles que la vérification de l'orthographe ou l'utilisation de la boîte de dialogue Rechercher et remplacer .

  5. Ensuite, effectuez les tâches qui nécessitent une manipulation de colonne. Les étapes générales de la manipulation d'une colonne sont les suivantes:

    1. Insérez une nouvelle colonne (B) en regard de la colonne d'origine (A) nécessitant un nettoyage.

    2. Ajoutez une formule qui transformera les données en haut de la nouvelle colonne (B).

    3. ReCopier vers le bas la formule dans la nouvelle colonne (B). Dans un tableau Excel, une colonne calculée est automatiquement créée avec les valeurs remplies.

    4. Sélectionnez la nouvelle colonne (B), copiez-la et collez-la en tant que valeurs dans la nouvelle colonne (B).

    5. Supprimez la colonne d'origine (A), qui convertit la nouvelle colonne de B en A.

Pour nettoyer périodiquement la même source de données, envisagez d'enregistrer une macro ou d'écrire du code pour automatiser le processus dans son intégralité. Vous pouvez également envisager d'utiliser plusieurs compléments externes écrits par des fournisseurs tiers, répertoriés dans la section fournisseurs tiers , si vous n'avez pas le temps ou les ressources nécessaires pour automatiser le processus.

Informations supplémentaires

Description

Vue d'ensemble de la connexion aux données (importation)

Décrit toutes les méthodes d'importation de données externes dans Office Excel.

Recopier automatiquement des données dans les cellules d’une feuille de calcul

Montre comment utiliser la commande remplissage .

Créer et mettre en forme des tableaux

redimensionner un tableau en ajoutant ou en supprimant des lignes et des colonnes

utiliser des colonnes calculées dans un tableau Excel

Montrez comment créer un tableau Excel et ajouter ou supprimer des colonnes ou des colonnes calculées.

Créer une macro

Montre plusieurs façons d'automatiser des tâches répétitives à l'aide d'une macro.

Vous pouvez utiliser un vérificateur d'orthographe pour non seulement trouver les mots mal orthographiés, mais aussi rechercher les valeurs qui ne sont pas utilisées de manière cohérente, par exemple, le nom d'un produit ou d'une société, en ajoutant ces valeurs à un dictionnaire personnel.

Informations supplémentaires

Description

Vérifier la grammaire et l’orthographe

Montre comment corriger les mots mal orthographiés dans une feuille de calcul.

Utiliser des dictionnaires personnalisés pour ajouter des mots au vérificateur d'orthographe

Explique comment utiliser des dictionnaires personnels.

Les lignes en double constituent un problème courant lors de l'importation de données. Nous vous conseillons de filtrer d'abord les valeurs uniques pour confirmer que les résultats sont corrects avant de supprimer les valeurs en double.

Informations supplémentaires

Description

Filtrer des valeurs uniques ou supprimer des doublons

Présente deux procédures étroitement liées: comment filtrer des lignes uniques et supprimer les lignes en double.

Vous voudrez peut-être supprimer une chaîne de début courante, telle qu'une étiquette suivie d'un signe deux-points et d'un espace, ou un suffixe, tel qu'une expression parenthetic à la fin de la chaîne obsolète ou inutile. Pour ce faire, recherchez des instances de ce texte et remplacez-le par un texte ou tout autre texte.

Informations supplémentaires

Description

Vérifier si une cellule contient du texte (sans respect de la casse)

vérifier si une cellule contient du texte (respect de la casse)

Explique comment utiliser la commande Rechercher et plusieurs fonctions pour rechercher du texte.

Supprimer les caractères de texte

Explique comment utiliser la commande remplacer et plusieurs fonctions pour supprimer du texte.

Rechercher ou remplacer du texte et des nombres dans une feuille de calcul

Montrez comment utiliser les boîtes de dialogue Rechercher et remplacer .

Trouve, TROUVERB

cherche, CHERCHERB

remplace, REMPLACERB

substitut


gauche, GAUCHEBdroite, DROITEB


NBCAR, LenB STXT, MIDB

Il s'agit des fonctions que vous pouvez utiliser pour effectuer différentes tâches de manipulation de chaîne, telles que la recherche et le remplacement d'une sous-chaîne dans une chaîne, l'extraction de portions d'une chaîne ou la détermination de la longueur d'une chaîne.

Parfois, le texte se trouve dans un sac mixte, surtout quand il s'agit de texte. À l'aide d'une ou plusieurs des trois fonctions case, vous pouvez convertir du texte en lettres minuscules, telles que des adresses de messagerie, des lettres majuscules, telles que des codes de produit ou une casse correcte, telle que des noms ou des titres de livre.

Informations supplémentaires

Description

Modifier la casse d’un texte

Explique comment utiliser les trois fonctions case.

LOWER

ConVertit toutes les lettres majuscules d'une chaîne de texte en lettres minuscules.

NÉCESSAIRES

Met en majuscule la première lettre de chaque chaîne de caractères et toute lettre d’un texte qui suit un caractère non alphabétique. Toutes les autres lettres sont converties en lettres minuscules.

UPPER

ConVertit le texte en lettres majuscules.

Parfois, les valeurs de texte contiennent des espaces de début et de fin, ou plusieurs espaces incorporés (Unicode 32 et 160), ou des caractères non imprimables (valeurs du jeu de caractères Unicode comprises entre 0 et 31, 127, 129, 141, 143, 144 et 157). Ces caractères peuvent parfois provoquer des résultats inattendus lorsque vous triez, filtrez ou effectuez des recherches. Par exemple, dans la source de données externe, les utilisateurs peuvent faire des erreurs typographiques en ajoutant par inadvertance des caractères d'espace supplémentaire, ou les données texte importées à partir de sources externes peuvent contenir des caractères non imprimables incorporés dans le texte. Comme ces caractères ne sont pas facilement remarqués, les résultats inattendus peuvent être difficiles à comprendre. Pour supprimer ces caractères indésirables, vous pouvez utiliser une combinaison des fonctions SUPPRESPACE, EPURAGE et SUBSTITUe.

Informations supplémentaires

Description

Montre comment supprimer tous les espaces et caractères non imprimables du jeu de caractères Unicode.

CODE

Renvoie le numéro de code du premier caractère du texte.

NOUVELLE

Supprime du texte les premiers caractères non imprimables 32 dans le code ASCII sur 7 bits (valeurs comprises entre 0 et 31).

TRIM

Supprime du texte le caractère d'espace ASCII 7 bits (valeur 32).

EXCEPTÉ

Vous pouvez utiliser la fonction SUBSTITUe pour remplacer les caractères Unicode de valeur supérieure (valeurs 127, 129, 141, 143, 144, 157 et 160) par les caractères ASCII 7 bits pour lesquels les fonctions SUPPRESPACE et CLEAN ont été conçues.

Il existe deux principaux problèmes liés aux nombres qui peuvent nécessiter le nettoyage des données: le numéro a été importé par inadvertance en tant que texte et le signe négatif doit être remplacé par le standard pour votre organisation.

Informations supplémentaires

Description

Convertir les nombres stockés en tant que texte en nombres

Montre comment convertir des nombres mis en forme et stockés dans des cellules en tant que texte, ce qui peut entraîner des problèmes de calcul ou générer des ordres de tri confus, au format numérique.

DOLLAR

ConVertit un nombre au format texte et applique un symbole monétaire.

TEXT

ConVertit une valeur en texte dans un format de nombre spécifique.

RÉSOLU

Arrondit un nombre au nombre de décimales spécifié, met en forme le nombre au format décimal en utilisant un point et des virgules, et renvoie le résultat sous forme de texte.

VALUE

Convertit en nombre une chaîne de caractères représentant un nombre.

Dans la mesure où il existe de nombreux formats de date différents et que ces formats peuvent être confondus avec des codes de parties numérotées ou d'autres chaînes qui contiennent des barres obliques ou des traits d'Union, les dates et les heures doivent souvent être converties et reformatées.

Informations supplémentaires

Description

Modifier le système de date, le format ou l'interprétation sur deux chiffres de l'année

Décrit le fonctionnement du système de date dans Office Excel.

Convertir des heures

Montre comment convertir des unités de temps différentes.

Convertir les dates stockées en tant que texte en dates

Explique comment convertir des dates mises en forme et stockées dans des cellules en tant que texte, ce qui peut entraîner des problèmes de calcul ou générer des ordres de tri confus, jusqu'au format de date.

DATE

Renvoie le numéro de série séquentiel qui représente une date particulière. Si le format de cellule était Standard avant que la fonction ne soit entrée, le résultat est mis en forme en tant que date.

DATEVALUE

ConVertit une date représentée par du texte en un numéro de série.

TIME

Renvoie le nombre décimal d’une heure précise. Si le format de cellule était Standard avant que la fonction ne soit entrée, le résultat est mis en forme en tant que date.

TIMEVALUE

Renvoie le nombre décimal de l’heure représentée par une chaîne de texte. Le nombre décimal est une valeur comprise entre 0 (zéro) 0,99999999, qui représente les heures comprises entre 0:00:00 (12:00:00 AM) et 23:59:59 (11:59:59 P.M.).

Une tâche courante après l'importation de données à partir d'une source de données externe consiste à fusionner deux colonnes ou plus en une, ou à fractionner une colonne en deux colonnes ou plus. Par exemple, vous voudrez peut-être fractionner une colonne qui contient un nom complet en prénom et en prénom. Vous pouvez également fractionner une colonne qui contient un champ d'adresse en colonnes de rue, de ville, de région et de code postal distinctes. L'inverse peut également être vrai. Vous voudrez peut-être fusionner une colonne de prénom et de nom dans une colonne de nom complet, ou combiner des colonnes d'adresses distinctes dans une colonne. Les valeurs courantes supplémentaires qui peuvent nécessiter une fusion dans une colonne ou une division en plusieurs colonnes incluent les codes de produit, les chemins d'accès et les adresses IP (Internet Protocol).

Informations supplémentaires

Description

Combiner le prénom et le nom

combiner du texte et des nombres

combiner dutexte avec une date ou une heure

Combinez plusieurs colonnes à l'aide d'une fonction

Afficher des exemples typiques de la combinaison de valeurs de deux colonnes ou plus.

Fractionner du texte en plusieurs colonnes à l’aide de l’Assistant Conversion

Montre comment utiliser cet Assistant pour fractionner des colonnes en fonction de différents séparateurs courants.

Fractionner du texte en plusieurs colonnes en utilisant des fonctions

Montre comment utiliser les fonctions gauche, STXT, droite, cherche et NBCAR pour fractionner une colonne Name en deux colonnes ou plus.

Combiner ou fractionner le contenu des cellules

Montre comment utiliser la fonction CONCATENER, l'opérateur & (perluète) et l'Assistant Conversion de texte en colonnes.

Fusionner des cellules ou fractionner des cellules fusionnées

Montre comment utiliser les commandes fusionner les cellules, fusionner entreet fusionner et centrer .

CONCATENER

Joint deux chaînes de texte ou plus dans une seule chaîne de texte.

La plupart des fonctionnalités d'analyse et de mise en forme dans Office Excel partent du principe que les données existent dans une table bidimensionnelle à deux dimensions. Il peut arriver que vous souhaitiez faire en sorte que les lignes deviennent des colonnes et que celles-ci deviennent des lignes. Dans d'autres cas, les données ne sont même pas structurées sous la forme d'un tableau, et vous avez besoin d'un mode de transformation des données d'un tableau non tabulaire en un format tabulaire.

Informations supplémentaires

Description

TRANSPOSE

Renvoie une plage verticale de cellules sous la forme d'une plage horizontale, ou inversement.

Parfois, les administrateurs de base de données utilisent Office Excel pour rechercher et corriger les erreurs de correspondance lorsque deux tables ou plus sont jointes. Cela peut impliquer le rapprochement de deux tables à partir de feuilles de calcul différentes, par exemple, pour afficher tous les enregistrements dans les deux tables ou pour comparer les tables et rechercher les lignes qui ne correspondent pas.

Informations supplémentaires

Description

Rechercher des valeurs dans une liste de données

Montre les méthodes courantes pour rechercher des données à l'aide des fonctions de recherche.

RECHERCHE

Renvoie une valeur provenant d'une plage à une ligne ou colonne, ou d'une matrice. La fonction recherche a deux formes de syntaxe: la forme vectorielle et la forme matricielle.

RECHERCHEH

Recherche une valeur dans la ligne supérieure d'une table ou d'une matrice de valeurs, puis renvoie une valeur dans la même colonne à partir d'une ligne que vous spécifiez dans la table ou la matrice.

RECHERCHEV

Recherche une valeur dans la première colonne d'une matrice et renvoie une valeur dans la même ligne d'une autre colonne de la matrice de tables.

INDEX

Renvoie une valeur ou une référence à une valeur à partir d'une table ou d'une plage. Il existe deux formes de fonction INDEX: la forme matricielle et la forme référence.

MATCH

Retourne la position relative d'un élément dans une matrice qui correspond à une valeur spécifiée dans un ordre spécifié. Utilisez la fonction EQUIV plutôt qu’une des fonctions RECHERCHE lorsque vous avez besoin de la position d’un élément dans une plage et non de l’élément en tant que tel.

DÉCALAGE

Renvoie une référence à une plage qui correspond à un nombre déterminé de lignes et de colonnes d’une cellule ou plage de cellules. La référence qui est renvoyée peut être une cellule unique ou une plage de cellules. Vous pouvez spécifier le nombre de lignes et de colonnes à renvoyer.

Développez vos compétences dans Office
Découvrez des formations
Accédez aux nouvelles fonctionnalités en avant-première
Rejoignez le programme Office Insider

Ces informations vous ont-elles été utiles ?

Nous vous remercions pour vos commentaires.

Merci pour vos commentaires. Il serait vraisemblablement utile pour vous de contacter l’un de nos agents du support Office.

×