I dieci metodi principali per la pulizia dei dati

Parole con errori di ortografia, spazi finali, prefissi indesiderati, maiuscole/minuscole non corrette e caratteri non stampabili creano una brutta prima impressione. E questi non sono che una piccola parte dell'elenco di elementi negativi che possono essere presenti nei dati. Ma basta darsi un po' da fare per ripulire come si deve i fogli di lavoro con Microsoft Excel.

Non sempre si ha il controllo del formato e del tipo di dati che vengono importati da un'origine dati esterna, ad esempio un database, un file di testo o una pagina Web. Per poter analizzare i dati, spesso è necessario ripulirli. Fortunatamente, Excel include molte caratteristiche che consentono di ottenere dati con l'esatto formato desiderato. In alcuni casi, l'attività è semplice e può essere eseguita con una caratteristica specifica per l'operazione. Ad esempio, è possibile usare facilmente il correttore ortografico per correggere le parole con errori di ortografia nelle colonne che contengono commenti o descrizioni. O, se si vogliono rimuovere le righe duplicate, è possibile farlo rapidamente usando la finestra di dialogo Rimuovi duplicati.

In altri casi, invece, potrebbe essere necessario modificare una o più colonne con una formula per convertire i valori di importati in nuovi valori. Ad esempio, se si vogliono rimuovere gli spazi finali, è possibile creare una nuova colonna per pulire i dati con una formula, inserire i dati nella nuova colonna, convertire le formule della nuova colonna in valori e quindi rimuovere la colonna originale.

I passaggi di base per la pulizia dei dati sono i seguenti:

  1. Importare i dati da un'origine dati esterna.

  2. Creare una copia di backup dei dati originali in una cartella di lavoro separata.

  3. Verificare che i dati nelle righe e nelle colonne siano in formato tabulare con: dati simili in ogni colonna, tutte le colonne e le righe visibili e nessuna riga vuota all'interno dell'intervallo. Per risultati ottimali, usare una tabella di Excel.

  4. Eseguire prima le attività che non richiedono la modifica della colonna, ad esempio il controllo ortografico o le operazioni con Trova e sostituisci.

  5. Successivamente, eseguire le attività che richiedono la modifica della colonna. I passaggi generali per la modifica di una colonna sono:

    1. Inserire una nuova colonna (B) accanto alla colonna originale (A) da pulire.

    2. Aggiungere una formula che trasformerà i dati nella parte superiore della nuova colonna (B).

    3. Inserire la formula nella nuova colonna (B). In una tabella di Excel una colonna calcolata viene creata automaticamente con i valori inseriti.

    4. Selezionare la nuova colonna (B), copiarla e incollarla come valori nella nuova colonna (B).

    5. Rimuovere la colonna originale (A), che converte la nuova colonna da B ad A.

Per pulire periodicamente la stessa origine dati, valutare la possibilità di registrare una macro o di scrivere codice per automatizzare l'intero processo. Esistono anche diversi componenti aggiuntivi esterni scritti da fornitori di terze parti, elencati nella sezione Provider di terze parti che possono essere usati se non si ha il tempo o le risorse per automatizzare il processo personalmente.

Altre informazioni

Descrizione

Panoramica della connessione (importazione) di dati

Descrive tutti i metodi di importazione di dati esterni in Office Excel.

Riempire automaticamente con dati le celle di un foglio di lavoro

Mostra come usare il comando Riempimento.

Creare o eliminare una tabella Excel

Aggiungere o rimuovere righe e colonne da una tabella di Excel

Usare le colonne calcolate in una tabella di Excel

Mostra come creare una tabella di Excel e aggiungere o eliminare colonne o le colonne calcolate.

Creare una macro

Mostra diversi metodi per automatizzare le attività ripetitive con una macro.

Il correttore ortografico può essere usato non solo per trovare parole con errori di ortografia, ma anche valori usati in modo incoerente, ad esempio nomi di prodotto o società, aggiungendo tali valori a un dizionario personalizzato.

Altre informazioni

Descrizione

Controllare l'ortografia e la grammatica

Mostra come correggere le parole con errori di ortografia in un foglio di lavoro.

Usare dizionari personalizzati per aggiungere parole al correttore ortografico

Spiega come usare i dizionari personalizzati.

Il problema delle righe duplicate è molto frequente quando si importano i dati. È consigliabile filtrare prima per i valori univoci per verificare che i risultati siano quelli desiderati e quindi rimuovere i valori duplicati.

Altre informazioni

Descrizione

Filtrare i valori univoci o rimuovere i valori duplicati

Mostra due procedure strettamente correlate: come filtrare per le righe univoche e come rimuovere righe duplicate.

Per rimuovere una stringa iniziale comune, ad esempio un'etichetta seguita da due punti e spazio, o un suffisso, ad esempio una frase tra parentesi obsoleta o non necessaria alla fine della stringa, trovare le istanze del testo specifico e sostituirle con altro testo o nessun testo.

Altre informazioni

Descrizione

Verificare se una cella contiene testo (senza distinzione tra maiuscole e minuscole)

Verificare se una cella contiene testo (con distinzione tra maiuscole e minuscole)

Mostra come usare il comando Trova e molte funzioni di ricerca del testo.

Rimuovere caratteri dal testo

Mostra come usare il comando Sostituisci e molte funzioni di rimozione del testo.

Trovare o sostituire testo e numeri in un foglio di lavoro

Trova e sostituisci

Mostra come usare le finestre di dialogo Trova e Sostituisci.

TROVA, TROVA.B

CERCA, CERCA.B

SOSTITUISCI, SOSTITUISCI.B

SOSTITUISCI

SINISTRA, SINISTRAB

DESTRA, DESTRA.B

LUNGHEZZA, LUNGB

STRINGA.ESTRAI, MEDIA.B

Queste sono le funzioni che possono essere usate per eseguire varie operazioni di modifica delle stringhe, ad esempio cercare e sostituire una sottostringa all'interno di una stringa, estrarre parti di una stringa o determinare la lunghezza di una stringa.

A volte il testo viene visualizzato con formattazione mista, soprattutto per quanto riguarda l'uso di maiuscole/minuscole del testo. Usando una o più delle tre funzioni relative alle lettere maiuscole/minuscole, è possibile convertire il testo in lettere minuscole, ad esempio per gli indirizzi di posta elettronica, in lettere maiuscole, ad esempio per i codici prodotto, o applicando l'iniziale maiuscola, ad esempio per i nomi o i titoli.

Altre informazioni

Descrizione

Modificare la combinazione di lettere maiuscole o minuscole del testo

Mostra come usare le tre funzioni relative alle lettere maiuscole/minuscole.

MINUSC

Converte in minuscolo tutte le lettere maiuscole contenute in una stringa di testo.

MAIUSC.INIZ

Converte in maiuscolo la prima lettera di una stringa di testo e tutte le altre lettere che seguono un qualsiasi carattere diverso da una lettera. Le rimanenti lettere vengono convertite in minuscolo.

MAIUSC

Converte in maiuscolo il testo.

A volte i valori di testo contengono spazi iniziali, spazi finali o più spazi incorporati (valori del set di caratteri Unicode 32 e 160) oppure caratteri non stampabili (valori del set di caratteri Unicode da 0 a 31, 127, 129, 141, 143, 144 e 157). Questi caratteri a volte possono produrre risultati imprevisti durante le operazioni di ordinamento, filtro o esecuzione di una ricerca. Ad esempio, nell'origine dati esterna gli utenti possono fare errori di battitura aggiungendo inavvertitamente spazi superflui oppure i dati di testo importati da origini esterne possono contenere i caratteri non stampabili incorporati nel testo. Questi caratteri non sono facilmente rilevabili, quindi potrebbe essere difficile capire il motivo di eventuali risultati imprevisti. Per rimuovere questi caratteri indesiderati, è possibile usare una combinazione delle funzioni ANNULLA.SPAZI, LIBERA e SOSTITUISCI.

Altre informazioni

Descrizione

Mostra come rimuovere tutti gli spazi e i caratteri non stampabili dal set di caratteri Unicode.

CODICE

Restituisce un codice numerico per il primo carattere di una stringa di testo.

LIBERA

Rimuove i primi 32 caratteri non stampabili nel codice ASCII a 7 bit (valori da 0 a 31) dal testo.

ANNULLA.SPAZI

Rimuove il carattere di spazio ASCII a 7 bit (valore 32) dal testo.

SOSTITUISCI

È possibile usare la funzione SOSTITUISCI per sostituire i caratteri Unicode di valore più alto (valori 127, 129, 141, 143, 144, 157 e 160) con i caratteri ASCII a 7 bit per cui sono state progettate le funzioni ANNULLA.SPAZI e LIBERA.

Esistono due principali problemi con i numeri che potrebbero richiedere la pulizia dei dati: il numero è stato inavvertitamente importato come testo e il segno negativo deve essere modificato nello standard per l'organizzazione.

Altre informazioni

Descrizione

Convertire in numeri i numeri memorizzati come testo

Mostra come convertire in formato numerico i numeri formattati e memorizzati come testo nelle celle che possono causare errori nei calcoli o nell'ordinamento dei dati.

VALUTA

Converte un numero in formato testo e applica un simbolo di valuta.

TESTO

Converte un valore di testo in un formato numerico specifico.

FISSO

Arrotonda un numero al numero specificato di decimali, lo formatta in formato decimale usando un punto e le virgole e restituisce il risultato in forma di testo.

VALORE

Converte una stringa di testo rappresentante un numero nel numero corrispondente.

I formati di data disponibili sono numerosi e possono essere confusi con codici di parti numerati o altre stringhe contenenti barre o trattini, quindi spesso le date e le ore devono essere convertite e riformattate.

Altre informazioni

Descrizione

Modificare il sistema data, il formato data o la modalità di interpretazione degli anni a due cifre

Descrive come funziona il sistema data in Office Excel.

Convertire gli orari

Mostra come eseguire le conversioni tra le diverse unità di tempo.

Convertire in date le date memorizzate come testo

Mostra come convertire in formato data le date formattate e memorizzate come testo nelle celle che possono causare errori nei calcoli o nell'ordinamento dei dati.

DATA

Restituisce il numero seriale sequenziale che rappresenta una data specifica. Se prima dell'immissione della funzione il formato di cella era Generale, il risultato viene formattato come una data.

DATA.VALORE

Converte una data sotto forma di testo in un numero seriale.

ORARIO

Restituisce il numero decimale di un'ora specifica. Se prima dell'immissione della funzione il formato di cella era Generale, il risultato viene formattato come una data.

ORARIO.VALORE

Restituisce il numero decimale dell'ora rappresentata da una stringa di testo. Il numero decimale è un valore compreso tra 0 e 0,99999999 indicante un'ora tra le 0:00:00 e le 23:59:59.

Un'attività comune dopo l'importazione di dati da un'origine dati esterna consiste nell'unione di due o più colonne in una sola o nella divisione di una colonna in due o più colonne. Si vuole, ad esempio, dividere una colonna che contiene un nome completo in nome e cognome. Oppure dividere una colonna che contiene un campo di indirizzo in colonne separate con via e numero civico, città, area geografica e codice postale. Lo stesso discorso vale per l'unione. Si vogliono unire due colonne Nome e Cognome in una colonna con il nome completo o combinare colonne di indirizzo separate in un'unica colonna. Altri valori comuni che possono richiedere l'unione in un'unica colonna o la divisione in più colonne sono: codici di prodotto, percorsi di file e indirizzi IP (Internet Protocol).

Altre informazioni

Descrizione

Combinare nomi e cognomi

Combinare testo e numeri

Combinare il testo con una data o un'ora

Combinare due o più colonne con una funzione

Mostra esempi tipici della combinazione di valori di due o più colonne.

Dividere il testo in colonne diverse con la Conversione guidata testo in colonne

Mostra come usare la procedura guidata per dividere le colonne in base a diversi delimitatori comuni.

Dividere il testo in colonne diverse con le funzioni

Mostra come usare le funzioni SINISTRA, STRINGA.ESTRAI, DESTRA, CERCA e LUNGHEZZA per dividere una colonna Nome in due o più colonne.

Unire o dividere il contenuto delle celle

Mostra come usare la funzione CONCATENA, l'operatore & (e commerciale) e la Conversione guidata testo in colonne.

Unire le celle o dividere celle unite

Mostra come usare i comandi Unisci celle, Unisci e Unisci e centra.

CONCATENA

Unisce due o più stringhe di testo in una singola stringa.

La maggior parte delle caratteristiche di analisi e formattazione in Office Excel presuppongono la presenza dei dati in un'unica tabella normale bidimensionale. A volte si potrebbe voler trasformare le righe in colonne e le colonne in righe. In altri casi, i dati non sono neanche strutturati in formato tabulare e potrebbe essere necessario convertirli da un formato non tabulare a uno tabulare.

Altre informazioni

Descrizione

MATR.TRASPOSTA

Restituisce un intervallo di celle verticale come intervallo orizzontale e viceversa.

In alcuni casi, gli amministratori del database usano Office Excel per trovare e correggere gli errori di corrispondenza quando due o più tabelle vengono unite. Questa operazione può implicare la riconciliazione di due tabelle di fogli di lavoro diversi, ad esempio per vedere tutti i record di entrambe le tabelle o per confrontare le tabelle e trovare le righe non corrispondenti.

Altre informazioni

Descrizione

Cercare valori in un elenco di dati

Mostra metodi comuni per cercare i dati con le funzioni di ricerca.

CERCA

Restituisce un valore da un intervallo di una riga o di una colonna oppure da una matrice. La funzione CERCA ha due forme di sintassi: vettore e matrice.

CERCA.ORIZZ

Cerca un valore nella riga superiore di una tabella o una matrice di valori e restituisce un valore nella stessa colonna dalla riga indicata nella tabella o nella matrice.

CERCA.VERT

Cerca un valore nella prima colonna di una matrice di tabella e restituisce un valore nella stessa riga da un'altra colonna nella matrice di tabella.

INDICE

Restituisce un valore o il riferimento a un valore da una tabella o un intervallo. La funzione INDICE ha due forme di sintassi: matrice e riferimento.

CONFRONTA

Restituisce la posizione relativa di un elemento in una matrice che corrisponde a un valore specificato nell'ordine specificato. Usare CONFRONTA invece di una delle funzioni CERCA quando è necessario determinare la posizione di un elemento in un intervallo piuttosto che l'elemento stesso.

SCARTO

Restituisce un riferimento a un intervallo spostato rispetto a una cella o a un intervallo di celle di un numero specificato di righe e di colonne. Il riferimento restituito può riferirsi a una cella singola o a un intervallo. È possibile specificare il numero di righe e di colonne dell'intervallo da restituire.

Di seguito è riportato un elenco parziale di provider di terze parti che forniscono prodotti che consentono di ripulire i dati in vari modi.

Nota : Microsoft non fornisce supporto per i prodotti di terze parti.

Provider

Prodotto

Add-in Express Ltd.

Ultimate Suite for Excel, Merge Tables Wizard, Duplicate Remover, Consolidate Worksheets Wizard, Combine Rows Wizard, Cell Cleaner, Random Generator, Merge Cells, Quick Tools for Excel, Random Sorter, Advanced Find & Replace, Fuzzy Duplicate Finder, Split Names, Split Table Wizard, Workbook Manager

Add-Ins.com

Duplicate Finder

AddinTools

AddinTools Assist

J-Walk &Associates, Inc.

Power Utility Pak versione 7

WinPure

ListCleaner Lite
ListCleaner Pro
Clean and Match 2007

Inizio pagina

Amplia le tue competenze
Esplora i corsi di formazione
Ottieni in anticipo le nuove caratteristiche
Partecipa al programma Office Insider

Queste informazioni sono risultate utili?

Grazie per i tuoi commenti e suggerimenti

Grazie per il tuo feedback! Potrebbe essere utile metterti in contatto con uno dei nostri operatori del supporto di Office.

×