Dieci modi principali per pulire i dati

Errori ortografici, spazi finali ricorrenti, prefissi indesiderati, applicazione di maiuscole/minuscole errate e caratteri non stampabili contribuiscono a creare una prima impressione negativa. Questo è solo un elenco parziale dei diversi modi in cui l'aspetto dei dati può risultare visivamente compromesso. Questo articolo illustra come procedere alla pulizia dei dati contenuti nei fogli di lavoro di Microsoft Excel.

Non sempre si ha il controllo sul formato e il tipo di dati importati da un'origine dati esterna, ad esempio un database, un file di testo o una pagina Web. Prima di poter analizzare i dati, spesso è necessario effettuarne la pulizia. Excel offre molte funzionalità che consentono di applicare ai dati l'esatto formato desiderato. Qualche volta è disponibile una funzionalità specifica che consente di eseguire l'attività in modo semplice e diretto. Ad esempio, è possibile usare il correttore ortografico per rimuovere facilmente gli errori ortografici nelle colonne che contengono commenti o descrizioni, oppure usare la finestra di dialogo Rimuovi duplicati per rimuovere velocemente le righe duplicate.

Altre volte può essere necessario modificare una o più colonne usando una formula per convertire i valori importati in nuovi valori. Ad esempio, per rimuovere gli spazi finali è possibile creare una nuova colonna per la pulizia dei dati mediante una formula, compilando la nuova colonna, convertendo le formule della nuova colonna in valori, quindi rimuovendo la colonna originale.

Questa è la procedura di base per la pulizia dei dati:

  1. Importare i dati da un'origine dati esterna.

  2. Creare una copia di backup dei dati originali in una cartella di lavoro distinta.

  3. Assicurarsi che i dati siano in un formato tabulare di righe e colonne con dati simili in ogni colonna, tutte le colonne e le righe visibili e nessuna riga vuota nell'intervallo. Per ottenere i migliori risultati, usare una tabella di Excel.

  4. Eseguire per prime le attività che non richiedono la modifica delle colonne, ad esempio il controllo ortografico o la sostituzione di testo tramite le finestra di dialogo Trova e sostituisci.

  5. Eseguire quindi le attività che richiedono la modifica delle colonne. Ecco la procedura generale per modificare una colonna:

    1. Inserire una nuova colonna (B) accanto alla colonna originale (A) che richiede un'operazione di pulizia.

    2. Aggiungere una formula per la trasformazione dei dati all'inizio della nuova colonna (B).

    3. Ricopiare la formula nella nuova colonna (B). In una tabella di Excel viene creata automaticamente una colonna calcolata con i valori risultanti.

    4. Selezionare la nuova colonna (B), copiarla, quindi incollarla come valori nella nuova colonna (B).

    5. Rimuovere la colonna originale (A). La nuova colonna verrà convertita da B ad A.

Per la pulizia periodica della stessa origine dati, è possibile registrare una macro o creare codice per automatizzare l'intero processo. Sono disponibili inoltre numerosi componenti aggiuntivi esterni creati da fornitori di terze parti, elencati nella sezione Fornitori di terze parti, che possono essere usati se non si dispone delle risorse e del tempo necessari per automatizzare direttamente il processo.

Altre informazioni

Descrizione

Informazioni generali sulla connessione (importazione) dei dati

Descrive tutti i metodi per l'importazione di dati esterni in Office Excel.

Riempire automaticamente le celle dei fogli di lavoro con dati

Illustra come usare il comando Riempimento.

Creare o eliminare una tabella di Excel

Aggiungere o rimuovere righe e colonne di tabelle di Excel

Creare, modificare o rimuovere una colonna calcolata in una tabella di Excel

Descrive come creare una tabella di Excel e aggiungere o eliminare colonne o colonne calcolate.

Creare una macro

Illustra i vari modi per automatizzare le attività ripetitive usando una macro.

Il controllo ortografico è utile non solo per trovare gli errori ortografici, ma anche i valori non usati in modo coerente, ad esempio nomi di prodotti o società, aggiungendoli a un dizionario personalizzato.

Altre informazioni

Descrizione

Controllo ortografico e grammaticale

Mostra come correggere gli errori ortografici in un foglio di lavoro.

Usare dizionari personalizzati per aggiungere parole al correttore ortografico

Spiega come usare i dizionari personalizzati.

Le righe duplicate costituiscono un problema frequente associato all'importazione dei dati. Prima di rimuovere i valori duplicati è opportuno applicare un filtro ai valori univoci per assicurarsi che i risultati siano quelli desiderati.

Altre informazioni

Descrizione

Filtrare i valori univoci o rimuovere i valori duplicati

Illustra due procedure correlate: come filtrare le righe univoche e come rimuovere le righe duplicate.

Potrebbe essere utile rimuovere una stringa iniziale comune, ad esempio un'etichetta seguita da due punti e uno spazio, oppure un suffisso, ad esempio una frase tra parentesi posta alla fine della stringa che è diventata obsoleta o inutile. A questo scopo è possibile trovare le istanze del testo e sostituirlo con una stringa di testo vuota o con altro testo.

Altre informazioni

Descrizione

Controllare se una cella contiene testo (senza distinzione tra maiuscole e minuscole)

Controllare se una cella contiene testo (distinzione tra maiuscole e minuscole)

Mostra come usare il comando Trova e alcune funzioni per trovare testo.

Rimuovere caratteri dal testo

Mostra come usare il comando Sostituisci e alcune funzioni per rimuovere testo.

Trovare o sostituire testo e numeri in un foglio di lavoro

Finestre di dialogo Trova e Sostituisci

Spiega come usare le finestre di dialogo Trova e Sostituisci.

TROVA, TROVA.B

RICERCA, CERCA.B

RIMPIAZZA, SOSTITUISCI.B

SOSTITUISCI

SINISTRA, SINISTRAB

DESTRA, DESTRA.B

LUNGHEZZA, LUNGB

STRINGA.ESTRAI, MEDIA.B

Queste funzioni possono essere usate per eseguire diverse attività di modifica delle stringhe, ad esempio trovare e sostituire una sottostringa all'interno di una stringa, estrarre parti di una stringa o determinare la lunghezza di una stringa.

La formattazione del testo risulta a volte incoerente, specialmente per quanto riguarda l'utilizzo di lettere maiuscole o minuscole. Con una o più delle tre funzioni MAIUSC/MINUSC è possibile convertire il testo in lettere minuscole, come gli indirizzi di posta elettronica, in lettere maiuscole, come i codici di prodotti, o in lettere maiuscole iniziali, come i nomi o i titoli di libri.

Altre informazioni

Descrizione

Convertire il testo in lettere maiuscole o minuscole

Illustra come usare le tre funzioni MAIUSC/MINUSC.

MINUSC

Converte in lettere minuscole tutte le lettere maiuscole contenute in una stringa di testo.

MAIUSC.INIZ

Converte in maiuscolo la prima lettera di una stringa di testo e tutte le altre lettere che seguono un qualsiasi carattere diverso da una lettera. Le rimanenti lettere vengono convertite in minuscolo.

MAIUSC

Converte il testo in lettere maiuscole.

Può capitare che i valori di testo contengano spazi iniziali, spazi finali, più spazi incorporati (valori 32 e 160 del set di caratteri Unicode) o caratteri non stampabili (valori da 0 a 31, 127, 129, 141, 143, 144 e 157 del set di caratteri Unicode). Tali caratteri possono a volte generare risultati imprevisti quando si eseguono le operazioni di ordinamento, filtro o ricerca. Ad esempio, nell'origine dati esterna gli utenti possono commettere errori tipografici aggiungendo accidentalmente spazi supplementari oppure nei dati di testo importati da origini esterne possono essere presenti caratteri non stampabili. Poiché non è semplice notare tali caratteri, in presenza di risultati imprevisti potrebbe essere difficile identificare il problema. Per rimuovere i caratteri indesiderati, è possibile usare una combinazione delle funzioni ANNULLA.SPAZI, LIBERA e SOSTITUISCI.

Altre informazioni

Descrizione

Rimuovere spazi e caratteri non stampabili dal testo

Descrive come rimuovere tutti gli spazi e i caratteri non stampabili dal set di caratteri Unicode.

CODICE

Restituisce un codice numerico per il primo carattere di una stringa di testo

LIBERA

Rimuove dal testo i primi 32 caratteri non stampabili nel codice ASCII a 7 bit (valori da 0 a 31).

ANNULLA.SPAZI

Rimuove dal testo il carattere spazio ASCII a 7 bit (valore 32).

SOSTITUISCI

È possibile usare la funzione SOSTITUISCI per sostituire i caratteri Unicode con il valore più alto (valori 127, 129, 141, 143, 144, 157 e 160) con i caratteri ASCII a 7 bit per cui sono state progettate le funzioni ANNULLA.SPAZI e LIBERA.

I numeri presentano due problemi principali che potrebbero richiedere la pulizia dei dati: il numero è stato inavvertitamente importato come testo e il segno negativo deve essere modificato in base allo standard dell'organizzazione.

Altre informazioni

Descrizione

Convertire in numeri i numeri memorizzati come testo

Descrive come convertire in formato numerico i numeri formattati e memorizzati nelle celle come testo, che potrebbero causare problemi di calcolo o generare ordinamenti non corretti.

VALUTA

Converte i numeri in formato testo e applica un simbolo di valuta.

TESTO

Converte un valore in testo assegnandogli un formato numerico specifico.

FISSO

Arrotonda un numero al numero specificato di decimali, formattandolo con i separatori delle migliaia e la virgola decimale, e restituisce il risultato in forma di testo.

VALORE

Converte una stringa di testo che rappresenta un numero nel numero corrispondente.

Poiché i formati di data sono numerosi e di diverso tipo e poiché possono essere confusi con i codici di parti numerate o altre stringhe contenenti barre o trattini, date e ore devono spesso essere convertite e riformattate.

Altre informazioni

Descrizione

Modificare il sistema di data, il formato di data o la modalità di interpretazione degli anni a due cifre

Descrive il funzionamento del sistema di data in Office Excel.

Convertire gli orari

Illustra la modalità di conversione tra diverse unità di tempo.

Convertire in date le date memorizzate come testo

Descrive come convertire in formato data le date formattate e memorizzate nelle celle come testo, che potrebbero causare problemi di calcolo o generare ordinamenti non corretti.

DATA

Restituisce il numero seriale in sequenza che rappresenta una data specifica. Se prima dell'immissione della funzione il formato di cella era Generale, il risultato viene formattato come una data.

DATA.VALORE

Converte una data rappresentata da testo in un numero seriale.

ORA

Restituisce il numero decimale di un'ora specifica. Se prima dell'immissione della funzione il formato di cella era Generale, il risultato viene formattato come una data.

ORARIO.VALORE

Restituisce il numero decimale dell'ora rappresentata da una stringa di testo. Il numero decimale è un valore compreso tra 0 e 0,99999999 indicante un'ora tra le 0.00.00 e le 23.59.59.

Un'attività comune dopo l'importazione dei dati da un'origine dati esterna consiste nell'unire due o più colonne in una sola o nel dividere una colonna in due o più colonne. Ad esempio, potrebbe essere necessario dividere una colonna contenente un nome completo in colonne con nome e cognome oppure una colonna contenente un campo indirizzo in colonne distinte per via, città, provincia e codice postale. Potrebbe, viceversa, essere utile unire una colonna con il nome e una con il cognome in una colonna con il nome completo o combinare colonne di indirizzi separate in una sola. Altri valori comuni che potrebbero richiedere l'unione in una colonna o la divisione in più colonne includono codici prodotto, percorsi di file e indirizzi IP (Internet Protocol).

Altre informazioni

Descrizione

Combinare nomi e cognomi

Combinare testo e numeri

Combinare il testo con una data o un orario

Combinare due o più colonne tramite una funzione

Fornisce tipici esempi relativi alla combinazione di valori da due o più colonne.

Dividere i nomi usando la Conversione guidata testo in colonne

Illustra come usare questa procedura guidata per dividere colonne in base a diversi delimitatori comuni.

Dividere il testo tra le colonne usando le funzioni

Descrive come usare le funzioni SINISTRA, STRINGA.ESTRAI, DESTRA, RICERCA e LUNGHEZZA per dividere una colonna contenente il nome in due o più colonne.

Combinare o dividere il contenuto delle celle

Spiega come usare la funzione CONCATENA, l'operatore & (e commerciale) e la Conversione guidata testo in colonne.

Unire celle o dividere celle unite

Descrive come usare i comandi Unisci celle, Unisci e Unisci e centra.

CONCATENA

Unisce due o più stringhe di testo in un'unica stringa di testo.

Nella maggior parte delle caratteristiche di analisi e formattazione di Office Excel si presuppone che i dati siano presenti in un'unica tabella bidimensionale. A volte può essere necessario convertire le righe in colonne e le colonne in righe, altre volte i dati non sono strutturati ed è necessario trasformarli in un formato tabulare.

Altre informazioni

Descrizione

MATR.TRASPOSTA

Restituisce un intervallo verticale di celle in un intervallo orizzontale e viceversa.

Gli amministratori di database usano a volte Office Excel per trovare e correggere errori di corrispondenza quando due o più tabelle sono unite in join. Questa operazione può ad esempio comportare la riconciliazione di due tabelle da diversi fogli di lavoro, per visualizzare tutti i record in entrambe le tabelle o per confrontare le tabelle e trovare le righe non corrispondenti.

Altre informazioni

Descrizione

Cercare i valori in un elenco di dati

Illustra i metodi comuni di ricerca dei dati usando le funzioni di ricerca.

CERCA

Restituisce un valore da un intervallo di una riga o di una colonna o da una matrice. La funzione CERCA dispone di due sintassi: vettore e matrice.

CERCA.ORIZZ

Cerca un valore nella prima riga di una tabella o di una matrice di valori e restituisce un valore nella stessa colonna da una riga specificata nella tabella o nella matrice.

CERCA.VERT

Cerca un valore nella prima colonna di una matrice tabella e lo restituisce nella stessa riga di un'altra colonna.

INDICE

Restituisce un valore o il riferimento a un valore da una tabella o un intervallo. La funzione INDICE dispone di due sintassi, quella per matrice e quella per riferimento.

CONFRONTA

Restituisce la posizione relativa di un elemento in una matrice che corrisponde a un valore specificato in un ordine particolare. Utilizzare la funzione CONFRONTA invece di una delle sintassi della funzione CERCA quando è necessario determinare la posizione di un elemento all'interno di un intervallo piuttosto che l'elemento stesso.

SCARTO

Restituisce un riferimento a un intervallo spostato rispetto a una cella o a un intervallo di celle di un numero specificato di righe e di colonne. Il riferimento restituito può riferirsi a una cella singola o a un intervallo. È possibile specificare il numero di righe e di colonne dell'intervallo da restituire.

Di seguito è riportato un elenco parziale di fornitori di terze parti che offrono prodotti utilizzabili per eseguire la pulizia dei dati in vari modi.

Inizio pagina

Queste informazioni sono risultate utili?

Ottimo! Altri commenti?

Cosa possiamo migliorare?

Grazie per i tuoi commenti e suggerimenti

×