I dieci metodi principali per la pulizia dei dati

Errori ortografici, spazi finali ricorrenti, prefissi indesiderati, applicazione di maiuscole/minuscole errate e caratteri non stampabili conferiscono un'impressione negativa ai fogli di lavoro. Questo è solo un elenco incompleto dei diversi modi in cui l'aspetto dei dati può risultare visivamente compromesso. In questo articolo verrà illustrato come procedere alla pulizia dei dati contenuti nei fogli di lavoro di Microsoft Office Excel.

In questo articolo

Nozioni fondamentali sulla pulizia dei dati

Controllo ortografia

Rimozione di righe duplicate

Ricerca e sostituzione di testo

Modifica di maiuscole/minuscole nel testo

Rimozione di spazi e caratteri non stampabili dal testo

Correzione di numeri e simboli di cancelletto

Correzione di date e ore

Unione e divisione di colonne

Trasformazione e ridisposizione di colonne e righe

Riconciliazione dei dati delle tabelle mediante join o corrispondenza

Fornitori di terze parti

Torna all'inizio

Nozioni fondamentali sulla pulizia dei dati

Non sempre è possibile controllare il formato e il tipo di dati importati da un'origine dati esterna, ad esempio un database, un file di testo o una pagina Web. Prima di poter analizzare i dati, spesso è necessario effettuarne la pulizia. In Office Excel sono disponibili molte funzionalità che consentono di applicare ai dati l'esatto formato desiderato. Qualche volta è disponibile una funzionalità specifica che consente di eseguire l'attività in modo semplice e diretto. Ad esempio, è possibile utilizzare il correttore ortografico per rimuovere facilmente gli errori ortografici nelle colonne che contengono commenti o descrizioni, oppure è possibile utilizzare la finestra di dialogo Rimuovi duplicati se si desidera rimuovere velocemente le righe duplicate.

Altre volte può essere necessario modificare una o più colonne utilizzando una formula per convertire i valori importati in nuovi valori. Ad esempio, per rimuovere gli spazi finali, è possibile creare una nuova colonna per la pulizia dei dati mediante una formula, compilando la nuova colonna, convertendo le formule della nuova colonna in valori, quindi rimuovendo la colonna originale.

Di seguito è riportata la procedura di base per la pulizia dei dati:

  1. Importare i dati da un'origine dati esterna.

  2. Creare una copia di backup dei dati originali in una cartella di lavoro distinta.

  3. Assicurarsi che i dati siano in un formato tabulare di righe e colonne con dati simili in ogni colonna, tutte le colonne e le righe visibili e nessuna riga vuota nell'intervallo. Per ottenere i migliori risultati, utilizzare una tabella di Excel.

  4. Eseguire per prime le attività che non richiedono la modifica delle colonne, ad esempio il controllo ortografico o la sostituzione di testo tramite le finestra di dialogo Trova e sostituisci.

  5. Eseguire quindi le attività che richiedono la modifica delle colonne. Di seguito è riportata la procedura generale per modificare una colonna:

    1. Inserire una nuova colonna (B) accanto alla colonna originale (A) che richiede un'operazione di pulizia.

    2. Aggiungere una formula per la trasformazione dei dati nella parte superiore della nuova colonna (B).

    3. Ricopiare la formula nella nuova colonna (B). In una tabella di Excel viene creata automaticamente una colonna calcolata con i valori risultanti.

    4. Selezionare la nuova colonna (B), copiarla, quindi incollarla come valori nella nuova colonna (B).

    5. Rimuovere la colonna originale (A). La nuova colonna verrà convertita da B ad A.

Per la pulizia periodica della stessa origine dati, è possibile registrare una macro o creare codice per automatizzare l'intero processo. Sono disponibili inoltre numerosi componenti aggiuntivi esterni creati da fornitori di terze parti, di cui viene fornito un elenco nella sezione Fornitori di terze parti, che è possibile utilizzare se non si dispone delle risorse e del tempo necessari per automatizzare direttamente il processo.

Ulteriori informazioni

Descrizione

Informazioni generali sulla connessione (importazione) dei dati (in lingua inglese)

Vengono descritti tutti i metodi per l'importazione di dati esterni in Office Excel.

Riempire automaticamente le celle dei fogli di lavoro con dati

Viene illustrato come utilizzare il comando Riempimento.

Creare o eliminare una tabella Excel

Aggiungere o rimuovere righe e colonne di tabelle Excel

Creare, modificare o rimuovere una colonna calcolata in una tabella Excel

Viene descritto come creare una tabella Excel e aggiungere o eliminare colonne o colonne calcolate.

Creare una macro

Vengono illustrati i vari modi per automatizzare le attività ripetitive utilizzando una macro.

Torna all'inizio

Controllo ortografia

Il controllo ortografico è utile non solo per trovare gli errori ortografici, ma anche i valori non utilizzati in modo coerente, ad esempio nomi di prodotti o società, aggiungendoli a un dizionario personalizzato.

Ulteriori informazioni

Descrizione

Controllo ortografico e grammaticale

Mostra come correggere gli errori ortografici in un foglio di lavoro.

Utilizzo di dizionari personalizzati per aggiungere parole al correttore ortografico

Viene spiegato come utilizzare i dizionari personalizzati.

Torna all'inizio

Rimozione di righe duplicate

Le righe duplicate costituiscono un problema comune associato all'importazione dei dati. Prima di rimuovere i valori duplicati è opportuno iniziare con l'applicazione di un filtro ai valori univoci per assicurarsi che i risultati siano quelli desiderati.

Ulteriori informazioni

Descrizione

Filtrare i valori univoci o rimuovere i valori duplicati

Vengono illustrate due procedure correlate: come filtrare le righe univoche e come rimuovere le righe duplicate.

Torna all'inizio

Ricerca e sostituzione di testo

Potrebbe essere utile rimuovere una stringa iniziale comune, ad esempio un'etichetta seguita da due punti e uno spazio, oppure un suffisso, ad esempio una frase tra parentesi posta alla fine della stringa che è diventata obsoleta o inutile. A questo scopo è possibile trovare istanze del testo e sostituirlo con una stringa di testo vuota o con altro testo.

Ulteriori informazioni

Descrizione

Controllare se una cella contiene testo (senza distinzione tra maiuscole e minuscole)

Controllare se una cella contiene testo (distinzione tra maiuscole e minuscole

Viene illustrato come utilizzare il comando Trova e alcune funzioni per trovare testo.

Rimuovere caratteri dal testo

Viene descritto come utilizzare il comando Sostituisci e alcune funzioni per rimuovere testo.

Trovare o sostituire testo e numeri in un foglio di lavoro

Finestra di dialogo Trova e sostituisci

Viene spiegato come utilizzare le finestre di dialogo Trova e Sostituisci.

TROVA, TROVA.B

RICERCA, CERCA.B

RIMPIAZZA, SOSTITUISCI.B

SOSTITUISCI

SINISTRA, SINISTRAB

DESTRA, DESTRA.B

LUNGHEZZA, LUNGB

STRINGA.ESTRAI, MEDIA.B

Queste funzioni possono essere utilizzate per eseguire diverse attività di modifica delle stringhe, ad esempio trovare e sostituire una sottostringa all'interno di una stringa, estrarre parti di una stringa o determinare la lunghezza di una stringa.

Torna all'inizio

Modifica di maiuscole/minuscole nel testo

La formattazione del testo risulta a volte incoerente, specialmente per quanto riguarda l'utilizzo di lettere maiuscole o minuscole. Con una o più delle tre funzioni MAIUSC/MINUSC è possibile convertire il testo in lettere minuscole, ad esempio gli indirizzi di posta elettronica, in lettere maiuscole, ad esempio codici di prodotti, o in lettere maiuscole iniziali, ad esempio nomi o titoli di libri.

Ulteriori informazioni

Descrizione

Convertire il testo in lettere maiuscole o minuscole

Viene descritto come utilizzare le tre funzioni MAIUSC/MINUSC.

MINUSC

Consente di convertire in lettere minuscole tutte le lettere maiuscole contenute in una stringa di testo.

MAIUSC.INIZ

Converte in maiuscolo la prima lettera di una stringa di testo e tutte le altre lettere che seguono un qualsiasi carattere diverso da una lettera. Le rimanenti lettere vengono convertite in minuscolo.

MAIUSC

Consente di convertire il testo in lettere maiuscole.

Torna all'inizio

Rimozione di spazi e caratteri non stampabili dal testo

Può accadere che i valori di testo contengano caratteri spazio iniziali, finali o multipli incorporati (valori del set di caratteri Unicode 32 e 160) oppure caratteri non stampabili (valori del set di caratteri Unicode da 0 a 31, 127, 129, 141, 143, 144 e 157). Questi caratteri possono a volte causare risultati imprevisti durante le operazioni di ordinamento, filtro o ricerca. Ad esempio, nell'origine dati esterna è possibile che gli utenti commettano inavvertitamente errori tipografici aggiungendo caratteri spazio supplementari oppure è possibile che i dati di testo importati da origini esterne contengano caratteri non stampabili incorporati nel testo. Poiché questi caratteri non vengono facilmente osservati, i risultati imprevisti possono risultare difficili da interpretare. Per rimuovere questi caratteri indesiderati è possibile utilizzare una combinazione delle funzioni ANNULLA.SPAZI, LIBERA e SOSTITUISCI.

Ulteriori informazioni

Descrizione

Rimuovere spazi e caratteri non stampabili dal testo

Viene descritto come rimuovere tutti gli spazi e i caratteri non stampabili dal set di caratteri Unicode.

CODICE

Restituisce un codice numerico per il primo carattere di una stringa di testo.

LIBERA

Rimuove dal testo i primi 32 caratteri non stampabili nel codice ASCII a 7 bit (valori da 0 a 31).

ANNULLA.SPAZI

Rimuove dal testo il carattere spazio ASCII a 7 bit (valore 32).

SOSTITUISCI

È possibile utilizzare la funzione SOSTITUISCI per sostituire i caratteri Unicode con il valore più alto (valori 127, 129, 141, 143, 144, 157 e 160) con i caratteri ASCII a 7 bit per cui sono state progettate le funzioni ANNULLA.SPAZI e LIBERA.

Torna all'inizio

Correzione di numeri e simboli di cancelletto

I numeri presentano due problemi principali che potrebbero richiedere la pulizia dei dati: il numero è stato inavvertitamente importato come testo ed è necessario modificare il segno negativo in base allo standard dell'organizzazione.

Ulteriori informazioni

Descrizione

Formati numerici disponibili

Vengono elencati tutti i formati numerici disponibili.

Convertire in numeri i numeri memorizzati come testo

Viene descritto come convertire in formato numerico i numeri formattati e memorizzati nelle celle come testo, che potrebbero causare problemi di calcolo o generare ordinamenti non corretti.

VALUTA

Converte i numeri in formato testo e applica un simbolo di valuta.

TESTO

Converte un valore di testo in un formato numerico specifico.

FISSO

Arrotonda un numero al numero di decimali specificato, applica al numero il formato decimale utilizzando come separatore delle migliaia il punto e la virgola e restituisce il risultato in formato testo.

VALORE

Converte una stringa di testo che rappresenta un numero nel numero corrispondente.

Torna all'inizio

Correzione di date e ore

Poiché i formati di data sono numerosi e di diverso tipo e poiché possono essere confusi con i codici di parti numerate o altre stringhe contenenti barre o trattini, date e ore devono spesso essere convertite e riformattate.

Ulteriori informazioni

Descrizione

Modificare il sistema di data, il formato di data o la modalità di interpretazione degli anni a due cifre

Viene descritto il funzionamento del sistema di data in Office Excel.

Convertire gli orari

Viene illustrata la modalità di conversione tra diverse unità di tempo.

Convertire in date le date memorizzate come testo

Viene descritto come convertire in formato data le date formattate e memorizzate nelle celle come testo, che potrebbero causare problemi di calcolo o generare ordinamenti non corretti.

DATA

Restituisce il numero seriale in sequenza che rappresenta una data specifica. Se prima dell'immissione della funzione il formato di cella era Generale, il risultato viene formattato come una data.

DATA.VALORE

Converte una data rappresentata da testo in un numero seriale.

ORARIO

Restituisce il numero decimale di un'ora specifica. Se prima dell'immissione della funzione il formato di cella era Generale, il risultato viene formattato come una data.

ORARIO.VALORE

Restituisce il numero decimale dell'ora rappresentata da una stringa di testo. Il numero decimale è un valore compreso tra 0 (zero) e 0,99999999 indicante un'ora tra 0.00.00 e 23.59.59.

Torna all'inizio

Unione e divisione di colonne

Un'attività comune dopo l'importazione dei dati da un'origine dati esterna consiste nell'unire due o più colonne in una o nel dividere una colonna in due o più colonne. Ad esempio, potrebbe essere necessario dividere una colonna contenente un nome completo in colonne con nome e cognome oppure una colonna contenente un campo indirizzo in colonne distinte per via, città, regione e codice postale. Potrebbe, viceversa, essere utile unire una colonna con il nome e una con il cognome in una colonna con il nome completo o combinare colonne di indirizzi separate in una sola. Altri valori comuni che potrebbero richiedere l'unione in una colonna o la divisione in più colonne includono codici prodotto, percorsi di file e indirizzi IP (Internet Protocol).

Ulteriori informazioni

Descrizione

Combinare nomi e cognomi

Combinare testo e numeri

Combinare il testo con una data o un orario

Combinare due o più colonne tramite una funzione

Vengono forniti tipici esempi relativi alla combinazione di valori da due o più colonne.

Dividere i nomi utilizzando Conversione guidata testo in colonne

Viene illustrato come utilizzare questa procedura guidata per dividere colonne in base a diversi delimitatori comuni.

Dividere il testo tra le colonne utilizzando le funzioni

Viene descritto come utilizzare le funzioni SINISTRA, STRINGA.ESTRAI, DESTRA, RICERCA e LUNGHEZZA per dividere una colonna contenente il nome in due o più colonne.

Combinare o dividere il contenuto delle celle

Viene spiegato come utilizzare la funzione CONCATENA, l'operatore & (e commerciale) e la Conversione guidata testo in colonne.

Unire celle o dividere celle unite

Viene descritto come utilizzare i comandi Unisci celle, Unisci e Unisci e centra.

CONCATENA

Unisce due o più stringhe di testo in una sola.

Torna all'inizio

Trasformazione e ridisposizione di colonne e righe

Nella maggior parte delle funzionalità di analisi e formattazione di Office Excel si presuppone che i dati siano presenti in un'unica tabella bidimensionale. A volte può essere necessario convertire le righe in colonne e le colonne in righe, altre volte i dati non sono strutturati ed è necessario trasformarli in un formato tabulare.

Ulteriori informazioni

Descrizione

MATR.TRASPOSTA

Restituisce un intervallo verticale di celle in un intervallo orizzontale e viceversa.

Torna all'inizio

Riconciliazione dei dati delle tabelle mediante join o corrispondenza

Gli amministratori di database utilizzano a volte Office Excel per trovare e correggere errori di corrispondenza quando due o più tabelle sono unite in join. Questa operazione può comportare la riconciliazione di due tabelle da diversi fogli di lavoro, ad esempio, per visualizzare tutti i record in entrambe le tabelle o per confrontare le tabelle e trovare le righe non corrispondenti.

Ulteriori informazioni

Descrizione

Cercare valori in un elenco di dati

Vengono illustrati i metodi comuni di ricerca dei dati utilizzando le funzioni di ricerca.

CERCA

Restituisce un valore da un intervallo di una riga o di una colonna o da una matrice. La funzione CERCA dispone di due forme di sintassi: vettore e matrice.

CERCA.ORIZZ

Cerca un valore nella prima riga di una tabella o di una matrice di valori e restituisce un valore nella stessa colonna da una riga specificata nella tabella o nella matrice.

CERCA.VERT

Cerca un valore nella prima colonna di una matrice tabella e restituisce un valore sulla stessa riga da un'altra colonna della matrice tabella.

INDICE

Restituisce un valore o il riferimento a un valore all'interno di una tabella o di un intervallo. La funzione INDICE dispone di due sintassi: matrice e riferimento.

CONFRONTA

Restituisce la posizione relativa di un elemento in una matrice che corrisponde a un valore specificato in un ordine particolare. Utilizzare la funzione CONFRONTA invece di una delle sintassi della funzione CERCA quando è necessario determinare la posizione di un elemento in un intervallo piuttosto che l'elemento stesso.

SCARTO

Restituisce un riferimento a un intervallo spostato rispetto a una cella o a un intervallo di celle di un numero specificato di righe e di colonne. Il riferimento restituito può riferirsi a una singola cella o a un intervallo di celle. È possibile specificare il numero di righe e di colonne dell'intervallo da restituire.

Torna all'inizio

Fornitori di terze parti

Di seguito è riportato un elenco parziale di fornitori di terze parti che offrono prodotti utilizzabili per eseguire la pulizia dei dati in vari modi.

Fornitore

Prodotto

Add-in Express Ltd.

Advanced Find & Replace (in lingua inglese)

Merge Cells Wizard (in lingua inglese)

Add-Ins.com

Duplicate Finder

J-Walk & Associates, Inc.

Power Utility Pak Version 7

PATools

PATools Advanced Find Replace (in lingua inglese)

Vonnix

Excel Power Expander 4.6

WinPure

ListCleaner Lite

ListCleaner Pro

Clean and Match 2007

Torna all'inizio

Si applica a: Excel 2007



Queste informazioni sono risultate utili?

No

Che cosa possiamo migliorare?

255 caratteri rimanenti

Per tutelare la privacy, non includere informazioni di contatto nei commenti e suggerimenti. Consulta la nostra informativa sulla privacy.

Grazie per i tuoi commenti e suggerimenti

Risorse di supporto

Cambia lingua