Cele mai eficiente zece metode de curățare a datelor

Notă: Dorim să vă oferim cel mai recent conținut de ajutor, cât mai rapid posibil, în limba dvs. Această pagină a fost tradusă automatizat și poate conține erori gramaticale sau inexactități. Scopul nostru este ca acest conținut să vă fie util. Vă rugăm să ne spuneți dacă informațiile v-au fost utile, în partea de jos a acestei pagini. Aici se află articolul în limba engleză, ca să îl puteți consulta cu ușurință.

Cuvintele ortografiate greșit, spațiile finale neglijente, prefixele nedorite, corpurile de literă incorecte și caracterele neimprimabile lasă o primă impresie neplăcută. Iar aceasta nici măcar nu este o listă completă de modalități prin care datele dvs. pot arăta urât. Să ne suflecăm mânecile. Este momentul să facem curățenie generală prin foile de lucru cu Microsoft Excel.

Nu aveți întotdeauna control asupra formatului și tipului de date pe care le importați dintr-o sursă de date externă, cum ar fi o bază de date, un fișier text sau o pagină web. Înainte să puteți analiza datele, este necesar adesea să le curățați. Din fericire, Excel are multe caracteristici pentru a vă ajuta să aduceți datele exact în formatul pe care îl doriți. Uneori, activitatea este simplă și există o caracteristică specifică ce face treaba pentru dvs. De exemplu, puteți utiliza cu ușurință Verificatorul ortografic pentru a corecta cuvintele scrise greșit în coloane care conțin comentarii sau descrieri. Sau, dacă doriți să eliminați rândurile dublate, puteți face rapid acest lucru, utilizând caseta de dialog Eliminare dubluri.

Alteori, poate fi necesar să manipulați una sau mai multe coloane utilizând o formulă pentru a efectua conversia valorilor importate la valori noi. De exemplu, dacă doriți să eliminați spațiile finale, puteți crea o nouă coloană pentru a curăța datele, utilizând o formulă, umplând noua coloană, efectuând conversia formulelor acelei coloane noi în valori și eliminând apoi coloana originală.

Pașii de bază pentru curățarea datelor sunt următorii:

  1. Importați date dintr-o sursă de date externă.

  2. Creați o copie backup a datelor inițiale într-un registru de lucru separat.

  3. Asigurați-vă că datele sunt în format tabelar, cu rânduri și coloane, cu: date similare în fiecare coloană, toate coloanele și rândurile vizibile și fără rânduri necompletate în zonă. Pentru rezultate optime, utilizați un tabel Excel.

  4. Efectuați activități care nu necesită mai întâi manipularea coloanelor, cum ar fi verificare ortografică sau utilizarea casetei de dialog Găsire și înlocuire.

  5. În continuare, efectuați activități care necesită manipularea coloanelor. Pașii generali pentru manipularea unei coloane sunt:

    1. Inserați o coloană nouă (B) lângă coloana originală (A) care necesită curățare.

    2. Adăugați o formulă care va transforma datele în partea de sus a coloanei noi (B).

    3. Umpleți formula în jos în noua coloană (B). Într-un tabel Excel, se creează automat o coloană calculată cu valorile umplute în jos.

    4. Selectați coloana nouă (B), copiați-o și lipiți-o apoi ca valori în coloana nouă (B).

    5. Eliminați coloana originală (A), care efectuează conversia coloanei noi din B în A.

Pentru a curăța periodic aceeași sursă de date, luați în considerare înregistrarea unei macrocomenzi sau scrierea de cod pentru a automatiza întregul proces. De asemenea, există un număr de programe de completare externe scrise de distribuitori terți, listate în secțiunea Furnizori terți, pe care le puteți utiliza dacă nu aveți timp sau resurse pentru a automatiza procesul pe cont propriu.

Mai multe informații

Descriere

Prezentare generală a conectării (importului) datelor

Descrie toate modurile de a importa datele externe în Office Excel.

Umplerea automată a datelor în celulele foii de lucru

Vă arată cum să utilizați comanda Umplere.

Crearea sau ștergerea unui tabel Excel

Redimensionarea unui tabel prin adăugarea sau eliminarea de rânduri și coloane

utilizarea coloanelor calculate într-un tabel Excel

Vă arată cum să creați un tabel Excel și să adăugați sau să ștergeți coloane sau coloane calculate.

Crearea unei macrocomenzi

Vă arată mai multe modalități de a automatiza activitățile repetitive utilizând o macrocomandă.

Puteți să utilizați un verificator ortografic pentru a găsi nu doar cuvintele ortografiate greșit, ci și valorile care nu sunt utilizate în mod unitar, cum ar fi nume de produse sau de firme, adăugând acele valori într-un dicționar particularizat.

Mai multe informații

Descriere

Verificarea ortografică și gramaticală

Vă arată cum să corectați cuvintele ortografiate greșit pe o foaie de lucru.

Utilizarea de dicționare particularizate pentru a adăuga cuvinte la verificatorul ortografic

Vă explică cum să utilizați dicționarele particularizate.

Rândurile dublate sunt o problemă comună atunci când importați date. Este o idee bună să filtrați după valori unice mai întâi, pentru a confirma că rezultatele sunt ceea ce doriți înainte de a elimina valorile dublate.

Mai multe informații

Descriere

Filtrarea pentru valori unice sau eliminarea valorilor dublate

Afișează două proceduri strâns legate: modul de a filtra după rânduri unice și modul de a elimina rândurile dublate.

Se recomandă să eliminați un șir inițial comun, cum ar fi o etichetă urmată de două puncte și spațiu, sau un sufix, cum ar fi o expresie cu paranteze de la sfârșitul șirului care este perimată sau inutilă. Puteți face acest lucru găsind instanțele textului respectiv și ștergându-le sau înlocuindu-le cu niciun text sau cu un alt text.

Mai multe informații

Descriere

Verificați dacă o celulă conține text (nu este sensibilă la diferențele dintre literele mari și mici)

Verificați dacă o celulă conține text (este sensibilă la diferențele dintre literele mari și mici)

Vă arată cum să utilizați comanda Găsire și mai multe funcții pentru a găsi text.

Eliminați caracterele din text

Vă arată cum să utilizați comanda Înlocuire și mai multe funcții pentru a elimina textul.

Găsirea sau înlocuirea textului și a numerelor dintr-o foaie de lucru

Vă arată cum să utilizați casetele de dialog Găsire și Înlocuire.

FIND, FINDB

SEARCH, SEARCHB

REPLACE, REPLACEB

SUBSTITUTE

LEFT, LEFTB

RIGHT, RIGHTB

LEN, LENB

MID, MIDB

Acestea sunt funcțiile pe care le puteți utiliza pentru a efectua diverse activități de manipulare a șirurilor, cum ar fi găsirea și înlocuirea unui subșir dintr-un șir, extragerea porțiunilor dintr-un șir sau determinarea lungimii unui șir.

Uneori, textul este livrat sub formă mixtă, mai ales atunci când ne referim la corpul de literă al textului. Utilizând una sau mai multe dintre cele trei funcții pentru corpul de literă, puteți efectua conversia textului la litere mici, cum ar fi adrese de e-mail, la majuscule, cum ar fi coduri de produse, sau la corpul de literă care încep cu majusculă, cum ar fi nume sau titluri de cărți.

Mai multe informații

Descriere

Modificarea textului în litere mari/mici

Vă arată cum să utilizați cele trei funcții pentru corpul de literă.

LOWER

Efectuează conversia tuturor literelor mari dintr-un șir de text în litere mici.

PROPER

Convertește în majusculă prima literă dintr-un șir de text și orice altă literă din text care urmează după orice alt caracter în afară de o literă. Face conversia tuturor celorlalte litere la litere mici.

UPPER

Efectuează conversia literelor textului în majuscule.

Uneori, valorile text conțin spații de început sau de sfârșit sau mai multe spații încorporate (valorile 32 și 160 din setul de caractere Unicode) sau caractere neimprimabile (valorile 0 - 31, 127, 129, 141, 143, 144 și 157 din setul de caractere Unicode). Aceste caractere pot cauza uneori rezultate neașteptate atunci când sortați, filtrați sau căutați. De exemplu, în sursa de date externă, utilizatorii pot face erori de scriere, adăugând din greșeală caractere spațiu suplimentare sau datele text importate din surse externe pot conține caractere neimprimabile care sunt încorporate în text. Pentru că aceste caractere nu sunt ușor de observat, rezultatele neașteptate pot fi greu de înțeles. Pentru a elimina aceste caractere nedorite, puteți utiliza o combinație de funcții TRIM, CLEAN și SUBSTITUTE.

Mai multe informații

Descriere

Vă arată cum să eliminați toate spațiile și caracterele neimprimabile din setul de caractere Unicode.

CODE

Returnează un cod numeric pentru primul caracter dintr-un șir text.

CLEAN

Elimină din text primele 32 de caractere neimprimabile din codul ASCII pe 7 biți (valorile 0 - 31).

TRIM

Elimină din text caracterul spațiu ASCII pe 7 biți (valoarea 32).

SUBSTITUTE

Puteți utiliza funcția SUBSTITUTE pentru a înlocui caracterele Unicode cu valori mai mari (valorile 127, 129, 141, 143, 144, 157 și 160) cu caracterele ASCII pe 7 biți pentru care au fost proiectate funcțiile TRIM și CLEAN.

Există două aspecte principale legate de numere, care vă pot impune să curățați datele: numărul a fost importat din greșeală ca text și semnul minus trebuie să fie modificat în semnul standard pentru organizația dvs.

Mai multe informații

Descriere

Conversia numerelor memorate ca text în numere

Vă arată cum să efectuați conversia numerelor formatate și stocate în celule ca text, ceea ce poate provoca probleme cu calculele sau poate cauza o ordine de sortare derutantă, la formatul de număr.

DOLLAR

Efectuează conversia unui număr în format text și aplică un simbol monetar.

TEXT

Efectuează conversia unei valori la text într-un format de număr specific.

FIXED

Rotunjește un număr la un număr precizat de zecimale, aplică numărului un format zecimal utilizând virgula sau punctul ca separator zecimal și returnează rezultatul ca text.

VALUE

Efectuează conversia într-un număr a unui șir de text care reprezintă un număr.

Deoarece există atât de multe formate de dată diferite și aceste formate pot fi confundate cu codurile de componente numerotate sau cu alte șiruri care conțin bare oblice sau cratime, datele și orele trebuie adesea să fie convertite și reformatate.

Mai multe informații

Descriere

Modificarea sistemului de date calendaristice, a formatului sau a interpretării anului din două cifre

Descrie cum funcționează sistemul de date calendaristice în Office Excel.

Conversia orelor

Vă arată cum să efectuați conversia între diferite unități de timp.

Conversia datelor calendaristice stocate ca text în date calendaristice

Vă arată cum să efectuați conversia datelor calendaristice formatate și stocate în celule ca text, ceea ce poate provoca probleme cu calculele sau poate cauza o ordine de sortare derutantă, la formatul de dată calendaristică.

DATE

Returnează numărul serial secvențial care reprezintă o anumită dată calendaristică. Dacă înainte de introducerea funcției, formatul era General, rezultatul se formatează ca dată calendaristică.

DATEVALUE

Efectuează conversia unei date reprezentate prin text într-un număr serial.

TIME

Returnează numărul zecimal pentru o anumită oră. Dacă înainte de introducerea funcției, formatul era General, rezultatul se formatează ca dată.

TIMEVALUE

Returnează numărul zecimal al orei reprezentate de un șir de text. Numărul zecimal este o valoare cuprinsă între 0 (zero) și 0,99999999, reprezentând momente de timp de la 0:00:00 (12:00:00 AM) până la 23:59:59 (11:59:59 PM).

O activitate uzuală după importul datelor dintr-o sursă de date externă este fie să îmbinați două sau mai multe coloane într-una singură, fie să scindați o coloană în două sau mai multe coloane. De exemplu, poate doriți să scindați o coloană care conține un nume complet într-un nume și un prenume. Sau poate doriți să scindați o coloană care conține un câmp adresă în coloane separate pentru stradă, localitate, regiune și cod poștal. Sau invers. Poate doriți să îmbinați o coloană Prenume și Nume de familie într-o coloană Nume complet, sau să combinați coloane de adresă separate într-o singură coloană. Printre valorile comune suplimentare care pot necesita îmbinarea într-o singură coloană sau scindarea în mai multe coloane se numără codurile de produse, căile de fișiere și adresele IP (Internet Protocol).

Mai multe informații

Descriere

Combinarea prenumelor și numelor

Combinarea textului și numerelor

Combinarea textului cu o dată sau oră

Combinarea a două sau mai multe coloane cu ajutorul unei funcții

Vă arată exemple obișnuite ale combinării valorilor din două sau mai multe coloane.

Scindarea textului în coloane diferite cu Expertul conversie text în coloane

Vă arată cum să utilizați acest expert pentru a scinda coloanele pe baza mai multor delimitatori comuni.

Scindarea textului în coloane diferite cu funcții

Vă arată cum să utilizați funcțiile LEFT, MID, RIGHT, SEARCH și LEN pentru a scinda o coloană Nume în două sau mai multe coloane.

Combinarea sau scindarea conținutului celulelor

Vă arată cum să utilizați funcția CONCATENATE, operatorul & (ampersand) și Expertul conversie text în coloane.

Îmbinarea celulelor sau scindarea celulelor îmbinate

Vă arată cum să utilizați comenzile Îmbinare celule, Îmbinare peste și Îmbinare și centrare.

CONCATENATE

Unește două sau mai multe șiruri text într-un singur șir text.

Majoritatea caracteristicilor de analiză și formatare din Office Excel presupun că datele se află într-un tabel unic, plat, bidimensional. Uneori, poate doriți să transformați rândurile în coloane și coloanele să devină rânduri. Alteori, datele nici măcar nu sunt structurate în format tabelar, și aveți nevoie de o modalitate de a transforma datele dintr-un format netabelar într-un format tabelar.

Mai multe informații

Descriere

TRANSPOSE

Returnează o zonă verticală de celule ca zonă orizontală sau viceversa.

Ocazional, administratorii de baze de date utilizează Office Excel pentru a găsi și a corecta erorile de potrivire atunci când sunt unite două sau mai multe tabele. Acest lucru ar putea implica reconcilierea a două tabele din foi de lucru diferite, de exemplu, pentru a vedea toate înregistrările din ambele tabele sau pentru a compara tabele și a găsi rândurile care nu se potrivesc.

Mai multe informații

Descriere

Căutarea valorilor într-o listă de date

Afișează modalitățile obișnuite de a căuta date, utilizând funcțiile de căutare.

LOOKUP

Returnează o valoare dintr-o zonă cu un rând sau o coloană sau dintr-o matrice. Funcția LOOKUP are două forme de sintaxă: formă vector și formă matrice.

HLOOKUP

Caută o valoare în rândul de sus al unui tabel sau într-o matrice de valori, apoi returnează o valoare în aceeași coloană dintr-un rând pe care îl specificați în tabel sau matrice.

VLOOKUP

Caută o valoare din prima coloană a unei matrice de tabel și returnează o valoare în același rând dintr-o altă coloană a matricei de tabel.

INDEX

Returnează o valoare sau referința la o valoare dintr-un tabel sau zonă de celule. Există două variante pentru funcția INDEX: forma de matrice și forma de referință.

MATCH

Returnează poziția relativă a unui element dintr-o matrice care se potrivește cu o valoare specificată într-o anumită ordine. Utilizați MATCH în locul uneia dintre funcțiile LOOKUP atunci când aveți nevoie să poziționați un element într-o zonă în locul elementului propriu-zis.

OFFSET

Întoarce o referință la o zonă care este un număr specificat de rânduri și coloane dintr-o celulă sau o zonă de celule. Referința care este returnată poate fi o singură celulă sau o zonă de celule. Specificați numărul de rânduri și numărul de coloane care să fie returnat.

Urmează o listă parțială de furnizori terți care au produse ce sunt utilizate pentru a curăța datele în diverse moduri.

Notă: Microsoft nu furnizează asistență pentru produsele de la terți.

Furnizor

Produs

Add-in Express Ltd.

Ultimate Suite for Excel, Merge Tables Wizard, Duplicate Remover, Consolidate Worksheets Wizard, Combine Rows Wizard, Cell Cleaner, Random Generator, Merge Cells, Quick Tools for Excel, Random Sorter, Advanced Find & Replace, Fuzzy Duplicate Finder, Split Names, Split Table Wizard, Workbook Manager

Add-Ins.com

Duplicate Finder

AddinTools

AddinTools Assist

J-Walk &Associates, Inc.

Power Utility Pak Version 7

WinPure

ListCleaner Lite
ListCleaner Pro
Clean and Match 2007

Începutul paginii

Extindeți-vă competențele Office
Explorați instruirea
Fiți primul care obține noile caracteristici
Alăturați-vă utilizatorilor Office Insider

Au fost utile aceste informații?

Vă mulțumim pentru feedback!

Vă mulțumim pentru feedback! Se pare că ar fi util să luați legătura cu unul dintre agenții noștri de asistență Office.

×