Deset nejlepších způsobů čištění dat

Důležité :  Tento článek je strojově přeložený – přečtěte si toto upozornění. Anglickou verzi tohoto článku pro referenci najdete tady.

Chybně napsaná slova, vzdorovité úvodní nebo koncové mezery, nežádoucí předpony, nesprávná malá nebo velká písmena a netisknutelné znaky v excelovém listu dělají špatný první dojem. A to nejsou zdaleka všechny případy, které komplikují práci s daty. Zjistěte, jak můžete listy vyčistit, aby byly informace snadněji čitelné a čísla se dala používat ve výpočtech přesněji.

V tomto článku

Základní informace o vyčištění dat

Kontrola pravopisu

Odebrání duplicitních řádků

Hledání a záměna textu

Změna malých a velkých písmen v textu

Odebrání mezer a netisknutelných znaků z textu

Oprava čísel a jejich znamének

Oprava kalendářních dat a časů

Slučování a rozdělování sloupců

Transformace a změna uspořádání sloupců a řádků

Sladění dat tabulek propojením nebo porovnáním

Jiní poskytovatelé

Základní informace o vyčištění dat

Když importujete data z externího zdroje dat, jako je databáze, textový soubor nebo webová stránka, nemusíte mít vždy pod kontrolou jejich formát a typ. Než budete data analyzovat, často je nutné je vyčistit. Aplikace Excel naštěstí nabízí mnoho funkcí, které dostanou data přesně do požadovaného formátu. Někdy je to jednoduché, protože existuje určitá funkce, která to udělá za vás. Například pomocí funkce Kontrola pravopisu můžete snadno vyčistit chybně napsaná slova ve sloupcích, které obsahují komentáře nebo popisy. Nebo když chcete odebrat duplicitní řádky, můžete to rychle udělat pomocí dialogového okna Odebrat duplicity.

Jindy může být potřeba zpracovat jeden nebo více sloupců pomocí vzorce a převést importované hodnoty na nové hodnoty. Pokud chcete například odebrat koncové mezery z dat pomocí vzorce, můžete vytvořit nový sloupec, přidat do něj vzorec, vyplnit tímto vzorcem celý nový sloupec, převést vzorce v tomto novém sloupci na hodnoty a nakonec odebrat původní sloupec.

Základní postup vyčištění dat:

  1. Importujte data z externího zdroje dat.

  2. Vytvořte záložní kopii původních dat v samostatném sešitu.

  3. Zajistěte, aby data měla tabulkový formát tvořený řádky a sloupci, u kterého jsou podobná data v jednotlivých sloupcích, a aby byly všechny sloupce a řádky viditelné a v oblasti se nevyskytovaly prázdné řádky. Nejlepších výsledků dosáhnete pomocí excelové tabulky.

  4. Nejdřív udělejte činnosti, které nevyžadují zacházení se sloupci, například zkontrolujte pravopis nebo pracujte s dialogovým oknem Najít a nahradit.

  5. Potom udělejte činnosti, které vyžadují zacházení se sloupci. Obecný postup zacházení se sloupci je tento:

    1. Vložte nový sloupec (například B) vedle původního sloupce (například A), který chcete vyčistit.

    2. Na začátek nového sloupce (B) přidejte vzorec, který bude transformovat data.

    3. Vyplňte dolů nový sloupec (B) tímto vzorcem. V excelové tabulce se automaticky vytvoří počítaný sloupec s hodnotami vyplněnými směrem dolů.

    4. Nový sloupec (B) vyberte, zkopírujte ho a pak ho vložte jako hodnoty zpátky do nového sloupce (B).

    5. Odstraňte původní sloupec (A) – tím se nový sloupec B změní na sloupec A.

Pokud potřebujete pravidelně čistit stejný zdroj dat, můžete nahrát makro nebo napsat kód v jazyku VBA a celý proces zautomatizovat. Existuje i celá řada externích doplňků od jiných dodavatelů. Najdete je v části Jiní poskytovatelé. Můžou se hodit, pokud nemáte čas nebo zdroje na to, abyste proces automatizovali sami.

Další informace

Popis

Základní informace o připojování k datům a jejich importu

Popisuje všechny způsoby importu externích dat do Excelu.

Automatické vyplnění buněk listu daty

Ukazuje, jak používat příkaz Vyplnit.

Vytvoření nebo odstranění tabulky aplikace Excel na listu

Ukazuje, jak vytvořit excelovou tabulku a přidat nebo odstranit sloupce nebo počítané sloupce.

Rychlý start: vytvoření makra

Ukazuje několik způsobů automatizace opakujících se úkolů pomocí makra.

Začátek stránky

Kontrola pravopisu

Pomocí kontroly pravopisu můžete nejen najít chybně napsaná slova, ale taky hodnoty, které nejsou používané konzistentně, například názvy produktů nebo společností – když tyto hodnoty přidáte do vlastního slovníku.

Další informace

Popis

Kontrola pravopisu a gramatiky

Ukazuje, jak opravit na listu chybně napsaná slova.

Přidávání slov do vlastních slovníků kontroly pravopisu

Vysvětluje, jak používat vlastní slovníky.

Začátek stránky

Odebrání duplicitních řádků

Duplicitní řádky představují častý problém při importu dat. Před odebráním duplicitních hodnot je vhodné nejdřív vyfiltrovat jedinečné hodnoty, abyste měli jistotu, že dosáhnete požadovaných výsledků.

Další informace

Popis

Filtrování jedinečných nebo odebrání duplicitních hodnot

Ukazuje dva úzce související postupy: jak vyfiltrovat jedinečné řádky a jak odebrat duplicitní řádky.

Začátek stránky

Hledání a záměna textu

Můžete chtít odebrat běžný úvodní řetězec, například popisek následovaný dvojtečkou a mezerou, nebo příponu – například zastaralý nebo zbytečný text v závorkách na konci řetězce. Můžete to udělat tak, že budete hledat jednotlivé instance tohoto textu a nahrazovat je jiným nebo žádným textem.

Další informace

Popis

Zkontrolujte, zda buňka obsahuje text (malá a velká písmena)

zaškrtněte, pokud buňka obsahuje text (malá a velká písmena)

Ukazují, jak používat příkaz Najít a několik funkcí pro hledání textu.

Vyhledání nebo nahrazení textu a čísel v listu

Ukazuje, jak používat dialogová okna Najít a Nahradit.

NAJÍT, FINDB (funkce)

HLEDAT, SEARCHB (funkce)

NAHRADIT, NAHRADITB (funkce)

DOSADIT (funkce)

ZLEVA, ZLEVAB (funkce)

ZPRAVA, RIGHTB (funkce)

DÉLKA, LENB (funkce)

ČÁST, MIDB (funkce)

Toto jsou funkce, které můžete použít k různým úkolům zacházení se řetězci, například k vyhledání a nahrazení podřetězce v řetězci, k extrakci části řetězce nebo ke zjištění délky řetězce.

Začátek stránky

Změna malých a velkých písmen v textu

Text se někdy vyskytuje v různých podobách, hlavně pokud jde o malá a velká písmena. Pomocí funkcí pro změnu velikosti písmen můžete převést text na malá písmena (třeba u e-mailových adres), na velká písmena (například u kódů produktů) nebo na první velká písmena slov (třeba u jmen nebo titulů knih).

Další informace

Popis

Změna malých a velkých písmen v textu

Ukazuje, jak používat tři funkce pro změnu velikosti písmen.

MALÁ (funkce)

Převede všechna velká písmena v textovém řetězci na malá písmena.

VELKÁ2 (funkce)

Převede první písmeno textu a všechna další písmena, která následují bezprostředně za neabecedními znaky, na velká písmena. Všechna ostatní písmena se převedou na malá.

VELKÁ (funkce)

Převede text na velká písmena.

Začátek stránky

Odebrání mezer a netisknutelných znaků z textu

Někdy mohou textové hodnoty obsahovat na začátku, na konci nebo uvnitř textu znaky mezer (znaková sada Unicode – hodnoty 32 a 160), nebo netisknutelné znaky (znaková sada Unicode – hodnoty 0 až 31, 127, 129, 141, 143, 144 a 157). Tyto znaky mohou způsobit neočekávané výsledky při řazení, filtrování nebo vyhledávání. V externím zdroji dat mohou uživatelé například udělat typografické chyby neúmyslným přidáním nadbytečných mezer, nebo importovaná textová data z externích zdrojů mohou v textu obsahovat netisknutelné znaky. Tyto znaky není snadné identifikovat, a proto může být obtížné zjistit příčinu neočekávaných výsledků. Chcete-li tyto nežádoucí znaky odebrat, můžete použít kombinaci funkcí PROČISTIT, VYČISTIT a DOSADIT.

Další informace

Popis

KÓD (funkce)

Vrátí číselný kód prvního znaku v textovém řetězci.

VYČISTIT (funkce)

Odebere z textu netisknutelné znaky, které jsou v 7bitovém kódu ASCII na prvních 32 místech (mají hodnoty 0 až 31).

PROČISTIT (funkce)

Odebere z textu znak mezery 7bitového kódu ASCII (s hodnotou 32).

DOSADIT (funkce)

Pomocí funkce DOSADIT můžete nahradit znaky Unicode vyšších hodnot (hodnot 127, 129, 141, 143, 144, 157 a 160) znaky 7bitového kódu ASCII, pro které byly funkce PROČISTIT a VYČISTIT navrženy.

Začátek stránky

Oprava čísel a jejich znamének

U čísel se mohou vyskytovat dva hlavní problémy, které můžou vyžadovat vyčištění dat: Číslo bylo chybně importováno jako text nebo je potřeba změnit záporné znaménko na standard používaný ve vaší organizaci.

Další informace

Popis

Převod čísel uložených jako text na čísla

Ukazuje, jak čísla, která jsou v buňkách naformátovaná a uložená jako text (což může způsobovat problémy při výpočtech nebo vést k matoucímu pořadí řazení), převést na číselný formát.

KČ (funkce)

Převede číslo na textový formát a přidá symbol měny.

HODNOTA.NA.TEXT (funkce)

Převede hodnotu na text v určitém číselném formátu.

ZAOKROUHLIT.NA.TEXT (funkce)

Zaokrouhlí číslo na určený počet desetinných míst, zformátuje toto číslo v desetinném formátu s tečkou a čárkami a výsledek vrátí v podobě textu.

HODNOTA (funkce)

Převede textový řetězec představující číslo na číslo.

Začátek stránky

Oprava kalendářních dat a časů

Protože existuje tolik formátů kalendářních dat a protože se tyto formáty dají splést s číselnými kódy dílů nebo jinými řetězci, které obsahují lomítka nebo pomlčky, je často nutné kalendářní data a časy převést a přeformátovat.

Další informace

Popis

Změna kalendářního systému, formátu data a způsobu vyhodnocení roků vyjádřených pomocí dvou číslic

Popisuje, jak v Excelu funguje kalendářní systém.

Převod časů

Ukazuje, jak převádět mezi různými časovými jednotkami.

Převod datových údajů uložených jako text na datové údaje

Ukazuje, jak datové údaje, které jsou v buňkách naformátované a uložené jako text (což může způsobovat problémy při výpočtech nebo vést k matoucímu pořadí řazení), převést na datový formát.

DATUM (funkce)

Vrátí pořadové číslo, které představuje určité datum. Jestliže je formát buňky před zadáním funkce Obecný, je výsledek formátován jako datum.

DATUMHODN (funkce)

Převede datum ve formě textu na pořadové číslo.

ČAS (funkce)

Vrátí desetinné číslo aktuálního času. Jestliže je formát buňky před zadáním funkce Obecný, je výsledek formátován jako datum.

ČASHODN (funkce

Vrátí desetinné číslo času zadaného jako textový řetězec. Desetinné číslo je hodnota v rozmezí od 0 (nula) do 0,99999999, která představuje čas od 0:00:00 (12:00:00 dop.) do 23:59:59 (11:59:59 odp.).

Začátek stránky

Slučování a rozdělování sloupců

Běžnou úlohou po importu dat z externího zdroje dat je sloučení dvou nebo více sloupců do jednoho sloupce nebo rozdělení jednoho sloupce do dvou nebo více sloupců. Můžete například chtít rozdělit sloupec, který obsahuje celé jméno, na křestní jméno a příjmení. Nebo sloupec obsahující pole adresy můžete chtít rozdělit na samostatné sloupce obsahující ulici, město, oblast a poštovní směrovací číslo. Může to platit i naopak. Můžete chtít sloučit sloupce Jméno a Příjmení do sloupce Celé jméno nebo zkombinovat samostatné adresní sloupce do jednoho sloupce. K dalším běžným hodnotám, které můžou vyžadovat sloučení do jednoho sloupce nebo rozdělení do více sloupců, patří kódy produktů, cesty k souborům a IP adresy.

Další informace

Popis

Kombinace křestních jmen a příjmení

Kombinace textu a čísel

Kombinace textu s datem nebo časem

Sloučení dvou nebo více sloupců pomocí funkce

Ukazují typické příklady slučování hodnot ze dvou nebo více sloupců.

Rozdělení jmen pomocí Průvodce převodem textu do sloupců

Ukazuje, jak pomocí průvodce rozdělit sloupce na základě různých běžných oddělovačů.

Rozdělení textu do sloupců pomocí funkcí

Ukazuje, jak pomocí funkcí ZLEVA, ČÁST, ZPRAVA, HLEDAT a DÉLKA rozdělit sloupec jmen do dvou nebo více sloupců.

Video: Sloučení obsahu několika buněk do jedné buňky

Ukazuje, jak používat funkci CONCATENATE a operátor & (ampersand.

Sloučení a oddělení buněk

Ukazuje, jak používat příkazy Sloučit buňky, Sloučit vodorovně a Sloučit a zarovnat na střed.

CONCATENATE (funkce)

Sloučí dva nebo více textových řetězců do jednoho.

Začátek stránky

Transformace a změna uspořádání sloupců a řádků

Většina analytických a formátovacích funkcí v Excelu předpokládá, že data existují v jedné ploché, dvourozměrné tabulce. Někdy můžete chtít, aby se z řádků staly sloupce a ze sloupců řádky. Jindy nejsou data vůbec formátovaná v tabulkovém formátu (řádky a sloupce) a potřebujete je transformovat z netabulkového do tabulkového formátu.

Další informace

Popis

TRANSPOZICE (funkce)

Svislou oblast buněk vrátí jako vodorovnou oblast a naopak.

Začátek stránky

Sladění dat tabulek propojením nebo porovnáním

Správci databází někdy používají Office Excel k tomu, aby u dvou propojených tabulek našli a opravili chyby shody položek. Může se jednat například o sladění dvou tabulek z různých listů zobrazením všech záznamů v obou tabulkách nebo porovnáním tabulek a vyhledáním řádků, které si neodpovídají.

Další informace

Popis

Vyhledání hodnot v seznamu dat

Ukazuje běžné způsoby vyhledávání dat pomocí vyhledávacích funkcí.

VYHLEDAT (funkce)

Vyhledá požadovanou hodnotu v oblasti obsahující jeden řádek nebo jeden sloupec nebo v matici. Funkce VYHLEDAT má dvě syntaktické formy: vektorovou a maticovou.

VVYHLEDAT (funkce)

Vyhledá hodnotu v prvním řádku tabulky nebo matice hodnot a potom z tabulky nebo matice vrátí hodnotu ze stejného sloupce z řádku, který jste zadali jako parametr.

SVYHLEDAT (funkce)

Tato funkce vyhledá v prvním sloupci tabulky zadanou hodnotu a vrátí hodnotu odpovídající buňky ve stejném řádku jiného sloupce tabulky.

INDEX (funkce)

Vrátí hodnotu nebo odkaz na hodnotu z tabulky nebo oblasti. Existují dvě různé formy funkce INDEX: maticová a odkazová.

POZVYHLEDAT (funkce)

Vrátí relativní pozici prvku matice, který odpovídá zadané hodnotě v určeném pořadí. Funkce POZVYHLEDAT se používá místo funkce VYHLEDAT v případech, kdy není potřeba získat hledaný prvek, ale jeho pozici.

POSUN (funkce)

Vrátí odkaz na oblast, která obsahuje určený počet řádků a sloupců, od určité buňky nebo oblasti buněk. Vrácený odkaz může být jedna buňka nebo oblast buněk. Počet řádků a sloupců, které se mají vrátit, můžete určit.

Začátek stránky

Jiní poskytovatelé

Tady je částečný seznam jiných poskytovatelů produktů, které se používají k čištění dat různými způsoby.

Poskytovatel

Produkt

Add-in Express Ltd.

Rozšířené najít a nahradit
Sloučit buňky Průvodce

Add-Ins.com

Duplikování vyhledávání

AddinTools

AddinTools Assist

J-Walk & Associates, Inc.

Power Utility Pak Version 7

Vonnix

Excel Power Expander 4.6

WinPure

ListCleaner Lite
ListCleaner Pro
Vyčistit a POZVYHLEDAT 2007

Začátek stránky

Poznámka : Upozornění ke strojovému překladu: Tento článek přeložil počítačový systém bez zásahu člověka. Společnost Microsoft nabízí tyto strojové překlady proto, aby umožnila uživatelům, kteří nemluví anglicky, získat informace o produktech, službách a technologiích této společnosti. Protože je tento článek strojově přeložený, může obsahovat slovní, syntaktické nebo gramatické chyby.

Sdílení Facebook Facebook Twitter Twitter E-mail E-mail

Byly tyto informace užitečné?

Výborně! Je ještě něco dalšího, co byste nám chtěli dát vědět?

Jak bychom ho mohli vylepšit?

Děkujeme vám za zpětnou vazbu.

×