Десетте най-добри начина да изчистите данните си

Забележка: Бихме искали да ви осигурим най-новото помощно съдържание възможно най-бързо на вашия собствен език. Тази страница е преведена чрез автоматизация и може да съдържа граматически грешки и несъответствия. Нашата цел е това съдържание да ви бъде полезно. Можете ли да ни кажете дали информацията е била полезна за вас, в дъното на тази страница? Ето статията на английски за бърза справка.

Думи с неправилен правопис, ненужни крайни интервали, нежелани представки, неправилен регистър на буквите и непечатаеми знаци правят лошо първо впечатление. И това дори не е пълен списък на начините, по които вашите данни може да се замърсят. Запретнете ръкави. Време е за основно пролетно почистване на вашите работни листове с Microsoft Excel.

Не винаги имате контрол над формата и типа на данните, които импортирате от външен източник на данни, като например база данни, текстов файл или уеб страница. Преди да можете да анализирате данните, често се налага първо да ги почистите. За щастие, Excel има много функции, които могат да ви помогнат да преобразувате данните в точния формат, който искате. Понякога задачата е проста и има конкретна функция, която върши работата вместо вас. Можете например лесно да използвате програмата за проверка на правописа, за да изчистите думи с грешен правопис в колоните, които съдържат коментари или описания. Или, ако искате да премахнете дублиращи се редове, можете бързо да го направите с помощта на диалоговия прозорец Премахване на дубликати.

В други случаи може да се наложи да обработите една или няколко колони с помощта на формула, за да преобразувате импортираните стойности в нови стойности. Ако например искате да премахнете крайните интервали, можете да създадете нова колона, за да изчистите данните, като използвате формула, запълните надолу новата колона, преобразувате формулите на тази нова колона в стойности и след това премахнете първоначалната колона.

Основните стъпки за почистване на данните са следните:

  1. Импортирайте данните от външен източник на данни.

  2. Създайте резервно копие на оригиналните данни в отделна работна книга.

  3. Уверете се, че данните са в табличен формат от редове и колони, като: във всяка колона има сходни данни, всички колони и редове са видими и няма празни редове в диапазона. За най-добри резултати използвайте таблица на Excel.

  4. Извършвате първо задачите, които не изискват обработка на колони, като например проверка на правописа или използване на диалоговия прозорец Търсене и заместване.

  5. След това извършете задачите, които изискват обработка на колони. Основните стъпки за обработка на колона са:

    1. Вмъкнете нова колона (B) до първоначалната колона (A), която трябва да бъде изчистена.

    2. Добавете формула, която ще преобразува данните, в началото на новата колона (B).

    3. Запълнете надолу формулата в новата колона (B). В таблица на Excel се създава автоматично изчисляема колона със запълнени надолу стойности.

    4. Изберете новата колона (B), копирайте я и след това я поставете като стойности в новата колона (B).

    5. Премахнете първоначалната колона (A), което преобразува новата колона от B в А.

За периодично изчистване на същия източник на данни помислете да не създадете макрос или да не напишете код за автоматизиране на целия процес. Има също и редица външни добавки, написани от други доставчици, изброени в раздела Други доставчици, които можете да използвате, ако нямате времето или ресурсите да автоматизирате процеса сами.

Още информация

Описание

Общ преглед на свързването с (импортирането на) данни

Описва всички начини за импортиране на външни данни в Office Excel.

Автоматично попълване с данни на клетки в работен лист

Показва как да използвате командата Запълване.

Създаване или изтриване на таблица на Excel

преоразмеряване на таблица чрез добавяне или премахване на редове и колони

използване на изчисляеми колони в таблица на Excel

Показват как да създадете таблица на Excel и как да добавите или изтриете колони или изчисляеми колони.

Създаване на макрос

Показва няколко начина за автоматизиране на повтарящи се задачи с помощта на макрос.

Можете да използвате програма за проверка на правописа не само за откриване на думи с неправилен правопис, но и за намиране на стойности, които не са използвани по еднакъв начин, например имена на продукти или фирми, като добавите тези стойности в потребителски речник.

Още информация

Описание

Проверка на правопис и граматика

Показва как да коригирате думи с неправилен правопис в работен лист.

Използване на потребителски речници за добавяне на думи в програмата за проверка на правописа

Обяснява как да използвате потребителски речници.

Дублиращите се редове са често срещан проблем при импортиране на данни. Добра идея е първо да филтрирате за уникални стойности, за да се уверите, че резултатите са каквито ги искате, преди да премахнете дублиращите се стойности.

Още информация

Описание

Филтриране за уникални стойности или премахване на дублиращи се стойности

Показва две тясно свързани процедури: как да филтрирате за уникални редове и как да премахвате дублиращи се редове.

Може да искате да премахнете общ начален низ, например етикет, последван от двоеточие и интервал, или суфикс, например вмъкната фраза в края на низа, която е остаряла или ненужна. Можете да направите това, като намерите отделни случаи на този текст и след това ги заместите с отсъствие на текст или друг текст.

Още информация

Описание

Проверка дали клетка съдържа текст (без разпознаване на малки и главни букви)

Проверка дали клетка съдържа текст (с разпознаване на малки и главни букви)

Показват как да използвате командата Намиране и няколко функции за откриване на текст.

Премахване на знаци от текст

Показва как да използвате командата Заместване и няколко функции за премахване на текст.

Търсене и заместване на текст и числа в работен лист

Показват как да използвате диалоговите прозорци Търсене и Заместване.

FIND, FINDB

SEARCH, SEARCHB

REPLACE, REPLACEB

SUBSTITUTE

LEFT, LEFTB

RIGHT, RIGHTB

LEN, LENB

MID, MIDB

Това са функциите, които можете да използвате, за да извършвате различни задачи за обработка на низове, като например намиране и заместване на подниз в низ, извличане на части от низ или определяне на дължината на низ.

Понякога текстът се импортира в разнородна форма, особено когато става въпрос за регистъра на буквите. С помощта на една или повече от трите функции за регистър можете да преобразувате текст в малки букви (например имейл адреси), главни букви (например продуктови кодове) или подходящ регистър (например заглавия на книги или имена).

Още информация

Описание

Променяне на регистъра на текст

Показва как да използвате трите функции за регистър.

LOWER

Преобразува всички главни букви от текстов низ в малки букви.

PROPER

Преобразува в главна първата буква в текстов низ и всички други букви в текста, които следват след всеки знак, различен от буква. Преобразува всички други букви в малки букви.

UPPER

Преобразува текст в главни букви.

Понякога текстовите стойности съдържат начални, крайни или множество вградени интервали (стойности 32 и 160 от набора знаци на Unicode) или непечатаеми знаци (стойности от 0 до 31, 127, 129, 141, 143, 144 и 157 от набора знаци на Unicode). Тези знаци могат понякога да доведат до неочаквани резултати при сортиране, филтриране или търсене. Във външния източник на данни например потребителите може да допуснат печатни грешки, добавяйки по невнимание допълнителни интервали, или импортираните текстови данни от външни източници може да съдържат непечатаеми знаци, които са вградени в текста. Тъй като тези знаци не се забелязват лесно, неочакваните резултати може да са трудни за разбиране. За да премахнете тези нежелани знаци, можете да използвате комбинация от функциите TRIM, CLEAN и SUBSTITUTE.

Още информация

Описание

Показва как да премахнете всички интервали и непечатаеми знаци от набора знаци на Unicode.

CODE

Връща числовия код на първия знак в текстов низ.

CLEAN

Премахва първите 32 непечатаеми знака в 7-битовия ASCII код (стойности от 0 до 31) от текста.

TRIM

Премахва 7-битовия ASCII знак за интервал (стойност 32) от текста.

SUBSTITUTE

Можете да използвате функцията SUBSTITUTE, за да заместите Unicode знаците с по-висока стойност (стойности 127, 129, 141, 143, 144, 157 и 160) със 7-битовите ASCII знаци, за които са предназначени функциите TRIM и CLEAN.

Има два основни проблема с числата, поради които може да се наложи да изчистите данните: числото случайно е импортирано като текст и знакът минус трябва да бъде променен според стандарта за вашата организация.

Още информация

Описание

Преобразуване на числа, записани като текст, в числа

Показва как да преобразувате числа, форматирани и съхранени в клетките като текст и поради това потенциално водещи до проблеми при изчисленията или до объркване на реда на сортиране, във формат на число.

DOLLAR

Преобразува число в текстов формат и добавя символ за валута.

TEXT

Преобразува стойност в текст в определен числов формат.

FIXED

Закръглява число до зададения брой знаци след десетичната запетая, форматира числото в десетичен формат с помощта на запетая и интервали и връща резултата като текст.

VALUE

Преобразува в число текстов низ, представящ число.

Понеже има толкова много различни формати за дата и понеже тези формати могат да бъдат объркани с номерирани кодове на части или други низове, които съдържат наклонени черти или тирета, датите и часовете често трябва да бъдат преобразувани и преформатирани.

Още информация

Описание

Промяна на системата на датиране, формата или интерпретацията на годината в двуцифрен формат

Описва как работи системата на датиране в Office Excel.

Преобразуване на часове

Показва как да преобразувате различни единици за час.

Преобразуване на дати, съхранени като текст, в дати

Показва как да преобразувате дати, форматирани и съхранени в клетките като текст и поради това потенциално водещи до проблеми при изчисленията или до объркване на реда на сортиране, във формат на дата.

DATE

Връща последователно серийно число, което представлява определена дата. Ако форматът на клетката е бил "Общи" преди въвеждането на функцията, резултатът се форматира като дата.

DATEVALUE

Преобразува дата, представена от текст, в пореден номер.

TIME

Връща десетичното число за зададен час. Ако форматът на клетката е бил "Общ" преди въвеждането на функцията, резултатът се форматира като дата.

TIMEVALUE

Връща десетичното число за часа, представен от текстов низ. Десетичното число е стойност в диапазона от 0 (нула) до 0,99999999, представяща часа от 0:00:00 ч. до 23:59:59 ч.

Често срещана задача след импортирането на данни от външен източник е или обединяване на две или повече колони в една, или разделяне на една колона в две или повече колони. Може например да искате да разделите колона, която съдържа пълно име, на собствено и на фамилно име. Или може да искате да разделите колона, която съдържа поле за адрес, на отделни колони за улица, град, област и пощенски код. Обратното също може да е вярно. Може да искате да обедините колони за собствено и за фамилно име в колона за пълно име или да комбинирате отделни колони за адрес в една колона. Други често срещани стойности, които може да изискват обединяване в една колона или разделяне на няколко колони, включват кодове на продукти, пътища към файлове и IP адреси.

Още информация

Описание

Обединяване на собствени и фамилни имена

Обединяване на текст и числа

Обединяване на текст с дата или час

Обединяване на две или повече колони с помощта на функция

Показват типични примери за обединяване на стойности от две или повече колони.

Разделяне на текст в различни колони със съветника за преобразуване на текст в колони

Показва как да използвате този съветник, за да разделите колони въз основа на различни често срещани разделители.

Разделяне на текст в различни колони с функции

Показва как да използвате функциите LEFT, MID, RIGHT, SEARCH и LEN, за да разделите колона за име на две или повече колони.

Обединяване или разделяне на съдържанието на клетки

Показва как да използвате функцията CONCATENATE, оператора & (амперсанд) и съветника за преобразуване на текст в колони.

Обединяване на клетки или разделяне на обединени клетки

Показва как да използвате командите Обединяване на клетки, Обедини по редове и Обедини и центрирай.

CONCATENATE

Обединява два или повече текстови низа в един текстов низ.

Повечето функциите за анализ и форматиране в Office Excel предполагат, че данните съществуват в една-единствена плоска, двуизмерна таблица. Понякога може да искате да превърнете редовете в колони, а колоните – в редове. В други случаи данните дори не са структурирани в табличен формат и имате нужда от начин да преобразувате данни от нетабличен в табличен формат.

Още информация

Описание

TRANSPOSE

Връща вертикален диапазон от клетки като хоризонтален диапазон, или обратното.

Понякога администраторите на бази данни използват Office Excel, за да откриват и коригират грешки в съпоставянето при съединяване на две или повече таблици. Това може да включва съгласуване на две таблици от различни работни листове за преглед например на всички записи от двете таблици или за сравняване на таблиците и откриване на редове, които не съвпадат.

Още информация

Описание

Търсене на стойности в списък от данни

Показва често използвани начини за търсене на данни с помощта на функциите за справка.

LOOKUP

Връща стойност от диапазон, обхващащ един ред или една колона, или от масив. Синтаксисът на функцията LOOKUP има две форми: за вектор и за масив.

HLOOKUP

Търси стойност в най-горния ред на таблица или масив от стойности и след това връща стойност в същата колона от посочен от вас ред в таблицата или масива.

VLOOKUP

Търси стойност в първата колона на масив от таблица и връща стойност в същия ред от друга колона в масива от таблицата.

INDEX

Връща стойност или препратката към стойност от таблица или диапазон. Функцията INDEX има две форми: за масив и за препратка.

MATCH

Връща относителната позиция на елемент в масив, който отговаря на указана стойност в указан ред. Използвайте MATCH вместо една от функциите LOOKUP, когато ви трябва позицията на елемент в диапазон, а не самият елемент.

OFFSET

Връща препратка към диапазон, който отстои на зададен брой на редове и колони от клетка или диапазон от клетки. Върнатата препратка може да бъде единична клетка или диапазон от клетки. Можете да зададете броя на върнатите редове и колони.

По-долу ще видите частичен списък на други доставчици, които предлагат продукти за изчистване на данни по различни начини.

Забележка: Microsoft не предоставя поддръжка за продукти на други доставчици.

Доставчик

Продукт

Add-in Express Ltd.

Ultimate Suite for Excel, Merge Tables Wizard, Duplicate Remover, Consolidate Worksheets Wizard, Combine Rows Wizard, Cell Cleaner, Random Generator, Merge Cells, Quick Tools for Excel, Random Sorter, Advanced Find & Replace, Fuzzy Duplicate Finder, Split Names, Split Table Wizard, Workbook Manager

Add-Ins.com

Duplicate Finder

AddinTools

AddinTools Assist

J-Walk &Associates, Inc.

Power Utility Pak Version 7

WinPure

ListCleaner Lite
ListCleaner Pro
Clean and Match 2007

Най-горе на страницата

Разширете уменията си в Office
Преглед на обучението
Получавайте първи новите функции
Присъединете се към участниците в Office Insider

Беше ли полезна тази информация?

Благодарим ви за обратната връзка!

Благодарим ви за вашата обратна връзка. Изглежда, че ще бъде полезно да ви свържем с един от нашите агенти по поддръжката на Office.

×