As dez principais maneiras de limpar os dados

Palavras com ortografia incorreta, espaços à direita persistentes, prefixos indesejados, maiúsculas e minúsculas impróprias e caracteres não imprimíveis prejudicam a qualidade de uma primeira impressão. E esta nem mesmo é uma lista completa das maneiras como seus dados podem ser contaminados. Arregace as mangas. É hora de algumas das principais limpezas de suas planilhas no Microsoft Excel.

Você nem sempre tem controle sobre o formato e o tipo de dados importados de uma fonte de dados externos, como um banco de dados, arquivo de texto ou uma página da Web. Antes de poder analisar os dados, em geral, você precisa limpá-los. Felizmente, o Excel tem muitos recursos para ajudá-lo a obter dados no exatamente no formato desejado. Às vezes, a tarefa é simples e há um recurso específico que faz o trabalho por você. Por exemplo, é possível usar facilmente o corretor ortográfico para limpar palavras com ortografia incorreta em colunas que contêm comentários ou descrições. Ou, se você deseja remover as linhas duplicadas, é possível fazer isso rapidamente usando a caixa de diálogo Remover Duplicatas.

Outras vezes, você pode precisar manipular uma ou mais colunas usando uma fórmula para converter os valores importados em novos valores. Por exemplo, se você desejar remover espaços à direita, pode criar uma nova coluna para limpar os dados usando uma fórmula, preencher a nova coluna, converter fórmulas da nova coluna de valores e, em seguida, remover da coluna original.

As etapas básicas para apagar dados são da seguinte maneira:

  1. Importar os dados de uma fonte de dados externa.

  2. Crie uma cópia de backup dos dados originais em uma pasta separada.

  3. Certifique-se de que os dados estejam em um formato tabular de linhas e colunas com: dados semelhantes em cada coluna, todas as colunas e linhas visíveis e não há linhas em branco dentro do intervalo. Para obter melhores resultados, use uma tabela do Excel.

  4. Faça primeiramente as tarefas que não requerem manipulação de coluna, como a verificação ortográfica ou que possa utilizar a caixa de diálogo Localizar e Substituir.

  5. Em seguida, faça as tarefas que exigem a manipulação de coluna. As etapas gerais para manipular uma coluna são:

    1. Inserir uma nova coluna (B) ao lado da coluna original (A) que precisa de limpeza.

    2. Adicione uma fórmula que transforma os dados na parte superior da nova coluna (B).

    3. Preencha a fórmula na nova coluna (B). Em uma tabela do Excel, uma coluna calculada é criada automaticamente com valores de preenchimento.

    4. Selecione a nova coluna (B), copie-a e cole como valores na nova coluna (B).

    5. Remover a coluna original (A), que converte a nova coluna de B para A.

Para limpar periodicamente a mesma fonte de dados, considere a possibilidade de gravar uma macro ou escrever código para automatizar o processo inteiro. Também há vários suplementos externos criados por fornecedores de terceiros, listados na seção Provedores de terceiros que você pode considerar o uso se não tiver tempo ou recursos para automatizar o processo por conta própria.

Mais informações

Descrição

Visão geral da conexão (importação) de dados

Descreve todas as maneiras de importar dados externos no Office Excel.

Preencher dados automaticamente nas células da planilha

Mostra como usar o comando Preencher.

Criar ou excluir uma tabela do Excel

Adicionar ou remover linhas de tabela do Excel e colunas

Criar, editar ou remover uma coluna calculada em uma tabela do Excel

Mostrar como criar uma tabela do Excel e adicionar ou excluir colunas ou colunas calculadas.

Criar uma macro

Mostra várias maneiras para automatizar tarefas repetitivas usando uma macro.

É possível usar um verificador ortográfico não apenas localizar palavras com ortografia incorreta, mas para localizar valores que não são usados de maneira consistente, como nomes de produto ou de empresa, adicionando esses valores a um dicionário personalizado.

Mais informações

Descrição

Verificar a ortografia e a gramática

Mostra como corrigir palavras com ortografia incorreta em uma planilha.

Usar dicionários personalizados para adicionar palavras ao verificador ortográfico

Explica como usar dicionários personalizados.

As linhas duplicadas são um problema comum ao importar dados. Convém filtrar valores únicos primeiro para confirmar se os resultados são os desejados antes de remover valores duplicados.

Mais informações

Descrição

Filtrar valores exclusivos ou remover valores duplicados

Mostra dois procedimentos estreitamente relacionados: como filtrar linhas exclusivas e como remover linhas duplicadas.

Talvez você queira remover uma cadeia de condução comum, como um rótulo seguido por dois-pontos e espaço ou um sufixo, como uma frase parentética no final da cadeia de caracteres que está obsoleta ou é desnecessária. É possível fazer isso localizando instâncias desse texto e, em seguida, substituindo-as por nenhum texto ou outro texto.

Mais informações

Descrição

Verificar se uma célula contém texto (diferencia maiúsculas de minúsculas)

Verificar se uma célula contém texto (diferencia maiúsculas de minúsculas)

Mostrar como utilizar o comando Localizar e várias funções para localizar o texto.

Remover caracteres do texto

Mostrar como utilizar o comando Substituir e várias funções para remover o texto.

Localizar ou substituir texto e números em uma planilha

Localizar e substituir

Mostrar como utilizar as caixas de diálogo Localizar e Substituir.

LOCALIZAR, LOCALIZARB

PESQUISAR E PESQUISARB

SUBSTITUIR, SUBSTITUIRB

SUBSTITUTE

ESQUERDA, ESQUERDAB

DIREITA, DIREITAB

COMP, COMPB

MÉD, MÉDB

Estas são as funções que podem ser usadas para a realização de várias tarefas de manipulação de cadeia de caracteres, como localização e substituição de uma subcadeia de caracteres dentro de uma cadeia, extração de partes de uma cadeia de caracteres ou determinação do comprimento de uma cadeia de caracteres.

Às vezes, texto é uma mistura, especialmente quando as maiúsculas e minúsculas do texto são uma preocupação. Usando uma ou mais das três funções para maiúsculas e minúsculas, é possível converter texto para letras minúsculas, como endereços de email, maiúsculas, como códigos de produto ou primeira maiúscula, como nomes ou títulos de catálogo.

Mais informações

Descrição

Alterar maiúsculas e minúsculas do texto

Mostra como usar as três funções para maiúsculas e minúsculas.

MINÚSCULA

Converte todas as letras maiúsculas em uma sequência de caracteres de texto para letras minúsculas.

PRI.MAIÚSCULA.

Coloca a primeira letra de uma seqüência de caracteres de texto em maiúscula e todas as outras letras do texto depois de qualquer caractere diferente de uma letra. Converte todas as outras letras para minúsculas.

MAIÚSCULA.

Converte o texto em letras maiúsculas.

Às vezes, os valores de texto contêm caracteres de espaço à esquerda, à direita ou vários caracteres de espaço incorporados (valores 32 e 160 do conjunto de caracteres de Unicode) ou caracteres não-imprimíveis (valores 0 a 31, 127, 129, 141, 143, 144 e 157 do conjunto de caracteres Unicode). Esses caracteres podem causar resultados inesperados na ordenação, filtragem ou pesquisa. Por exemplo, na fonte de dados externa, os usuários podem cometer erros tipográficos ao incluir caracteres de espaço adicionais inadvertidamente, ou dados de texto importados de fontes externas podem conter caracteres não-imprimíveis que estão incorporados no texto. Como esses caracteres não são facilmente identificados, pode ser difícil compreender os resultados inesperados. Para remover esses caracteres indesejados, você pode usar uma combinação das funções ARRUMAR, TIRAR e SUBSTITUIR.

Mais informações

Descrição

Remover espaços e caracteres não-imprimíveis do texto

Mostra como remover espaços e caracteres não imprimíveis do conjunto de caracteres Unicode.

CÓDIGO

Retorna um código numérico para o primeiro caractere de uma seqüência de caracteres de texto

TIRAR

Remove os primeiros 32 caracteres não imprimíveis no código ASCII de 7 bits (valores de 0 a 31) do texto.

ARRUMAR

Remove o caractere de espaço de ASCII de 7 bits (valor 32) do texto.

SUBSTITUIR

É possível usar a função SUBSTITUIR para substituir os maiores valores de caracteres Unicode (valores 127, 129, 141, 143, 144, 157 e 160) por caracteres ASCII de 7 bits para os quais as funções ARRUMAR e LIMPAR foram criadas.

Há duas questões principais com números que podem exigir que você limpe os dados: o número foi importado inadvertidamente como texto e o sinal negativo precisa ser alterado para o padrão para sua organização.

Mais informações

Descrição

Converter números armazenados como texto para números

Mostra como converter números que são formatados e armazenados em células como texto, que podem causar problemas com cálculos ou gerar ordens de classificação confusas, para o formato de número.

MOEDA

Converte um número em formato de texto e aplica um símbolo de moeda.

TEXTO

Converte um valor para texto em um formato de número específico.

DEF.NÚM.DEC

Arredonda o número para o número especificado de decimais, formata o número no formato decimal usando vírgula e pontos e retorna o resultado como texto.

VALOR

Converte uma sequência de caracteres de texto que representa um número em um número.

Como há tantos formatos de data diferente e porque esses formatos podem ser confundidos com códigos de parte numerada ou outras cadeias de caracteres que contêm barras ou hífens, as datas e horas frequentemente precisam ser convertidas e reformatadas.

Mais informações

Descrição

Alterar o sistema, o formato ou a interpretação do ano de dois dígitos da data

Descreve como o sistema de data funciona no Office Excel.

Converter horas

Mostra como converter entre unidades de tempo diferentes.

Converter datas armazenadas como texto para datas

Mostra como converter datas que são formatadas e armazenados em células como texto, que podem causar problemas com cálculos ou gerar ordens de classificação confusas, para o formato de data.

DATA

Retorna o número de série sequencial que representa uma determinada data. Se o formato da célula era Geral antes de a função ser inserida, o resultado será formatado como uma data.

DATA.VALOR

Converte uma data representada por um texto para um número de série

HORA

Retorna o número decimal para uma determinada hora. Se o formato da célula era Geral antes de a função ser inserida, o resultado será formatado como uma data.

VALOR.TEMPO

Retorna o número decimal da hora representada por uma seqüência de caracteres de texto. O número decimal é um valor que varia de 0 a 0,99999999 e que representa as horas entre 0:00:00 (12:00:00 AM) e 23:59:59 (11:59:59 PM).

Uma tarefa comum após importar dados de uma fonte de dados externos é mesclar duas ou mais colunas em uma ou dividir uma coluna em duas ou mais colunas. Por exemplo, convém dividir uma coluna que contém um nome completo em um nome e sobrenome. Ou, talvez você queira dividir uma coluna que contém um campo de endereço em rua, cidade, região e colunas de código postal separados. O inverso também pode ser verdadeiro. Talvez você queira mesclar uma coluna de Nome e Sobrenome em uma coluna de Nome Completo ou combinar colunas de endereço separadas em uma coluna. Valores comuns adicionais que podem exigir a mesclagem em uma coluna ou a divisão em várias colunas incluem códigos de produto, caminhos de arquivo e endereços IP (Internet Protocol).

Mais informações

Descrição

Combinar nomes e sobrenomes

Combinar texto e números

Combinar texto com uma data ou hora

Combinar duas ou mais colunas usando uma função

Mostre exemplos típicos de valores combinados de duas ou mais colunas.

Dividir nomes usando o Assistente para Conversão de Texto em Colunas

Mostra como usar o assistente para dividir colunas com base em vários delimitadores comuns.

Dividir texto entre colunas usando funções

Mostra como usar as esquerda funções,ESQUERDA, MÉD, DIREITA, PESQUISA e COMP para dividir uma coluna de nome em duas ou mais colunas.

Combinar ou dividir o conteúdo de células

Mostra como usar a função CONCATENAR, operador & (e comercial) e o Assistente para converter texto para colunas.

Mesclar células ou dividir células mescladas

Mostra como usar os comandos Mesclar células, Mesclar através e Mesclar e Centralizar.

CONCATENAR

Agrupa duas ou mais cadeias de caracteres em uma única cadeia de caracteres.

A maioria dos recursos de formatação no Office Excel e análise pressupõem que os dados existem em uma única tabela fixas bidimensional. Às vezes, é possível que você queira fazer com que as linhas se tornem colunas e as colunas se tornem linhas. Outras vezes, dados não estão nem mesmo estruturados em um formato tabular e você precisa de uma maneira de transformá-los em um formato tabular.

Mais informações

Descrição

TRANSPOR

Retorna um intervalo vertical de células como um intervalo horizontal ou vice-versa.

Ocasionalmente, os administradores do banco de dados usam o Office Excel para localizar e corrigir erros correspondentes quando duas ou mais tabelas são unidas. Esse procedimento pode envolver a reconciliação de duas tabelas de planilhas diferentes, por exemplo, para ver todos os registros em ambas as tabelas ou para comparar tabelas e localizar linhas que não correspondem.

Mais informações

Descrição

Pesquisar valores em uma lista de dados

Mostra maneiras mais comuns de pesquisar dados usando as funções de pesquisa.

PROC

Retorna valores de um intervalo de linha ou coluna ou de uma matriz. A função PROC apresenta duas formas sintáticas: vetorial e matricial.

PROCH

Procura um valor na linha superior de uma tabela ou matriz de valores e, em seguida, retorna um valor na mesma coluna de uma linha especificada na tabela ou matriz.

PROCV

Localiza um valor na primeira coluna de uma matriz de tabela e retorna um valor na mesma linha de outra coluna na matriz da tabela.

ÍNDICE

Retorna um valor ou a referência para um valor de dentro de uma tabela ou intervalo. Há duas formas da função ÍNDICE: matricial e de referência.

CORRESP

Retorna a posição relativa de um item em uma matriz que coincide com um valor especificado em uma ordem específica. Use CORRESP em vez de uma das funções PROC quando você precisar da posição de um item em um intervalo ao invés do item propriamente dito.

DESLOC

Retorna uma referência para um intervalo, que é um número especificado de linhas e colunas de uma célula ou intervalo de células. A referência retornada pode ser uma única célula ou um intervalo de células. Você pode especificar o número de linhas e de colunas a serem retornadas.

A seguir apresentamos uma lista parcial de provedores de terceiros que possuem produtos usados para limpar os dados de várias maneiras.

Início da página

Essas informações foram úteis?

Ótimo! Outros comentários?

Como podemos melhorá-lo?

Obrigado por seus comentários!

×