Las diez formas principales de limpiar los datos

Las palabras escritas de forma incorrecta, los espacios que persisten al final de una celda, los prefijos no deseados, las mayúsculas o minúsculas inadecuadas y los caracteres no imprimibles dan una mala impresión. Y esa ni siquiera es una lista completa de las formas en que los datos se pueden ensuciar. Remánguese, es hora de hacer una limpieza general en las hojas de cálculo con Microsoft Office Excel.

En este artículo

Conceptos básicos para limpiar los datos

Revisión ortográfica

Quitar filas duplicadas

Buscar y reemplazar texto

Cambiar las mayúsculas o minúsculas del texto

Quitar espacios y caracteres no imprimibles del texto

Corregir números y signos de números

Corregir fechas y horas

Combinar y dividir columnas

Transformar y reorganizar columnas y filas

Hacer cuadrar los datos de una tabla uniéndolos o haciéndolos coincidir

Otros proveedores

Volver al principio

Conceptos básicos para limpiar los datos

No siempre se tiene control sobre el formato y el tipo de datos que se importa desde un origen de datos externo, como una base de datos, un archivo de texto o una página Web. Con frecuencia, tendrá que limpiar los datos antes de poder analizarlos. Afortunadamente, Office Excel cuenta con muchas características para ayudarle a obtener los datos en el formato exacto que desee. Algunas veces, la tarea es muy sencilla y hay una característica específica que realiza el trabajo. Por ejemplo, puede utilizar fácilmente el corrector ortográfico para corregir las palabras que no están escritas correctamente en las columnas que contienen comentarios o descripciones. O, si desea quitar las filas duplicadas, puede hacerlo rápidamente utilizando el cuadro de diálogo Quitar duplicados.

En otras ocasiones, es posible que tenga que manipular una o varias columnas utilizando una fórmula para convertir los valores importados en nuevos valores. Por ejemplo, si desea quitar los espacios al final de las celdas, puede crear una nueva columna para limpiar los datos utilizando una fórmula, rellenar hacia abajo la nueva columna, convertir las fórmulas de esa nueva columna en valores y, a continuación, quitar la columna original.

Los pasos básicos para limpiar los datos son los siguientes:

  1. Importar los datos desde un origen de datos externo.

  2. Crear una copia de seguridad de los datos originales en un libro independiente.

  3. Asegurarse de que los datos están en un formato de tabla de filas y columnas que tengan: datos similares en cada columna, todas las columnas y filas visibles y que no haya filas en blanco dentro del rango. Para obtener los mejores resultados, utilice una tabla de Excel.

  4. Realice primero las tareas que no necesiten la manipulación de columnas, como revisar la ortografía o utilizar el cuadro de diálogo Buscar y reemplazar.

  5. A continuación, realice las tareas que requieran la manipulación de columnas. Los pasos generales para manipular una columna son:

    1. Insertar una nueva columna (B) junto a la columna original (A) que necesita limpieza.

    2. Agregar una fórmula que transforme los datos en la parte superior de la nueva columna (B).

    3. Rellenar hacia abajo en la nueva columna (B). En las tablas de Excel, las columnas calculadas se crean automáticamente con los valores rellenados hacia abajo.

    4. Seleccionar la nueva columna (B), copiarla y, a continuación, pegar como valores en la nueva columna (B).

    5. Quitar la columna original (A), con lo que la nueva columna se convierte de B a A.

Para limpiar periódicamente el mismo origen de datos, considere la posibilidad de grabar una macro o de escribir código para automatizar todo el proceso. También hay varios complementos externos escritos por otros proveedores que se enumeran en la sección Otros proveedores que puede considerar utilizar si no tiene tiempo o recursos para automatizar el proceso por sí mismo.

Más información

Descripción

Describe todas las formas de importar datos externos en Office Excel.

Rellenar datos automáticamente en celdas de hojas de cálculo

Muestra cómo utilizar el comando Rellenar.

Crear o eliminar una tabla de Excel

Agregar o quitar filas y columnas de una tabla de Excel

Crear, modificar o quitar una columna calculada en una tabla de Excel

Mostrar cómo crear una tabla de Excel y agregar o eliminar columnas o columnas calculadas.

Crear una macro

Muestra varias formas de automatizar las tareas repetitivas mediante la utilización de una macro.

Volver al principio

Revisión ortográfica

El corrector ortográfico se puede utilizar no sólo para buscar palabras escritas de forma incorrecta, sino también para buscar valores que no se utilizan de forma coherente, como nombres de productos o empresas, agregando esos valores a un diccionario personalizado.

Más información

Descripción

Comprobar la ortografía y la gramática

Muestra cómo corregir las palabras escritas de forma incorrecta en una hoja de cálculo.

Utilizar diccionarios personalizados para agregar palabras al corrector ortográfico

Explica cómo utilizar los diccionarios personalizados.

Volver al principio

Quitar filas duplicadas

Las filas duplicadas son un problema habitual cuando se importan datos. Es aconsejable aplicar un filtro para obtener los valores únicos primero y confirmar que los resultados son los que desea antes de quitar los valores duplicados.

Más información

Descripción

Aplicar para obtener los valores únicos o quitar los valores duplicados

Muestra dos procedimientos estrechamente relacionados: cómo aplicar un filtro para obtener filas únicas y cómo quitar filas duplicadas.

Volver al principio

Buscar y reemplazar texto

Puede que desee quitar una cadena común que aparece al principio, como una etiqueta formada por un punto y coma y un espacio, o un sufijo, como una frase entre paréntesis al final de la cadena que está obsoleta o es innecesaria. Puede hacerlo buscando instancias de ese texto y reemplazándolas por otro texto o dejándolas sin texto.

Más información

Descripción

Comprobar si una celda contiene texto (no distingue entre mayúsculas y minúsculas)

Comprobar si una celda contiene texto (distingue entre mayúsculas y minúsculas)

Muestra cómo utilizar el comando Buscar y varias funciones para buscar texto.

Quitar caracteres del texto

Muestra cómo utilizar el comando Reemplazar y varias funciones para quitar texto.

Buscar o reemplazar texto y números en una hoja de cálculo

Buscar y reemplazar

Muestra cómo utilizar los cuadros de diálogo Buscar y Reemplazar.

ENCONTRAR, ENCONTRARB

HALLAR, HALLARB

REEMPLAZAR, REEMPLAZARB

SUSTITUIR

IZQUIERDA, IZQUIERDAB

DERECHA, DERECHAB

LARGO, LARGOB

EXTRAE, EXTRAEB

Éstas son las funciones que puede utilizar para realizar diversas tareas de manipulación de cadenas, como buscar y reemplazar una subcadena dentro de una cadena, extraer partes de una cadena o determinar la longitud de una cadena.

Volver al principio

Cambiar las mayúsculas o minúsculas del texto

A veces el texto viene mezclado, en concreto en lo relativo a las mayúsculas y minúsculas. Utilizando una o varias de las tres funciones CASE, puede convertir texto a letras minúsculas, como en el caso de las direcciones de correo electrónico, a letras mayúsculas, como en el caso de los códigos de productos o a las letras de nombres propios, como en el caso de los nombres o títulos de libros.

Más información

Descripción

Cambiar las mayúsculas o minúsculas del texto

Muestra cómo utilizar las tres funciones CASE.

MINUSC

Convierte todas las letras mayúsculas de una cadena de texto en letras minúsculas.

NOMPROPIO

Pone en mayúscula la primera letra de una cadena de texto y otras letras del texto que siguen a cualquier carácter que no sea una letra. Convierte todas las demás letras en letras minúsculas.

MAYUSC

Convierte el texto a letras mayúsculas.

Volver al principio

Quitar espacios y caracteres no imprimibles del texto

A veces los valores de texto contienen espacios al principio y al final o varios caracteres de espacio incrustados (valores del conjunto de caracteres Unicode 32 y 160) o caracteres no imprimibles (valores del conjunto de caracteres Unicode 0 a 31, 127, 129, 141, 143, 144 y 157). Estos caracteres pueden originar algunas veces resultados inesperados al ordenar, filtrar o buscar. Por ejemplo, en el origen de datos externo, los usuarios pueden cometer errores tipográficos al agregar caracteres de espacios extra sin darse cuenta o los datos de texto importados de orígenes externos pueden contener caracteres no imprimibles que están incrustados en el texto. Como estos caracteres no son fácilmente observables, los resultados inesperados pueden ser difíciles de entender. Para quitar estos caracteres no deseados, puede utilizar una combinación de las funciones ESPACIOS, LIMPIAR y SUSTITUIR.

Más información

Descripción

Quitar espacios y caracteres no imprimibles del texto

Muestra cómo quitar todos los espacios y caracteres no imprimibles del conjunto de caracteres Unicode.

CODIGO

Devuelve un código numérico para el primer carácter de una cadena de texto.

LIMPIAR

Quita los primeros 32 caracteres no imprimibles del código ASCII de 7 bits (valores 0 a 31) del texto.

ESPACIOS

Quita el carácter de espacio ASCII de 7 bits (valor 32) del texto.

SUSTITUIR

Puede utilizar la función SUSTITUIR para reemplazar los caracteres Unicode de valor más alto (valores 127, 129, 141, 143, 144, 157 y 160) por los caracteres ASCII de 7 bits para los que fueron diseñadas las funciones ESPACIOS y LIMPIAR.

Volver al principio

Corregir números y signos de números

Hay dos problemas principales con los números que pueden hacer necesario limpiar los datos: el número fue importado como texto de forma involuntaria y el signo negativo necesita cambiarse al estándar de su organización.

Más información

Descripción

Formatos de números disponibles

Muestra todos los formatos de números disponibles.

Convertir los números almacenados como texto en números

Muestra cómo convertir los números a los que se ha dado formato y se han almacenado en celdas como texto, lo que origina problemas con los cálculos o produce órdenes de clasificación confusas, al formato de número.

MONEDA

Convierte un número a formato de texto y aplica un símbolo de moneda.

TEXTO

Convierte un valor a texto en un formato de número específico.

DECIMAL

Redondea un número al número especificado de decimales, aplica el formato decimal al número utilizando un punto y comas y devuelve el resultado como texto.

VALOR

Convierte una cadena de texto que representa un número en un número.

Volver al principio

Corregir fechas y horas

Debido a que hay tantos formatos de fecha diferentes y debido a que estos formatos pueden confundirse con códigos de piezas numeradas u otras cadenas que contienen barras oblicuas o guiones, con frecuencia es necesario convertir las fechas y horas aplicarles otro formato.

Más información

Descripción

Cambiar el sistema de fecha, el formato o la interpretación de un año con dos dígitos

Describe cómo funciona el sistema de fechas en Office Excel.

Convertir las horas

Muestra cómo hacer la conversión entre diferentes unidades de tiempo.

Convertir las fechas almacenadas como texto en fechas

Muestra cómo convertir las fechas que tienen formato de texto y que se han almacenado en celdas como texto, lo que puede producir problemas con los cálculos u órdenes de clasificación confusas, a un formato de fechas.

FECHA

Devuelve el número de serie secuencial que representa una fecha concreta. Si el formato de celda era General antes de introducir la función, el resultado tendrá formato de fecha.

FECHANUMERO

Convierte una fecha representada por texto en un número de serie.

HORA

Devuelve el número decimal de una hora concreta. Si el formato de celda era General antes de introducir la función, el resultado tendrá formato de fecha.

HORANUMERO

Devuelve el número decimal de la hora representada por una cadena de texto. El número decimal es un valor del 0 (cero) al 0.99999999, que representa las horas desde 0:00:00 (12:00:00 a.m.) hasta 23:59:59 (11:59:59 p.m.).

Volver al principio

Combinar y dividir columnas

Una tarea habitual después de importar datos de un origen de datos externo es combinar dos o más columnas en una o dividir una columna en dos o más columnas. Por ejemplo, es posible que desee dividir una columna que contiene un nombre completo en una columna con el nombre y otra con el apellido. O puede que desee dividir una columna que contiene un campo de dirección en columnas separadas para la calle, ciudad, región y código postal. También puede ocurrir al contrario, que desee combinar el nombre y el apellido en una columna con el nombre completo o combinar las columnas con los datos de una dirección separados en una sola columna. Otros valores habituales que pueden requerir la combinación en una columna o la división en varias columnas con los códigos de productos, las rutas de acceso de archivos y las direcciones IP (protocolo de Internet).

Más información

Descripción

Combinar los nombres y apellidos

Combinar texto y números

Combinar texto con fechas u horas

Combinar dos o más columnas mediante una función

Muestra ejemplos típicos de combinación de valores procedentes de dos o más columnas.

Dividir nombres mediante el Asistente para convertir texto en columnas

Muestra cómo utilizar este asistente para dividir columnas basándose en varios delimitadores comunes.

Dividir texto entre columnas mediante funciones

Muestra cómo utilizar las funciones IZQUIERDA, EXTRAE, DERECHA, HALLAR y LARGO para dividir columnas de nombres en dos o más columnas.

Combinar o dividir el contenido de las celdas

Muestra cómo utilizar la función CONCATENAR, el operador & (Y comercial) y el Asistente para convertir texto en columnas.

Combinar celdas o dividir celdas combinadas

Muestra cómo utilizar los comandos Combinar celdas, Combinar horizontalmente y Combinar y centrar.

CONCATENAR

Une dos o más cadenas de texto en una sola cadena.

Volver al principio

Transformar y reorganizar columnas y filas

La mayoría de los análisis y funciones de formato de Office Excel presuponen que los datos existen un una única tabla bidimensional. Puede que a veces desee hacer que las filas se conviertan en columnas y que las columnas se conviertan en filas. En otras ocasiones, los datos ni siquiera estarán estructurados en formato de tabla y necesitará un modo de transformarlos a un formato de tabla.

Más información

Descripción

TRANSPONER

Devuelve un rango de celdas vertical como rango de celdas horizontal o viceversa.

Volver al principio

Hacer cuadrar los datos de una tabla uniéndolos o haciéndolos coincidir

En ocasiones, los administradores de bases de datos utilizan Office Excel para buscar y corregir errores de coincidencia cuando se unen dos o más tablas, lo que puede implicar cuadrar dos tablas de hojas de cálculo diferentes, por ejemplo, para ver todos los registros en ambas tablas o para comparar las tablas y buscar las filas que no coinciden.

Más información

Descripción

Buscar valores en una lista de datos

Muestra formas habituales de buscar datos mediante las funciones de búsqueda.

BUSCAR

Devuelve un valor bien desde un rango de una sola fila o una sola columna o bien desde una matriz. La función BUSCAR tiene dos formas de sintaxis: la forma vectorial y la forma matricial.

BUSCARH

Busca un valor en la fila superior de una tabla o una matriz de valores y, a continuación, devuelve un valor en la misma columna de una fila que especifique en la tabla o matriz.

BUSCARV

Busca un valor en la primera columna de una tabla o matriz y devuelve un valor en la misma fila de otra columna de la tabla o matriz.

INDICE

Devuelve un valor o la referencia a un valor dentro de una tabla o rango. Hay dos formas de la función INDICE: la forma matricial y la forma de referencia.

COINCIDIR

Devuelve la posición relativa de un elemento en una matriz que coincide con un valor especificado en un orden especificado. Utilice COINCIDIR en vez de una de las funciones BUSCAR cuando necesite la posición de un elemento en un rango en vez del propio elemento.

DESREF

Devuelve una referencia a un rango que es un número especificado de filas y columnas desde una celda o rango de celdas. La referencia que se devuelve puede ser una sola celda o un rango de celdas. Puede especificar el número de filas y el número de columnas que se van a devolver.

Volver al principio

Otros proveedores

A continuación se presenta una lista parcial de otros proveedores que ofrecen productos que se pueden utilizar para limpiar datos de diversas formas.

Proveedor

Producto

Add-in Express Ltd.

Add-Ins.com

Duplicate Finder

AddinTools

JKP Application Development Services

J-Walk & Associates, Inc.

Power Utility Pak Version 7

Office Assistance LLC

PATools

Vonnix

Excel Power Expander 4.6

WinPure

ListCleaner Lite

ListCleaner Pro

Clean and Match 2007

Volver al principio

Se aplica a: Excel 2007



¿Le ha sido útil esta información?

No

¿Cómo podemos mejorarlo?

255 caracteres restantes

Para proteger su privacidad, no incluya información de contacto en sus comentarios. Revisar política de privacidad.

¡Gracias por sus comentarios!

Recursos de soporte técnico

Cambiar idioma