Las diez mejores formas de limpiar los datos

Palabras con errores ortográficos, persistentes espacios finales, prefijos no deseados, uso inadecuado de mayúsculas y minúsculas y caracteres no imprimibles producen una mala primera impresión. Y esto es solo una muestra de las formas en que puede arruinarse el aspecto de la información. Manos a la obra. Ha llegado la hora de hacer una limpieza profunda de las hojas de cálculo en Microsoft Excel.

No siempre se tiene control sobre el formato y el tipo de datos que se importan desde un origen de datos externo, como una base de datos, un archivo de texto o una página web. Para poder analizar los datos, suele ser necesario limpiarlos. Afortunadamente, Excel cuenta con muchas características que le ayudarán a darle a sus datos el formato exacto que quiera. A veces, la tarea es sencilla y hay una característica determinada que hace el trabajo automáticamente. Por ejemplo, se puede usar el corrector ortográfico para limpiar las palabras mal escritas en columnas que contienen comentarios o descripciones. O bien, si desea quitar filas duplicadas, puede hacerlo rápidamente mediante el cuadro de diálogo Quitar duplicados.

Otras veces, es posible que tenga que manipular una o más columnas con una fórmula para convertir los valores importados en nuevos valores. Por ejemplo, si quiere eliminar los espacios finales, puede crear una columna para limpiar los datos mediante una fórmula, rellenar la nueva columna, convertir las fórmulas de la nueva columna en valores y luego quitar la columna original.

Los pasos básicos para limpiar datos son los siguientes:

  1. Importe los datos de un origen de datos externo.

  2. Cree una copia de seguridad de los datos originales en otro libro.

  3. Asegúrese de que los datos están en un formato tabular de filas y columnas con: datos similares en cada columna, todas las columnas y filas visibles y ninguna fila en blanco dentro del rango. Para obtener los mejores resultados, use una tabla de Excel.

  4. Realice primero las tareas que no requieren manipulación de columna, como la revisión ortográfica o el uso del cuadro de diálogo Buscar y reemplazar.

  5. A continuación, realice las tareas que requieren manipulación de columna. Los pasos generales para manipular una columna son:

    1. Inserte una nueva columna (B) junto a la columna original (A) que tiene que limpiar.

    2. En la parte superior de la nueva columna (B), agregue una fórmula que transforme los datos.

    3. Rellene la fórmula de la nueva columna (B). En una tabla de Excel, se crea automáticamente una columna calculada con los valores rellenados.

    4. Seleccione la nueva columna (B), cópiela y péguela como valores en la nueva columna (B).

    5. Quite la columna original (A), lo que convierte la nueva columna B en A.

Para limpiar periódicamente el mismo origen de datos, plantéese la posibilidad de grabar una macro o escribir código para automatizar todo el proceso. También existen varios complementos externos escritos por otros proveedores, que aparecen en la sección Otros proveedores, que puede utilizar si no tiene tiempo o recursos para automatizar el proceso por su cuenta.

Más información

Descripción

Información general sobre conexión de datos (importación)

Describe todas las formas de importar datos externos en Office Excel.

Rellenar datos automáticamente en celdas de hojas de cálculo

Muestra cómo utilizar el comando Rellenar.

Crear o eliminar una tabla de Excel

Agregar o quitar columnas y filas de la tabla de Excel

Crear, editar o quitar una columna calculada en una tabla de Excel

Muestra cómo crear una tabla de Excel y agregar o eliminar columnas o columnas calculadas.

Crear una macro

Muestra varias maneras de automatizar tareas repetitivas mediante una macro.

Puede usar un corrector ortográfico no solo para encontrar errores ortográficos, sino para encontrar valores que no se usan de forma uniforme, como nombres de producto o de compañía, agregando estos valores a un diccionario personalizado.

Más información

Descripción

Revisar la ortografía y la gramática

Muestra cómo corregir palabras con errores ortográficos en una hoja de cálculo.

Usar diccionarios personalizados para agregar palabras al corrector ortográfico

Explica cómo usar diccionarios personalizados.

Las filas duplicadas constituyen un problema habitual al importar datos. Es conveniente filtrar primero los valores únicos para confirmar que los resultados son los deseados antes de quitar valores duplicados.

Más información

Descripción

Filtrar valores únicos o quitar valores duplicados

Muestra dos procedimientos estrechamente relacionados: cómo filtrar filas únicas y cómo quitar filas duplicadas.

Puede que quiera quitar una cadena inicial común, como una etiqueta seguida por dos puntos y espacio o un sufijo, como una frase entre paréntesis al final de la cadena que está obsoleta o es innecesaria. Para ello, puede buscar instancias de ese texto y sustituirlo por otro texto o por ninguno.

Más información

Descripción

Comprobar si una celda contiene texto (sin distinguir mayúsculas de minúsculas)

Comprobar si una celda contiene texto (distinguiendo mayúsculas de minúsculas)

Muestra cómo usar el comando Buscar y varias funciones para buscar texto.

Quitar caracteres del texto

Muestra cómo usar el comando Reemplazar y varias funciones para quitar texto.

Buscar o reemplazar texto y números en una hoja de cálculo

Buscar y reemplazar

Muestra cómo usar los cuadros de diálogo Buscar y Reemplazar.

ENCONTRAR, ENCONTRARB

HALLAR, HALLARB

REEMPLAZAR, REEMPLAZARB

SUSTITUIR

IZQUIERDA, IZQUIERDAB

DERECHA, DERECHAB

LARGO, LARGOB

EXTRAE, EXTRAEB

Estas son las funciones que puede usar para realizar diversas tareas de manipulación de cadena, como buscar y reemplazar una subcadena dentro de una cadena, extraer partes de una cadena o determinar la longitud de una cadena.

A veces el texto se convierte en una mezcla heterogénea, especialmente en lo tocante al uso de mayúsculas y minúsculas. Mediante una o varias de las tres funciones de mayúsculas y minúsculas, puede convertir texto en letras minúsculas (como direcciones de correo electrónico), en letras mayúsculas (como códigos de producto) o en mayúsculas o minúsculas, según corresponda (como nombres o títulos de libros).

Más información

Descripción

Cambiar de mayúsculas a minúsculas o viceversa

Muestra cómo usar las tres funciones de mayúsculas y minúsculas.

MINUSC

Convierte todas las mayúsculas de una cadena de texto en minúsculas.

NOMPROPIO

Cambia a mayúscula la primera letra del argumento texto y cualquiera de las otras letras de texto que se encuentren después de un carácter que no sea una letra. Convierte todas las demás letras a minúsculas.

MAYUSC

Pone el texto en mayúsculas.

En ocasiones, los valores de texto contienen caracteres iniciales, finales o varios espacios insertados (valores 32 y 160 del juego de caracteres de Unicode), o caracteres no imprimibles (valores de 0 a 31, 127, 129, 141, 143, 144 y 157 del juego de caracteres Unicode). Estos caracteres pueden producir resultados no esperados al ordenar, filtrar o buscar. Por ejemplo, el usuario puede cometer errores tipográficos al agregar de forma accidental espacios adicionales, o el texto importado de orígenes externos puede contener caracteres no imprimibles insertados. Debido a que estos caracteres suelen pasar inadvertidos, puede resultar difícil comprender la naturaleza de los resultados no esperados. Para quitar los caracteres no deseados, puede utilizar una combinación de las funciones ESPACIOS, LIMPIAR y SUSTITUIR.

Más información

Descripción

Quitar espacios y caracteres no imprimibles del texto

Muestra cómo quitar todos los espacios y caracteres no imprimibles del juego de caracteres Unicode.

CODIGO

Devuelve un código numérico del primer carácter de una cadena de texto

LIMPIAR

Quita los primeros 32 caracteres no imprimibles del código ASCII de 7 bits (valores de 0 a 31) del texto.

ESPACIOS

Elimina el carácter de espacio de ASCII de 7 bits (valor 32) del texto.

SUSTITUIR

Puede usar la función SUSTITUIR para reemplazar los caracteres Unicode de valor superior (valores 127, 129, 141, 143, 144, 157 y 160) por los caracteres ASCII de 7 bits para los que se diseñaron las funciones ESPACIOS y LIMPIAR.

Existen dos problemas principales relacionados con números que pueden requerir que se limpien los datos: el número se importó inadvertidamente como texto, y hay que cambiar el signo negativo al estándar de la organización.

Más información

Descripción

Convertir números almacenados como texto a números

Muestra cómo convertir números que tienen formato de texto y se almacenan en las celdas como texto, lo que puede provocar problemas en los cálculos o generar criterios de ordenación confusos, a formato de número.

MONEDA

Convierte un número a formato de texto y le aplica un símbolo de moneda.

TEXTO

Convierte un valor en texto, con un formato numérico específico.

DECIMAL

Redondea un número al número de decimales especificado, da formato decimal al número con comas y puntos, y devuelve el resultado como texto.

VALOR

Convierte una cadena de texto que representa un número en un número.

Dado que hay tantos formatos de fecha distintos y que estos formatos pueden confundirse con códigos numéricos de referencia u otras cadenas que contienen barras diagonales o guiones, suele ser necesario convertir las fechas y horas y volverles a dar formato.

Más información

Descripción

Cambiar el sistema de fecha, el formato o la interpretación de un año expresado con dos dígitos

Describe cómo funciona el sistema de fechas en Office Excel.

Convertir horas

Muestra cómo convertir una unidad horaria en otra distinta.

Convertir fechas almacenadas como texto en fechas

Muestra cómo convertir fechas que tienen formato de texto y se almacenan en las celdas como texto, lo que puede provocar problemas en los cálculos o generar criterios de ordenación confusos, a formato de fecha.

FECHA

Devuelve el número de serie secuencial que representa una fecha determinada. Si el formato de celda era General antes de escribir la función, el resultado tendrá formato de fecha.

FECHANUMERO

Convierte una fecha representada con texto a un número de serie.

HORA

Devuelve el número decimal de una hora determinada. Si el formato de celda era General antes de escribir la función, el resultado tendrá formato de fecha.

HORANUMERO

Devuelve el número decimal de la hora representada por una cadena de texto. El número decimal es un valor comprendido entre 0 (cero) y 0, 99999999 que representa las horas entre 0:00:00 (12:00:00 a.m.) y 23:59:59 (11:59:59 p.m.).

Una tarea común después de importar datos desde un origen de datos externos es combinar dos o más columnas en una, o dividir una columna en dos o más columnas. Por ejemplo, puede que quiera dividir una columna que contiene un nombre completo en una columna de nombre y otra de apellidos. O bien, puede que desee dividir una columna que contiene un campo de dirección en columnas separadas de calle, ciudad, región y código postal. También puede suceder lo contrario. Puede que quiera combinar una columna de nombre y otra de apellidos en una columna de nombre completo, o combinar distintas columnas de dirección en una sola columna. Entre otros valores comunes que tal vez haya que combinar en una sola columna o dividirse en varias columnas, se incluyen códigos de producto, rutas de acceso de archivo y direcciones IP (Protocolo de Internet).

Más información

Descripción

Combinar nombres y apellidos

Combinar texto y números

Combinar texto con una fecha u hora

Combinar dos o más columnas mediante una función

Muestra ejemplos típicos de combinación de valores de dos o más columnas.

Dividir nombres con el Asistente para convertir texto en columnas

Muestra cómo usar a este asistente para dividir columnas en función de distintos delimitadores comunes.

Dividir texto entre columnas mediante funciones

Muestra cómo usar las funciones IZQUIERDA, EXTRAE, DERECHA, HALLAR y LARGO para dividir una columna de nombre en dos o más columnas.

Combinar o dividir el contenido de celdas

Muestra cómo usar la función CONCATENAR, el operador & ("y" comercial) y el Asistente para convertir texto en columnas.

Combinar celdas o dividir celdas combinadas

Muestra cómo utilizar los comandos Combinar celdas, Combinar horizontalmente y Combinar y centrar.

CONCATENAR

Une dos o más cadenas de texto en una sola cadena de texto.

La mayoría de las características de análisis y formato de Office Excel presupone que los datos se encuentran en una sola tabla bidimensional plana. Es posible que a veces quiera convertir las filas en columnas y las columnas en filas. Otras veces, los datos no están ni siquiera estructurados en un formato tabular y se necesita una forma de transformar los datos de un formato no tabular a uno tabular.

Más información

Descripción

TRANSPONER

Devuelve un rango de celdas vertical como rango horizontal, o viceversa.

En ocasiones, los administradores de bases de datos usan Office Excel para buscar y corregir errores de coincidencia cuando se combinan dos o más tablas. Esto podría incluir conciliar dos tablas de diferentes hojas de cálculo para, por ejemplo, ver todos los registros de ambas tablas o comparar las tablas y buscar las filas que no coinciden.

Más información

Descripción

Buscar valores en una lista de datos

Muestra formas comunes habituales de buscar datos mediante las funciones de búsqueda.

BUSCAR

Devuelve un valor procedente de un rango de una fila o columna, o bien, de una matriz. La función BUSCAR tiene dos formas de sintaxis: vectorial y matricial.

BUSCARH

Busca un valor en la fila superior de una tabla o una matriz de valores y luego devuelve un valor en la misma columna de una fila especificada en la tabla o matriz.

BUSCARV

Busca un valor específico en la primer columna de una matriz de tabla y devuelve, en la misma fila, un valor de otra columna de dicha matriz de tabla.

ÍNDICE

Devuelve un valor o la referencia a un valor en una tabla o rango. La función INDICE presenta dos formas: matricial y de referencia.

COINCIDIR

Devuelve la posición relativa de un elemento en una matriz que coincida con un valor especificado en un orden especificado. Utilice COINCIDIR en lugar de las funciones BUSCAR cuando necesite conocer la posición de un elemento en un rango en lugar del elemento en sí.

DESREF

Devuelve una referencia a un rango que es un número de filas y de columnas de una celda o rango de celdas. La referencia devuelta puede ser una celda o un rango de celdas. Puede especificar el número de filas y el número de columnas a devolver.

La siguiente es una lista parcial de otros proveedores que tienen productos que se usan para limpiar los datos de diversas maneras.

Principio de página

¿Le ha sido útil esta información?

De acuerdo. ¿Algún comentario más?

¿Cómo podemos mejorarlo?

¡Gracias por sus comentarios!

×