Cách mười hàng đầu để làm sạch dữ liệu của bạn

Quan trọng:  Bài viết này là dịch máy, hãy xem tuyên bố miễn trừ trách nhiệm. Bạn hãy tìm phiên bản tiếng Anh của bài viết này tại đây để tham khảo.

Từ sai chính tả, khoảng trắng ở cuối khó, tiền tố không mong muốn, đúng các trường hợp, và các ký tự tạo ấn tượng đầu tiên không hợp lệ. Và mà không phải là một danh sách đầy đủ cách dữ liệu của bạn có thể bẩn. Cuộn lên tay áo của bạn. Đây là lần cho một số spring-cleaning chính của trang tính của bạn với Microsoft Excel.

Bạn luôn không có quyền điều khiển định dạng và kiểu dữ liệu mà bạn nhập từ một nguồn dữ liệu ngoài, chẳng hạn như cơ sở dữ liệu, tệp văn bản hoặc một trang Web. Trước khi bạn có thể phân tích dữ liệu, bạn thường xuyên cần dọn dẹp. May mắn, Excel có nhiều tính năng giúp bạn tìm hiểu dữ liệu trong định dạng chính xác mà bạn muốn. Đôi khi, nhiệm vụ được đơn giản và có là một tính năng cụ thể nào công việc cho bạn. Ví dụ, bạn có thể dễ dàng sử dụng bộ kiểm tra chính tả để dọn dẹp các từ sai chính tả trong cột có chứa chú thích hoặc mô tả. Hoặc, nếu bạn muốn loại bỏ hàng trùng lặp, bạn có thể nhanh chóng làm điều này bằng cách dùng hộp thoại Loại bỏ các mục trùng lặp .

Tại thời điểm khác, bạn có thể cần sửa đổi một hoặc nhiều cột bằng cách dùng công thức để chuyển đổi các giá trị được nhập vào giá trị mới. Ví dụ, nếu bạn muốn loại bỏ khoảng trắng ở cuối, bạn có thể tạo một cột mới để làm sạch dữ liệu bằng cách dùng công thức, điền vào cột mới, chuyển đổi công thức cột mới đó thành giá trị, và sau đó loại bỏ cột gốc.

Các bước cơ bản để làm sạch dữ liệu là như sau:

  1. Nhập dữ liệu từ nguồn dữ liệu ngoài.

  2. Tạo bản sao lưu dữ liệu ban đầu trong một sổ làm việc khác.

  3. Đảm bảo rằng dữ liệu trong một định dạng bảng hàng và cột với: dữ liệu tương tự trong mỗi cột, tất cả các cột và hàng Hiển thị và không có hàng trống trong phạm vi. Để có kết quả tốt nhất, sử dụng bảng Excel.

  4. Thực hiện tác vụ mà không yêu cầu thao tác cột đầu tiên, chẳng hạn như kiểm tra chính tả hoặc bằng cách dùng hộp thoại Tìm và thay thế .

  5. Tiếp theo, hãy thực hiện nhiệm vụ yêu cầu cột thao tác. Các bước chung cho thao tác một cột là:

    1. Chèn một cột mới (B) bên cạnh cột gốc (A) cần làm sạch này.

    2. Thêm công thức sẽ biến đổi dữ liệu ở trên cùng của cột mới (B).

    3. Điền công thức trong cột mới (B). Trong bảng Excel, một cột được tính toán tự động được tạo bằng giá trị điền xuống dưới.

    4. Chọn cột mới (B), sao chép nó, sau đó dán dưới dạng giá trị vào cột mới (B).

    5. Loại bỏ cột gốc (A), chuyển đổi cột mới từ B đến A.

Để định kỳ dọn cùng một nguồn dữ liệu, hãy cân nhắc ghi lại macro hoặc mã để tự động hóa quy trình toàn bộ văn bản. Cũng là một số lượng bên ngoài bổ trợ được viết bởi nhà cung cấp bên thứ ba, được liệt kê trong phần nhà cung cấp bên thứ ba , rằng bạn có thể cân nhắc sử dụng nếu bạn không có thời gian hoặc các tài nguyên để tự động hóa quy trình riêng bạn.

Thông tin khác

Mô tả

Tổng quan về kết nối (nhập) dữ liệu

Mô tả tất cả các cách để nhập dữ liệu ngoài vào Office Excel.

Tự động điền dữ liệu vào các ô trong trang tính

Hiển thị cách sử dụng lệnh điền .

Tạo hoặc xóa bỏ bảng Excel

Thêm hoặc loại bỏ cột và hàng trong bảng Excel

sử dụng cột được tính toán trong bảng Excel

Hiển thị cách tạo bảng Excel và thêm hoặc xóa cột hoặc cột được tính toán.

Tạo một macro

Hiển thị một vài cách để tự động hóa tác vụ lặp lại bằng cách dùng macro.

Bạn có thể sử dụng một trình soát chính tả không chỉ tìm từ sai chính tả, nhưng để tìm các giá trị không được sử dụng nhất quán, chẳng hạn như tên sản phẩm hoặc công ty, bằng cách thêm các giá trị vào từ điển tùy chỉnh.

Thông tin khác

Mô tả

Kiểm tra chính tả và ngữ pháp

Hiển thị cách sửa từ sai chính tả trên một trang tính.

Sử dụng từ điển tùy chỉnh để thêm từ vào bộ kiểm tra chính tả

Giải thích cách sử dụng từ điển tùy chỉnh.

Hàng trùng lặp là vấn đề thường gặp khi bạn nhập dữ liệu. Đó là một ý kiến hay để lọc các giá trị duy nhất đầu tiên để xác nhận rằng các kết quả là những gì bạn cần trước khi bạn loại bỏ giá trị trùng lặp.

Thông tin khác

Mô tả

Lọc các giá trị duy nhất hoặc loại bỏ những giá trị trùng lặp

Hiển thị hai thủ tục chặt chẽ liên quan: làm thế nào để lọc cho hàng duy nhất và làm thế nào để loại bỏ hàng trùng nhau.

Bạn có thể muốn loại bỏ một chuỗi đứng đầu phổ biến, chẳng hạn như nhãn theo sau là dấu hai chấm và khoảng cách, hoặc hậu tố, chẳng hạn như một cụm từ parenthetic ở đầu của chuỗi đã lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm lần xuất hiện của văn bản và sau đó thay thế nó với không có văn bản hoặc văn bản khác.

Thông tin khác

Mô tả

Kiểm tra xem ô có chứa văn bản (quản)

kiểm tra xem ô có chứa văn bản (chữ)

Hiển thị cách dùng lệnh Tìm và một số hàm để tìm văn bản.

Loại bỏ ký tự từ văn bản

Hiển thị cách sử dụng lệnh thay thế và một số hàm để loại bỏ văn bản.

Tìm hoặc thay thế văn bản và số trên một trang tính

Tìm và thay thế

Hiển thị cách dùng hộp thoại Tìmthay thế .

FIND, FINDB

SEARCH, SEARCHB

REPLACE, REPLACEB

SUBSTITUTE

LEFT, LEFTB

RIGHT, RIGHTB

LEN, LENB

MID, MIDB

Đây là các chức năng mà bạn có thể dùng để thực hiện nhiều chuỗi thao tác tác vụ, chẳng hạn như tìm và thay thế một chuỗi con trong một chuỗi, trích xuất các phần của một chuỗi, hoặc xác định độ dài của chuỗi.

Đôi khi văn bản có một túi hỗn hợp, đặc biệt là khi văn bản là có liên quan. Sử dụng một hoặc nhiều trong các hàm ba chữ hoa chữ thường, bạn có thể chuyển đổi văn bản thành chữ thường chữ cái, chẳng hạn như địa chỉ email, chữ hoa chữ cái, chẳng hạn như mã sản phẩm hoặc kiểu chữ thích hợp, chẳng hạn như tên hoặc tiêu đề sổ.

Thông tin khác

Mô tả

Thay đổi kiểu chữ hoa/thường

Hiển thị cách sử dụng các chức năng ba chữ hoa chữ thường.

DƯỚI

Chuyển đổi tất cả chữ hoa chữ cái trong chuỗi văn bản thành chữ thường chữ cái.

THÍCH HỢP

Viết hoa chữ thứ nhất trong một chuỗi văn bản và bất kỳ chữ nào trong văn bản đứng sau một ký tự không phải là chữ. Chuyển đổi tất cả các chữ khác thành chữ thường.

TRÊN

Chuyển đổi văn bản thành chữ hoa chữ cái.

Đôi khi giá trị văn bản chứa hàng đầu, dấu, hoặc nhiều ký tự khoảng trắng được nhúng (ký tựUnicode đặt giá trị 32 và 160) hoặc các ký tự (ký tự Unicode đặt giá trị 0 đến 31, 127, 129, 141, 143, 144 và 157). Các ký tự đôi khi có thể gây ra lỗi không mong đợi khi bạn sắp xếp, lọc hoặc tìm kiếm. Ví dụ, trong nguồn dữ liệu ngoài, người dùng có thể thực hiện lỗi in bằng cách thêm vô tình thêm khoảng cách ký tự, hoặc văn bản được nhập dữ liệu từ nguồn bên ngoài có thể chứa các ký tự được nhúng trong văn bản. Vì các ký tự sau không dễ dàng nhận thấy, kết quả không mong muốn có thể khó hiểu. Để loại bỏ các ký tự không mong muốn, bạn có thể dùng kết hợp các hàm TRIM, sạch và thay thế.

Thông tin khác

Mô tả

Cho biết cách để loại bỏ tất cả khoảng trắng và các ký tự từ bộ ký tự Unicode.

Trả về một mã số cho ký tự đầu tiên trong một chuỗi văn bản.

DỌN

Loại bỏ 32 các ký tự đầu tiên trong mã ASCII 7-bit (giá trị 0 đến 31) khỏi văn bản.

CẮT XÉN

Loại bỏ ký tự khoảng trắng ASCII 7-bit (giá trị 32) khỏi văn bản.

THAY THẾ

Bạn có thể dùng hàm SUBSTITUTE để thay thế giá trị cao hơn ký tự Unicode (giá trị 127, 129, 141, 143, 144, 157 và 160) với các ký tự ASCII 7-bit mà hàm TRIM và sạch đã được thiết kế.

Có hai vấn đề chính với các số có thể yêu cầu bạn làm sạch dữ liệu: số đã được vô tình được nhập dưới dạng văn bản, và đăng âm cần phải thay đổi chuẩn cho tổ chức của bạn.

Thông tin khác

Mô tả

Chuyển đổi số được lưu trữ dưới dạng văn bản sang số

Cho biết cách để chuyển đổi số được định dạng và lưu trữ trong các ô dưới dạng văn bản, có thể gây ra các vấn đề với tính toán hoặc tạo ra gây nhầm lẫn thứ tự sắp xếp, để định dạng số.

ĐÔ-LA

Chuyển đổi một số thành văn bản định dạng và áp dụng một ký hiệu tiền tệ.

VĂN BẢN

Chuyển đổi một giá trị thành văn bản trong một định dạng số cụ thể.

CỐ ĐỊNH

Làm tròn số đến số đã xác định vị trí thập phân, định dạng số thập phân định dạng bằng cách sử dụng dấu chấm và dấu phẩy và trả về kết quả dưới dạng văn bản.

GIÁ TRỊ

Chuyển đổi một chuỗi văn bản đại diện cho một số thành một số.

Vì có rất nhiều định dạng ngày khác nhau và vì các định dạng này có thể nhầm lẫn với phần đánh số mã hoặc chuỗi khác có chứa dấu gạch chéo hay dấu gạch ngang, ngày và thời gian thường cần được chuyển đổi và được định dạng lại.

Thông tin khác

Mô tả

Thay đổi các hệ thống ngày, định dạng, hoặc năm chữ số hai giải thích

Mô tả cách hoạt động của hệ thống ngày trong Office Excel.

Chuyển đổi thời gian

Cho biết cách để chuyển đổi giữa các đơn vị thời gian khác nhau.

Chuyển đổi ngày tháng được lưu dưới dạng văn bản thành ngày tháng

Hiển thị cách chuyển đổi ngày tháng mà được định dạng và lưu trữ trong các ô dưới dạng văn bản, có thể gây ra các vấn đề với tính toán hoặc tạo ra gây nhầm lẫn thứ tự sắp xếp, để định dạng ngày.

NGÀY

Trả về số tuần tự tuần tự đại diện cho một ngày cụ thể. Nếu định dạng ô là chung trước khi hàm được nhập, kết quả được định dạng dưới dạng một ngày.

DATEVALUE

Chuyển đổi ngày tháng được biểu thị bằng văn bản thành số sê-ri.

THỜI GIAN

Trả về số thập phân cho một thời gian cụ thể. Nếu định dạng ô là chung trước khi hàm được nhập, kết quả được định dạng dưới dạng một ngày.

TIMEVALUE

Trả về số thập phân của thời gian được đại diện bởi một chuỗi văn bản. Số thập phân là một giá trị từ 0 (không) đến 0.99999999, thể hiện thời gian từ 0:00:00 (12:00:00 sa) đến 23:59:59 (11:59:59 ch).

Tác vụ phổ biến sau khi nhập dữ liệu từ nguồn dữ liệu ngoài là hoặc phối hai hoặc nhiều cột vào một hoặc phân tách một cột thành hai hoặc nhiều cột. Ví dụ, bạn có thể muốn chia tách cột có chứa tên đầy đủ vào một tên và họ. Hoặc, bạn có thể muốn chia tách cột có chứa một địa chỉ trường thành phố riêng biệt, thành phố, vùng và mã bưu chính cột. Đảo ngược cũng có thể đúng. Bạn có thể muốn phối cột đầu tiên và cuối cùng tên vào một cột tên đầy đủ, hoặc kết hợp cột riêng biệt địa chỉ vào một cột. Bổ sung các giá trị phổ biến có thể yêu cầu sáp nhập vào một cột hoặc tách thành nhiều cột có mã sản phẩm, đường dẫn tệp và địa chỉ giao thức Internet (IP).

Thông tin khác

Mô tả

Kết hợp tên và họ

kết hợp văn bản và số

kết hợp văn bản với ngày hoặc thời gian

kết hợp hai hoặc nhiều cột bằng cách dùng hàm

Hiển thị các ví dụ điển hình về cách kết hợp các giá trị từ hai hoặc nhiều cột.

Tách văn bản thành cột khác nhau với Trình hướng dẫn Chuyển đổi Văn bản thành Cột

Hiển thị cách sử dụng trình hướng dẫn này để chia tách cột dựa trên nhiều dấu tách phổ biến.

Tách văn bản thành các cột khác nhau bằng cách sử dụng hàm

Hiển thị cách sử dụng ở bên trái, hàm MID, RIGHT, SEARCH và LEN để tách tên cột thành hai hoặc nhiều cột.

Kết hợp hay tách nội dung của ô

Hiển thị cách sử dụng hàm CONCATENATE, & (dấu và) toán tử và chuyển văn bản thành cột trình hướng dẫn.

Phối ô hoặc tách ô đã phối

Hiển thị cách sử dụng các lệnh Phối ô, Phối quaphối và căn giữa .

CONCATENATE

Nối hai hoặc nhiều chuỗi văn bản vào một chuỗi.

Hầu hết các phân tích và các tính năng định dạng trong Office Excel giả định rằng dữ liệu tồn tại trong một bảng duy nhất, hai chiều phẳng. Đôi khi bạn có thể muốn thực hiện các hàng trở thành cột, và các cột thành hàng. Tại thời điểm khác, dữ liệu không thậm chí có cấu trúc trong định dạng bảng, và bạn cần một cách để biến đổi dữ liệu từ một nontabular thành định dạng bảng.

Thông tin khác

Mô tả

HOÁN ĐỔI

Trả về một phạm vi dọc của các ô dưới dạng một phạm vi ngang, hoặc ngược lại.

Đôi khi, người quản trị cơ sở dữ liệu sử dụng Office Excel để tìm và sửa lỗi khớp khi hai hoặc nhiều bảng được nối. Điều này có thể liên quan đến điều hòa hai bảng từ trang tính khác nhau, ví dụ, để xem tất cả bản ghi trong cả hai bảng hoặc để so sánh bảng và tìm các hàng không khớp.

Thông tin khác

Mô tả

Tra cứu các giá trị trong danh sách dữ liệu

Hướng dẫn cách thông thường để tìm dữ liệu bằng cách dùng các hàm tra cứu.

TRA CỨU

Trả về một giá trị từ một phạm vi một hàng hoặc một cột hoặc từ một mảng. Hàm LOOKUP có hai cú pháp biểu mẫu: dạng vector và dạng mảng.

HÀM HLOOKUP

Tìm kiếm một giá trị trong hàng trên cùng của bảng hoặc một mảng các giá trị, và sau đó trả về một giá trị trong cùng một cột từ một hàng bạn xác định trong bảng hoặc mảng.

HÀM VLOOKUP

Tìm kiếm một giá trị trong cột đầu tiên của một mảng bảng và trả về một giá trị trong cùng hàng từ một cột trong mảng bảng.

CHỈ MỤC

Trả về một giá trị hoặc tham chiếu tới một giá trị từ trong một bảng hoặc phạm vi. Có hai hình thức của hàm INDEX: dạng mảng và biểu mẫu tham chiếu.

KHỚP

Trả về vị trí tương đối của một mục trong một mảng khớp với một giá trị đã xác định theo thứ tự được chỉ định. Sử dụng khớp thay vì một trong các hàm tra cứu khi bạn cần vị trí của một mục trong một phạm vi thay vì mục đó.

GIÁ TRỊ BÙ TRỪ

Trả về tham chiếu tới một phạm vi cách một ô hoặc phạm vi ô một số hàng và một số cột đã xác định. Tham chiếu được trả về có thể là một ô đơn hoặc một phạm vi ô. Bạn có thể chỉ rõ số hàng và số cột cần trả về.

Sau đây là một phần danh sách các nhà cung cấp bên thứ ba có sản phẩm được dùng để làm sạch dữ liệu trong nhiều cách khác nhau.

Ghi chú: Microsoft không cung cấp hỗ trợ cho sản phẩm của bên thứ ba.

Nhà cung cấp

Sản phẩm

Bổ trợ Express Ltd.

cho Excel, trình hướng dẫn bảng phối, loại bỏ trùng lặp, hợp nhất bảng hướng dẫn, hướng dẫn hàng kết hợp, ô sạch hơn, ngẫu nhiên tạo, phối ô, công cụ nhanh cho Excel, sắp xếp ngẫu nhiên, tìm kiếm nâng cao & thay thế, mờ trình tìm kiếm trùng lặp, Tách tên, tách bảng hướng dẫn, sổ làm việc quản lý

Thêm Ins.com

Trình tìm kiếm trùng lặp

AddinTools

AddinTools hỗ trợ

J-đi & đồng nghiệp, Inc.

Power Tiện ích Lëtzebuergeschen Phiên bản 7

WinPure

ListCleaner Lite
ListCleaner Pro
gọn gàng và Match 2007

Đầu trang

Ghi chú: Tuyên bố miễn trừ trách nhiệm Dịch Máy: Bài viết này do một hệ thống máy tính dịch mà không có sự can thiệp của con người. Microsoft cung cấp những bản dịch máy này để giúp người dùng không nói tiếng Anh hiểu nội dung về các sản phẩm, dịch vụ và công nghệ của Microsoft. Do bài viết này được dịch máy nên có thể có các lỗi về từ vựng, cú pháp hoặc ngữ pháp.

Phát triển các kỹ năng của bạn
Khám phá nội dung đào tạo
Sở hữu tính năng mới đầu tiên
Tham gia Người dùng nội bộ Office

Thông tin này có hữu ích không?

Cảm ơn phản hồi của bạn!

Cảm ơn bạn đã phản hồi! Để trợ giúp tốt hơn, có lẽ chúng tôi sẽ kết nối bạn với một trong những nhân viên hỗ trợ Office của chúng tôi.

×