أفضل عشر طرق لمسح البيانات

الكلمات التي تحتوي علي أخطاء املائيه وستوبورن المسافات الزائدة والبادئات غير المرغوب فيها والحالات غير المطبوعة والأحرف غير القابلة ولا يمكنك الحصول علي الشوائب في البيانات الخاصة بك. جمع سلفيسك. حان الوقت لبعض الارتداد الرئيسي لأوراق العمل باستخدام Microsoft Excel.

لا تملك دائما التحكم في تنسيق البيانات التي تقوم باستيرادها من مصدر بيانات خارجي ، مثل قاعده بيانات أو ملف نصي أو صفحه ويب. قبل ان تتمكن من تحليل البيانات ، تحتاج غالبا إلى تنظيفها. لتمكين Excel من العديد من الميزات لمساعدتك في الحصول علي البيانات بالتنسيق الدقيق الذي تريده. في بعض الأحيان ، تكون المهمة مباشره وهناك ميزه محدده تقوم بالمهمة. علي سبيل المثال ، يمكنك بسهوله استخدام المدقق الإملائي لتنظيف الكلمات التي بها أخطاء املائيه في الاعمده التي تحتوي علي تعليقات أو أوصاف. أو ، إذا كنت تريد أزاله الصفوف المكررة ، يمكنك القيام بذلك بسرعة باستخدام مربع الحوار أزاله التكرارات .

في أوقات أخرى ، قد تحتاج إلى التعامل مع عمود واحد أو أكثر باستخدام صيغه لتحويل القيم المستوردة إلى قيم جديده. علي سبيل المثال ، إذا أردت أزاله المسافات الزائدة ، يمكنك إنشاء عمود جديد لتنظيف البيانات باستخدام صيغه ، وتعبئة العمود الجديد ، وتحويل صيغ العمود الجديد إلى قيم ، ثم أزاله العمود الأصلي.

فيما يلي الخطوات الاساسيه لتنظيف البيانات:

  1. استيراد البيانات من مصدر بيانات خارجي.

  2. إنشاء نسخه احتياطيه من البيانات الاصليه في مصنف منفصل.

  3. تاكد من ان البيانات موجودة في تنسيق جدولي من الصفوف والاعمده التي تحتوي علي: بيانات مماثله في كل عمود ، وكل الاعمده والصفوف المرئية ، ولا توجد صفوف فارغه داخل النطاق. للحصول علي أفضل النتائج ، استخدم جدول Excel.

  4. قم بتنفيذ المهام التي لا تتطلب معالجه العمود أولا ، مثل التدقيق الإملائي أو استخدام مربع الحوار بحث واستبدال .

  5. بعد ذلك ، قم بتنفيذ المهام التي تتطلب معالجه العمود. الخطوات العامة لمعالجه عمود هي:

    1. أدرج عمودا جديدا (ب) بجانب العمود الأصلي (ا) الذي يحتاج إلى التنظيف.

    2. أضف صيغه تقوم بتحويل البيانات في اعلي العمود الجديد (B).

    3. قم بتعبئة الصيغة في العمود الجديد (B). في جدول Excel ، يتم تلقائيا إنشاء عمود محسوب بالقيم المعباه.

    4. حدد العمود الجديد (B) ، وانسخه ، ثم قم بلصقه كقيم في العمود الجديد (B).

    5. أزاله العمود الأصلي (A) ، الذي يحول العمود الجديد من B إلى ا.

لتنظيف مصدر البيانات نفسه بشكل دوري ، ضع في اعتبارك تسجيل ماكرو أو كتابه التعليمات البرمجية لاتمته العملية بالبالكامل. هناك أيضا عدد من الوظائف الاضافيه الخارجية التي تمت كتابتها بواسطة موردي الجهات الخارجية ، المدرجة في القسم " موفرو الجهات الخارجية" ، يمكنك استخدامه إذا لم يكن لديك الوقت أو الموارد لاتمته العملية بنفسك.

المعلومات الإضافية

الوصف

تعبئة البيانات تلقائياً في خلايا ورقة العمل

إظهار كيفيه استخدام الأمر " تعبئة ".

إنشاء جداول

وتنسيقها

تغيير حجم جدول بواسطة أضافه صفوف وأعمده أو ازالتهااستخدام الاعمده المحسوبة في جدول Excel

إظهار كيفيه إنشاء جدول Excel وأضافه أعمده أو أعمده محسوبة أو حذفها.

إنشاء ماكرو

إظهار طرق متعددة لتنفيذ المهام المتكررة تلقائيا باستخدام ماكرو.

يمكنك استخدام المدقق الإملائي لعدم العثور علي الكلمات التي بها أخطاء املائيه فقط ، ولكن للعثور علي القيم التي لا يتم استخدامها بشكل متناسق ، مثل أسماء المنتجات أو الشركات ، عن طريق أضافه هذه القيم إلى قاموس مخصص.

المعلومات الإضافية

الوصف

التدقيق الإملائي والتدقيق النحوي

يظهر كيفيه تصحيح الكلمات التي بها أخطاء املائيه في ورقه عمل.

استخدام قواميس مخصصه لأضافه كلمات إلى المدقق الإملائي

توضح هذه المقالة كيفيه استخدام قواميس مخصصه.

تعد الصفوف المكررة مشكله شائعه عند استيراد البيانات. من المستحسن تصفيه القيم الفريدة أولا للتاكد من ان النتائج هي العناصر التي تريدها قبل أزاله القيم المتكررة.

المعلومات الإضافية

الوصف

التصفية حسب القيم الفريدة أو إزالة القيم المتكررة

يعرض إجراءين ذي صله بشكل كبير: كيفيه التصفية للصفوف الفريدة وكيفيه أزاله الصفوف المكررة.

قد تحتاج إلى أزاله سلسله المسافة البادئة الشائعة ، مثل التسمية متبوعه بنقطتين ومسافة ، أو لاحقه ، مثل عبارة بارينثيتيك في نهاية السلسلة القديمة أو غير الضرورية. يمكنك القيام بذلك عن طريق البحث عن مثيلات النص ، ثم استبدالها بدون نص أو اي نص آخر.

المعلومات الإضافية

الوصف

التحقق مما إذا كانت أحدي الخلايا تحتوي علي نص (بدون تحسس حاله الأحرف)

تحقق مما إذا كانت الخلية تحتوي علي نص (تحسس حاله الأحرف)

إظهار كيفيه استخدام الأمر " بحث " والعديد من الدالات للبحث عن نص.

أزاله الأحرف من النص

يظهر كيفيه استخدام الأمر استبدال ودالات متعددة لأزاله النص.

البحث عن نصوص وأرقام في ورقة عمل أو استبدالها

إظهار كيفيه استخدام مربعي الحوار بحثواستبدال .

FIND ،

البحث عن FINDB ، SEARCHB

استبدال ، REPLACEB



،
LEFTB
، RIGHTB
، المتوسطة ، LENB ، MIDB

هذه هي الدالات التي يمكنك استخدامها لتنفيذ مهام معالجه سلاسل متنوعة ، مثل البحث عن سلسله فرعيه واستبدالها داخل سلسله ، واستخراج أجزاء من سلسله ، أو تحديد طول السلسلة.

في بعض الأحيان ، ياتي النص في حقيبة مختلطة ، خاصه عندما يكون النص مهتما. باستخدام واحده أو أكثر من دالات الحالة الثلاثة ، يمكنك تحويل نص إلى أحرف صغيره ، مثل عناوين البريد الكتروني أو الأحرف الكبيرة مثل رموز المنتجات أو الحالة المناسبة مثل الأسماء أو عناوين الكتب.

المعلومات الإضافية

الوصف

تغيير حالة نص

يظهر كيفيه استخدام الدالات الثلاثة حالات.

LOWER

تحول كل الأحرف الكبيرة في سلسله نصيه إلى أحرف صغيره.

ضمان

تحوّل هذه الدالة الحرف الأول في سلسلة نصية وأي أحرف أخرى في النص الذي يلي أي حرف آخر غير حرف أبجدي إلى حرف كبير. وتحوّل كافة الأحرف الأخرى إلى أحرف صغيرة.

UPPER

تحويل نص إلى أحرف كبيره.

في بعض الأحيان تحتوي القيم النصية علي أحرف المسافات البادئة أو اللاحقة أو المتعددة المضمنة (Unicode قيم مجموعه الأحرف 32 و 160) أو الأحرف غير المطبوعة (قيم مجموعه أحرف Unicode 0 إلى 31 و 127 و 129 و 141 و 143 و 144 و 157). قد تؤدي هذه الأحرف أحيانا إلى ظهور نتائج غير متوقعه عند فرز أو تصفيه أو بحث. علي سبيل المثال ، في مصدر البيانات الخارجي ، قد يؤدي المستخدمون إلى حدوث أخطاء مطبعية عن طريق أضافه أحرف مسافات اضافيه بدون قصد ، أو قد تحتوي بيانات نصيه مستورده من مصادر خارجيه علي أحرف غير مطبوعه مضمنه في النص. نظرا لعدم ملاحظه هذه الأحرف بسهوله ، قد يصعب فهم النتائج غير المتوقعة. لأزاله هذه الأحرف غير المرغوب فيها ، يمكنك استخدام تركيبه من الدالات TRIM و CLEAN و "استبدال".

المعلومات الإضافية

الوصف

يظهر كيفيه أزاله كل المسافات والأحرف غير المطبوعة من مجموعه أحرف Unicode.

تعليم

تُرجع رمزاً رقمياً للحرف الأول في سلسلة نصية.

نظف

أزاله الأحرف الاولي غير المطبوعة في 32 في التعليمات البرمجية ASCII ذات 7 بت (القيم من 0 إلى 31) من النص.

TRIM

أزاله حرف المسافة ASCII الذي يمثل 7 بت (القيمة 32) من النص.

يستبدل

يمكنك استخدام الدالة replace لاستبدال أحرف Unicode ذات القيمة الأعلى (القيم 127 و 129 و 141 و 143 و 144 و 157 و 160) بأحرف ASCII ذات 7 بت والتي تم تصميم وظائف الاقتطاع والتنظيف لها.

هناك مشكله رئيسيه بالأرقام التي قد تتطلب منك تنظيف البيانات: تم استيراد الرقم بدون قصد كنص ، ويجب تغيير العلامة السالبة إلى المعايير القياسية لمؤسسك.

المعلومات الإضافية

الوصف

تحويل الأرقام المخزّنة كنص إلى أرقام

يظهر كيفيه تحويل الأرقام التي تم تنسيقها وتخزينها في الخلايا كنص ، مما يؤدي إلى حدوث مشاكل تتعلق بالحسابات أو إنشاء ترتيبات فرز محيره ، إلى تنسيق الأرقام.

$

تحويل رقم إلى تنسيق نصي وتطبيق رمز عمله.

TEXT

تحويل قيمه إلى نص بتنسيق أرقام معين.

تم التصحيح

تقريب رقم إلى عدد محدد من الأرقام العشرية ، وتنسيق الرقم بالتنسيق العشري باستخدام نقطه وفواصل ، وإرجاع النتيجة كنص.

VALUE

تحوّل هذه الدالة سلسلة نصية تمثل رقماً إلى رقم.

بما ان هناك تنسيقات تاريخ مختلفه ، ولذلك قد يتم الخلط بين هذه التنسيقات باستخدام رموز الأجزاء المرقمة أو السلاسل الأخرى التي تحتوي علي علامات الخطوط المائلة أو الواصلات والتواريخ والأوقات غالبا.

المعلومات الإضافية

الوصف

تغيير نظام التاريخ أو التنسيق أو تفسير السنه من رقمين

يصف هذا الموضوع كيفيه عمل نظام التاريخ في Office Excel.

تحويل الأوقات

يظهر كيفيه التحويل بين وحدات زمنيه مختلفه.

تحويل التواريخ المخزّنة كنص إلى تواريخ

يظهر كيفيه تحويل التواريخ التي تم تنسيقها وتخزينها في الخلايا كنص ، مما قد يؤدي إلى حدوث مشاكل تتعلق بالحسابات أو إنشاء ترتيبات فرز محيره ، إلى تنسيق التاريخ.

DATE

إرجاع الرقم التسلسلي التسلسلي الذي يمثل تاريخا معينا. إذا كانت الخلية بالتنسيق عام قبل إدخال الدالة، فيتم تنسيق الخلية كتاريخ.

DATEVALUE

تحول تاريخ يمثله النص إلى رقم تسلسلي.

TIME

تُرجع هذه الدالة الرقم العشري لوقت محدد. إذا كانت الخلية بالتنسيق عام قبل إدخال الدالة، فيتم تنسيق الخلية كتاريخ.

TIMEVALUE

تُرجع هذه الدالة الرقم العشري للوقت ممثلاً بسلسلة نصية. الرقم العشري هو قيمه تتراوح بين 0 (صفر) إلى 0.99999999 ، تمثل الأوقات من 0:00:00 (12:00:00 ص) إلى 23:59:59 (11:59:59 م).

ان المهمة الشائعة بعد استيراد البيانات من مصدر بيانات خارجي هي اما ان تقوم بدمج عمودين أو أكثر في جدول واحد ، أو منقسمة إلى اثنين أو أكثر من الاعمده. علي سبيل المثال ، قد ترغب في تقسيم العمود الذي يحتوي علي اسم كامل إلى اسم أول واخر. أو ، قد ترغب في تقسيم عمود يحتوي علي حقل عنوان في أعمده الشارع والمدينة والمنطقة والرمز البريدي. قد يكون العكس صحيحا أيضا. قد تحتاج إلى دمج عمود الاسم الأول والأخير في عمود "الاسم الكامل" ، أو دمج أعمده عناوين منفصلة في عمود واحد. تتضمن القيم الاضافيه الأكثر شيوعا التي قد تتطلب دمجها في عمود واحد أو تقسيمها إلى أعمده متعددة رموز المنتجات ومسارات الملفات وعناوين بروتوكول الإنترنت (IP).

المعلومات الإضافية

الوصف

دمج الاسمين




الأول والأخير دمج النص مع التاريخ أو الوقتدمج عمودين أو أكثر باستخدام داله

إظهار الامثله النموذجية لجمع القيم من عمودين أو أكثر.

تقسيم النص إلى أعمدة مختلفة باستخدام "معالج تحويل النص إلى أعمدة"

يظهر كيفيه استخدام هذا المعالج لتقسيم الاعمده استنادا إلى المحددات الشائعة المختلفة.

تقسيم النص إلى أعمدة مختلفة باستخدام دالات

يظهر كيفيه استخدام الدالات اليمني والمتوسطة واليمني والبحث والLEN لتقسيم عمود اسم إلى عمودين أو أكثر.

دمج محتويات الخلايا أو تقسيمها

يظهر كيفيه استخدام الدالة سلسله ، & التشغيل (علامة العطف) ، ومعالج تحويل النص إلى أعمده.

دمج خلايا أو تقسيم خلايا مدمجة

يظهر كيفيه استخدام الأوامر دمج الخلاياوالدمج عبروالدمج والتوسيط .

CONCATENATE

ربط اثنين أو أكثر من السلاسل النصية في سلسله نصيه واحده.

تفترض معظم ميزات التحليل والتنسيق في Office Excel ان البيانات موجودة في جدول ثنائي الابعاد مسطح. في بعض الأحيان ، قد ترغب في جعل الصفوف ستصبح أعمده ، وتصبح الاعمده صفوفا. في بعض الأحيان ، لا يتم بناء البيانات بتنسيق جدولي ، ستحتاج إلى طريقه لتحويل البيانات من نونتابولار إلى تنسيق جدولي.

المعلومات الإضافية

الوصف

TRANSPOSE

إرجاع نطاق خلايا عمودي كنطاق أفقي ، أو العكس.

في بعض الأحيان ، يستخدم مسؤولو قاعده البيانات Office Excel للبحث عن الأخطاء المطابقة وتصحيحها عند انضمام جدولين أو أكثر. قد يشمل هذا تسويه جدولين من أوراق عمل مختلفه ، علي سبيل المثال ، للاطلاع علي كل السجلات في كلا الجدولين أو لمقارنه الجداول والبحث عن الصفوف التي لا تتطابق.

المعلومات الإضافية

الوصف

البحث عن قيم في قائمة بيانات

إظهار الطرق الشائعة للبحث عن البيانات باستخدام دالات البحث.

اشتقاق

إرجاع قيمه اما من نطاق صف واحد أو من عمود واحد أو من صفيف. تحتوي الدالة LOOKUP علي نموذجين لبناء الجملة: نموذج الخط المتجه ونموذج الصفيف.

HLOOKUP

البحث عن قيمه في الصف العلوي من جدول أو صفيف من القيم ، ثم إرجاع قيمه في العمود نفسه من صف تحدده في الجدول أو الصفيف.

VLOOKUP

البحث عن قيمه في العمود الأول من صفيف الجدول وإرجاع قيمه في الصف نفسه من عمود آخر في صفيف الجدول.

INDEX

تُرجع هذه الدالة قيمة أو مرجعاً إلى قيمة من ضمن جدول أو نطاق. هناك نموذجان للدالة INDEX: نموذج الصفيف ونموذج المرجع.

MATCH

ترجع هذه الدالة الموضع النسبي لعنصر في صفيف يطابق قيمه محدده بترتيب معين. استخدم الدالة MATCH بدلاً من إحدى دالات LOOKUP عندما تريد معرفة موضع عنصر في نطاق وليس معرفة العنصر نفسه.

استكمال

تُرجع هذه الدالة مرجعاً إلى نطاق يتكوّن من عدد معين من الصفوف والأعمدة من خلية أو نطاق من الخلايا. يكون المرجع الذي يتم إرجاعه عبارة عن خلية واحدة أو نطاق من الخلايا. ويمكنك تحديد عدد الصفوف وعدد الأعمدة التي سيتم إرجاعها.

فيما يلي قائمه جزئيه لموفري الجهات الخارجية الذين لديهم منتجات يتم استخدامها لتنظيف البيانات بطرق متعددة.

ملاحظة: لا تقدم Microsoft دعما لمنتجات الجهات الخارجية.

الموفر

المنتج

الوظيفة الاضافيه المحدودة.

المجموعة المتميزة ل Excel ، معالج دمج الجداول ، ريموفير التكرار ، معالج دمج الصفوف ، معالج الدمج للصفوف ، تنظيف الخلايا ، المولد العشوائي ، دمج الخلايا ، الاداات السريعة ل Excel ، الأنماط العشوائية ، ال& بحث المتقدم ، معالج الجداول المنقسمة

Add-Ins.com

الباحث المكرر

أدينتوولس

مساعده أدينتوولس

J-اطلع علي &الشركاء ، Inc..

الإصدار 7 من باك

وينبوري

ليستكلينير Lite
ليستكلينير Pro
النظيفة والمطابقة في 2007

أعلى الصفحة

تعزيز مهارات Office
استكشاف التدريب
الحصول على الميزات الجديدة أولاً
الانضمام إلى Office Insider

هل كانت المعلومات مفيدة؟

نشكرك على ملاحظاتك!

شكراً لك على الملاحظات! يبدو أنه من المفيد إيصالك بأحد وكلاء دعم Office لدينا.

×