استخراج بيانات العملاء الكنديين

يقوم بتحميل مجموعة بيانات Excel وفحصها، ثم يقرأ ويحلل ملف نصي لاستخراج أسماء العملاء المحددة والقيم النقدية باستخدام التعبيرات العادية.

التصنيف
تعلم آلي
تاريخ الإنجاز
April 2024
التقنيات المستخدمة
Python 3 Jupyter Notebook pandas matplotlib re (regular expressions) built-in file
ملف المشروع
غير مسموح بالتحميل إلا بإذن من أمين قحطان. تواصل معه للحصول على الإذن.

نظرة عامة على المشروع

<table><tbody><tr data-start=\"2126\" data-end=\"2830\"><td data-start=\"2157\" data-end=\"2830\" data-col-size=\"xl\">يقوم دفتر الملاحظات أولاً باستيراد <strong data-start=\"2186\" data-end=\"2196\">pandas</strong> و<strong data-start=\"2201\" data-end=\"2215\">matplotlib</strong> لتحميل ملف Excel <code data-start=\"2228\" data-end=\"2252\">clean_canada_data.xlsx</code> في إطار بيانات وعرض الصفوف القليلة الأولى منه للحصول على نظرة عامة سريعة. ثم ينتقل إلى معالجة النصوص: باستخدام وحدة <strong data-start=\"2395\" data-end=\"2403\">open</strong> المدمجة في Python ووحدة <strong data-start=\"2412\" data-end=\"2418\">re</strong>، يقرأ <code data-start=\"2436\" data-end=\"2454\">Iphone_Order.txt</code>، ويستخرج الاسم الكامل للعميل الثاني الذي يبدأ اسمه بـ "S" وينتهي بـ "er"، ويجد جميع أنماط المبلغ بالدولار (على سبيل المثال "$1,499.99")، ويوضح تقسيم النص عند علامات الترقيم. أخيرًا، يعرض أول خمسة سجلات مع أعمدة رأسية مناسبة لتوضيح تقنيات معالجة البيانات الأساسية ومطابقة الأنماط.</td></tr></tbody></table><table><tbody><tr data-start=\"2831\" data-end=\"3243\"><td data-start=\"2831\" data-end=\"2862\" data-col-size=\"sm\"></td></tr></tbody></table>

معاينة ملف

استعرض ملف الخاص بالمشروع أدناه أو اطلب نسخة منه.

لا يمكن معاينة هذا النوع من الملفات مباشرة.