خط أنابيب لتصنيف أورام الثدي (الخبيثة مقابل الحميدة) باستخدام نموذج شجرة القرار على بيانات السمات السريرية.
<table><tbody><tr data-start=\"2142\" data-end=\"2760\"><td data-start=\"2173\" data-end=\"2760\" data-col-size=\"xl\">يبدأ دفتر الملاحظات بتحميل مجموعة البيانات <code data-start=\"2210\" data-end=\"2229\">Breast cancer.csv</code> باستخدام pandas وعرض الصفوف الأولى. إنه يتجاهل الأعمدة غير التنبؤية (<code data-start=\"2389\" data-end=\"2393\">id</code>، <code data-start=\"2395\" data-end=\"2408\">Unnamed: 32</code>)، ويقوم بتشفير <code data-start=\"2430\" data-end=\"2441\">التشخيص</code> المستهدف (M → 1, B → 0)، ويقوم بقياس الميزات باستخدام MinMaxScaler. بعد تقسيمها إلى مجموعات تدريب/اختبار، تُدرّب <code data-start=\"2624\" data-end=\"2665\">DecisionTreeClassifier(random_state=42)</code>، ثم تُقيّم الأداء عبر الدقة، والدقة، والاستدعاء، ودرجة F1، ومصفوفة الارتباك.</td></tr></tbody></table><table><tbody><tr data-start=\"2761\" data-end=\"3160\"><td data-start=\"2761\" data-end=\"2792\" data-col-size=\"sm\"></td></tr></tbody></table>
استعرض ملف الخاص بالمشروع أدناه أو اطلب نسخة منه.