أشهر خوارزميات التعلم الآلي في وقتنا الحالي
يمكن للتعلم الآلي (ML) أن يفعل كل شيء من تحليل الأشعة السينية إلى التنبؤ بأسعار سوق الأسهم والكثير. مع هذه المجموعة الواسعة من التطبيقات وتواجد خوارزميات التعلم الآلي بتنوع شديد ، ليس من المفاجئ أن ينمو سوق التعلم الآلي العالمي من 21.7 مليار دولار في عام 2022 إلى 209.91 مليار دولار بحلول عام 2029 ، وفقًا لـ Fortune Business Insights (شركة تقدم دراسات السوق والخدمات الاستشارية للشركات العالمية).
في صميم التعلم الآلي توجد الخوارزميات ، والتي يتم تدريبها لتصبح نماذج التعلم الآلي المستخدمة لتشغيل بعض أكثر الابتكارات تأثيرًا في العالم اليوم. في هذه المقالة ، ستتعرف على أربع أهم خوارزميات التعلم الآلي التي يجب معرفتها عند بدء رحلة التعلم الآلي الخاصة بك واستكشاف أنماط التعلم المختلفة المستخدمة لتحويل خوارزميات التعلم الآلي إلى نماذج التعلم الآلي. لكن قبل البدء لنعطي تعريفا ملخصا لماهية خوارزميات التعلم الآلي.
ما هي خوارزميات التعلم الآلي:
تشير خوارزمية التعلم الآلي إلى رمز البرنامج (الرياضيات أو منطق البرنامج) الذي يمكّن المحترفين من دراسة مجموعات البيانات الكبيرة المعقدة وتحليلها وفهمها واستكشافها. تتبع كل خوارزمية سلسلة من التعليمات لتحقيق هدف إجراء تنبؤات أو تصنيف المعلومات عن طريق التعلم والتأسيس واكتشاف الأنماط المضمنة في البيانات.
تحدد خوارزميات التعلم الآلي القواعد والعمليات التي يجب أن يأخذها النظام في الاعتبار أثناء معالجة مشكلة معينة. تقوم هذه الخوارزميات بتحليل ومحاكاة البيانات للتنبؤ بالنتيجة ضمن نطاق محدد مسبقًا. علاوة على ذلك ، عندما يتم إدخال بيانات جديدة في هذه الخوارزميات ، فإنها تتعلم وتحسن بناءً على التعليقات على الأداء السابق في توقع النتائج. للتبسيط، تميل خوارزميات التعلم الآلي إلى أن تصبح “أكثر ذكاءً” مع كل تكرار.
أشهر خوارزميات التعلم الآلي في وقتنا الحالي:
هناك العديد من الخوارزميات شائعة الإستخدام في مجتمعات التطوير مثل :
- الانحدارالخطي
- الانحدار اللوجستي
- شجرة القرار
- SVM
- kNN
- K- Mean
سنتحدث اليوم عن أهم وأشهر أربع خوارزميات تحتاج إلى معرفتها عندما تبدأ حياتك المهنية في التعلم الآلي:
1- الانحدار اللوجستي Logistic Regression:
لا ، الانحدار اللوجستي ليس لمشاكل الانحدار. إنه في الواقع لمهام التصنيف. تطبق الخوارزمية وظيفة لوجستية على مجموعة من الميزات التي تتنبأ بنتيجة متغير تابع. بالطبع ، لن يكون اسم المتغير المستقل صحيحًا لأنه لم يكن يعتمد على متغيرات الإدخال المتوقعة بالفعل. وهي مقسمة إلى ثلاث فئات:
- الانحدار اللوجستي الثنائي
- الانحدار اللوجستي متعدد الأسماء
- الانحدار اللوجيستي الترتيبي
يتم استخدام الانحدار اللوجستي الثنائي بشكل شائع عندما يكون هناك تصنيفان أو نتائج ثنائية محتملة (نعم أو لا ؛ ناجح أو فاشل). يمكن أن يساعد هذا في طرق مثل التنبؤ بما إذا كان من المحتمل أن يجتاز الطالب دورة أو يفشل فيها أو التنبؤ بما إذا كان الورم سرطانيًا أم لا. الانحدار اللوجستي متعدد الأسماء له ثلاث نتائج أو أكثر بدون ترتيب ، والانحدار اللوجستي الترتيبي له ثلاث نتائج أو أكثر بترتيب طبيعي.
2- شجرة القرار Decision tree:
شجرة القرار هي خوارزمية تعلم خاضعة للإشراف تستخدم للتصنيف والنمذجة التنبؤية.
على غرار مخطط انسيابي رسومي ، تبدأ شجرة القرار بالعقدة الجذرية (root node)، والتي تطرح سؤالاً محددًا من البيانات ثم ترسلها إلى فرع أسفل اعتمادًا على الإجابة. يؤدي كل من هذه الفروع إلى عقدة داخلية ، والتي بدورها تطرح سؤالًا آخر عن البيانات قبل توجيهها نحو فرع آخر اعتمادًا على الإجابة. يستمر هذا حتى تصل البيانات إلى عقدة نهائية ، تسمى أيضًا عقدة طرفية(leaf node) ، لا تتفرع أكثر من ذلك.
تعتبر أشجار القرار شائعة في التعلم الآلي لأنها يمكن أن تتعامل مع مجموعات البيانات المعقدة بالبساطة النسبية.
3- K-mean
عبارة عن خوارزمية تجميع غير خاضعة للإشراف مصممة لتقسيم البيانات غير الموسومة إلى رقم معين (هذا هو “K”) للتجمعات المتميزة. بعبارة أخرى ، تعثر k-mean على الملاحظات التي تشترك في الخصائص المهمة وتصنفها معًا في مجموعات. حل التجميع الجيد هو الحل الذي يجد الكتل بحيث تكون الملاحظات داخل كل مجموعة أكثر تشابهًا من المجموعات نفسها.
هناك أمثلة لا حصر لها على الأماكن التي يمكن أن يكون فيها هذا التجميع الآلي للبيانات مفيدًا للغاية. على سبيل المثال ، ضع في اعتبارك حالة إنشاء حملة إعلانية عبر الإنترنت لمجموعة جديدة تمامًا من المنتجات التي يتم طرحها في السوق. بينما يمكننا عرض إعلان عام واحد لجميع السكان ، فإن الطريقة الأفضل هي تقسيم السكان إلى مجموعات من الأشخاص الذين لديهم خصائص ومصالح مشتركة تعرض إعلانات مخصصة لكل مجموعة. K-mean عبارة عن خوارزمية تجد هذه المجموعات في مجموعات البيانات الكبيرة حيث لا يمكن إجراؤها يدويًا.
4- KNN Algorithm:
تستخدم خوارزمية K-Nearest Neighbours مجموعة البيانات بأكملها كمجموعة تدريب ، بدلاً من تقسيم مجموعة البيانات إلى مجموعة تدريب ومجموعة اختبار.
عندما تكون النتيجة مطلوبة لمثيل بيانات جديد ، تمر خوارزمية KNN عبر مجموعة البيانات بأكملها للعثور على أقرب مثيلات k إلى المثيل الجديد ، أو عدد الحالات k الأكثر تشابهًا مع السجل الجديد ، ثم تُخرج المتوسط من النتائج (لمشكلة الانحدار) أو النمط (الفئة الأكثر شيوعًا) لمشكلة التصنيف. قيمة k يحددها المستخدم.
يتم حساب التشابه بين الحالات باستخدام مقاييس مثل المسافة الإقليدية ومسافة هامينج.
خلاصة:
تميل خوارزميات التعلم الآلي إلى التعلم من الملاحظات. يقومون بتحليل البيانات ، تعيين المدخلات للمخرجات ، واكتشاف أنماط البيانات. تصبح الخوارزميات أكثر ذكاءً لأنها تعالج المزيد من البيانات ، مما يحسن الأداء التنبئي العام.
اعتمادًا على المتطلبات المتغيرة وتعقيد المشكلات ، تستمر المتغيرات الجديدة لخوارزميات التعلم الآلي الحالية في الظهور. يمكنك اختيار الخوارزمية التي تناسب احتياجاتك على أفضل وجه والحصول على السبق في التعلم الآلي.
مصادر:
ورقة معلومات خوارزمية التعلم الآلي لمصمم التعلم الآلي من Microsoft Azure وهي تساعدك كثيراً على فهم المجالات المتاحة وأيهما أنسب لك لتتعلم تطوير خوارزميات قابلة للتعلم الذاتي.
أيضاً هناك صانع محتوى عربي على يوتيوب بإسم “Mustafa Othman” يقدم قائمة فيديوهات تشرح خوارزميات تعلم الآلة بتعمق أكثر ويمكنك الإطلاع على منصة يوتيوب والبحث عن فيديوهات أخرى للإستفادة من أكثر من مصدر. نشارك معكم قائمة الفيديو هنا للإفادة والدعم للمحتوى المتميز.