
أهم المهارات بالنسبة لأولئك الذين يعملون مع Machine Learning هي معرفة الطريقة و الخيار الصحيح وبداء وتحليل لمشكلة معينة. بعض الخيارات تافهة (على سبيل المثال ، خاضعة للإشراف أو غير خاضعة للرقابة ، الانحدار أو التصنيف) ، لأنها مرتبطة بتركيبة المشكلة نفسها. ومع ذلك ، حتى بعد تحديد ما تحاول حله ، عادة ما يكون هناك عدد لا يحصى من الخوارزميات التي يمكن استخدامها.
على سبيل المثال ، تخيل أنك تريد تطوير نظام قادر على التنبؤ بمتغير قاطع. يمكن حل هذه المشكلة إما شجرة التصنيف أو الجوار الأقرب لـ K أو حتى الشبكات العصبية الاصطناعية. بالطبع ، هناك سبب لوجود العديد من الخوارزميات ، حتى عندما تحل مشاكل مماثلة: لكل منها خصائصه التي يمكننا الاستفادة منها.
ما يجعل المهمة أكثر صعوبة هو أنه لحل بعض المشكلات ، مثل التعرف على الكلام والقيادة المستقلة ، من الضروري وجود بنية تتكون من العديد من الطبقات (مثل المعالجة المسبقة ، واستخراج المعالم ، والتحسين ، والتنبؤ ، وصنع القرار). لكل طبقة ، يمكن استخدام العديد من الخوارزميات المختلفة.
المشكلة هي: لتحقيق نتائج أفضل ، يجب تطبيق التغييرات على الطبقات الداخلية والخوارزميات المقابلة لها. ومع ذلك ، نظرًا لأن كل طبقة مسؤولة عن حل مهام معينة ، يصبح من الصعب حقًا تحديد كيف ستؤثر هذه التغييرات على النظام ككل.
يشير التعلم الشامل (E2E) إلى تدريب نظام تعليمي محتمل التعقيد يمثله نموذج واحد (على وجه التحديد شبكة عصبية عميقة) يمثل النظام المستهدف الكامل ، متجاوزًا الطبقات المتوسطة الموجودة عادةً في تصميمات خطوط الأنابيب التقليدية.
التعلم من البداية إلى النهاية
يعد التعلم الشامل موضوعًا ساخنًا في مجال التعلم العميق للاستفادة من بنية الشبكة العصبية العميقة (DNNs) ، المؤلفة من عدة طبقات ، من أجل حل المشكلات المعقدة. على غرار الدماغ البشري ، فإن كل طبقة من طبقات DNN (أو مجموعة من الطبقات) قادرة على التخصص لأداء المهام الوسيطة اللازمة لمثل هذه المشاكل. يوضح Tobias Glasmachers كيف يتم صياغة E2E في سياق التعلم العميق [1]:
“لقد تم تعميم هذه القوة الأنيقة والقوية الغامضة [E2E] في سياق التعلم العميق. إنها نتيجة طبيعية على ما يبدو للبنى العصبية العميقة التي تغمى الحدود الكلاسيكية بين آلة التعلم ومكونات المعالجة الأخرى عن طريق توجيه خط أنابيب معالجة معقدة إلى لغة النمذجة المتماسكة والمرنة للشبكات العصبية. ”
تم تطبيق هذا النهج البديل بنجاح لحل العديد من المشكلات المعقدة. فيما يلي معلومات عن كيفية تطبيق E2E على مشاكل التعرف على الكلام والقيادة الذاتية.
التعرف على الكلام
تصميم النهج التقليدي لنظام فهم اللغة المنطوقة هو بنية خط أنابيب مع عدد من المكونات المختلفة ، كما يتضح من التسلسل التالي:
الصوت (الإدخال) -> استخراج الميزة -> اكتشاف الصوت -> تكوين الكلمة -> نص النص (الإخراج).
يتمثل أحد القيود الواضحة في بنية خطوط الأنابيب هذه في أنه يجب تحسين كل وحدة على حدة وفقًا لمعايير مختلفة. يتمثل نهج E2E في استبدال السلسلة المذكورة أعلاه لشبكة عصبية واحدة ، مما يتيح استخدام معيار تحسين وحيد لتحسين النظام:
الصوت (الإدخال) – – – (NN) – → نسخة (الإخراج)
مايك لويس وآخرون. تقديم نهج التعلم E2E لمفاوضات اللغة الطبيعية [2]. النظام الناتج هو وكيل حوار يستند إلى شبكة عصبية واحدة قادرة على التفاوض من أجل التوصل إلى اتفاق. تم ذلك عن طريق تدريب NN باستخدام بيانات من مجموعة كبيرة من سجلات التفاوض بين الإنسان والبشر التي تحتوي على مجموعة متنوعة من أساليب التفاوض المختلفة.
ومن المزايا الأخرى لنهج E2E أنه من الممكن تصميم نموذج جيد الأداء دون معرفة عميقة بالمشكلة ، على الرغم من تعقيده. رونان كولوبرت وآخرون. اشرح كيف يمكن استخدام بنية الشبكة العصبية الموحدة وخوارزمية التعلم المناسبة لمعالجة اللغة الطبيعية (NLP) من أجل تجنب الهندسة الخاصة بالمهام والكثير من المعرفة السابقة [3]:
“[…] نحاول التفوق على معايير متعددة مع تجنب الهندسة الخاصة بالمهام. بدلاً من ذلك ، نستخدم نظامًا تعليميًا واحدًا قادرًا على اكتشاف تمثيلات داخلية كافية. […] رغبتنا في تجنب الميزات الهندسية الخاصة بالمهمة منعتنا من استخدام مجموعة كبيرة من المعرفة اللغوية. بدلاً من ذلك ، نصل إلى مستويات أداء جيدة في معظم المهام من خلال نقل تمثيلات وسيطة تم اكتشافها في مجموعات كبيرة من البيانات غير المسماة. نسمي هذا النهج “تقريبًا من نقطة الصفر” للتأكيد على الاعتماد المنخفض (ولكن لا يزال مهمًا) على معرفة مسبقة في البرمجة اللغوية العصبية. ”
القيادة الذاتية
يمكن تصنيف أنظمة القيادة المستقلة كمثال رائع للأنظمة المعقدة المكونة من عدة طبقات. تبعًا للهندسة المعمارية التي اقترحها Alexandru Serban et al. ، يمكننا تصميم نظام قيادة مستقل باستخدام 5 طبقات مختلفة
تأتي بيانات الإدخال من عدة مستشعرات (الكاميرات ، LIDAR ، الرادارات ، وما إلى ذلك) التي تتم معالجتها في طبقة دمج المستشعر لاستخراج الميزات ذات الصلة (مثل اكتشاف الكائنات). مع كل البيانات التي تمت معالجتها والميزات ذات الصلة المستخرجة ، يتم إنشاء “نموذج عالمي” في الطبقة الثانية. يشتمل هذا النموذج على الصورة الكاملة للبيئة المحيطة مع الحالة الداخلية للمركبة.
من هذا النموذج ، يجب على النظام اختيار القرارات التي يجب اتخاذها في طبقة السلوك. وفقًا لأهداف السيارة ، فهي ترفع خيارات سلوك متعددة استنادًا إلى سياسة النظام وتختار الأفضل من خلال تطبيق بعض معايير التحسين.
مع القرارات المتخذة ، يحدد النظام المناورات التي يجب على السيارة تنفيذها من أجل تلبية السلوك الذي تم اختياره في طبقة التخطيط وأخيراً يتم إرسال قيم التحكم إلى وحدات واجهة المشغل في طبقة التحكم في السيارة.
في مقالة “التعلم من النهاية إلى النهاية للسيارات ذاتية القيادة” ، ماريوس بوجارسكي وآخرون. اقترح نظام E2E قادرًا على التحكم في سيارة مستقلة مباشرةً من وحدات البكسل التي توفرها الكاميرات المدمجة [5]. كان النظام قادرًا على تعلم التمثيلات الداخلية للخطوات الوسيطة ، مثل اكتشاف ميزات الطريق المفيدة ، مع زاوية التوجيه البشرية فقط كإشارة التدريب. يلعب استخدام الشبكات العصبية التلافيفية (CNN) دورًا مهمًا في النظام المقترح لقدرته على استخراج ميزات مفيدة من بيانات الصورة:
“إن التقدم الذي حققته CNN هو أن الميزات يتم تعلمها تلقائيًا من خلال أمثلة التدريب. تعتبر طريقة CNN قوية بشكل خاص في مهام التعرف على الصور لأن عملية الالتفاف تلتقط الطبيعة ثنائية الأبعاد للصور. ”
يتجاوز تصميم CNN التعرف على الأنماط من أجل معرفة خط المعالجة بالكامل اللازم لتوجيه السيارات. تتكون بنية الشبكة من 9 طبقات ، بما في ذلك طبقة التطبيع و 5 طبقات تلافيفية و 3 طبقات متصلة بالكامل. تم تدريب النظام باستخدام بيانات القيادة الحقيقية المسجلة التي تم جمعها في وسط نيو جيرسي وإلينوي وميشيغان وبنسلفانيا ونيويورك. يوضح الشكل التالي مخطط كتلة تصميم نظام التدريب:
مع ما يقرب من 72 ساعة من بيانات القيادة ، كان النظام قادرًا على تعلم كيفية توجيه السيارة في أنواع الطرق المختلفة وظروف الطقس:
“كانت كمية صغيرة من بيانات التدريب من أقل من مائة ساعة من القيادة كافية لتدريب السيارة على العمل في ظروف متنوعة ، على الطرق السريعة ، والطرق المحلية والسكنية في ظروف مشمسة ، غائمة ، وممطرة. شبكة CNN قادرة على تعلم ميزات الطريق ذات مغزى من إشارة تدريب قليلة للغاية (القيادة وحدها). يتعلم النظام على سبيل المثال اكتشاف الخطوط العريضة للطريق دون الحاجة إلى ملصقات واضحة أثناء التدريب. ”
حدود E2E
إذا كان استخدام DNN واحد بين المدخلات والمخرجات يعمل في الأمثلة المذكورة أعلاه ، فلماذا لا نستخدمها كنهج عام لحل كل مشكلة في تعلم الآلة؟
العديد من الأسباب التي تجعل E2E خيارًا غير ممكن في حالات مختلفة:
من الضروري وجود قدر كبير من البيانات: يُعتبر دمج بعض المعرفة السابقة في التدريب عنصرًا أساسيًا سيتيح زيادة الأداء في العديد من التطبيقات. لتعلم E2E عدم دمج هذه المعرفة السابقة ، يجب تقديم المزيد من أمثلة التدريب.
من الصعب تحسين النظام أو تعديله: إذا كان يجب تطبيق بعض التغييرات الهيكلية (على سبيل المثال زيادة أبعاد الإدخال بإضافة المزيد من الميزات) ، لن يكون للنموذج القديم أي فائدة ويجب استبدال الحفرة DNN وتدريبها من جديد.
لا يمكن استخدام الوحدات المتاحة عالية الكفاءة: العديد من التقنيات فعالة حقًا لحل بعض المهام. على سبيل المثال ، يتم توزيع أنظمة التعرف على الأشياء الحديثة إلى حد كبير ، ولكن بمجرد دمجها في نظام E2E ، لا يمكن اعتبارها E2E بعد الآن.
يصعب التحقق من الصحة: إذا كان المستوى العالي من التحقق ضروريًا ، فقد يصبح E2E غير ممكن. نظرًا للهندسة المعقدة ، يمكن أن يكون العدد المحتمل لأزواج الإدخال / الإخراج كبيرًا بدرجة كافية لجعل التحقق من الصحة غير ممكن. هذا مهم بشكل خاص لبعض القطاعات مثل صناعة السيارات.
علاوة على هذه المشكلات ، قد لا تعمل E2E في بعض التطبيقات ، كما هو موضح في [1]:
“لقد أثبتنا أن التعلم من البداية إلى النهاية يمكن أن يكون غير فعال للغاية لتدريب نماذج الشبكات العصبية التي تتكون من وحدات متعددة غير تافهة. التعلم الشامل يمكن أن ينهار تمامًا ؛ في أسوأ الحالات ، لا تستطيع أي من الوحدات التعليمية التعلم. في المقابل ، يمكن لكل وحدة معرفة ما إذا كانت الوحدات الأخرى مدربة بالفعل وتم تجميد أوزانها. هذا يشير إلى أن تدريب آلات التعلم المعقدة يجب أن يستمر بطريقة منظمة ، وتدريب وحدات بسيطة أولاً ومستقلة عن بقية الشبكة. ”
استنتاج
تعد النهاية من النهاية إلى النهاية أداة رائعة بلا جدال لحل المهام المعقدة. تسمح فكرة استخدام نموذج واحد يمكنه التخصص في التنبؤ بالنواتج مباشرة من المدخلات بتطوير أنظمة معقدة للغاية يمكن اعتبارها أحدث ما توصلت إليه التكنولوجيا. ومع ذلك ، يأتي كل تعزيز بسعر: في حين يتم تكريسه في المجال الأكاديمي ، لا تزال الصناعة مترددة في استخدام E2E لحل مشاكلها بسبب الحاجة إلى كمية كبيرة من بيانات التدريب وصعوبة التحقق من الصحة.
0 responses on "دليل تطوير الذكاء الاصتناعي - Machine Learning"