الشبكات العصبية والتعليم العميق neural network Perceptrons الجزء 11

5/5 - (1 صوت واحد)

بناء شبكة بسيطة لتصنيف الأرقام المكتوبة بخط اليد

 

بعد تعريف الشبكات العصبية ، دعنا نرجع إلى التعرف على خط اليد. يمكننا تقسيم مشكلة التعرف على الارقام  المكتوبة بخط اليد إلى مشكلتين فرعيتين. أولاً ، يجب ايجاد طريقة الى  تحليل الصورة وبعدها تقسامها الى ارقام منفردة  في سلسلة من الصور المنفصلة ، كل منها يحتوي على رقم واحد. على سبيل المثال ،

digits الشبكات العصبية والتعليم العميق neural network Perceptrons الجزء 11

 

الى ست صور منفصلة ،

نحن البشر حل مشكلة تجزئة هذا بسهولة ، ولكن من الصعب على برنامج كمبيوتر لتقسيم الصورة بشكل صحيح. بمجرد تقسيم الصورة ، يحتاج البرنامج إلى تصنيف كل رقم فردي. لذلك ، على سبيل المثال ، نود أن يدرك برنامجنا أن الرقم الأول أعلاه ،

digits الشبكات العصبية والتعليم العميق neural network Perceptrons الجزء 11

هو 5.

سنركز على كتابة برنامج لحل المشكلة الثانية ، أي ، تصنيف الأرقام الفردية. نحن نفعل ذلك لأنه تبين أن مشكلة التجزئة ليست صعبة الحل ، بمجرد أن تكون لديك طريقة جيدة لتصنيف الأرقام الفردية. هناك العديد من الطرق لحل مشكلة التجزئة. يتمثل أحد الأساليب في تجربة العديد من الطرق المختلفة لتقسيم الصورة ، باستخدام مصنف الأرقام الفردي لتحقيق كل تجزئة تجريبية. يحصل تجزئة التجربة على درجة عالية إذا كان مصنف الأرقام الفردية واثقًا من تصنيفها في جميع الشرائح ، ودرجة منخفضة إذا كان المصنف يواجه الكثير من المتاعب في مقطع واحد أو أكثر. تكمن الفكرة في أنه إذا كان المصنف يواجه مشكلة في مكان ما ، فمن المحتمل أن يكون لديه مشكلة لأنه تم اختيار التجزئة بشكل غير صحيح. يمكن استخدام هذه الفكرة والاختلافات الأخرى لحل مشكلة التجزئة بشكل جيد. لذا بدلاً من القلق بشأن التقسيم ، سنركز على تطوير شبكة عصبية يمكنها حل المشكلة الأكثر إثارة للاهتمام والصعوبة ، وهي التعرف على الأرقام الفردية المكتوبة بخط اليد.

للتعرف على الأرقام الفردية ، سنستخدم شبكة عصبية ثلاثية الطبقات:

digits الشبكات العصبية والتعليم العميق neural network Perceptrons الجزء 11

تحتوي طبقة الإدخال الخاصة بالشبكة على خلايا عصبية ترمز لقيم وحدات البكسل المدخل. كما تمت مناقشته في القسم التالي ، ستتكون بيانات التدريب الخاصة بالشبكة من 28 صورة 28 بيكسل لأرقام مكتوبة بخط اليد ، وبالتالي فإن طبقة الإدخال تحتوي على 784 = 28 × 28 خلية عصبية. للبساطة لقد أغفلت معظم الخلايا العصبية المدخلة 784 في الرسم البياني أعلاه. وحدات البكسل المدخلة هي greyscale ، مع قيمة 0.0 تمثل white ، وقيمة 1.0 تمثل الأسود ، وبين القيم التي تمثل ظلال الرمادي الداكن تدريجياً.

الطبقة الثانية من الشبكة هي طبقة مخفية. نحن نرمز إلى عدد الخلايا العصبية في هذه الطبقة المخفية بواسطة n ، وسنقوم باختبار قيم مختلفة لـ n. يوضح المثال الموضح طبقة مخفية صغيرة تحتوي فقط على n = 15 خلية عصبية.

تحتوي طبقة الخرج للشبكة على 10 خلايا عصبية. إذا كان الحريق العصبي الأول ، أي ، لديه مخرجات ،1 ، فإن ذلك سيشير إلى أن الشبكة تعتقد أن الرقم هو 0. إذا تم إطلاق العصبون الثاني فهذا يدل على أن الشبكة تعتقد أن الرقم هو 1. وهكذا . وبتعبير أدق ، فإننا نرقم الخلايا العصبية للخرج من 0 إلى 9 ، ونكتشف أي الخلايا العصبية لديها أعلى قيمة تنشيط. إذا كان هذا العصبون هو ، على سبيل المثال ، العصبون رقم 6 ، فإن شبكتنا سوف تخمن أن رقم الإدخال كان 6. وهكذا بالنسبة للخلايا العصبية الخرجية الأخرى.

قد نتساءل لماذا نستخدم 10 الخلايا العصبية الإخراج. بعد كل شيء ، الهدف من الشبكة هو أن تخبرنا أي رقم (0،1،2 ، … ، 9) يتوافق مع صورة المدخلات. والطريقة الطبيعية التي يبدو عليها القيام بذلك هي استخدام 4 عصبونات ناتجة ، بمعالجة كل خلية عصبية على أنها تأخذ قيمة ثنائية ، اعتمادًا على ما إذا كان ناتج العصبون أقرب إلى 0 أو إلى 1. إن أربعة عصبونات تكفي لتشفير الإجابة ، منذ 24 = 16 أكثر من 10 قيم ممكنة لرقم الإدخال. لماذا يجب أن تستخدم شبكتنا 10 خلايا عصبية بدلاً من ذلك؟ أليس هذا غير فعال؟ إن التبرير النهائي هو تجريبي: يمكننا تجربة كل من تصميمات الشبكة ، وقد تبين أنه بالنسبة لهذه المشكلة بالتحديد ، تتعلم الشبكة ذات الخلايا العصبية الخرجية العشرة أن تتعرف على أرقام أفضل من الشبكة ذات 4 خلايا عصبية. لكن هذا يتركنا نتساءل عن السبب في استخدام 10 خلايا عصبية للخرج تعمل بشكل أفضل. هل هناك بعض التجربه التي من شأنها أن تخبرنا مسبقا أنه ينبغي لنا استخدام التشفير 10 الإخراج بدلا من الترميز 4 الإخراج؟

0 responses on "الشبكات العصبية والتعليم العميق neural network Perceptrons الجزء 11"

Leave a Message

//thaudray.com/4/4336760
× للتسجيل بالجامعة تواصل معنا الان
X