
السلام عليكم
سوفة نبداء سلسة تتحدث عن الشبكات العصبية والتعليم العميق Neural Networks and Deep Learning
استخدام الشبكات العصبية للتعرف على الأرقام المكتوبة بخط اليد
النظام البصري البشري هو واحد من عجائب الدنيا. فكر في التسلسل التالي للأرقام المكتوبة بخط اليد:
معظم الناس يتعرفون على هذه الأرقام دون عناء مثل 504192. هذه السهولة خادعة. في كل نصف من دماغنا ، لدى البشر قشرة بصرية أساسية ، تعرف أيضًا باسم V1 ، تحتوي على 140 مليون خلية عصبية ، مع عشرات المليارات من الارتباطات بينها. ومع ذلك ، فإن الرؤية البشرية لا تتضمن فقط V1 ، بل سلسلة كاملة من القشرة البصرية – V2 ، V3 ، V4 ، و V5 – تعمل بشكل متزايد على معالجة الصور المعقدة. نحمل في رؤوسنا حاسوبًا فائقًا ، ومعاينًا للتطور على مدى مئات الملايين من السنين ، ومكيفًا بشكل رائع لفهم العالم المرئي. التعرف على أرقام مكتوبة بخط اليد ليس بالأمر السهل. بدلا من ذلك ، نحن البشر بشغف ، ومدهش بشكل جيد في جعل معنى ما تظهر لنا أعيننا. لكن ما يقرب من كل هذا العمل يتم دون وعي. ولذا فإننا لا نقدر عادة مدى صعوبة مشكلة أنظمتنا البصرية.
ملاحظة قدرة العين على الرؤية 576 ميجا بيكسل
سوف تواجة صعوبة إذا حاولت كتابة برنامج كمبيوتر للتعرف على أرقام مثل تلك المذكورة أعلاه. ما يبدو سهلا عندما نفعل ذلك بأنفسنا يصبح من الصعب للغاية. الحدس البسيط حول كيفية تعرفنا على الأشكال – “9 يحتوي على حلقة في القمة ، وخط رأسي في أسفل اليمين” – يتبين أنه ليس بهذه البساطة للتعبير عن الخوارزميات. عندما تحاول أن تجعل هذه القواعد دقيقة ، فسوف تضيع بسرعة في مستنقع من الاستثناءات والمحاذير والحالات الخاصة. يبدو ميئوسا منه.
كيف تتعامل الخوراخميات الشبكة العصبية
الشبكات العصبية ( neural network ) تقترب من المشكلة بطريقة مختلفة. الفكرة هي أخذ عدد كبير من الأرقام المكتوبة بخط اليد ، والتي تُعرف باسم أمثلة التدريب ،
ثم تطوير نظام يمكن أن يتعلم من تلك الأمثلة التدريبية. وبعبارة أخرى ، تستخدم الشبكة العصبية الأمثلة لاستنتاج القواعد تلقائيًا للتعرف على الأرقام المكتوبة بخط اليد. علاوة على ذلك ، من خلال زيادة عدد الأمثلة التدريبية ، يمكن للشبكة معرفة المزيد عن الكتابة اليدوية ، وبالتالي تحسين دقتها. لذلك ، بينما أظهرنا فقط 100 رقم تدريب أعلاه ، ربما يمكننا بناء أداة أفضل للتعرف على خط اليد باستخدام الآلاف أو حتى الملايين أو المليارات من الأمثلة التدريبية.
سنقوم في هذا الفصل بكتابة برنامج كمبيوتر يقوم بتطبيق شبكة عصبية تتعرف على الأرقام المكتوبة بخط اليد. يبلغ طول البرنامج 74 سطرًا فقط ، ولا يستخدم أي مكتبات شبكات عصبية خاصة. لكن هذا البرنامج القصير يمكنه التعرف على الأرقام بدقة تتجاوز 96٪ ، دون تدخل بشري. علاوة على ذلك ، سنقوم في الفصول اللاحقة بتطوير أفكار يمكن أن تحسن الدقة إلى أكثر من 99 في المائة. في الواقع ، أفضل الشبكات العصبية التجارية هي الآن جيدة جدا بحيث يتم استخدامها من قبل البنوك لمعالجة الشيكات ، ومن قبل مكاتب البريد للتعرف على العناوين.
نحن نركز على التعرف على الكتابة اليدوية لأنها مشكلة نموذج أولي ممتازة للتعلم عن الشبكات العصبية بشكل عام. كنموذج أصلي ، فإنها تصطدم بعلامة حلوة: إنه أمر صعب – ليس من الصعب التعرف على الأرقام المكتوبة بخط اليد – ولكن ليس من الصعوبة بمكان أن تتطلب حلًا بالغ التعقيد ، أو قوة حسابية هائلة. علاوة على ذلك ، إنها طريقة رائعة لتطوير تقنيات أكثر تقدمًا ، مثل التعلم العميق. ومن ثم سوف نعود مرارًا وتكرارًا إلى مشكلة التعرف على خط اليد. في وقت لاحق من هذا الكتاب ، سنناقش كيف يمكن تطبيق هذه الأفكار على المشاكل الأخرى في رؤية الكمبيوتر ، وكذلك في الكلام ، ومعالجة اللغة الطبيعية ، وغيرها من المجالات.
بالطبع ، إذا كانت نقطة الفصل هي فقط كتابة برنامج كمبيوتر للتعرف على الأرقام المكتوبة بخط اليد ، فإن هذا الفصل سيكون أقصر بكثير! ولكن على طول الطريق سوف نطور العديد من الأفكار الرئيسية حول الشبكات العصبية ، بما في ذلك نوعان مهمان من الخلايا العصبية الاصطناعية (perceptron والعصبون السيني) ، وخوارزمية التعلم القياسية للشبكات العصبية ، والمعروفة باسم انحدار الانحدار العشوائي stochastic gradient descent. في جميع الأحوال ، أركز على شرح سبب إنجاز الأشياء بالطريقة التي تعمل بها ، وعلى بناء الحدس للشبكات العصبية. يتطلب ذلك مناقشة أطول مما لو كنت قد قدمت للتو الميكانيكا الأساسية لما يحدث ، ولكن الأمر يستحق ذلك للتفاهم الأعمق الذي ستحصل عليه. من بين المكافآت ، بحلول نهاية الفصل سوف نكون في وضع يمكننا من فهم ما هو التعلم العميق ، ولماذا يهم.
سلسلة مقالات تعلم الشبكات العصبية والتعليم العميق المقال التالي
0 responses on "الشبكات العصبية والتعليم العميق neural network"