تعلم 13 مهارات لتصبح عالم بيانات – Data Scientist

ارجو تقييم المقال

أفضل 13 مهارات ليصبح عالم بيانات
1. التعليم
يتلقى علماء البيانات تعليماً عالياً – 88٪ منهم على الأقل حاصلون على درجة الماجستير و 46٪ حاصلون على درجة الدكتوراه – وعلى الرغم من وجود استثناءات ملحوظة ، فعادة ما تكون هناك حاجة إلى خلفية تعليمية قوية جدًا لتطوير عمق المعرفة اللازم ليكون عالم بيانات. لتصبح عالمًا في مجال البيانات ، يمكنك الحصول على درجة البكالوريوس في علوم الكمبيوتر والعلوم الاجتماعية والعلوم الفيزيائية والإحصاء. مجالات الدراسة الأكثر شيوعًا هي الرياضيات والإحصاء (32٪) ، تليها علوم الكمبيوتر (19٪) والهندسة (16٪). ستمنحك درجة في أي من هذه الدورات المهارات التي تحتاجها لمعالجة وتحليل البيانات الضخمة.

بعد برنامج شهادتك ، لم تنته بعد. الحقيقة هي أن معظم علماء البيانات حاصلون على درجة الماجستير أو الدكتوراه ويقومون أيضًا بالتدريب عبر الإنترنت لتعلم مهارة خاصة مثل كيفية استخدام Hadoop أو الاستعلام عن البيانات الكبيرة. لذلك ، يمكنك التسجيل في برنامج درجة الماجستير في مجال علوم البيانات أو الرياضيات أو الفيزياء الفلكية أو أي مجال آخر ذي صلة. ستمكنك المهارات التي تعلمتها خلال برنامج الشهادة من الانتقال بسهولة إلى علم البيانات.

بصرف النظر عن التعلم في الفصل ، يمكنك ممارسة ما تعلمته في الفصل عن طريق إنشاء تطبيق أو بدء مدونة أو استكشاف تحليل البيانات لتمكينك من معرفة المزيد.

في رأيي ، يكون الحصول على درجة الماجستير أو الدكتوراه اختياريًا طالما أنك قادر على إكمال العمل. في معظم مجالات وظائف الصناعة ، لست بحاجة إلى إجراء البحوث ونشر أحدث نماذج التعلم الآلي والجديد طالما أنك قادر على حل مشكلات العمل.

resource مفيدة الكتاب الاليكتروني الموارد الحرة: 74 أسرار لتصبح عالم البيانات للمحترفين

2. R البرمجة
المعرفة المتعمقة واحدة على الأقل من هذه الأدوات التحليلية ، لعلم البيانات R المفضل بشكل عام. تم تصميم R خصيصًا لاحتياجات علوم البيانات. يمكنك استخدام R لحل أي مشكلة تواجهها في علم البيانات. في الواقع ، يستخدم 43 في المائة من علماء البيانات R لحل المشكلات الإحصائية. ومع ذلك ، R لديه منحنى التعلم حاد.

من الصعب التعلم خاصة إذا كنت تتقن لغة برمجة بالفعل. ومع ذلك ، هناك موارد كبيرة على الإنترنت لتبدأ في البحث ، مثل Simplilearn’s Data Science Training with R Programming Language. إنه مورد رائع لعلماء البيانات الطموحين.

3. بيثون الترميز
Python هي لغة الترميز الأكثر شيوعًا التي أراها مطلوبة عادةً في أدوار علوم البيانات ، إلى جانب Java أو Perl أو C / C ++. بيثون هي لغة برمجة كبيرة لعلماء البيانات. هذا هو السبب في أن 40 في المائة من المجيبين الذين شملهم الاستطلاع أورايلي يستخدمون بيثون كلغة برمجة رئيسية.

نظرًا لتعدد استخداماتها ، يمكنك استخدام Python في جميع الخطوات تقريبًا في عمليات علم البيانات. يمكن أن يستغرق تنسيقات البيانات المختلفة ويمكنك بسهولة استيراد جداول SQL في التعليمات البرمجية الخاصة بك. يتيح لك إنشاء مجموعات بيانات ويمكنك العثور على أي نوع من مجموعات البيانات التي تحتاجها على Google حرفيًا.

يمكنك فهم المزيد حول أساسيات Python وكيف يتم استخدامه في علم البيانات مع الكتب أدناه:

Python Data Science Handbook
بيثون لتحليل البيانات
تعلم بايثون

4. Hadoop منهاج
على الرغم من أن هذا ليس مطلبًا دائمًا ، إلا أنه يفضل بشدة في العديد من الحالات. تجربة مع Hive أو Pig هي أيضًا نقطة بيع قوية. قد يكون الإلمام بالأدوات السحابية مثل Amazon S3 مفيدًا أيضًا. صنفت دراسة أجرتها CrowdFlower على 3490 وظيفة في مجال علوم البيانات على LinkedIn Apache Hadoop في المرتبة الثانية من حيث الأهمية بالنسبة لعالم البيانات الذي حصل على تصنيف 49٪.

بصفتك عالمًا للبيانات ، قد تواجه موقفًا حيث يتجاوز حجم البيانات لديك ذاكرة نظامك أو تحتاج إلى إرسال البيانات إلى خوادم مختلفة ، حيث يأتي Hadoop. يمكنك استخدام Hadoop لنقل البيانات بسرعة إلى مختلف نقاط على النظام. هذا ليس كل شئ. يمكنك استخدام Hadoop لاستكشاف البيانات ، وترشيح البيانات ، وأخذ البيانات وتلخيصها.

5. مزود قاعدة البيانات / الترميز
على الرغم من أن NoSQL و Hadoop أصبحا مكونًا كبيرًا في علم البيانات ، إلا أنه من المتوقع أن يكون المرشح قادرًا على كتابة وتنفيذ الاستعلامات المعقدة في SQL. SQL (لغة استعلام منظمة) هي لغة برمجة يمكنها مساعدتك على تنفيذ عمليات مثل إضافة وحذف واستخراج البيانات من قاعدة البيانات. يمكن أن يساعدك أيضًا على القيام بالوظائف التحليلية وتحويل هياكل قواعد البيانات.

عليك أن تكون بارعا في SQL كعالم بيانات. وذلك لأن SQL مصممة خصيصًا لمساعدتك في الوصول إلى البيانات والتواصل معها والعمل عليها. يمنحك رؤى عند استخدامه لاستعلام قاعدة البيانات. يحتوي على أوامر موجزة يمكن أن تساعدك على توفير الوقت وتقليل مقدار البرمجة التي تحتاجها لتنفيذ استعلامات صعبة. سيساعدك تعلم SQL على فهم قواعد البيانات العلائقية بشكل أفضل وتعزيز ملف التعريف الخاص بك كعالم بيانات.

6. اباتشي سبارك
أصبح Apache Spark أكثر تقنيات البيانات الكبيرة انتشارًا على مستوى العالم. إنه إطار حساب بيانات كبير مثل Hadoop. الفرق الوحيد هو أن سبارك أسرع من Hadoop. وذلك لأن Hadoop يقرأ ويكتب على القرص ، مما يجعله أبطأ ، لكن Spark تخزن حساباتها في الذاكرة.

تم تصميم Apache Spark خصيصًا لعلوم البيانات للمساعدة في تشغيل الخوارزمية المعقدة بشكل أسرع. يساعد في نشر معالجة البيانات عند التعامل مع بحر كبير من البيانات ، وبالتالي توفير الوقت. كما أنه يساعد عالم البيانات على التعامل مع مجموعات البيانات غير المهيكلة المعقدة. يمكنك استخدامه على جهاز واحد أو مجموعة من الآلات.

يتيح تطبيق Apache spark لعلماء البيانات منع فقد البيانات في علم البيانات. تكمن قوة Apache Spark في سرعتها ومنصتها مما يجعل من السهل تنفيذ مشاريع علوم البيانات. باستخدام Apache spark ، يمكنك إجراء تحليلات بدءًا من تناول البيانات وحتى توزيع الحوسبة.

7. تعلم الآلة و الذكاء الاصطناعى
هناك عدد كبير من علماء البيانات لا يجيدون مجالات وتقنيات التعلم الآلي. ويشمل ذلك الشبكات العصبية ، والتعلم التعزيز ، والتعلم العدائي ، وما إلى ذلك. إذا كنت تريد أن تبرز من علماء البيانات الآخرين ، فأنت بحاجة إلى معرفة أساليب التعلم الآلي مثل تعلم الآلة الخاضعة للإشراف ، وأشجار القرار ، والانحدار اللوجستي ، إلخ. ستساعدك هذه المهارات على حل مشكلات علوم البيانات المختلفة التي تستند إلى توقعات النتائج التنظيمية الرئيسية.

يحتاج علم البيانات إلى تطبيق المهارات في مجالات مختلفة من التعلم الآلي. كشفت Kaggle ، في أحد استطلاعاتها ، أن نسبة صغيرة من محترفي البيانات مؤهلون في مهارات التعلم الآلي المتقدمة مثل تعلم الآلة الخاضعة للإشراف ، والتعلم الآلي غير الخاضع للرقابة ، والسلسلة الزمنية ، ومعالجة اللغة الطبيعية ، والكشف الخارجي ، رؤية الكمبيوتر ، محركات التوصية ، البقاء على قيد الحياة التحليل ، التعلم التعزيز ، والتعلم العدائي.

يتضمن علم البيانات العمل مع كميات كبيرة من مجموعات البيانات. قد ترغب في أن تكون على دراية بالتعلم الآلي.

8. التصور البيانات
ينتج عالم الأعمال كمية هائلة من البيانات بشكل متكرر. يجب ترجمة هذه البيانات إلى تنسيق يسهل فهمه. يفهم الأشخاص الصور بشكل طبيعي في أشكال المخططات والرسوم البيانية أكثر من البيانات الأولية. المصطلح يقول “الصورة تساوي ألف كلمة”.

بصفتك عالم بيانات ، يجب أن تكون قادرًا على تصور البيانات بمساعدة أدوات تصور البيانات مثل ggplot و d3.js و Matplotlib و Tableau. ستساعدك هذه الأدوات على تحويل النتائج المعقدة من مشاريعك إلى تنسيق يسهل فهمه. الشيء ، الكثير من الناس لا يفهمون الارتباط التسلسلي أو قيم p. يجب أن تُظهر لهم بصريًا ما تمثله هذه المصطلحات في نتائجك.

يوفر التصور البيانات للمؤسسات الفرصة للعمل مع البيانات مباشرة. يمكنهم فهم الأفكار التي ستساعدهم في التصرف وفقًا لفرص عمل جديدة والبقاء في صدارة المنافسات.

على وجه الخصوص ، كتبت مقالًا للحديث عن أهمية تخيل البيانات وكيفية إنشاء سرد أفضل للبيانات.

9. البيانات غير المهيكلة
من الأهمية بمكان أن يكون عالِم البيانات قادرًا على العمل مع بيانات غير منظمة. البيانات غير المهيكلة هي محتوى غير معرف لا يتلاءم مع جداول قاعدة البيانات. من الأمثلة على ذلك مقاطع الفيديو ، منشورات المدونة ، مراجعات العملاء ، منشورات التواصل الاجتماعي ، خلاصات الفيديو ، الصوت إلخ. إنها نصوص ثقيلة مجمعة معًا. يصعب فرز هذا النوع من البيانات لأنها غير مبسطة.

أشار معظم الناس إلى البيانات غير المهيكلة باسم “التحليلات المظلمة” بسبب تعقيدها. يساعدك العمل مع البيانات غير المنظمة على كشف الأفكار التي قد تكون مفيدة في اتخاذ القرارات. كعالم بيانات ، يجب أن يكون لديك القدرة على فهم ومعالجة البيانات غير المهيكلة من منصات مختلفة.

10. فضول فكري
“ليس لدي أي موهبة خاصة. أنا فقط فضولي بحماس. ”
– البرت اينشتاين
لا شك أنك رأيت هذه العبارة في كل مكان مؤخرًا ، لا سيما فيما يتعلق بعلماء البيانات. يصف فرانك لو ما يعنيه ، ويتحدث عن “المهارات اللينة” الضرورية الأخرى في مدونة ضيفه المنشورة قبل بضعة أشهر.

يمكن تعريف الفضول على أنه الرغبة في اكتساب المزيد من المعرفة. بصفتك عالم بيانات ، يجب أن تكون قادرًا على طرح أسئلة حول البيانات لأن علماء البيانات يقضون حوالي 80 بالمائة من وقتهم في اكتشاف البيانات وإعدادها. ذلك لأن حقل علم البيانات هو حقل يتطور بسرعة كبيرة وعليك معرفة المزيد لمواكبة الوتيرة.

تحتاج إلى تحديث معرفتك بانتظام من خلال قراءة المحتويات عبر الإنترنت وقراءة الكتب ذات الصلة عن الاتجاهات في علم البيانات. لا تطغى على كمية البيانات الهائلة التي تطير عبر الإنترنت ، يجب أن تكون قادرًا على معرفة كيفية فهم كل شيء. الفضول هو أحد المهارات التي تحتاجها للنجاح كعالم بيانات. على سبيل المثال ، في البداية ، قد لا ترى الكثير من التبصر في البيانات التي جمعتها. يمكّنك الفضول من فحص البيانات للعثور على الإجابات والمزيد من الأفكار.

11. الفطنة التجارية
لكي تكون عالماً في مجال البيانات ، ستحتاج إلى فهم قوي للصناعة التي تعمل فيها ، ومعرفة مشكلات الأعمال التي تحاول شركتك حلها. فيما يتعلق بعلوم البيانات ، تعد القدرة على تمييز المشكلات المهمة التي يجب حلها بالنسبة إلى العمل أمرًا بالغ الأهمية ، بالإضافة إلى تحديد طرق جديدة يجب أن تستفيد بها الشركة من بياناتها.

لتكون قادرًا على القيام بذلك ، يجب أن تفهم كيف يمكن للمشكلة التي تحلها أن تؤثر على العمل. لهذا السبب تحتاج إلى معرفة كيفية عمل الشركات حتى تتمكن من توجيه جهودك في الاتجاه الصحيح.

12. مهارات الاتصال
تبحث الشركات التي تبحث عن عالم بيانات قوي عن شخص يمكنه ترجمة النتائج الفنية بشكل واضح وبطلاقة إلى فريق غير فني ، مثل قسم التسويق أو المبيعات. يجب على عالم البيانات تمكين الشركة من اتخاذ القرارات عن طريق تسليحها برؤى كمية ، بالإضافة إلى فهم احتياجات زملائهم غير التقنيين من أجل تغيير البيانات بشكل مناسب.

بالإضافة إلى التحدث بنفس اللغة التي تفهمها الشركة ، فأنت بحاجة أيضًا إلى التواصل باستخدام سرد البيانات. كعالم بيانات ، عليك أن تعرف كيفية إنشاء قصة حول البيانات لتسهيل على أي شخص فهمها. على سبيل المثال ، لا يعد تقديم جدول بيانات فعالاً مثل مشاركة الرؤى من تلك البيانات بتنسيق سرد القصص. سيساعدك استخدام سرد القصص على توصيل نتائجك بشكل صحيح إلى أصحاب العمل.

عند التواصل ، انتبه إلى النتائج والقيم المضمنة في البيانات التي قمت بتحليلها. لا يريد معظم أصحاب الأعمال معرفة ما قمت بتحليله ، فهم مهتمون بكيفية تأثيره على أعمالهم بشكل إيجابي. تعلم كيفية التركيز على تقديم القيمة وبناء علاقات دائمة من خلال التواصل.

13. العمل الجماعي
لا يمكن لعالم البيانات أن يعمل بمفرده. سيتعين عليك العمل مع المديرين التنفيذيين للشركة لتطوير الاستراتيجيات ومديري منتجات العمل والمصممين لإنشاء منتجات أفضل والعمل مع المسوقين لإطلاق حملات تحويل أفضل والعمل مع مطوري برامج العميل والخادم لإنشاء خطوط أنابيب للبيانات وتحسين سير العمل. سيكون عليك حرفيًا العمل مع كل شخص في المنظمة ، بما في ذلك عملائك.

بشكل أساسي ، ستتعاون مع أعضاء فريقك لتطوير حالات الاستخدام من أجل معرفة أهداف العمل والبيانات المطلوبة لحل المشكلات. ستحتاج إلى معرفة الطريقة الصحيحة لمعالجة حالات الاستخدام والبيانات اللازمة لحل المشكلة وكيفية ترجمة النتيجة وتقديمها إلى ما يمكن بسهولة فهمه من قبل جميع المعنيين.

يونيو 17, 2019

0 responses on "تعلم 13 مهارات لتصبح عالم بيانات - Data Scientist"

Leave a Message

X