كيف تبدأ مع التعلم الآلي والذكاء الاصطناعي

اخلاء مسؤولية | DISCLAIMER
الذكاء الاصطناعي “كما نعرفه اليوم ، في أحسن الأحوال ، تسمية خاطئة. الذكاء الاصطناعي ليس ذكيًا بأي حال من الأحوال ، لكنه مصطنع. لا يزال أحد أهم الموضوعات في الصناعة ويتمتع باهتمام متجدد في الأوساط الأكاديمية. هذا ليس جديد – مر العالم بسلسلة من القمم والوديان في الذكاء الاصطناعي على مدار الخمسين عامًا الماضية. ولكن ما يجعل الفورة الحالية لنجاحات الذكاء الاصطناعي مختلفة هو أن أجهزة الحوسبة الحديثة أصبحت أخيرًا قوية بما يكفي للتنفيذ الكامل لبعض الأفكار الجامحة التي كانت معلقة حولها لفترة طويلة.
بالعودة إلى الخمسينيات من القرن الماضي ، في الأيام الأولى لما نسميه الآن الذكاء الاصطناعي ، كان هناك جدل حول تسمية المجال. جادل هربرت سيمون ، المطور المشارك لكل من آلة نظرية المنطق وحلول المشكلات العامة ، بأن الحقل يجب أن يكون له اسم أكثر تهدئة هو “معالجة المعلومات المعقدة”. هذا بالتأكيد لا يلهم الرهبة التي يفعلها “الذكاء الاصطناعي” ، ولا ينقل فكرة أن الآلات يمكن أن تفكر مثل البشر.
ومع ذلك ، فإن “معالجة المعلومات المعقدة” هي وصف أفضل بكثير لما هو الذكاء الاصطناعي في الواقع: تحليل مجموعات البيانات المعقدة ومحاولة عمل استنتاجات من الكومة. تتضمن بعض الأمثلة الحديثة للذكاء الاصطناعي التعرف على الكلام (في شكل مساعدين افتراضيين مثل Siri أو Alexa) والأنظمة التي تحدد ما هو موجود في الصورة أو توصي بما يجب شراؤه أو مشاهدته بعد ذلك. لا يمكن مقارنة أي من هذه الأمثلة بالذكاء البشري ، لكنها تظهر أنه يمكننا القيام بأشياء رائعة بمعالجة كافية للمعلومات.
سواء كنا نشير إلى هذا المجال على أنه “معالجة المعلومات المعقدة” أو “الذكاء الاصطناعي” (أو “التعلم الآلي” الذي يبدو أكثر خطورة من Skynet) فهو غير ذي صلة. لقد بذلت كميات هائلة من العمل والبراعة البشرية في بناء بعض التطبيقات المذهلة على الإطلاق. على سبيل المثال ، انظر إلى GPT-3 ، نموذج التعلم العميق للغات الطبيعية الذي يمكن أن يولد نصًا لا يمكن تمييزه عن النص المكتوب من قبل شخص (ومع ذلك يمكن أن يحدث خطأ بشكل مضحك). إنه مدعوم بنموذج الشبكة العصبية الذي يستخدم أكثر من 170 مليار معلمة لنمذجة اللغة البشرية.
بنيت على قمة GPT-3 هي الأداة المسماة Dall-E ، والتي ستنتج صورة لأي شيء خيالي يطلبه المستخدم. يتيح لك إصدار 2022 المحدث من الأداة ، Dall-E 2 ، الذهاب إلى أبعد من ذلك ، حيث يمكنه “فهم” الأنماط والمفاهيم المجردة تمامًا. على سبيل المثال ، فإن مطالبة Dall-E بتصور “رائد فضاء يركب حصانًا بأسلوب Andy Warhol” سينتج عددًا من الصور مثل هذا:

جاك أوجرادي / دال إي
لا يقوم Dall-E 2 ببحث Google للعثور على صورة مماثلة ؛ يقوم بإنشاء صورة بناءً على نموذجها الداخلي. هذه صورة جديدة مبنية من لا شيء سوى الرياضيات.
ليست كل تطبيقات الذكاء الاصطناعي رائدة مثل هذه. يجد الذكاء الاصطناعي والتعلم الآلي استخدامات في كل صناعة تقريبًا. أصبح التعلم الآلي سريعًا أمرًا ضروريًا في العديد من الصناعات ، حيث يعمل على تشغيل كل شيء بدءًا من محركات التوصية في قطاع البيع بالتجزئة إلى سلامة خطوط الأنابيب في صناعة النفط والغاز والتشخيص وخصوصية المريض في صناعة الرعاية الصحية. لا تمتلك كل شركة الموارد اللازمة لإنشاء أدوات مثل Dall-E من البداية ، لذلك هناك طلب كبير على مجموعات أدوات ميسورة التكلفة وقابلة للتحقيق. التحدي المتمثل في تلبية هذا الطلب له أوجه تشابه مع الأيام الأولى لحوسبة الأعمال ، عندما أصبحت أجهزة الكمبيوتر وبرامج الكمبيوتر بسرعة هي الأعمال التقنية المطلوبة. بينما لا يحتاج الجميع إلى تطوير لغة البرمجة أو نظام التشغيل التاليين ، فإن العديد من الشركات ترغب في الاستفادة من قوة مجالات الدراسة الجديدة هذه ، وهم بحاجة إلى أدوات مماثلة لمساعدتهم.
ARS VIDEO
Blade Runner Game Director Louis Castle: Extended Interview
نظرة عامة على مشهد الأداة
ما الذي يدخل في بناء نموذج ML / AI في عالم اليوم؟ تحدث آرس مع الدكتورة إلين أمبروز ، مديرة الذكاء الاصطناعي في شركة Protenus الناشئة للرعاية الصحية في منطقة بالتيمور ، حول كيفية بناء نموذج ML جديد. كما أوضحت ذلك ، هناك ثلاثة عوامل رئيسية تدخل في إنشاء نموذج جديد: “25 بالمائة يطرح السؤال الصحيح ، و 50 بالمائة لاستكشاف البيانات وتنظيفها ، وهندسة الميزات ، واختيار الميزات ، [و] 25 بالمائة من التدريب والتقييم النموذج ، “قالت. في حين أن الحصول على كمية هائلة من البيانات في متناول اليد هو نعمة ، لا تزال هناك أسئلة تحتاج إلى طرحها قبل الغوص. وفقًا لأمبروز ، تحتاج الشركات إلى فهم مشاكل العمل التي يمكن حلها باستخدام التعلم الآلي والأهم من ذلك ، فهم الأسئلة التي يمكنهم الإجابة عليها بالبيانات المتوفرة لديهم.
في حين أن التكنولوجيا المتاحة لا يمكنها بالضرورة أن تخبرك بالأسئلة التي يجب طرحها ، إلا أنها يمكن أن تساعد الفريق في القيام ببعض استكشاف البيانات ثم المساعدة في التدريب والتقييم لنموذج تعلم الآلة.
حاليًا ، هناك العديد من الشركات التي تبيع حزم البرامج التي تفعل ذلك بالضبط – تسمح للمجموعات أو الأفراد بإنشاء نموذج للذكاء الاصطناعي أو التعلم الآلي دون الحاجة إلى تقديم حل من البداية. بالإضافة إلى حزم الكل في واحد هذه ، هناك العديد من المكتبات المتاحة مجانًا والتي تتيح للمطورين الاستفادة من التعلم الآلي. في الواقع ، في الغالبية العظمى من تطبيقات التعلم الآلي ، لن يبدأ المطور أو عالم البيانات أو مهندس البيانات من الصفر.
تمرين
بمجرد تحديد الفريق للأسئلة الصحيحة وتحديد أن البيانات المتاحة يمكنها الإجابة على هذه الأسئلة ، يجب تكوين النموذج. ستحتاج بعض بياناتك إلى وضعها جانبًا لاستخدامها كـ “مجموعة تحقق” ، والتي تُستخدم للمساعدة في ضمان قيام نموذجك بما يفترض أن يقوم به ، بينما سيتم استخدام الباقي كأساس للتدريب نموذجك.
على السطح ، يبدو هذا سهلاً: ضع جانباً بعض النسبة المئوية من بياناتك ولا تسمح لجزء التدريب برؤيتها حتى تتمكن من استخدام البيانات للتحقق لاحقًا. لكن الوضع يمكن أن يصبح معقدًا بسرعة. ما هي النسبة التي يجب أن تكون؟ ماذا لو كان الحدث الذي تريد تصميمه نادرًا جدًا؟ ستحتاج إلى بعض البيانات من هذا الحدث في كل من مجموعات بيانات التدريب والتحقق من الصحة ، فكيف يمكنك تقطيع الأشياء؟ يمكن لأدوات الذكاء الاصطناعي / تعلم الآلة أن تساعد في تحديد كيفية فصل هذا الفصل وربما التغلب على المشكلات الهيكلية في بياناتك ، لكن التكوين لا يزال خطوة حاسمة للوصول بشكل صحيح.
السؤال التالي هو ما هو نوع نظام التعلم الآلي الذي يجب على المرء استخدامه: شبكة عصبية (NN) ، أو آلة متجهية داعمة (SVM) ، أو غابة معززة متدرجة. لا توجد إجابة كاملة ، وأي طريقة – على الأقل بالمعنى النظري – جيدة مثل أي طريقة أخرى. ومع ذلك ، إذا تخلينا عن النظرية ونظرنا إلى العالم الحقيقي ، فإن التطبيق العملي يفرض أن بعض الخوارزميات مناسبة بشكل أفضل لمهام معينة طالما أنك لا تبحث عن النتيجة المثلى تمامًا. ستسمح أداة الجودة لبناء نموذج AI / ML للمستخدم باختيار نوع الخوارزمية التي يريد استخدامها تحت الغطاء. يعد الاهتمام بجميع الرياضيات وتقديم هذا النوع من النظام للمطور العادي أمرًا أساسيًا.
بمجرد أن يكون لديك مجموعة من البيانات للتدرب عليها ، ومجموعة من البيانات لمحاولة التحقق من نموذجك بها ، وخوارزمية أساسية ، يمكنك محاولة الموازنة بين حساسية وخصوصية نموذجك. في مرحلة ما من بناء نموذجك ، ستحتاج إلى تحديد ما إذا كان أحد الشروط صحيحًا أم لا أو ما إذا كانت بعض القيم أعلى أو أقل من عتبة رياضية معينة. هذه خيارات ثنائية ، لكن الأمور ليست بهذه البساطة. نظرًا لأن العالم الحقيقي والبيانات التي تأتي منه فوضوية ، فهناك أربع نتائج محتملة لنموذجك: إيجابي حقيقي ، وإيجابي كاذب ، وسلبي حقيقي ، وسلبي كاذب.

النموذج المثالي سيبلغ عن الإيجابيات والسلبيات الحقيقية فقط ، ولكن هذا ليس ممكنًا رياضيًا في كثير من الأحيان. لذا فإن إيجاد توازن بين الحساسية (المتعلقة بالإيجابيات الحقيقية) والخصوصية (المرتبطة بعدد السلبيات الحقيقية) أمر بالغ الأهمية.
في حين أنه لا يوجد شيء يمنع الفرد من القيام بكل هذا يدويًا وإعادة التدريب وإعادة الاختبار باستمرار ، فإن تضمين أداة رسومية لطيفة يمكن أن يجعلها مهمة أكثر سهولة. بالنسبة للمطورين منذ فترة طويلة ، فكر في الفرق بين تشغيل مصحح الأخطاء على سطر الأوامر قبل 25 عامًا مقابل تشغيل مصحح أخطاء كامل يستند إلى IDE اليوم.
تعيين
بمجرد بناء النموذج وتدريبه ، يمكنه القيام بما تم تصميمه للقيام به: تقديم توصيات حول ما يجب شراؤه أو مشاهدته بعد ذلك ، أو العثور على قطط في الصور ، أو تقدير أسعار المساكن. ومع ذلك ، لجعل نموذجك يقوم بالأشياء فعليًا ، يجب أن يكون قابلاً للنشر. هناك العديد من الطرق لنشر النماذج ، وهي تختلف وفقًا للمتطلبات والبيئة التي سيتم استخدام نموذجك فيها.
أولئك الذين هم على دراية بتكنولوجيا المعلومات الحديثة والبيئات السحابية قد سمعوا بلا شك عن Docker وتقنيات نقل الحاويات المماثلة الأخرى. باستخدام هذا النوع من التكنولوجيا ، يمكن الوصول إلى نموذج مدرب بالكامل – إلى جانب خادم ويب صغير يعمل داخل حاوية خفيفة الوزن – من أي مكان عبر السحابة. يمكن استخدام استعلامات الويب القياسية (أو غيرها من الاستدعاءات الخارجية المكافئة) لتمرير المعلومات إلى النموذج ، مع توقع أن تحتوي الاستجابة على النتائج (“هذه قطة” أو “هذه ليست قطة”).
تسمح هذه الطريقة للنموذج المدرَّب بالوجود بمعزل حتى يمكن إعادة استخدامه وإعادة نشره في حالة معروفة. ومع ذلك ، في بيئة ديناميكية في العالم الحقيقي ، تتغير البيانات باستمرار ، لذلك يوجد الآن مجال مزدهر من الشركات التي تسعى لنشر النماذج وتتبعها ، ومراقبة دقتها ، وتوفير كل ما يلزم لتحقيق “حياة تعلم كاملة” دورة.” يُعرف هذا الحقل باسم “MLOps” ، بمعنى “عمليات التعلم الآلي”. (فكر في “devops” ، لكن ركز على دورة حياة ML المحدودة هذه بدلاً من SDLC الأوسع.)
يتيح الجمع بين مجموعات نماذج ML / AI المدربة والإعلان عنها في حدائق الحيوان النموذجية للمستخدمين المستقلين الاستفادة من العمل الذي كرسته المنظمات الأكبر لتدريب النموذج. على سبيل المثال ، يمكن للمطور المهتم بتتبع حركة الأشخاص في مساحة معينة أن يستخدم نموذجًا مدربًا يقوم بالرفع الثقيل للتعرف على الصور والتنبؤ بالمسار. يمكن للمطور بعد ذلك تطبيق منطق عمل محدد لتوليد قيمة من فكرة دون الحاجة إلى القلق بشأن تفاصيل كيفية بناء النموذج وتدريبه.
ذكر الدكتور أمبروز أيضًا طريقة مختلفة لمشاركة النموذج ونشره. قالت ، من خلال تفكيك النموذج ومعلماته ، يمكنك “حفظ نسخة مستمرة من نموذج مدرب مع البيانات الوصفية في تنسيق [ملف معروف].” نظرًا لأن نموذج ML هو في الحقيقة مجرد مجموعة من المعادلات الرياضية الثابتة ، يمكن “تصدير” النموذج وتعبئته بطريقة تسمح له بأن يكون قابلاً للنقل ولكن لا يزال يعمل. نموذج الشبكة العصبية ، على سبيل المثال ، ليس أكثر من مجموعة كبيرة من المعادلات الخطية مع عدد كبير من المعلمات. يعتمد العدد الدقيق على المدخلات وتفاصيل كل طبقة من طبقات الشبكة.
توجد تنسيقات متعددة لهذا النوع من التمثيل ، من لغة ترميز النموذج التنبئي (مخطط قائم على XML) إلى تمثيل خط أنابيب Spark ML المستند إلى zip. يمكن استخدام هذه الملفات لمشاركة النماذج المدربة بالكامل وتوزيعها بين المستخدمين أو مهام سير العمل. طالما أن المستخدم أو التطبيق الآخر يعرف ما هو النموذج الأساسي المناسب ، فيمكنه إعادة تكوين الإعداد المدرب بالكامل بالمعلومات المشفرة داخل هذه الملفات.
من النظري إلى العملي
مع استمرار زيادة فائدتهما في التعلم الآلي والذكاء الاصطناعي ، سيزداد اعتمادهما فقط. يجب أن تكون هذه المقالة كافية لمنحك فهمًا أساسيًا للأنظمة – أو على الأقل كافية لتترك لك مجموعة كاملة من علامات تبويب المتصفح المفتوحة لقراءتها.
إذا كانت هذه المقالة قد أثارت اهتمامك ، فابق على اتصال – في غضون أسابيع قليلة ، سيدير Ars سلسلة كاملة حول إنشاء نماذج الذكاء الاصطناعي وتقييمها وتشغيلها. سنأخذ الدروس المستفادة من تجربة العام الماضي مع معالجة اللغة الطبيعية ونجرب أيدينا في بعض المشكلات المختلفة – ونأمل أن تأتي معك في الرحلة.





