ماذا يعني مصطلح رؤية الحاسوب - Computer Vision ؟ وما أبعاده في مجال الذكاء الاصطناعي؟

ماذا يعني مصطلح رؤية الحاسوب - Computer Vision ؟ وما أبعاده في مجال الذكاء الاصطناعي؟


Peak -  دعنا نبدأ بأحجية صغيرة! ما هي التقنية التي تمر عليك كل يوم ولكنك لا تلاحظها أو لا تعرف معلومات كافية عنها؟ الإجابة هي التقنية التي تعتبر أحد أقوى أنواع الذكاء الاصطناعي وأكثرها إقناعاً؛ ألا وهي رؤية الكمبيوتر -Computer Vision! في هذه المقالة؛ سوف نلقي نظرة على ماهية هذه التقنية المميزة ، وكيف تعمل.

 

رؤية الكمبيوتر هي مجال من مجالات  علوم الكمبيوتر، الذي يركز على محاكاة أو تقليد أجزاء من نظام الرؤية البشرية المعقد، لتتمكن أجهزة الكمبيوتر من تحديد ومعالجة الأشياء في الصور ومقاطع الفيديو بنفس الطريقة التي يفعلها البشر. 

 

من وقت ليس ببعيد، كانت إمكانيات رؤية الكمبيوتر محدودة جداّ، ولكن بفضل التقدم في علم الذكاء الاصطناعي والابتكارات في التعلّم العميق والشبكات العصبية ، تمكن هذا المجال من تحقيق قفزات كبيرة في السنوات الأخيرة وتمكن من تجاوز البشر في بعض المهام المتعلقة بالكشف عن الأشياء والمجسمات وتحديد هويتها أو تسميتها. لا شك أن أحد العوامل الدافعة وراء نمو رؤية الكمبيوتر، هو كمية البيانات التي ننتجها اليوم والتي يتم استخدامها بعد ذلك للتدريب وتحسين رؤية الكمبيوتر.

 

إلى جانب الكميات الهائلة التي يتم تبادلها ونقلها على منصات التواصل الاجتماعي ومنصات اخرى من البيانات المرئية ، من الممكن الآن الوصول إلى قوة الحوسبة المطلوبة لتحليل البيانات. ومع نمو مجال رؤية الكمبيوتر مع الأجهزة والخوارزميات الجديدة ، زادت معدلات الدقة لتحديد الأشياء والمجسمات. 

 

بدأت التجارب المبكرة في رؤية الكمبيوتر في الخمسينيات من القرن الماضي ، وتم استخدامها لأول مرة تجارياً للتمييز بين النصوص المكتوبة بخط اليد بحلول السبعينات ، واليوم نمت تطبيقات رؤية الكمبيوتر بشكل كبير.

 

كيف تعمل تقنية رؤية الكمبيوتر ؟

 

أحد الأسئلة الرئيسية المشتركة بين  علم الأعصاب وعلم التعلّم الآلي هو: كيف تعمل أدمغتنا بالضبط ؟ وكيف يمكننا محاكاة ذلك باستخدام الخوارزميات الخاصة بنا؟ الحقيقة هي أن هناك عدد قليل جداَ من النظريات التي يمكن تطبيقها المتعلقة بحسابات الدماغ. لذا على الرغم من حقيقة أن الشبكات العصبية من المفترض أن "تحاكي طريقة عمل الدماغ" ، إلا أن لا أحد متأكد تماماَ ما اذا كان ذلك حقيقياَ فعلاً أم لا! ينطبق هذا التناقض نفسه على رؤية الكمبيوتر،نظراَ  لأننا لم نتخذ قراراً حاسماً كبشر وعلماء بشأن كيفية معالجة الدماغ والعينين للصور ، فمن الصعب تحديد مدى تقارب الخوارزميات التي ننتجها من العمليات العقلية الداخلية التي تجري في أدمغتنا.

 

في مستويات معينة،  تتمثل رؤية الكمبيوتر في التعرف على الأنماط فقط. لذا إحدى الطرق لتدريب الكمبيوتر على كيفية فهم البيانات المرئية هي من خلال تزويده بالكثير من الصور! بل الآلاف والملايين منها، ومن ثم تصنيفها ، ثم إخضاعها لتقنيات البرامج المختلفة أو الخوارزميات التي تتيح للكمبيوتر البحث عن الأنماط في جميع العناصر التي تتعلق بهذه التصنيفات.

 

كم تستغرق تقنية رؤية الكمبيوتر لـ "فك شيفرة" الصور؟؟

 

باختصار ليس بالوقت الطويل! هذا هو السبب في أن رؤية الكمبيوتر مثيرة للإهتمام بشكل كبير؛ والسبب في ذلك أنه في حين كانت تستغرق أجهزة الكمبيوتر العملاقة في الماضي أياماَ أو أسابيعاَ أو حتى شهوراً لتدقيق جميع الحسابات المطلوبة ، نجحت أجهزة الكمبيوتر الحالية بشرائحها عالية السرعة  اليوم ، إلى جانب الإنترنت السريع والموثوق والشبكات السحابية؛ بتدقيق الحسابات وتحليل الصور والبحث عن الأنماط فيها، بسرعة قد تصل لأجزاء من الثانية!  كان وما يزال العامل الحاسم هو رغبة العديد من الشركات الكبرى ، بإجراء أبحاث الذكاء الاصطناعي لمشاركة عملهم على Facebook و Google و Microsoft ، لا سيما من خلال الاستعانة بمصادر مفتوحة لبعض أعمال التعلم الآلي الخاصة بهم، مما يسمح للآخرين بالبناء على عملهم بدلاً من البدء من الصفر. 

 

بعض تطبيقات رؤية الكمبيوتر 

 

رؤية الكمبيوتر في السيارات ذاتية القيادة: لا يقتصر استخدام هذه التقنية الرائعة من قبل شركات التكنولوجيا فحسب، إنما هناك الكثير من الشركات والقطاعات الأخرى التي بإمكانها أن تستفيد  من تقنية رؤية الكمبيوتر والتعلم الآلي في تطبيقات الصور وغيرها. إن تطرقنا إلا قطاع السيارات، تمكّن رؤية الكمبيوتر السيارات ذاتية القيادة من فهم محيطها. حيث تلتقط الكاميرات الموجودة داخل وخارج السيارة، مقاطع فيديو من زوايا مختلفة حول السيارة وتغذيها إلى برنامج رؤية الكمبيوتر ، والذي يعالج بعد ذلك الصور في الوقت الفعلي للعثور على أطراف الطرق ، وقراءة إشارات المرور ، واكتشاف السيارات والأشياء والمشاة وغيرها. ويمكن بعد ذلك للسيارة ذاتية القيادة أن تشق طريقها في الشوارع والطرق السريعة ، وأن تتجنب العقبات ، وفي المستقبل الليس ببعيد؛ أن تقود الركاب بأمان إلى وجهتهم.

 

رؤية الكمبيوتر في التعرف على الوجوه: تلعب رؤية الكمبيوتر أيضًا دورًا مهمًا في تطبيقات التعرف على الوجه ، وهي التقنية التي تمكّن أجهزة الكمبيوتر من مطابقة صور وجوه الأشخاص بهوياتهم. تقوم خوارزميات رؤية الكمبيوتر بالكشف عن ملامح الوجه في الصور ومقارنتها بقواعد بيانات ملفات تعريف الوجه. وتستخدم منصات التواصل الاجتماعي مثلاً، خاصية التعرف على الوجه للمصادقة على أصحاب الحسابات مع هوياتهم. بالإضافة الى استخدام بعض الجهات القانونية في بعض الدول تقنية التعرف على الوجه لتحديد المجرمين في قنوات الفيديو المختلفة.

 

رؤية الكمبيوتر في الرعاية الصحية: دعونا نفترض سيناريو محتمل ومخصص لواقعنا الحالي تحت وباء فيروس كورونا Covid-19 ،إن قمنا بإدخال تقنية رؤية الكمبيوتر إليه، لنرى ما هي التطبيقات المحتملة لهذه التقنية الرائعة التي قد تزيد من فاعلية سير العملية الصحية؟ أولاً؛ يمكن أن تساعد خوارزميات الرؤية الحاسوبية في أتمتة المهام مثل؛ الكشف عن الفيروس في الصور الطبقية للرئتين بعد أخذ عينة من مريض مؤكد واحد ثم تطبيق رؤية الكمبيوتر في العملية المخبرية من خلال مسح مرضى آخرين وفحصهم بنفس الوقت لمطابقة الفيروس إن وجد أو للعثور على الأنماط والأعراض المصاحبة للفيروس في المرضى المحتملين.  ثانياً؛ يمكن استخدام تطبيق التعرف على الوجه لمساعدة القطاع الصحي بطريقة غير مباشرة في هذه الظروف، من خلال استخدام كاميرات إشارات المرور أو الـ Drones لمسح الشوارع والتعرف على الأشخاص المخالفين  -بشكل متكرر-لقوانين حظر التجول الكلي أو الجزئي التي فرضتها الكثير من الدول مثل؛ الأردن، للحد من انتشار الوباء قدر الإمكان.