30 أبريل، 2024
أطروحة دكتوراه في قسم هندسة الحاسوب عن التنبؤ الفيديوي البارز المساق بالمحتوى باستخدام الشبكات العصبية اللافوفية العميقة
ناقشت كلية الهندسة/قسم هندسة الحاسوب أطروحة دكتوراة بعنوان التنبؤ الفيديوي البارز المساق بالمحتوى باستخدام الشبكات العصبية اللافوفية العميقة و ذلك في الساعة التاسعة صباحا من يوم الثلاثاء الموافق 2024/4/30 و على قاعة المناقشات في القسم، حضر المناقشة عدد من تدريسي القسم.
ناقشت الاطروحة التي تقدمت بها الطالبة زهراء طلال عبد استخدام البنية الاساسية لنماذج التعلم العميق مثل أجهزة
التشفيرالتلقائية AE ونماذج التشفير التلقائي المتغيير VAE و كذلك الشبكة العدائية التوليدية GAN.
تم دمج معمارية التشفير التلقائي مع الطبقات اللافوفية الثلاثية الابعاد وطبقات التجمع الثلاثية الأبعاد و اقتراح نموذج التشفير التلقائي الثلاثية الابعاد.ان النتائج الكمية لهذا النموذج هي 32.1 بالنسبة ل PSNR 7.97 بالنسبة MSE و 0.94 بالنسبة ل SSIM.
إن هذا النموذج المقترح يستهلك 5.415MB لمعاملات الاوزان و 20.66MB و 22.216G FLOP وإن نموذج التشفير التلقائي الثلاثي الابعاد المقترح يحقق أداءًمقبوالً لكنه ما زال يعاني من ضبابية التنبؤ،وخاصة في النتائج البصرية.
إما النموذج الثاني هو التشفير التلقائي الثلاثي الابعاد المحسن المقترح EAE – 3D و يعتمد على إعادة ترتيب طبقات التجميع ثلاثية الابعاد التي تم تطبيقها في النموذج الأول المقترح. أدى هذا إلى تحسين أداء النموذج 3D-EAE.
هدفت الاطروحة إلى تحقيق نموذج تنبؤ فيديوي مستقر قائم على التعلم العميق،وذلك بإقتراح النموذج الثالث عن طريق دمج نموذج التشفير التلقائي المتغير (VAE) مع الطبقات اللافوفيةالثلاثية الابعاد لتوليد النموذج( 3D-VAE).تساعد وظيفة أخذ العينات الزمنية المقترحة
،MSE لـ 3.99*10-4
لزيادة أداء نموذج 3D-VAE، الذي يصل إلى 35.6 لـ PSNR
و0.966 للـ SSIM.كذلك تم تقديم النموذج الرابع (3D-VGAN)لتقليل التوقعات الضبابية قدر الإمكان . يجمع هذا النموذج بين طبقات اللافوفية الثلاثية الابعاد 3D-CONV و وحدة التشفير التلقائي المتغيرة 3D-VAE، كذلك الشبكة العدائية التوليدية GAN للحصول على مزايا هذه الطبقات والمعماريات،مثل القدرة على استخراج مستقر وسلس بشكل فوري للميزات الكامنة المستمرة وإنتاج نموذج تنبؤ أقل ضبابية. هذا التكامل يحقق أداء أفضل مقارنة ب
و MSE 2.616*10-4 وكانت نتائج 3D-VGAN المقترحة هي 39.96 لـ PSNR و .SSIM لـ 0.973
إن النماذج الأربعة المقترحة تستهلك مصادر مادية كبيرة.
لذا تم اقتراح تقنية التقليم القائمة على حذف الأوزان الاقل قيما لتقليل من حجم النموذج المقترح مع العمل على الحفاظ على الأداء بأفضل وجه بقدر الإمكان .
اقتطعت تقنية التقليم ٪38من إجمالي FLOP من النموذج(3D-AE) المقترح بينما تم حذف ٪39.1من إجماليFLOP بالنسبة للنموذج
3D-EAD و تم اقتطاع ٪49.7 من إجمالي FLOP من نموذج 3D-VAE المقترح، ويتم
تقليم ٪29.7 من إجمالي FLOP من نموذج 3D-VGANالمقترح.
أظهرت نتائج الاطروحة ان النماذج المقترحة حققت أداءًعاليًا مع انخفاض من التعقيدات المادية للنماذج
المقترحة .
ترأس المناقشة الأستاذ الدكتور أحمد خورشيدمحمد/كلية الهندسة/جامعة دهوك و الأستاذ المساعد الدكتورة يسرى فيصل محمد /كلية علوم الحاسوب و الرياضيات /جامعة الموصل و الأستاذ المساعد الدكتور محمد أحمد شاكر/كلية الهندسة/جامعة دهوك و الأستاذ المساعد الدكتورة ميادة فارس غانم و الأستاذ المساعد الدكتور زهير قيس إبراهيم /مركز الحاسبة الإليكترونية /جامعة الموصل والأستاذ الدكتور شفاء عبدالرحمن داؤد عضوا و مشرفا.