10 مايو، 2022

مناقشة رسالة ماجستير في كلية علوم الحاسوب والرياضيات – قسم علوم الحاسوب بعنوان: (A Framework for Real-Time Big Data Analytics)

مناقشة رسالة ماجستير في كلية علوم الحاسوب والرياضيات – قسم علوم الحاسوب بعنوان: (A Framework for Real-Time Big Data Analytics)استمرارا لحركة البحث العلمي وبحضور السيد رئيس جامعة الموصل الأستاذ الدكتور قصي كمال الدين الأحمدي المحترم وحضور ومتابعة السيدة عميد كلية علوم الحاسوب والرياضيات الأستاذ الدكتور ضحى بشير عبد الله المحترمةناقشت كلية علوم الحاسوب والرياضيات بجامعة الموصل يوم الثلاثاء 10-5 -2021، رسالة الماجستير : ( اطار عمل لتحليلات البيانات الضخمة في الزمن الحقيقي )للطالبة رنا عبدالغفور محمد طاهر وبإشراف الاستاذ الدكتور ضحى بشير عبدالله تناولت الرسالة التي تقدمت بها الطالبة اقتراح اطار عمل لتحليل البيانات الضخمة في الزمن الحقيقي بهدف دعم اتخاذ القرار Decision- Making باستخدام تقنيات حديثة في معالجة البيانات المتدفقة .وتأتي اهمية هذا العمل للدور الكبير لتحليل البيانات الضخمة في الزمن الحقيقي في العصر الحالي وبمجالات مختلفة كالصحة والتعليم والاقتصاد والامن السيبراني وكشف الاحتيال وغيرها . تطرقت الدراسة الى بناء Periodic Task Model لمعالجة البيانات في الزمن الحقيقي اضافة الى الجمع بين قوة ادوات البيانات الضخمة المتمثلة باستخدام عدة مكونات ضمن Apache Spark Ecosystem وتقنيات الذكاء الاصطناعي .تم تطبيق اطار العمل في مجال البيانات المالية لدعم قرار المستثمرين حيث تمت عملية تحليل البيانات في مرحلتين ( (offline Data/Real-time Data .كان الهدف من المرحلة الاولى (offline) هو بناء نموذج تعلم الي ثنائي لتصنيف التغريدات وفقًا لقطبيتها الى موجبة وسالبة. حيث تم اختبار العديد من خوارزميات التعلم الآلي باستخدام SparkMLlib ,وهي مكتبة التعلم الالي من Apache Spark ومن خلال واجهة التطبيقات PySpark . بالاضافة الى استخدام نموذج معتمد على شبكة LSTM للتنبؤ بالسعر المستقبلي للسهم اعتمادا على بيانات اسعار الاسهم بعد اغلاق جلسة المال اعتمادًا على البيانات التاريخية المكتسبة من Yahoo Finance API.في المرحلة الثانية (ٌReal-time data) التي تعمل على معالجة البيانات في الزمن الحقيقي،تم اختيار منصة Twitter كمصدر للبيانات المتدفقة التي سيتم معالجتها باستخدام النموذج الالي المعتمد في المرحلة الاولى.اعتمدت معالجة (التغريدات) في الزمن الحقيقي على Spark Structured Streaming ، وهو محرك معالجة لتدفق البيانات يعتمد في عمله على Spark SQL . حيث تم انشاء خط أنابيب لتدفق التغريدات الفعلية من Twitter API إلى النظام المحلي ليتم معالجة البيانات فور وصولها على شكل جدول غير محدد في الذاكرة دون اجراء عملية خزن للبيانات واعطاء النتائج المرجوة لدعم القرار ضمن الفترة الزمنية المحددة . بالاضافة الى تمثيل مبدأ المعالجة المتوازية في تنفيذ عمليات تحليل البيانات مما ادى الى تحقيق استخدام عالٍ للقوة الحسابية وإنهاء عدد من المهام خلال نفس الفترة الزمنية.تهدف الدراسة الى استخدام مفهوم Structured Streaming وبناء Periodic Task Model لتحليل البيانات الضخمة المتدفقة في الزمن الحقيقي اضافة الى المعالجة المتوازية ضمن اطار عمل يمكن تطبيقه في مجالات مختلفة فيما بعد لدعم اتخاذ القرار Decision-Making. ترأس لجنة المناقشة الاستاذ المساعد الدكتور نجلاء بديع ابراهيم وعضوية كل من الاستاذ المساعد الدكتور صفوان عمر حسون والاستاذ المساعد الدكتور مشاري عايد عسكر من محافظة صلاح الدين –جامعة تكريت وبأشراف وعضوية الاستاذ الدكتور ضحى بشير عبدالله . وبعد المناقشة العلمية ودفاع الطالبة عن رسالتها تم قبول الرسالة ومنح الباحثة شهادة الماجستير في علوم الحاسوب فالف مبروك.

مشاركة الخبر

مشاركة الخبر