Abstract:
ان عملية التنبؤ بأداء الطالب هي عملية صعبة ومليئة بالتحديات, وذلك يرجع الى
كمية البيانات الكبيرة جدا والمخزنة في قواعد بيانات الجامعات والمؤسسات
التعليمية. علم التنقيب عن البيانات يقوم بالبحث داخل قواعد البيانات هذه من
أجل الحصول على المعلومات الضرورية والمفيدة حول أداء الطالب.
في جامعة بوليتكنك فلسطين يوجد الكثير من البيانات المتعلقة بطالب تخصص
الهندسة وغيرها من التخصصات بالطبع, من العام 1994 وحتى يومنا الحالي. من
المفيد استخدام هذه البيانات المتعلقة بطالب الهندسة بكافة فروعها من أجل حل
مشاكل الطالب واساتذتهم والهيئة االكاديمية واإلدارية بشكل عام.
في هذا البحث تم استخدام أحد ادوات تعلم االلة وهي support vector
machine او SVM بنوعيها RBF-SVM و Linear-SVM وذلك بهدف بناء
نموذج يعتمد على بيانات طالب الهندسة في الجامعة للتنبؤ بأداء الطالب بعد خمس
سنوات من دراسة الهندسة والحصول على شهادة البكالوريوس في هذا التخصص,
بمعنى معرفة فئة المعدل التراكمي الذي سيحصل عليه طالب ما عند حصوله على
الشهادة الجامعية في تخصص الهندسة. وتم أيضا عمل تحسين على نموذج -RBF
SVM الذي أعطى دقة اعلى من Linear-SVM باستخدام طريقتين هما: ال Grid
Search و ال Genetic Algorithm بهدف الحصول على دقة أعلى في عملية
التنبؤ.
أظهرت نتائج البحث دقة ممتازة مقارنة بغيره من االبحاث في هذا المجال, كانت
دقة نموذج 96 enhanced RBF-SVM% وهذه تعتبر نسبة ممتازة ودقيقة جدا.
Predicting student performance is becoming more challenging due to large amount of
data in the educational databases. Data mining tools could be used to explore academic
databases with the objective of extracting knowledge about student’s performance. Machine
learning (ML) teaches computer to learn and make decisions, ML tools may include
but not restricted: Decision Trees (DT), Artificial Neural Networks (ANN), Support Vector
Machines (SVM)...etc.
The academic databases at Palestine Polytechnic University (PPU), contain millions of
records of data about tens of thousands of students over the last 40 years. In this thesis,
we decided to extract a subset of this huge data, and build our own data set which contains
the most important features about engineering students according to expert advice
at PPU. Then, we have built our model using SVM as a classifier and the Radial Basis
Function (RBF) with linear kernels as a pre-processor for feature selection.
The proposed model is used to predict student performance at PPU. The data set of
students in the engineering discipline is used as a benchmark. Results of our model
show excellent classification accuracy and AUC for the student’s performance, highest
obtained accuracy and AUC is 96% for optimized RBF-SVM model using the genetic
algorithm and grid search method, these results make the model a reliable one to be
generalized for the university students from other disciplines. Furthermore, it could be
developed to be used by instructors, academic supervisors and students to take proactive
steps to improve learning strategies.
Description:
CD , no of pages 58 , 31047, informatics 3/2019 , in the store