وثيقة
المعرف
https://digitalrepository.uob.edu.bh/id/ea093299-21c4-479e-a289-b60b37f3d954

A Novel model for Chart-to-Text Generation by utilizing NN models

وكيل مرتبط
Hewahi, Nabil, مشرف الرسالة العلمية
تاريخ النشر
2024
اللغة
الأنجليزية
مدى
[1], 9, 61, [2] Pages
مكان المؤسسة
Skhair, Bahrain
نوع الرسالة الجامعية
Thesis (Master)
الجهه المانحه
University of Bahrain, College of Science, Department of Postgraduate Programs
الملخص الإنجليزي
Abstract : This research introduces a novel neural network-based model designed to enhance the automatic generation of textual descriptions for scientific charts, building on the foundational work of "SCICAP: Generating Captions for Scientific Figures." Our proposed model combines advanced Convolutional Neural Network (CNN) architectures for effective feature extraction from scientific charts with multiple Recurrent Neural Network (RNN) layers to generate descriptive, accurate captions. This study is distinguished due to its comparative analysis of different RNN architectures, such as Long Short-Term Memory (LSTM) and Gated Recurrent Units (GRU), to identify the most effective model for textual caption generation. Central to our methodology is the utilization of CNNs to parse visual input, transforming complex chart images into a rich set of feature vectors. These vectors serve as inputs for the sequential RNN layers, which are tasked with constructing coherent and contextually relevant textual descriptions. The performance of various CNN-RNN combinations is rigorously evaluated using the BLEU-4 (Bilingual Evaluation Understudy) metric, a standard in the natural language processing field for assessing the linguistic quality of machine-generated text against human-written references. Our Research showed that Bi- LSTM performed the best with a BLEU score of 0.3, future researches will be required for more reliable captioning.
ملاحظة
عنوان الغلاف :
نموذج جديد لإنشاء مخطط إلى نص من خلال استخدام نماذج الشبكات العصيبية.
المجموعة
قالب العنصر
أطروحات
الملخص العربي
الملخص :

يقدم هذا البحث نموذجا جديدا قائما على الشبكة العصبية مصمما لتعزيز التوليد التلقائي للأوصاف النصية للمخططات العلمية، بناء على العمل التأسيسي ل SCICAP إنشاء تسميات توضيحية للشخصيات العلمية". يجمع نموذجنا المقترح بين معماريات الشبكة العصبية التلافيفية المتقدمة (CNN) لاستخراج الميزات الفعالة من المخططات العلمية مع طبقات متعددة من الشبكة العصبية المتكررة (RNN) لإنشاء تسميات توضيحية وصفية ودقيقة. تتميز هذه الدراسة بسبب تحليلها المقارن المعماريات RNN المختلفة ، مثل الذاكرة طويلة المدى (LSTM) والوحدات المتكررة ذات البوابات (GRU) ، لتحديد النموذج الأكثر فعالية لإنشاء التسمية التوضيحية النصية من الأمور الأساسية في منهجيتنا استخدام مقياس 4-BLEU ، وهو معيار في مجال معالجة اللغة الطبيعية لتقييم الجودة اللغوية للنص الذي تم إنشاؤه آليا مقابل المراجع المكتوبة بشري.
أظهر بحثنا أن أداء Bi-LSTM هو الأفضل بدرجة 0.3 BLEU ، وستكون هناك حاجة إلى أبحاث مستقبلية للحصول على تسميات توضيحية أكثر موثوقية.