
13-02-2019, 10:32 PM
|
 |
قلم ذهبي مميز
|
|
تاريخ التسجيل: Feb 2019
مكان الإقامة: مصر
الجنس :
المشاركات: 171,467
الدولة :
|
|
رد: سبل تطوير محلل الصرف الآلي
سبل تطوير محلل الصرف الآلي
حسن مظفر الرزّو
رابعًا: معالج التشكيل:
يعمد معالج التشكيل إلى إعادة تركيب عناصر الكلمة لغرض مقارنتها بالكلمة المدخلة إلى ساحة المعالجة الآلية، وذلك للتأكد من التحليل الصرفي لبنيتها، ويتم ذلك عن طريق إعادة تركيب جذع الكلمة، عبر صهر الجذر مع جميع الصيغ الصرفية المناظرة للهيكل الصرفي الذي حدده المستخلص، والتي يسمح المعجم اللغوي بانطباقها عليها.
فعلى سبيل المثال، وفي حالة الهيكل الصرفي "مفعل" يقوم معالج التشكيل باسترجاع الصيغ الصرفية المناظرة له من ملف الصيغ الصرفية وهي: "مَفعل، مفعل، مفعل، منفَعِل" بعد ذلك يقوم بالتأكد من صحة انطباق الصيغة الصرفية المحتملة على جذر الكلمة قيد الدراسة، ليقوم بعد ذلك بصهر الجذر مع كل صيغة صرفية منطبقة عليه، ثم ينفذ جميع عمليات الإبدال والإعلال الواجبة تحت توجيه سلسلة القواعد الصرف صوتية التي يتعامل معها، بعدها يدمج عناصر الكلمة الأخرى (السوابق واللواحق) مع جذع الكلمة الذي أعاد تركيبه.
وتستمر فعالية معالج التشكيلي تركيب الكلمة تامة التشكيل لحين المطابقة التامة.
5- المحلل الصرفي الآلي والموسوعات العربية:
إن المؤسسات التي عملت وتعمل على إعداد الموسوعات العربية الإلكترونية - قد عمدت إلى زج حجم كبير من المعلومات: كالكتب، والدوريات، والتقارير، ووثائق البحث العلمي، ودوائر المعارف الشهيرة، والصحف، والنشرات، في جعبة موسوعاتها الجديدة بسبب توفر وسائط تخزين عملاقة (مثل أقراص CD-ROM & DVD)، بيد أن العقبة التي لا تزال تقف أمام استثمار هذه الموسوعات المكتنزة تكمن في الطرائق المتاحة للوصول إلى مفرداتها اللغوية.
إن المهام الرئيسة التي تنتظر عملية استثمار المعلومات المتاحة في هذه الموسوعات، تشمل:
أ- تحليل مضمون المحتويات لأغراض الفهرسة والاستخلاص.
ب- صياغة آلية محكمة لعملية البحث (بدلالة الكلمة، أو مجموعة كلمات) عن طريق اعتماد عوامل العلاقات المنطقية (AND / OR / NOT) المصاحبة للمنطق البولياني Boolean Logic.
ج- إظهار نتائج عملية البحث والاستقصاء على شكل قائمة بالإحالات المرجعية، أو فقرات النصوص التي تحوي الكلمات المطلوبة.
يشخص المحلل الصرفي الآلي (بالوقت الحالي) في مكان الصدارة بوصفه الأداة الفاعلة، والسريعة لمساعدة الباحث في الوصول إلى المفردات التي ينشدها في عملية البحث.
تبدأ عملية البحث بإظهار قوائم متعدِّدة الخيارات تُتِيح للمستخدم اختيار هيكلية البحث المقترحة، والكلمة (أو مجموعة الكلمات) التي يريد الوصول إليها في الموسوعة، لكي يشرع المحلل الآلي بعملية البحث لتنفيذ هذه المهمة.
تعد موسوعات الحديث النبوي الشريف مثالاً حيًّا على تضخم حجم المعلومات، وتنوع المصادر، وتشابك الدلالات اللغوية، عند مقارنتها مع بقيَّة الموسوعات العربية، وبسبب العمق المعرفي، وتنوع الدلالات اللغوية لنصوص السنة النبوية والكلم النبوي، فإن عملية البحث والاستقصاء في هذه الرياض المباركة تعاني من أكثر من إشكالية، وتفتقر إلى أداة بحث حاسوبية متميزة في الدقة، وكفاءة الأداء.
من أجل هذا فقد وقع اختيارنا على مجموعة الموسوعات المتوفرة في السوق العربية والتي تعالج هذا الموضوع الحيوي، وتوظف المحلل الصرفي الآلي لمهمة البحث في الكم الهائل من المعلومات التي تحتويها، بغرض الوقوف على الخصائص الإيجابية التي يوفرها كل نظام، والثغرات التي تصاحب آلية عمله فتؤدي إلى تشابك المفردات الناتجة عن عملية البحث، بحيث يصعب على المستخدم الاستفادة منها، أو ظهور أخطاء في عملية البحث التي يباشرها المستخدم.
6- آلية العمل وخطة الاختبار:
إن إحدى الإمكانيات التي يقدمها برنامج الحديث الشريف للمستخدم للوصول إلى أحاديث محددة - هي إمكانية البحث بواسطة البحث الصرفي، إن المحلل الآلي متعدد الأطوار قد وظف في بيئة موسوعة الحديث النبوي للعمل وفق الآلية المدرجة في الشكل (2)؛ لكي يتيح للمستخدم إمكانية الوصول إلى المفردات التي يريدها بدقة، وسرعة كبيرة.
ويبدو واضحًا أن المستخدم يلعب دورًا هامًّا في عملية توجيه المحلل الصرفي الآلي صوب الغاية التي يصبو إليها، عن طريق اختيار الجذر المناسب للكلمة من قائمة الاحتمالات التي يظهرها البرنامج.
بيد أنَّ هذا الأمر لا يلغي إمكانية ظهور جملة من العقبات التطبيقية وموارد الخطأ التي تنجم عن وجود ثغرات منطقية (برمجية، أو لغوية صرفية) بسبب تعقد البنية الصرفية، ووجود شذوذ في بعض الأماكن الذي يعترض بدوره الصياغات المنطقية الكلية.
ولكي نقف عند هذه النقاط، ونحسن تشخيصها، فقد أجريت سلسلة اختبارات لغوية صرفية لمحتوى الموسوعة عن طريق توظيف المحلل الصرفي الآلي، وقد أثمرت هذه الاختبارات عن جملة من النقاط التي تتعلق بالمحلل وكفاءة أدائه.
يظهر في الجدول (2) نخبة من الكلمات المدخلة في قائمة البحث، ويلاحظ أن المحلل الصرفي الآلي يفشل في عملية البحث عن بعض الكلمات (مثل: حبلى، وسلمى)، فيؤشر كلمات تختلف عنها تمامًا في المعنى والمبنى، وهناك كلمات لم يفلح المحلل الصرفي في إيجادها في نصوص الموسوعة مع إظهار عبارة "غير قابلة للتحليل"، كذلك فقد لوحظ أن الهمزة تلعب دورًا كبيرًا في التمهيد للمحلل الصرفي بإيجاد الكلمة المطلوبة بسهولة، في حين يشكل عليه تحليلها بدون وجود الهمزة فيدرجها في قائمة "غير قابلة للتحليل".
يضاف إلى كل هذا أن عملية اختيار المستخدم للجذر المناسب لكلمة البحث تعترضه عقبة عدم توفر معرفة كافية للمستخدم المعاصر بعلوم الصرف وتفعيلاته، الأمر الذي قد يجعله يختار الجذر غير المناسب، فيفشل المحلل الصرفي، ولا يصل الباحث إلى ضالته المنشودة.
الجدول (2) نتائج الاختبار الميداني للمحلل الصرفي متعدد الأطوار.
ت كلمة البحث الجذر المطابقة الملاحظات 1 حبلى فعلى كلا أظهر المحلل نصوص تحوي كلمة هرقل. 2 سلمى فعلى نعم أظهر كلمة رسول الله صلى الله عليه وسلم. 3 قتيل فعل نعم
4 صريع فعيل نعم
5 الأنبياء فعال كلا لم يفلح في إيجادها بدون الهمزة. 6 حوراء فعلاء نعم
7 غضبان فعلان كلا
8 عنبسة اسم علم … لم يفلح في إيجادها وأظهر عبارة غير قابلة للتحليل. 9 ملكوت فعلوت نعم
10 بئس فعل جامد كلا
11 اكفهر افعلل … لم يجدها. 12 معراج مفعال نعم
13 رشوة فعلة نعم
14 شيعة فعلة كلا
7- سبل تطوير أداء المحلل الصرفي:
يبدو جليًّا أن المحلل الصرفي الآلي متعدد الأطوار ذو فائدة كبيرة في ميدان البحث عن النصوص في الموسوعات العربية (على مستوى الكلمة، مجموعة كلمات، أو جذر الكلمة)، ويتصف بكفاءة أداء جيدة، وسرعة كبيرة، كذلك فإن التعديلات التي أجرتها العالمية على إصداراتها الجديدة قد غطت كثيرًا من الجوانب التي كانت تشكل ثغرات ملحوظة في أداء المحلل الصرفي في الإصدار الأول.
بَيْدَ أنَّ هذا الأمر لا يعني اكتمال دورة العمل الصرفي والبرمجي في هذا الميدان، لوجود جملة إضافية من الثغرات التي تنتظر منطقًا برمجيًّا أكثر دقة، ومعيارًا صرفيًّا أكثر صرامة لا تخرج عن دائرته الجذور الصرفية الشاذة التي قد تَنْضَوِي تَحْتَ أكثر من قاعدة.
ولتجاوز هذه العقبة نوصي باعتماد التعديلات التالية على هيكليته البرمجية الصرفية، والتي تنضوي تحت أكثر من محور للتطوير:
المحور الأول: التطوير في الأنموذج الصرفي للمحلل:
ويشمل جملة من الإضافات الجديدة إلى خوارزميات البنية الصرفية للمحلل متعدد الأطوار، أهمها:
أ- إن حدة ظاهرة اللبس الصرفي في لغتنا العربية، والذي تظهر آثاره بوضوح عند غياب تشكيل الكلمة، ينشب عنه حالات لبس زائفة، وأخرى شبه زائفة، تتفاعل بدورها مع أنواع اللبس الأصيل، فينجم عن ذلك حالات مضاعفة ومتباينة من الخلط الصرفي، والصرف نحوي، لذا أصبح من الضروري إنشاء قاعدة بيانات صرفية تصاحب المحلل الصرفي الآلي، بحيث تستوعب جل حالات اللبس الممكنة.
ب- ضرورة توفير بيانات معجمية تربط بين جذر الكلمة، والصيغ الصرفية المنطبقة عليه من جانب، وبين الكلمات المشتقة، ومعانيها الصرفية من جانب آخر، كذلك فإن إدراج الأطر الدلالية للصياغة سوف توفر معلمات كافية عن علاقات إسناد الأطر الدلالية لها.
ج- اعتماد مبدأ الإحصاء الصرفي لسلاسل الرموز اللغوية تمهيدًا لاستيعاب ظاهرة الشذوذ، ولترشيد حالات اللبس الزائفة، وشبه الزائفة عن طريق توفير عدد معقول من الإحصائيات الصرفية لمعدلات استخدام الجذور، والصيغ الصرفية، والحالات التصريفية والإعرابية.
د- الاهتمام بزيادة كفاءة أداء المعالج الصرفي الآلي بحيث يمتلك القدرة على التعامل مع النص الخالي من التشكيل، لتجاوز عقبة حاجته للنصوص تامة التشكيل، وجزئية التشكيل، واللتان سوف تنصهران في ظاهرة غياب تشكيل المفردة العربية.
هـ- توظيف مدقق لتمييز الأخطاء الإملائية للكلمة المدخلة إلى المعالج الآلي تلقائيًّا، في قطاعي الكلمات المشكلة وغير المشكلة؛ للتقليل من حجم الضياعات بالتفتيش عن كلمات مزيفة.
و- استخدام آليات جديدة لتحسين أداء المحلل الصرفي الآلي في استرجاع المعلومات العربية، وتجاوز عقبة الاختيار اليدوي للمستخدم من قائمة احتمالات الجذور.
المحور الثاني: اقتراح آلية مستحدثة للبحث الموضوعي:
إن سبر معظم عمليات البحث التي يمارسها الباحث المتخصص، أو المستخدم العادي في الموسوعات الحاسوبية يظهر بوضوح أن نسبة البحث عن الأسماء والموضوعات تزيد على 90 % من عمليات البحث، بينما لا تزيد عملية البحث عن الأفعال أو الصفات عن نسبة 5 %، الأمر الذي يحتم إعطاء الأسماء والموضوعات أهمية خاصة في عملية البحث؛ لتذليل العقبات أمام الباحث أو المستخدم.
يمكن تصنيف الأسماء إلى عدة فئات أهمها:
1- الأعلام.
2- العلوم والفنون.
3- الأماكن والبلدان.
4- أسماء الآلة.
5- المخلوقات (الإنسان، الحيوان، النبات).
6- الظواهر الكونية بشتى تفرعاتها.
7- الحدث التاريخي.
ولتجاوز كثرة الحقول التي تندرج تحتها الأسماء والتبويبات الموضوعية، ولغرض توفير قواعد معطيات ذكية للباحث العربي في هذا الميدان، فقد تم صياغة مجموعة من الخوارزميات البرمجية اللغوية التي ارتكزت إلى برنامج أعد في بيئة Visual Basic، عولجت من خلاله قواعد البيانات التي تحويها مثل هذه الموسوعات عن طريق تمييز أنواع الماهية Entity Type التي تتصف بها المفردات الموضوعية المستخدمة في هذا المضمار، والعلاقات القائمة بين أنواع مختلفة من الماهية Association and pairing عن طريق توظيف مُخطَّطات علاقات الماهية Entity Relationship Diagram.
أظهرت النتائج المستحصلة من المعالجة الذكية لمجموعة منتخبة من المعطيات المتوفرة في المكتبات (تزيد عدد صفحاتها على بضعة آلاف صفحة وفي أكثر من موضوع تراثي) وجود أكثر من عقبة برمجية تنشأ عن بعض أنواع الماهية متعددة الأوجه Two faced Entities مما يحتم معالجة إضافية لمحتويات نص المعطيات لتجاوز عقبة تشعب الارتباطات العلائقية، كذلك ظهر أن زج معيار النسبة أو الخاصية Attribute للمفردة المعلوماتية التي تعرف الماهية يزيد من القدرات الذكية للمعطيات المتوفرة.
اعتمدت هذه الخوارزميات على عملية استثمار الجذور الصرفية المتاحة في المحلل الصرفي الآلي مع زج العلاقات الدلالية التي تربط بين عناصر الكلمات (المفردة/ المركبة) وكيفية استثمارها في سبر دائرة الدلالة اللغوية لهذه الكلمات في دائرة الموسوعات العربية.
إن هذا الأمر لا يلغي بالمقابل ضرورة زج مفاهيم النص الفائق Hypertext، والارتباطات الفائقة Hyperlink في معالجة وحوسبة الموسوعات العربية، لفتح الأبواب على مصاريعها أمام المستخدم عن طريق إتاحة مناخ معرفي أكثر عمقًا يتجاوز حدود الكلمة باتجاه دلالتها، ومضمونها الاصطلاحي، بحيث يتيح للمستخدم العربي متابعة تداعيات الأفكار التي تنشب عن مطالعة كلمة ما، فتنبعث عنها جملة من الدلالات والاصطلاحات التي تعمق فهمنا للموضوع الذي تدور الكلمة في فلكه.
8- مراجع البحث:
أ- العربية:
1- الضامن، الدكتور حاتم صالح، الصرف، الطبعة الأولى، 1991، وزارة التعليم العالي والبحث العلمي، جامعة بغداد، مطابع دار الحكمة للطباعة والنشر، بغداد.
2- الدجني، عبدالفتاح، النزعة المنطقية في النحو العربي، الطبعة الأولى، 1982، وكالة المطبوعات، الكويت.
3- علي، الدكتور نبيل، اللغة العربية والحاسوب: دراسة بحثية، الطبعة الأولى، 1988، دار تعريب، بيروت.
4- عمايره، الدكتور خليل أحمد، في التحليل اللغوي: منهج وصفي تحليلي، الطبعة الأولى، 1407هـ، مكتبة المنار، الزرقاء، الأردن.
5- المنصوري، الدكتور علي جابر، وعلاء الدين هاشم الخفاجي، محاضرات في علم الصرف، الطبعة الأولى، 1989، وزارة التعليم العالي والبحث العلمي، جامعة بغداد، بيت الحكمة، مطبعة التعليم العالي، الموصل.
ب- الإنجليزية:
1- Bear, J., A Morphological Recognizer With Syntactic & Phonological Rules, Proceedings of The 15th International Conference On Computational Linguistics, Bonn, West Germany, 20-22 August, 1986.
2- Koskenniemi,K., A General Computational Model For Word Form Recognition and Production, 1984,pp.178-181.
3- Thalouth,B. &Al-Dannan,A., 1986, A Comprehensive Arabic Morphological Analyzer Generator, IBM Kuwait Scientific Center (KSC), Kuwait.
4- Winogard, T., ******** As A cognitive Process, Vol. I: Syntax, Addison Wisely, 1983.
__________________
سُئل الإمام الداراني رحمه الله ما أعظم عمل يتقرّب به العبد إلى الله؟ فبكى رحمه الله ثم قال : أن ينظر الله إلى قلبك فيرى أنك لا تريد من الدنيا والآخرة إلا هو سبحـــــــــــــــانه و تعـــــــــــالى.
|