دراسات وأبحاث
المترجم الآلي للغة الإشارة
العدد 152 | نيسان (أبريل)-2020

بقلم منار منعم

تعتبر لغةُ الإشارة اللغةَ الطبيعية الأولى للصمّ. ولغة الإشارة - وفق خبراء اليونسكو - أسلوب غير شفوي لتواصل الصمّ فيما بينهم ولتواصلهم مع المجتمع. تعتمد هذه اللغة على استعمال رموز يدوية وغير يدوية مثل تعابير الوجه وحركة الرأس والأكتاف للتعبير عن المفاهيم والأفكار لإيصال المعلومات إلى الآخرين.

والصَّمَم بتعريفه العام هو فقدان أو ضعف حادّ في حاسة السمع، يُؤثّر على المهارات اللغوية للصمّ، حيث يعانون من تأخر واضح في نمو اللغة المنطوقة نظرًا لغياب التغذية الراجعة عند صدور الأصوات، وخصوصًا في مرحلة الطفولة المبكرة. ويَظهر هذا التأثير واضحًا في التأخر الأكاديمي في مهارات القراءة والكتابة. وبالمقابل أشارت العديد من الدراسات إلى أنّ مستوى ذكاء الأفراد الصمّ لا يختلف عن مستوى ذكاء الأفراد السامعين، وذلك لأن فقدان السمع لا يُؤثر على القدرات العقلية ولا على القدرة على التعلّم عند التلاميذ الصمّ، ومع ذلك فهم بحاجة إلى دعم خاص في نظامهم الأكاديمي ورفدهم بأنظمة تقنية لتحقيق نموذج تعليمي فعّال واستغلال طاقاتهم استغلالًا مناسبًا.

عند الحديث عن لغة الإشارة العربية، يمكننا التمييز بين نموذجين أساسيين للغة الإشارة:

1-   لغة الإشارة العربية الطبيعية: وهي اللغة التي طورها مجتمع الصمّ، والتي تختلف في مفرداتها وقواعدها عن اللغة العربية، وتختلف كذلك من مجتمع لآخر. والهدف منها هو التواصل بين الصمّ فيما بينهم وبين الصمّ والمجتمع.

2-  لغة الإشارة المطابقة للعربية: وهي لغة طوَّرها خبير لغة الإشارة "عبد الكريم عطايا" (عطايا)، واعتمدتها (جمعية إيماء لتعليم الصمّ) في دمشق (EMAA 2016). يهدف هذا النموذج إلى تعليم الصمّ اللغة العربية الفصحى بواسطة الإشارات، وقد أثبت نموذج مشابه له هو لغة الإشارة المطابقة للغة الإنكليزية “Signed Exact English SEE” فعاليته في مساعدة الصمّ على التعلّم.

يُوضّح الشكل-1 الفرق في استعمال المصطلحات بين لغة الإشارة الطبيعية ولغة الإشارة المطابقة، فإشارة "الأكل" تُشير إلى مفهوم "الأكل" في لغة الإشارة الطبيعية، وذلك بقطع النظر عن نوع الكلمة (اسمًا كانت أم فعلًا) وعن زمن الفعل الذي يمكن أن يُفهم من سياق الحديث، أما في لغة الإشارة المُطابقة فإنّ "الأكل" المصدر يختلف عن "يَأكُل" الفعل في زمن المضارع ويختلف عن "أَكَل" الفعل في الزمن الماضي.

 

الشكل- 1: مثال على لغة الإشارة الطبيعية والمطابقة

 

1-       الترجمة الآلية للغة الإشارة

تواجه الترجمة الآلية للغة الإشارة العربية الطبيعية بوجه عام ولغة الإشارة المطابقة بوجه خاص مجموعة من التحديات، أولها ضعف الدراسات اللغوية التي تدرس لغة الإشارة العربية، وعدم وجود مدونات بأحجام جيدة تُساعد على بناء أنظمة ترجمة آلية إحصائية، إضافة إلى صعوبة توليد وإظهار الإشارات.

يمكننا الاستفادة من نفس تقنيات الترجمة الآلية المستعملة في أنظمة الترجمة بين اللغات المنطوقة للترجمة إلى لغة الإشارة، مع الأخذ بالحسبان خصوصية لغة الإشارة من حيث طبيعة ناتج الترجمة وفضاء تمثيل ناتج الترجمة.

 

2-       المترجم الإشاري الافتراضي

لتمثيل وتوليد الإشارات يمكن الاستعانة بمترجم للغة الإشارة، وحفظ الإشارات على شكل مقاطع، ثم إعادة تركيب هذه المقاطع عند ترجمة الجمل. تعتبر هذه الطريقة فعالة من حيث طبيعة ناتج الترجمة، لكن تبدأ المشكلة عند الحاجة إلى تعديل أو إضافة إشارات جديدة، لأنّ هذا يتطلب جهدًا كبيرًا من المُطوّر والمُترجم الإشاري لإعادة تسجيل مقاطع إضافية وربطها بنظام الترجمة الآلي.

يُعتبر استعمال الشخص الافتراضي Virtual Human مترجمًا إشاريًّا من الطرق الشائعة حاليًّا في أنظمة الترجمة الآلية للغة الإشارة، حيث تتجاوز هذه الطريقة مشاكل الاعتماد على مترجم لغة إشارة لتوليد الإشارات، وتمكِّن من تعديل وإضافة إشارات جديدة. يُوجد العديد من أنظمة المحاكاة الافتراضية للإنسان منها ما هو مفتوح المصدر ومنها ما هو تجاري. ضمن هذا البحث استعملنا المترجم الافتراضي WebSign (LaTICE) ضمن نظام الترجمة الآلي. طوِّر هذا النظام في مخبر أبحاث "الاتصالات والمعلوماتية" في جامعة تونس. دَخْلُ البرنامج ملف ترميز "SML: Sign Markup Language" وهو ملف بصيغة XML، ويقوم بإظهار الإشارات المُعرَّفة في هذا الملف ضمن الفضاء الثلاثي الأبعاد. يحوي الشكل-2 جزءًا من ترميز SML لليد اليُسرى بالوضع الافتراضي.

الشكل -2: مقطع من ترميز SML لليد اليُسرى

جرت عملية توليد الإشارات بالاستعانة بالموقع الرسمي للمُحاكي الإشاري WebSign؛ فهذا الموقع يُوفر واجهةً تفاعلية لتوليد إشارات مفردة أو سلسلة من الإشارات المتحركة في شريط زمني، وتمكِّن هذه الواجهة من التحكم في اتجاه وزوايا دوران المفاصل المختلفة لليد لتوليد الإشارة المطلوبة. وعند الانتهاء من تصميم الإشارة يمكن الحصول على ترميز SML المقابل، بعد ذلك يُحفظ هذا الترميز في ملف، وتُحفظ معلومات الكلمة المقابلة للإشارة في قاعدة معطيات.

 

3-       النموذج المقترح لترجمة نص عربي إلى لغة الإشارة العربية المطابقة

بُنيت لغة الإشارة المطابقة للغة العربية على مجموعة قواعد توافق بنية وقواعد اللغة العربية، لذا فإنّ منهجية الاعتماد على القواعد هي المنهجية المثلى، وخصوصًا في ظلّ غياب مدونات أو مصادر للغة الإشارة المطابقة.

يُوضّح الشكل-3 البنية العامة لنظام الترجمة الآلية، وهو يتألف من المكونات الآتية:

 

الشكل- 3: البنية العامة لنظام الترجمة الآلي

 

1-3- معالج الدخل

الدخل هو جملة أو مجموعة جمل باللغة العربية الفصحى، مشكولة أو غير مشكولة. ضمن هذا المُكوّن نولِّد الرماز الموحد Unicode، والتشكيل الآلي للكلمات غير المشكولة باستعمال المشكِّل الآلي FARASA Diacritics.

2-3- معالج التركيب الأبجدي

يمكن تمثيل الجمل بلغة الإشارة المطابقة اعتمادًا على العناصر الأبجدية لكل كلمة، مع أخذ علامات الشكل (أي الحركات) بالحسبان أو بتجاهلها.

لتحقيق هذه الطريقة نحتاج إلى مجموعة من العناصر الأولية للأبجدية الإشارية. وباستعمال خوارزمية التركيب الأبجدي الإشاري نكون قادرين على ترجمة الجمل العربية إلى ما يقابلها من الإشارات.

 العناصر الأولية للأبجدية الإشارية المطابقة

حروف الأبجدية: يقابل كل حرف أبجدي إشارة خاصة تُمثّل بيد واحدة (اليُمنى أو اليُسرى) حسب موقع الحرف ضمن الكلمة. في الشكل-4 مثال على ذلك.

الشكل-4: إشارة حرف النون باليد اليُمنى واليُسرى                                         

  الهمزة بأشكالها المختلفة (فوق الألف وتحتها وعلى نبرة وعلى الواو)، وبنوعيها همزة الوصل وهمزة القطع؛ لكل منها إشارة خاصة به.

  لام التعريف بنوعيها الشمسية والقمرية، ولكل منهما إشارة خاصة.

  علامات التشكيل: (الفتحة وتنوين النصب، والضمة وتنوين الرفع، والكسرة وتنوين الجر).

  قمنا بتوليد الإشارات المقابلة لجميع العناصر السابقة، وحفظها ضمن ملفات بصيغة XML.

       خوارزمية التركيب الأبجدي الإشاري:

وهي خوارزمية تركيب إشارات الكلمات انطلاقًا من العناصر الأولية السابقة. تعتمد هذه الخوارزمية أساسًا على تجزيء الكلمة إلى مقاطعها الصوتية، ثم توليد الإشارة المقابلة لكل مقطع صوتي، وتجميع هذه الإشارات للحصول على الإشارة النهائية للكلمة. ويتم الحصول على الإشارة المقابلة للمقطع الصوتي على شكل أزواج من الإشارات كما يلي: (إشارة الحرف الأول باليد اليُسرى – إشارة الحرف الثاني باليد اليُمنى) (إشارة الحرف الثالث باليد اليُسرى – إشارة الحرف الرابع باليد اليمنى)؛ وذلك عندما يكون طول المقطع أربعة أحرف.

بعد الانتهاء من تركيب الإشارة النهائية للكلمة وتجميع إشارات المقاطع المُشكِّلة لها ضمن مكوّن "مُركّب إشارات الخرج" يُوجَّه الترميز النهائي إلى المُترجم الافتراضي لإظهار الإشارة.

       خوارزمية التركيب الأبجدي مع علامات التشكيل:

تُماثل الخوارزمية السابقة، مع إلحاق إشارات علامات التشكيل بعد إشارات الأحرف، يحوي الجدول-1 توصيفَ الإشارة المقابلة لكل علامة من علامات التشكيل، ويُوضِّح الشكلان -5 و -6 إشارة حرف التاء مع علامات التشكيل، وإشارات علامات التنوين.

الجدول- 1: توصيف إشارات علامات التشكيل

الشكل -5: إشارات علامات التشكيل لحرف التاء

الشكل -6: إِشارات علامات التنوين

 

قمنا بتوليد وحفظ الإشارات المقابلة لكل علامة تشكيل (أربع إشارات لأربع علامات هي علامة السكون والحركات الثلاث) لكل حرف، وبكلتا اليدين اليُمنى واليُسرى؛ أي ثماني إشارات لكل حرف.

 

3-3- المُعالج التحليلي Analytical Handler

 الترجمة التحليلية هي الطريقة الثانية لترجمة اللغة العربية إلى لغة الإشارة المُطابقة، وهي ترجمة تحاول أن تُبرز الخصائص اللغوية والبنية الصرفية والدلالية للجملة، إضافة إلى المصطلحات والصيغ الإشارية. ولتحقيق هذه المعالجة نحتاج إلى الاستعانة بمكونات معالجة اللغة العربية كالمحلّل الصرفي ونظام تحديد أقسام الكلام POS Tagger ونظم المعالجة الدلالية مثل Wordnet وغيرها.

ونحتاج كذلك إلى استخلاص هذه الخصائص من الجملة التي هي في قيد الترجمة، ثم مقابلتها بالإشارات المناسبة لها، وأخيرًا ترتيب هذه الإشارات وفق قواعد لغة الإشارة المُطابقة. صمِّم هذا الجزء من المُترجم بتقسيمه إلى ثلاثة مُكونات رئيسية هي على التسلسل: مُعالج الكلمات الخاصة، ومُعالج المُصطلحات، ومُعالج الخصائص الصرفية واللغوية.

 

4-3- مُعالج الكلمات الخاصة

معالجة الكلمات الخاصة التي لا تتبع قواعد الترجمة الإشارية، حيث يُستبدل بالكلمة إشارتها المقابلة مباشرة.

 

5-3- مُعالج المُصطلحات Terms Handler

نقصد بالمصطلحات: المصطلحات الإشارية. والمصطلح الإشاري هو إشارة واحدة اتفق الصمّ عليها، ترمز إلى مفهوم أو غرض ما. مثل "إشارة كتاب"، أو "إشارة أكل"، وتُحفظ هذه الإشارات (وفق ترميز SML) مع الكلمات التي تقابلها، لاستبدالها مباشرةً عند مصادفتها في الدخل. وفي لغة الإشارة المُطابقة يُعامل المصطلح كأي كلمة، فيمكن أن يُضاف إليه السوابق أو اللواحق، وتلحقه الضمائر وعلامات الجمع.

عند إضافة المُصطلحات الإشارية للمُترجم وبالاستعانة بأداة Wordnet نكون قد أتحنا إضافة جميع المُترادفات للمُصطلح الإشاري إن وُجدت؛ فمثلًا إذا وُجد مصطلح إشاري في قاموس الإشارات لكلمة "مَسجد"، وكان دخل المترجم جملة "الجامع الكبير في دمشق" مثلًا، سنكون قادرين على اكتشاف أنّ كلمة "جامع" مرادف لمسجد، ومن ثَم يُمكننا استعمال المصطلح الإشاري نفسه.

 

6-3- مُركّب إشارات الخرج Output Sign Assembler

بعد الحصول على ترميز مجموعة الإشارات المقابلة لكلمات الدخل، تُجمع هذه الرموز وفق قواعد المُترجم الإشاري WebSign لتظهر حركة كاملة بالشكل المطلوب. أثناء التجميع النهائي للإشارات يجب مراعاة إضافة فواصل زمنية بين الكلمات، تكون فيها جميع عناصر المُحاكي الإشاري بالوضع الافتراضي، حتى يكون بالإمكان تمييز بداية إشارة الكلمة ونهايتها.

 

7-3- قاموس لغة الإشارة Sign Language Dictionary

أُعِدَّ القاموس الإشاري باستعمال قاعدة معطيات MySQL، وهو يحوي معلومات عن توصيف الإشارات؛ فمثلًا الإشارة التي تُقابل المُصطلح الإشاري "كِتاب"، تخزَّن مع الخصائص الخاصة بها ضمن قاعدة المعطيات كما في الجدول-2. ويُبيّن الجدول-3 طريقة تخزين إشارات الأحرف الأبجدية. ونحتفظ بترميز الإشارات ضمن ملفات بصيغة XML، لأن هذه الملفات تتميّز بسهولة عمليات تعديل الإشارات وإضافتها برمجيًّا.

أُضيفت - حتى هذه اللحظة - الإشارات الأساسية فقط لعمل المترجم، لكن حتى يُحقّق المترجم الإشاري الفائدة المرجوة مازلنا بحاجة إلى إضافة العديد من الإشارات.

الجدول-2: بنية جدول المصطلحات الإشارية

 

الجدول- 3: بنية جدول الأبجدية الإشارية

 

 

8-3- مُكونات معالجة اللغة العربية NLP Components

 استعملنا مُحلل "الخليل" الصرفي (oujda-nlp-team 2010) ضمن هذا المترجم. يُظهر مُحلّل الخليل قائمة بجميع التحليلات الصرفية المُمكنة لكلمات الدخل. وكذلك استعملنا Farasa POS Tagger (QCRI)، وقمنا بضم قاعدة بيانات WordNet إلى المُترجم للحصول على المترادفات في حالة المصطلحات الإشارية.

 

9-3- مثال توضيحي لمراحل ترجمة جملة إلى لغة الإشارة

نفترض أن دخل المترجم هو جملة "اقرأ كتابك"، أولًا بعد التشكيل الآلي للجملة وبما أنّه لا يُوجد أي كلمة خاصة في هذه الجملة تكون الخطوة التالية هي التحليل الصرفي لها، يُوضّح الشكل-7 ناتج التحليل الصرفي لجملة "اقرأ كتابك".

الشكل-7: ناتج مرحلة التحليل الصرفي لجملة "اقرأ كتابك" ضمن المترجم

 

الخطوة التالية هي معالجة المصطلحات الإشارية لجملة "اقرأ كتابك"، كما في الشكل-8.

الشكل -8: ناتج مرحلة معالجة المصطلحات الإشارية ضمن المترجم

 

بعد ذلك تجري معالجة التعابير الصرفية للجملة حيث يُستبدل بها الإشارات الموافقة، كما في الشكل-9.

الشكل-9: ناتج مرحلة معالجة الخصائص الصرفية واللغوية ضمن المترجم

 

في النهاية، تُرسل الكلمة المتبقية "اقرأ" للتقطيع وفق قواعد لغة الإشارة المطابقة، يُظهر الشكل-10 ناتج تقطيع كلمة "اقرأ".

الشكل-10: ناتج مرحلة التركيب الأبجدي ضمن المترجم

 

أخيرًا، ترسَل جميع الإشارات إلى مرحلة تجميع الإشارات. يُوضّح الشكل-11 دخل وخرج هذه المرحلة.

الشكل-11: ناتج مرحلة مركب إشارات الخرج ضمن المترجم

 

يكون الخرج النهائي للمُحاكي الإشاري على شكل فيديو. لكننا حولناه هنا إلى سلسلة صور في الشكل-12 للتوضيح فقط.

الشكل-12: الخرج النهائي للمحاكي الإشاري

 

4-   الخلاصة

ثمة عوامل عديدة تؤدي دورًا هامًّا في الحصول على نتائج جيدة للترجمة. أما في لغة الإشارة، فإنّ المترجم الإشاري يؤدي الجزء الأهم في عملية الترجمة، لأنه حتى لو كانت جميع مكونات النظام كالمحللات الصرفية أو غيرها تعمل بالشكل المطلوب، يجب أن يكون المترجم الإشاري قادرًا على إظهار جميع المعلومات بطريقة بسيطة وواضحة حتى تصل إلى المستعمل النهائي.

ومع أن الأبحاث الحديثة للترجمة الآلية تتجّه نحو اعتماد منهجية المدونات الثنائية اللغة باعتبارها الطريقة الأشد فعالية للغات المنطوقة، فإنّ هذا لا ينطبق على الترجمة الآلية للغات الإشارة عمومًا وللغة الإشارة العربية خصوصًا، وذلك بسبب الافتقار إلى المدونات الموثقة أو المكتوبة للغة الإشارة، وتنوّعِ طرق تمثيل لغة الإشارة، وعدمِ وجود ترميز مُوحّد للإشارات. لذلك، علينا اعتماد منهجية القواعد في هذه المرحلة.

 

المراجع

 

oujda-nlp-team. (2010). Alkhalil Morpho Sys. Retrieved from https://sourceforge.net/projects/alkhalil/

EMAA. (2016)Retrieved from https://www.facebook.com/Eemaa.Sy/

LaTICE. WebSign. (2016)Retrieved from http://www.latice.rnu.tn/websign

QCRI. FARASA.(2017) Retrieved from http://qatsdemo.cloudapp.net/farasa/

عطايا, ع. ا. (2015) عالم الصم والبكم. Retrieved from atayafordeaf.com

قد ترغب كذلك بقراءة
التعليم عن بعد..ماله وماعليه
التعلم الآلي عن طريق البرمجة الاحتمالية
وصولية الأشخاص ضعاف البصر إلى صفحات الوب
تطبيقات النمذجة الرياضية في التنبؤ بانتشار الأوبئة (فيروس كورونا)
التكنولوجيا في مواجهة كوفيد-19