Original topic:

كيفيّة تصميم ذكاء اصطناعي قادر على التعامل مع اللهجات المتعدّدة

(Topic created on: 05-17-2024 05:24 AM)
60 Views
AudaiManaserh
Active Level 4
Options
معرض جالاكسى
يدعمGalaxyAI حاليًا التواصل بـ16 لغة، مما يسهل تخطي حواجز اللغة من خلال الترجمة الفورية على الأجهزة، لتدشّن سامسونج بذلك عصراً جديداً من الذكاء الاصطناعي للهواتف المحمولة، وفي هذا الإطار نقوم بزيارة مراكز أبحاث سامسونج في جميع أنحاء العالم للتعرف على بداية ظهورGalaxyAI واستكشاف التحديات التي تواجه تطوير الذكاء الاصطناعي والوقوف على حلولها. وفي الوقت الذي تناول فيه الجزء الأول من هذه السلسلة مهمة تحديد البيانات المطلوبة، فإنّ هذا الجزء يركّز على التحدي المعقد المتمثل في استيعاب اللهجات المختلفة.

يمثل تدريب نموذج الذكاء الاصطناعي على فهم لغة ما عملية معقدة، ولكن ماذا لو لم تكن لغة واحدة، بل مجموعة من اللهجات المتنوعة؟ ففي الوقت الذي تمّ فيه إضافة اللغة العربيّة لتصبح إحدى اللغات المعتمدة لدى ميّزاتGalaxy AI مثل الترجمة المباشرةLive Translate؛ واجه فريق مركز سامسونج للبحث والتطوير في الأردن تحديّاً في استيعاب عدد كبير من اللهجات العربية السائدة في منطقة الشرق الأوسط وشمال أفريقيا، والتي تتميز كل منها بنطقها الفريد ومعجمها وبنيتها النحوية.

تأتي اللغة العربية ضمن أكثر ست لغات انتشارًا في العالم، حيث يتحدثها يوميًا أكثر من400 مليون شخص. وتصنف اللغة العربية إلى نوعين: الفصحى “الرسميّة”، والعاميّة “اللهجات المختلفة”. تُستخدم الفصحى عادةً في المناسبات العامة والرسمية، وكذلك في نشرات الأخبار، بينما تُستخدم العاميّة بشكل أكثر شيوعًا في المحادثات اليومية، وتنتشر اللغة العربية في أكثر من20 دولة، ويوجد حاليًا حوالي30 لهجة في المنطقة.

image

القواعد غير المكتوبة

إدراكاً للاختلاف والتنوّع الذي تقدمه هذه اللهجات، وظف فريق مركز البحث والتطوير لدى سامسونج في الأردن مجموعة من التقنيات لتحديد ومعالجة الخصائص اللغوية الفريدة المتأصلة في كل منها. وقد أثبتت هذه المنهجيّة دورها المحوري في ضمان قدرةGalaxy AI على الفهم والاستجابة بطريقة تعكس الفروق الدقيقة بين اللهجات.

ويقول محمد حمدان، رئيس مشروع فريق تطوير اللغة العربية: “على عكس اللغات الأخرى، فإن نطق المفعول به في اللغة العربية يختلف باختلاف الفاعل والفعل في الجملة. لذا فإننا نهدف لتطوير نموذج قادر على فهم كل هذه اللهجات والرد عليها باللغة العربية الفصحى”.

إن تحويل النص إلى كلام “TTS”، يعدّ جزء لا يتجزأ من ميّزة الترجمة المباشرةLive Translate فيGalaxy AI، بحيث يمكّن المستخدمين من التفاعل مع متحدثين بلغات مختلفة عن طريق تحويل الكلمات المنطوقة إلى نص مكتوب ثم نطقها لفظيًا. وقد واجه فريق تحويل النص إلى كلام تحديًا استثنائياً نابعًا من الخصوصية المتأصلة في العمل مع اللغة العربية.

image

في اللغة العربية، تُستخدم علامات التشكيل كوسيلة مساعدة للنطق في سياقات معينة مثل النصوص الدينية والشعر والمواد التعليمية. وفي حين أن المتحدثين الأصليين يفهمون عادةً علامات التشكيل، إلا أنها لا تُستخدم بشكل شائع في الكتابة اليومية. ويشكل هذا الغياب تحديًا أمام الآلات في تحويل الكلمات غير المشكّلة إلى وحدات صوتيّة والتي تعدّ ضرورية لتركيب الكلام.

يقول محمد حويله: “إن ندرة مجموعات البيانات التي يمكن الاعتماد عليها والتي تعكس بدقة الاستخدام السليم لعلامات التشكيل تعتبر تحديًا. ونتيجة لذلك، كنا بحاجة إلى تطوير نموذج عصبي قادر على التنبؤ بدقة واستعادة علامات التشكيل المفقودة”.

تعمل النماذج العصبية بشكل مشابه للدماغ البشري. ومن أجل التنبؤ بعلامات التشكيل، يجب على النموذج تحليل كميات هائلة من النصوص العربية، واستيعاب اصطلاحات اللغة وقواعدها، وفهم الفروق الدقيقة في سياق استخدام الكلمات. على سبيل المثال، يمكن لنطق الكلمة بشكل كبير أن يختلف بناءً على الفعل أو الجنس الذي تشير إليه، وقد شكّل التدريب المكثف من قبل الفريق أهمية كبيرة في زيادة دقة نموذج تحويل النص إلى كلام باللغة العربية.

تعزيز مستوى الفهم

وقالت آية حسن، رئيس قسم الفريق المكلّف بإنشاء قاعدة البيانات: “تولى فريق مركز سامسونج للبحث والتطوير في الأردن مهمة جمع مجموعة واسعة من التسجيلات الصوتية التي تصور لهجات مختلفة من مصادر متعددة. وقد تم نسخ هذه التسجيلات بدقة، مع التركيز على التقاط الأصوات والمفردات والتعابير الاصطلاحية الفريدة. قمنا بالاستعانة بمجموعة من المتحدثين الأصليين الذين يجيدون هذه اللهجات، ومجهزين بفهم عميق للفوارق والاختلافات بينها، حيث استمعوا بدقة إلى التسجيلات وقاموا يدويًا بنسخ الكلمات المنطوقة إلى نص”.

image

لقد لعب هذا المسعى دورًا محوريًا في تحسين نظام التعرف التلقائي على الكلام (ASR)، وبالتالي تمكينGalaxy AI من التنقل بفعالية في النسيج الغني للهجات العربية. ويعدASR بمثابة حجر الزاوية في تسهيل إمكانات الفهم والاستجابة في الوقت الفعلي لـGalaxy AI.

ويُشير محمد حمدان، المسؤول عن مشروعASR إلى أنّ إنشاء نظامASR قادر على استيعاب العديد من اللهجات ضمن نموذج موحد يعدّ مهمة معقّدة، فهو يتطلب فهمًا عميقًا للفوارق اللغوية، وتنظيم البيانات بدقة، واستخدام استراتيجيات النمذجة المتقدمة.

ذروة الابتكار

بعد أشهر طويلة من التخطيط والتطوير والاختبارات، أصبح الفريق مستعدًا لدمج اللغة العربية كخيار لغة لـGalaxy AI، مما يسهل التواصل عبر الحدود لجمهور أوسع. وقد أدى هذا الجهد المتفاني إلى تعزيز انتشار خدماتGalaxy AI وجعلها في متناول المتحدثين بالغة العربية، مما ساهم بشكل فعال في تقليل الحواجز اللغوية والثقافية بينهم وبين الأفراد في جميع أنحاء العالم، وفي هذه العملية، قام الفريق بإنشاء منهجيات وممارسات رائدة يمكن اعتمادها على نطاق عالمي، ولا يزال العمل جارياً لتعزيز النماذج والقدرات اللغوية لـGalaxy AI.

image

في الجزء المقبل، نلتقي بكم من فيتنام لاستكشاف جهود الفريق في تحسين جودة البيانات اللغوية. وسنتعمق في المتطلبات التي ينطوي عليها تدريب نموذج الذكاء الاصطناعي الفعال.

لا تشكل اللغة العربية سوى لغة واحدة من اللغات واللهجات المدمجة حديثًا التي يدعمها الآنGalaxy AI، ويمكن تنزيلها عبر الإعدادات. كما تتوفّر ميّزات اللغة الخاصة بـGalaxy AI، بما في ذلك الترجمة المباشرةLive Translate والمترجم الفوريInterpreter، على أجهزةGalaxy المجهزة بواجهةOne UI 6.1 المحدّثة من سامسونج.

تمّ إصدار واجهة One UI 6.1 لأول مرة في سلسلةGalaxy S24، ثم امتدت لاحقًا إلى مجموعة واسعة من أجهزةGalaxy، بما في ذلك سلسلةS23 وS23 FE وسلسلةS22 وسلسلةS21 وZ Fold5 وZ Fold4 وZ Fold3 وZ Flip5 وZ Flip4 وZ Flip3 وسلسلةTab S9 وسلسلةTab S8.


3 Comments
peral
Active Level 6
معرض جالاكسى
نشكر الشكر الجزيل لفريق تطوير اللغة العربية، وخاصة في دعم ميزة الترجمة المباشرة والترجمة الفورية للمكالمات الدولية, وفي مجال الذكاء الاصطناعي وخاصة في مجال الترجمة المباشرة والترجمة الفورية في الذكاء الاصطناعي Galaxy AI, لشركة سامسونك في دعم اللغة العربية، ونتمنى دعم سامسونج ميزة الإدخال الصوتي باللغة العربية وحتى في حالة عدم توفر خدمة الانترنت في إضافة البيانات الصوتية و الحزمة الصوتية للغة العربية في وضع عدم الاتصال بالإنترنت، وكذلك إضافة أصوات عربية ذات جودة عالية وممتازة إلى ميزة تحويل النص إلى كلام من سامسونج لعدة أصوات عربية (ذكر، وانثى)، ونتمنى من سامسونج دعم هواتف سامسونك الفئة الاقتصادية والمتوسطة أيضا في ميزة الإدخال الصوتي (الإملاء الصوتي) الكتابة بالصوت من سامسونج على لوحة مفاتيح سامسونك باللغة العربية، وكذلك في ميزة تحويل النص إلى كلام من سامسونج، ونتمنى من سامسونج مخاطبة شركة جوجل بإصلاح الخطأ الاملائي في كتابة حرف التاء المربوطة في نهاية الكلمة باللغة العربية، فيتم تحويل حرف التاء المربوطة إلى حرف الهاء المربوطة بدلا من حرف التاء المربوطة في نهاية الكلمة باللغة العربية، نرجو من سامسونج مخاطبة شركة جوجل بإصلاح هذا الخطأ الاملائي بأقرب وقت ممكن، وكذلك في دعم تطبیق المساعد الصوتي لسامسونج بيكسبي Bixby voice, باللغة العربية، مع الشكر الجزيل لكم.
peral
Active Level 6
معرض جالاكسى
نتمنى من فريق تطوير اللغة العربية في شركة سامسونج، دعم اللغة العربية في ميزة الإدخال الصوتي لسامسونج على لوحة مفاتيح سامسونك باللغة العربية، وإضافة البيانات الصوتية (الحزمة الصوتية) للغة العربية في وضع عدم الاتصال بالإنترنت، لقائمة باقي اللغات الأخرى، وكذلك إضافة أصوات عربية متنوعة وذات جودة عالية وممتازة إلى ميزة تحويل النص إلى كلام من سامسونج TTS Arabic voice, وكذلك دعم مساعد سامسونك الصوتي بيكسبي Bixby voice, باللغة العربية والصوت العربي، ونتمنى من فريق تطوير اللغة العربية، دعم اللغة العربية في جميع المزايا والتطبيقات والبرامج الأخرى، مع الشكر الجزيل لكم.
معرض جالاكسى
A+I *(&_----5-----?!$^_÷÷÷÷÷÷÷
GALAXY AI
0 Likes