مستقبل الترجمة الاصطناعية.. بدأ بفكرة من فيلم خيال علمي.. واليوم تتطور لإدراك السلوك وآداب الحديث.. فهل نقترب من تحقيقها؟
الضوضاء، واحدة من أكبر التحديات التي تحتاج الترجمة الاصطناعية للمحادثات أن تتعامل معها، وفقاً لما أخبرني به ألكسندر وايبل «ألكس».
قد يكون جهاز قادراً على تحديد الكلام في مختبر أو غرفة اجتماعات.
ولكنه سيعاني في التعامل مع كل أنواع الضوضاء التي تظهر في الخلفية والتي أسمعها مثلاً أثناء اتصالي مع البروفيسور وايبل من محطة كيوتو.
كنت أكافح لأتابعه باللغة الإنجليزية، على خط مشوش يذكّرني بأننا على بعد حوالي 10 آلاف كم. تظل هذه المسافة عقبة للتواصل حتى إذا كنا نتحدث اللغة نفسها. لم نصل إلى المستقبل بعد.
إذا كانت لدينا مثل هذه التقنية، لكان وايبل قادراً على التحدث بلغته الألمانية الأصلية، ويمكنني سماع كلماته بالإنجليزية.
وكان بإمكانه أيضاً التحدث بحرية وسلاسة مع هؤلاء اليابانيين يتحدثون من حوله، كلٌ بلغته الأصلية.
الأمر بدأ من «سمكة بابل»
بحيب ما نُشر في صحيفة The Guardian البريطانية؛ ففي معهد كارلسروه للتكنولوجيا، حيث يعمل أستاذاً لعلوم الحاسب
يقدم وايبل وزملاؤه المحاضرات باللغة الألمانية يستمع إليها الطلاب باللغة الإنجليزية من خلال مترجم إلكتروني.
يوّلد النظام نصاً يمكن للطلبة قراءته على شاشات أجهزة الكمبيوتر والهواتف، لذا فإن الأمر أقرب ما يكون إلى الترجمة السينمائية.
يساعد ذلك المحاضر على التحدث بوضوح، ودون الحاجة لمزاحمة الضوضاء والثرثرة في الخلفية، وأن يقول المادة نفسها تقريباً في كل عام.
فكرة الترجمة الاصطناعية للمحادثات موجودة منذ زمن طويل. ويعتبر وايبل، الذي يعمل أستاذاً لعلوم الحاسب في جامعة كارنيغي ميلون في بيتسبرغ أيضاً مخترعها نوعاً ما.
إذ قدم مقترحاً بها في معهد ماساتشوستس للتكنولوجيا عام 1978.
بينما اخترعها دوغلاس أدامز نوعاً ما في الوقت نفسه تقريباً.
فيلم «The Hitchhiker’s Guide to the Galaxy» «أي دليل المسافر إلى المجرة» يعرض شكلاً من الحياة يسمى «سمكة بابل»، عند وضعه في الأذن.
يمكّن المستمع من فهم أي لغة في الكون.
ليقدّم الفيلم أحد تلك الأجهزة التي يحلم بها عشّاق التكنولوجيا قبل وقت طويل من أن تصبح قابلة للتطبيق عملياً.
مثل أجهزة الاتصالات الصوتية المحمولة وأجهزة التلفزيون المسطحة التي يمكن تعليقها على الجدران؛ أمور كان يجب أن توجد، وستصبح يوماً ما متاحة بالتأكيد.
ضم النظام الأول لترجمة المحادثات الخاص بوايبل، الذي جرى تجميعه عام 1991، 500 كلمة.
ويعمل على محطات عمل كبيرة ويستغرق بعض الدقائق لمعالجة ما يسمع. ويعترف وايبل بأنه «لم يكن جاهزاً للاستخدام الفعلي».
والآن بدأت أجهزة تبدو مثل النموذج البدائي لـ «سمكة بابل» في الظهور، مع التقدم الذي تشهده الترجمة الاصطناعية وتقنيات التعرف على الصوت.
أدخل جوجل على سماعات الأذن Pixel خاصية الترجمة باستخدام ترجمة جوجل، التي يمكنها كذلك تقديم ترجمة صوتية عبر تطبيقها الذكي.
ويقدم برنامج «سكايب» أيضاً خاصية الترجمة، يمكنها التعامل مع المحادثات بـ10 لغات.
وهناك عدد من الشركات الأصغر، مثل Waverly Labs، الشركة الناشئة في بروكلين، التي طورَّت سماعات أذن للمترجمين. ويمكننا تلخيص التقييمات في وسائل الإعلام التقنية بأنها :
«ليست سيئة في الواقع».
لازلنا في مرحلة مبكرة
تقدم الأنظمة المتاحة حالياً إثباتاً للمفهوم والفكرة، ولكن حتى هذه المرحلة يمكن اعتبار كل ذلك «مستجدات جذابة»، وليست خطوات حقيقية تجاه ما يسميه وايبل «خلق مجتمع ذي شفافية لغوية».
تتمثل أحد التطورات الرئيسية التي تقود الترجمة الاصطناعية للمحادثات في انتشار فكرة تشجيع الأشخاص على الحديث إلى التقنيات التي بحوزتهم.
يقول باراك توروفسكي، مدير خدمة ترجمة جوجل:
«لا نزال بشكل عام في مرحلة مبكرة للغاية فيما يتعلق بالأجهزة التي تدعم الصوت، ولكنها تتطور بسرعة كبيرة، وستكون الترجمة أحد الأجزاء الرئيسية لهذه الرحلة».
خلال الشهر الأخير، يناير/كانون الثاني، قدمت شركة جوجل وضعية مترجم فوري لأجهزتها المنزلية.
عندما تقول: «مرحباً، جوجل، كن مترجمي الفوري للغة الفرنسية» ستنشط الترجمة الصوتية، وعلى الشاشات الذكية، والترجمة النصية.
وتقترح جوجل تطبيقاً محتملاً لتسجيل حجوزات الفنادق، ربما سيمثّل ذلك بديلاً عملياً لتحدث المسافرين بالإنجليزية، سواء كانت لغتهم الأصلية أو لغة إضافية.
يمكنك القيام بذلك بالفعل إذا كان لديك تطبيق الترجمة على هاتفك، ولو على شاشة صغيرة للغاية وسماعة خارجية. هذا النوع من التفاعلات العامة البسيطة يمثّل أغلبية استخدامات خاصية المحادثات بالتطبيق.
ولكن الاستخدام الآخر الشائع هو ما يطلق عليه توروفسكي «الرومانسية». تكشف سجلات البيانات عن شعبية استخدام عبارات مثل «أحبك» و»لديك عيون جميلة».
الكثير من ذلك قد لا يمثل أي شيء جديد. فبعد كل شيء، ظلّت سطور الدردشة تتكون من العبارات الثابتة القياسية لمدة عقود.
الفكرة والبداية ..المرأة الفرنسية
استخدمت Waverly Labs خاصية الدردشة لجذب حملة تمويل Indiegogo، في مقطع فيديو يوضح فيه مؤسس ورئيس الشركة، أندرو أوتشوا، كيف جاءته فكرة المترجم عندما التقى امرأة فرنسية خلال عطلة ولم يتمكن من التواصل معها جيداً.
كانت تجربة استخدام تطبيق الترجمة «مريعة». الهاتف يعترض طريقك في الوصول لهدفك، لكن السماعات لن تكون مزعجة. ويعرض الفيديو ما قد سيكون عليه الحال:
يقدم للمرأة الفرنسية سماعة أذن، ومن ثمّ يذهبون لتناول القهوة والاستمتاع بالمشاهد الطبيعية.
حقق الإعلان نجاحاً مذهلاً، وجمع 4.4 مليون دولار «3.4 مليون إسترليني» أكثر من المستهدف بنحو 30 ضعفاً.
يقول أحد العملاء إن سماعة Pilot من الشركة مكّنته من التحدث لوالدة صديقته للمرة الأولى. ويذكر بعضهم أنها مكّنتهم من التحدث إلى أزواجهم.
يقول أوتشوا: «حتى إننا استقبلنا رسالة من شخص ما يخبرنا بأنه يستخدمها للتحدث مع زوجته التي تتحدث الإسبانية.
وما يحيرني كيف تعرفوا على بعضهما في البداية». يمكننا استنتاج حدوث ذلك من خلال وكالة أو عبر الإنترنت. ويقر أوتشوا بأن:
«التقنية تحتاج للتحسن بعض الشيء قبل أن تكون قادراً على العثور على حب حياتك من خلال السماعة، ولكن ذلك ليس بعيد المنال».
خصَّص العديد من المستخدمين الأوائل سماعة الأذن Pilot لأغراض غير رومانسية تماماً، لاستخدامها في المؤسسات.
وتطور Waverly الآن نموذجاً جديداً للاستخدامات الاحترافية، مما يستلزم إدخال تحسينات على الأداء للتعرف على الكلام، ودقة الترجمة، والوقت المستغرق لتقديم العبارات المترجمة. يقول أوتشوا: «أصحاب الأعمال والمحترفون يكونون أقل صبراً في المحادثات».
استخدام سماعات الأذن..وتوقعات جوجل
يتميز الإصدار الجديد بتحسينات على التصميم، للتغلب على مشكلة الجانب الجمالي لسماعة Pilot. ولاستخدام السماعة في محادثة سيحتاج كلا الطرفين لارتداء سماعات Pilots في آذانهم. يقول أوتشوا: «وجدنا أنه من الغريب وغير الصحي مشاركة أحدهم سماعة الأذن مع شخص غريب.
لا يمكن توقع ذلك بشكل كامل». وهذه المشكلة يمكن حلها إذا أصبحت سماعات الترجمة أكثر انتشاراً بحيث يكون لهؤلاء الغرباء سماعاتهم الخاصة.
ولكن قابلية حدوث ذلك، ومدى سرعة حدوثه، لن يعتمد كثيراً على السماعات نفسها، وإنما على مدى انتشار الأجهزة التي يتم التحكم بها صوتياً والترجمة الصناعية بشكل عام.
هنا، يبدو أن الدافع الرئيسي هو الوصول للأسواق الآسيوية الناشئة. تعتقد جوجل أن 50% من محتوى الإنترنت باللغة الإنجليزية، بينما 20% فقط من سكان العالم يتحدثون هذه اللغة.
يقول توروفسكي: «إذا نظرت إلى المناطق التي يتزايد فيها استخدام الإنترنت بشكل كبير، مثل الدول الآسيوية، معظم هذه الدول لا يتحدث الإنجليزية على الإطلاق.
لذا، يعتبر كسر حاجز اللغة في هذه الدول هدفاً مهماً للجميع، من بينهم جوجل بكل تأكيد. ولهذا السبب تستثمر شركة جوجل الكثير من الموارد في أنظمة الترجمة».
ويشير وايبل كذلك إلى أهمية آسيا، موضحاً أن الترجمة الصوتية بدأت في الواقع من اليابان والصين. ولا يزال هناك طريق طويل يجب قطعه.
تحتاج الترجمة للتزامن، مثل صوت المترجم وهو يتحدث ليغطي صوت السياسي الأجنبي على شاشات التلفزيون، وليس بالطريقة الحالية التي يحتاج المتحدث فيها للتوقف كل عدة كلمات بانتظار تقديم الترجمة للمستمع. وتحتاج إلى أن تعمل من دون الاتصال بالإنترنت.
في المواقف التي لا يمكن من خلالها الوصول للإنترنت، ولمواجهة المخاوف بشأن كمية البيانات الخاصة المتراكمة في التخزين السحابي، والتي يجرب إرسالها للخوادم لمعالجتها.
التطوير للبرمجيات..المواكبة للتواصل الواقعي
لا تحتاج الأنظمة فقط لمواكبة التحديات المادية مثل الضوضاء الجانبية، كما يقترح وايبل، بل تحتاج أيضاً إلى أن تكون مزودة بوعي اجتماعي، أن تعرف سلوكيات الأشخاص، وتخاطب الأشخاص بشكل مناسب.
عندما تراسلت مع البروفيسور وايبل لأول مرة، مدركاً أنه أستاذ جامعي ألماني وأن التقاليد القارية تتطلب احتراماً شديداً للوضع الأكاديمي، أخطأت في التعبير الرسمي وخاطبته قائلاً «عزيزي بروفيسور وايبل». وكما توقعت، رد عليّ بالأسلوب الإنجليزي المتداول عالمياً «مرحباً ماريك». الترجمة الاصطناعية الدقيقة لآداب الحديث لن تجعل الأشخاص بحاجة لمعرفة التقاليد الثقافية المختلفة.
ستسهل بذلك التفاعل بين الأشخاص والحد من سوء الفهم. وفي الوقت نفسه، ستساعد في الحفاظ على التقاليد المحلية، مما يبطئ من انتشار العادات المتعلقة بالإنجليزية الدولية، مثل تجاوز الاسم الأول في المحادثة.
مع ذلك، فإن الأساتذة وغيرهم من المختصين لن يعملوا على التوعية اللغوية للبرنامج. إذا تطورت التقنية لتقديم ترجمة اصطناعية للمحادثات كلية وسلسة -سمكة بابل باختصار- فستضيف فعلياً قيمة للمهارات اللغوية.