Translatotronخدمة جديدة من "جوجل" تترجم الكلام إلى كلام مباشرةً

كشفت شركة جوجل عن خدمتها الجديدة ترانسلاتوترون Translatotron، و هو نظام تجريبي جديد قادر على ترجمة الكلام المنطوق إلى كلام منطوق مباشرةً، مما يلغي الحاجة لأي نص.

وأعلنت الشركة في منشور على مدونتها الخاصة بمجال الذكاء الاصطناعي إن ترانسلاتوترون Translatotron هو أول نموذج قائم على طرفين يستطيع مباشرةً ترجمة الكلام من لغة إلى أخرى بصورة منطوقة، حيث يقوم الكمبيوتر في نماذج الترجمة الاصطناعية الحالية، بتحويل الحديث إلى كتابة، ثم يترجمها و يقدمها بإلقاء روبوتي، و هو ما يقود عادة إلى أخطاء في الترجمة.

و أضافت جوجل أن هناك ثلاث مراحل لأنظمة الترجمة في الوقت الراهن، وهي: التعرف التلقائي على الكلام، الذي يحول الكلام إلى نص، و الترجمة الآلية، التي تترجم ذلك النص إلى لغة أخرى، و مرحلة تحويل النص إلى كلام.

و وفق جوجل، فإن ترانسلاتوترون Translatotron تستخدم نموذجا تطبيقيا يعتمد على تحويل المدخلات الصوتية إلى طيف بصري يمثل ترددات الحديث، ثم تستخدم الأداة هذا الطيف في إنشاء طيف مقابل في اللغة المترجم إليها، مما يعني تأمين ترجمة أسرع و أدق.

و تحتوي الأداة على مكون اختياري ينشأ شيفرة حاسوبية لصوت المتحدث و يطبقها في اللغة المترجم إليها أي أن النظام يحتفظ بالخصائص الصوتية للمتحدث عند الترجمة، و رغم أن صوت المترجم يظل روبوتيا بعض الشيء لكنه يظهر بوضوح عناصر أساسية في صوت و إلقاء المتحدث.