«أوبن إيه آي» تطلق مزايا صوتية جديدة

17

شفقنا-بيروت
أعلنت «أوبن إيه آي» عن إطلاق مجموعة جديدة من مزايا الذكاء الصوتي ضمن واجهة البرمجة الخاصة بها (API)، في خطوة تهدف إلى تمكين المطورين من إنشاء تطبيقات قادرة على التحدث مع المستخدمين، وترجمة المحادثات، وتحويل الكلام إلى نص بشكل فوري.

وتتضمن التحديثات نموذجاً صوتياً جديداً يحمل اسم New GPT‑Realtime‑2، وهو إصدار مطوّر يعتمد على قدرات استدلال من فئة «جي بي تي 5»، ما يسمح له بالتعامل مع طلبات أكثر تعقيداً مقارنة بالإصدار السابق New GPT‑Realtime‑1.5.

وبحسب الشركة، يتيح النموذج الجديد إنشاء محاكاة صوتية واقعية قادرة على إجراء محادثات مباشرة مع المستخدمين بطريقة أكثر سلاسة وطبيعية.

ترجمة فورية بأكثر من 70 لغة!
كما كشفت «أوبن إيه آي» عن ميزة GPT‑Realtime‑Translate، المصممة لتوفير ترجمة صوتية فورية تواكب سير المحادثة بشكل لحظي.

وتدعم الأداة أكثر من 70 لغة للإدخال، إضافة إلى 13 لغة للإخراج الصوتي، ما يسمح بإجراء محادثات مترجمة مباشرة بين المستخدمين من دون الحاجة إلى توقف أو إعادة صياغة.

كذلك أطلقت الشركة ميزة GPT-Realtime-Whisper، التي توفّر إمكانات تحويل الكلام إلى نص مباشرة أثناء المحادثات، مع التقاط النصوص فور حدوث التفاعل الصوتي.

وقالت الشركة إن النماذج الجديدة تهدف إلى نقل التفاعل الصوتي «من مجرد نظام سؤال وجواب إلى واجهات صوتية قادرة على الاستماع، والاستدلال، والترجمة، والنسخ، واتخاذ الإجراءات أثناء تطور المحادثة».

استخدامات واسعة وتحذيرات من سوء الاستغلال
وترى «أوبن إيه آي» أن هذه الأدوات قد تكون مفيدة للشركات التي تسعى إلى تطوير خدمات العملاء، إضافة إلى قطاعات أخرى تشمل التعليم، والإعلام، وتنظيم الفعاليات، ومنصات صناعة المحتوى.

وفي المقابل، أشارت الشركة إلى أنها أضافت ضوابط حماية لمنع استغلال التقنيات الجديدة في عمليات الاحتيال أو الرسائل المزعجة أو أشكال الإساءة الرقمية.

وأوضحت أن النظام يتضمن آليات قادرة على إيقاف المحادثات تلقائياً في حال رصد محتوى ينتهك سياسات الاستخدام الخاصة بالشركة.

وتتوفر جميع النماذج الجديدة ضمن خدمة Realtime API، على أن يتم احتساب تكلفة Translate وWhisper بالدقيقة، بينما يعتمد تسعير New GPT‑Realtime‑2 على عدد «الرموز البرمجية» المستخدمة (Tokens).

ترك الرد

Please enter your comment!
Please enter your name here