إطلاق نسخة تجريبية من Open AI لتوليد صوت متقدم.. ماذا تتيح؟

إطلاق نسخة تجريبية من Open AI لتوليد صوت متقدم.. ماذا تتيح؟
تجمع هذه النسخة الجديدة بين التعرف على الصوت والتوليف في إطار واحد - الصورة من unsplash

أعلنت شركة "أوبن إيه آي" Open AI، عن إطلاق نسخة تجريبية لواجهة برمجة التطبيقات بحيث تسمح للمطورين إنشاء تطبيقات مع صوت متقدم، وتتيح هذه النسخة إنشاء تفاعلات صوتية متعددة ومنخفضة التكلفة، كما تسمح بتبسيط تطوير تطبيقات المحادثات دون الحاجة إلى استخدام نماذج.

تتيح إنشاء تفاعلات صوتية متعددة

وبحسب الشركة، فمن المتوقع أن تكون النسخة التجريبية شبيهة بشكل كبير لما يتم استخدامه في تطبيق "شات جي بي تي" CHAT GPT، على أن تتيح إنشاء تفاعلات صوتية متعددة ومنخفضة التكلفة ضمن التطبيقات، وهو ما يوفر استجابة عالية ومتميزة لهذه التطبيقات، وبالأخص إذا كانت تعتمد على الدردشة التفاعلية مثل "شات جي بي تي".

كما تجمع هذه النسخة الجديدة بين التعرف على الصوت والتوليف في إطار واحد، مع تبسيط تطوير تطبيقات المحادثات دون الحاجة إلى استخدام نماذج متعددة.

ما ذا توفر واجهة برمجة التطبيقات في الوقت الحالي؟

تجدر الإشارة إلى أن واجهة برمجة التطبيقات توفر في الوقت الفعلي الحالي التفاعلات الطبيعية بين الكلام والكلام بالوقت الفعلي.

ويتم هذا عن طريق استخدام ستة أصوات مُحددة مسبقًا، وهي تجمع بين التعرف على الكلاب والتوليف في مكالمة واجهة برمجة تطبيقات واحدة.

بالإضافة إلى ذلك فإن هذا الأمر سوف يساهم في تبسيط تطوير تطبيقات المحادثة السلسلة عن طريق تبسيط ما كان يتطلب في السابق نماذج متعددة.

اطلاق الوضع الصوتي المتقدم

وفي وقت سابق، كانت شركة "أوبن إيه آي" قد أعلنت، عن بدء طرح وضع الصوت المتقدم، على نطاق واسع لمستخدمي "شات جي بي تي" المشتركين في الخطط المأجورة.

وستتوفر هذه الميزة الصوتية في البداية للمشتركين في خطتي Plus للأفراد وTeams للفرق، في حين سيحصل العملاء في خطط Enterprise و Edu عليها في وقت لاحق.

وكجزء من هذا الاطلاق، حصل الوضع الصوتي المتقدم على تصميم جديد؛ إذ يعرض الآن "شات جي بي تي" دائرة زرقاء متحركة بدلا من النقاط السوداء المتحركة في الواجهة أثناء الاستخدام.

وسيظهر للمستخدمين إشعار داخل التطبيق بجوار أيقونة الصوت عندما تصبح الميزة متاحة لهم، كما حصل "شات جي بي تي" على 5 أصوات جديدة يمكن للمستخدمين تجربتها، مما يرفع إجمالي عدد الأصوات المتاحة إلى 9 أصوات.

وأبانت الشركة، أن الوضع الصوتي المتقدم يتيح للمستخدمين التفاعل الصوتي مع "شات جي بي تي" ChatGPT بطريقة طبيعية مع استجابات صوتية سريعة، وإمكانية تتابع الأسئلة والاستفسارات، ومقاطعة ChatGPT أثناء الرد إذا لزم الأمر، كما هو الحال في المحادثات البشرية اليومية.

للمزيد: OpenAI تطرح نموذج الذكاء الاصطناعي الجديد وإصدار سطح المكتب من "شات جي بي تي"

يمكنكم متابعة آخر الأخبار عبر حساب سيدتي على منصة اكس