انتقل إلى المحتوى الرئيسي

كيفية استخدام الإضافة

يوفر مُدمج روبوت الدردشة الذكي أثناء التشغيل وظيفتين رئيسيتين: الدردشة من نص إلى نص وتحويل النص إلى كلام. تتبع كلتا الميزتين سير عمل مشابه:

  1. تسجيل رمز موفر واجهة برمجة التطبيقات الخاص بك
  2. تكوين الإعدادات الخاصة بكل ميزة
  3. إرسال الطلبات ومعالجة الردود

تسجيل رمز المزود

قبل إرسال أي طلبات، قم بتسجيل رمز موفر واجهة برمجة التطبيقات الخاص بك باستخدام الدالة RegisterProviderToken.

تسجيل رمز المزود في Blueprint

وظيفة الدردشة من نص إلى نص

يدعم البرنامج المساعد وضعين لطلبات الدردشة لكل مزود:

طلبات الدردشة غير المتدفقة

استرجاع الرد الكامل في مكالمة واحدة.

إرسال طلب دردشة OpenAI

طلبات الدردشة المتدفقة

استقبال أجزاء الرد في الوقت الفعلي لتفاعل أكثر ديناميكية.

إرسال طلب دردشة OpenAI المتدفق

وظيفة تحويل النص إلى كلام (TTS)

حوّل النص إلى صوت عالي الجودة باستخدام مزودي خدمة تحويل النص إلى كلام الرائدين. تُرجع الإضافة بيانات الصوت الخام (TArray<uint8>) والتي يمكنك معالجتها وفقًا لاحتياجات مشروعك.

بينما تُظهر الأمثلة أدناه معالجة الصوت للتشغيل باستخدام إضافة Runtime Audio Importer (انظر توثيق استيراد الصوت)، فإن Runtime AI Chatbot Integrator مصمم لتكون مرنة. تُرجع الإضافة ببساطة بيانات الصوت الخام، مما يمنحك الحرية الكاملة في كيفية معالجتها لحالة استخدامك المحددة، والتي قد تشمل تشغيل الصوت، والحفظ في ملف، ومزيد من معالجة الصوت، ونقلها إلى أنظمة أخرى، وتصورات مخصصة، والمزيد.

طلبات تحويل النص إلى كلام غير المتدفقة

تُرجع طلبات تحويل النص إلى كلام غير المتدفقة بيانات الصوت الكاملة في استجابة واحدة بعد معالجة النص بالكامل. هذا النهج مناسب للنصوص الأقصر حيث لا تكون مشكلة انتظار الصوت الكامل.

إرسال طلب تحويل النص إلى كلام من OpenAI

طلبات TTS المتدفقة

يقوم TTS المتدفق بتسليم مقاطع الصوت فور إنشائها، مما يسمح لك بمعالجة البيانات بشكل تدريجي بدلاً من الانتظار حتى يتم توليد الصوت بالكامل. هذا يقلل بشكل كبير من زمن الواقع الملحوظ للنصوص الطويلة ويمكن التطبيقات في الوقت الفعلي. كما يدعم ElevenLabs Streaming TTS أيضًا وظائف البث المجزء المتقدمة لسيناريوهات توليد النصوص الديناميكية.

إرسال طلب OpenAI Streaming TTS

الحصول على الأصوات المتاحة

تقدم بعض موفري TTS واجهات برمجة تطبيقات (APIs) لسرد الأصوات لاكتشاف الأصوات المتاحة برمجيًا.

Get Google Cloud Voices

معالجة الأخطاء

عند إرسال أي طلبات، من الضروري معالجة الأخطاء المحتملة عن طريق التحقق من ErrorStatus في رد الاتصال الخاص بك. يوفر ErrorStatus معلومات حول أي مشكلات قد تحدث أثناء الطلب.

معالجة الأخطاء

إلغاء الطلبات

يسمح لك البرنامج المساعد بإلغاء كل من طلبات النص إلى النص وطلبات تحويل النص إلى كلام أثناء تنفيذها. يمكن أن يكون هذا مفيدًا عندما تريد مقاطعة طلب طويل الأمد أو تغيير تدفق المحادثة ديناميكيًا.

إلغاء الطلب

أفضل الممارسات

  1. تعامل دائمًا مع الأخطاء المحتملة عن طريق التحقق من ErrorStatus في رد الاتصال الخاص بك
  2. كن حذرًا بشأن حدود معدل واجهة برمجة التطبيقات والتكاليف لكل مزود
  3. استخدم وضع البث للمحادثات الطويلة أو التفاعلية
  4. فكر في إلغاء الطلبات التي لم تعد هناك حاجة إليها لإدارة الموارد بكفاءة
  5. استخدم تحويل النص إلى كلام بالبث للنصوص الأطول لتقليل زمن الوصول الملحوظ
  6. لمعالجة الصوت، تقدم إضافة Runtime Audio Importer حلاً مناسبًا، ولكن يمكنك تنفيذ معالجة مخصصة بناءً على احتياجات مشروعك
  7. عند استخدام نماذج التفكير (DeepSeek Reasoner, Grok)، تعامل مع مخرجات التفكير والمحتوى بشكل مناسب
  8. اكتشف الأصوات المتاحة باستخدام واجهات برمجة التطبيقات الخاصة بسرد الأصوات قبل تنفيذ ميزات تحويل النص إلى كلام
  9. لبث ElevenLabs المجزأ: استخدم الوضع المستمر عندما يتم إنشاء النص تدريجيًا (مثل ردود الذكاء الاصطناعي) والوضع الفوري لمقاطع النص المشكلة مسبقًا
  10. اضبط مهلات التفريغ المناسبة للوضع المستمر لتحقيق التوازن بين الاستجابة وتدفق الكلام الطبيعي
  11. اختر أحجام المقاطع المثالية وأوقات إرسال التأخير بناءً على متطلبات التطبيق في الوقت الفعلي

استكشاف الأخطاء وإصلاحها

  • تحقق من صحة بيانات اعتماد واجهة برمجة التطبيقات الخاصة بك لكل مزود
  • تحقق من اتصالك بالإنترنت
  • تأكد من تثبيت أي مكتبات معالجة صوت تستخدمها (مثل Runtime Audio Importer) بشكل صحيح عند العمل مع ميزات تحويل النص إلى كلام
  • تحقق من أنك تستخدم تنسيق الصوت الصحيح عند معالجة بيانات استجابة تحويل النص إلى كلام
  • لتحويل النص إلى كلام بالبث، تأكد من أنك تتعامل مع مقاطع الصوت بشكل صحيح
  • لنماذج التفكير، تأكد من أنك تعالج كل من مخرجات التفكير والمحتوى
  • تحقق من الوثائق الخاصة بالمزود لتوفر النموذج وإمكانياته
  • لبث ElevenLabs المجزأ: تأكد من استدعاء FinishChunkedStreaming عند الانتهاء لإغلاق الجلسة بشكل صحيح
  • لمشاكل الوضع المستمر: تحقق من اكتشاف حدود الجمل بشكل صحيح في نصك
  • للتطبيقات في الوقت الفعلي: اضبط أوقات إرسال التأخير للمقاطع ومهلات التفريغ بناءً على متطلبات زمن الوصول لديك