본문으로 건너뛰기

플러그인 사용 방법

Runtime AI Chatbot Integrator는 두 가지 주요 기능을 제공합니다: 텍스트-텍스트 채팅과 텍스트-음성 변환(TTS). 두 기능 모두 유사한 워크플로우를 따릅니다:

  1. API 제공자 토큰 등록
  2. 기능별 설정 구성
  3. 요청 전송 및 응답 처리

제공자 토큰 등록

어떤 요청을 보내기 전에, RegisterProviderToken 함수를 사용하여 API 제공자 토큰을 등록하세요.

Blueprint에서 제공자 토큰 등록

텍스트-텍스트 채팅 기능

이 플러그인은 각 제공업체별로 두 가지 채팅 요청 모드를 지원합니다:

비스트리밍 채팅 요청

단일 호출로 완전한 응답을 검색합니다.

Send OpenAI Chat Request

스트리밍 채팅 요청

더 동적인 상호작용을 위해 응답 청크를 실시간으로 수신합니다.

Send OpenAI Streaming Chat Request

텍스트 음성 변환(TTS) 기능

선도적인 TTS 제공업체를 사용하여 텍스트를 고품질 음성 오디오로 변환합니다. 이 플러그인은 프로젝트 요구 사항에 따라 처리할 수 있는 원시 오디오 데이터(TArray<uint8>)를 반환합니다.

아래 예제들은 Runtime Audio Importer 플러그인을 사용한 오디오 재생을 위한 오디오 처리를 보여주지만(자세한 내용은 오디오 임포트 문서 참조), Runtime AI Chatbot Integrator는 유연하게 설계되었습니다. 이 플러그인은 단순히 원시 오디오 데이터를 반환하므로, 특정 사용 사례에 맞게 오디오 재생, 파일 저장, 추가 오디오 처리, 다른 시스템으로 전송, 사용자 정의 시각화 등 다양한 방식으로 데이터를 처리할 수 있는 완전한 자유를 제공합니다.

비스트리밍 TTS 요청

비스트리밍 TTS 요청은 전체 텍스트가 처리된 후 단일 응답으로 완전한 오디오 데이터를 반환합니다. 이 접근 방식은 전체 오디오를 기다리는 것이 문제가 되지 않는 짧은 텍스트에 적합합니다.

Send OpenAI TTS Request

스트리밍 TTS 요청

스트리밍 TTS는 오디오 청크가 생성되는 대로 전달하여 전체 오디오가 합성되기를 기다리지 않고 데이터를 점진적으로 처리할 수 있게 합니다. 이는 긴 텍스트에 대한 인지된 지연 시간을 상당히 줄이고 실시간 애플리케이션을 가능하게 합니다. ElevenLabs 스트리밍 TTS는 또한 동적 텍스트 생성 시나리오를 위한 고급 청크 스트리밍 기능을 지원합니다.

Send OpenAI Streaming TTS Request

사용 가능한 음성 가져오기

일부 TTS 공급자는 사용 가능한 음성을 프로그래밍 방식으로 발견할 수 있는 음성 목록 API를 제공합니다.

Get Google Cloud Voices

오류 처리

요청을 보낼 때는 콜백에서 ErrorStatus를 확인하여 잠재적인 오류를 처리하는 것이 중요합니다. ErrorStatus는 요청 중 발생할 수 있는 문제에 대한 정보를 제공합니다.

오류 처리

요청 취소

이 플러그인은 진행 중인 텍스트-텍스트 및 TTS 요청을 모두 취소할 수 있도록 합니다. 이는 장시간 실행되는 요청을 중단하거나 대화 흐름을 동적으로 변경하고자 할 때 유용할 수 있습니다.

요청 취소

모범 사례

  1. 콜백에서 ErrorStatus를 확인하여 잠재적 오류를 항상 처리하세요
  2. 각 제공업체별 API 속도 제한 및 비용을 주의하세요
  3. 장문 또는 대화형 대화에는 스트리밍 모드를 사용하세요
  4. 더 이상 필요하지 않은 요청은 취소하여 리소스를 효율적으로 관리하세요
  5. 긴 텍스트의 경우 지연 시간을 줄이기 위해 스트리밍 TTS를 사용하세요
  6. 오디오 처리의 경우 Runtime Audio Importer 플러그인이 편리한 솔루션을 제공하지만, 프로젝트 요구사항에 따라 맞춤형 처리를 구현할 수 있습니다
  7. 추론 모델(DeepSeek Reasoner, Grok)을 사용할 때는 추론 및 콘텐츠 출력을 적절히 처리하세요
  8. TTS 기능을 구현하기 전에 음성 목록 API를 사용하여 사용 가능한 음성을 확인하세요
  9. ElevenLabs 청크 스트리밍의 경우: 증분적으로 생성되는 텍스트(예: AI 응답)에는 연속 모드를 사용하고, 미리 형성된 텍스트 청크에는 즉시 모드를 사용하세요
  10. 응답성과 자연스러운 음성 흐름 사이의 균형을 맞추기 위해 연속 모드에 적절한 플러시 시간 초과를 구성하세요
  11. 애플리케이션의 실시간 요구사항에 따라 최적의 청크 크기와 전송 지연 시간을 선택하세요

문제 해결

  • 각 제공업체에 대한 API 자격 증명이 올바른지 확인하세요
  • 인터넷 연결을 확인하세요
  • TTS 기능 작업 시 사용하는 오디오 처리 라이브러리(예: Runtime Audio Importer)가 제대로 설치되었는지 확인하세요
  • TTS 응답 데이터를 처리할 때 올바른 오디오 형식을 사용하고 있는지 확인하세요
  • 스트리밍 TTS의 경우 오디오 청크를 올바르게 처리하고 있는지 확인하세요
  • 추론 모델의 경우 추론 및 콘텐츠 출력을 모두 처리하고 있는지 확인하세요
  • 모델 가용성 및 기능에 대한 제공업체별 문서를 확인하세요
  • ElevenLabs 청크 스트리밍의 경우: 완료 시 FinishChunkedStreaming을 호출하여 세션을 올바르게 닫으세요
  • 연속 모드 문제의 경우: 텍스트에서 문장 경계가 올바르게 감지되는지 확인하세요
  • 실시간 애플리케이션의 경우: 지연 시간 요구사항에 따라 청크 전송 지연 및 플러시 시간 초과를 조정하세요