- 단계 1: 테스트를 위한 시나리오 프롬프트, 전사본 또는 오디오 입력을 생성합니다.
- 단계 2: 사용자 정의 가능한 환경에서 에이전트 대화를 시뮬레이션합니다.
- 단계 3: 내장 또는 사용자 정의 메트릭을 사용하여 평가를 시작합니다.
- 단계 4: 평가 결과를 전사본 및 오디오 재생과 비교합니다.
- 단계 5: 생산 통화를 모니터링하고 실시간 성과를 평가합니다.
- 단계 6: 성과 임계값 및 비정상 행동에 대한 경고를 설정합니다.
- 단계 7: 성과 결과를 분석하고 AI 에이전트를 최적화합니다.