Skip to Content
AgentsТестирование в Playground

Тестирование в Playground

Playground — это среда для тестирования и доработки агентов перед развёртыванием.

Доступ к Playground

  1. Перейдите в раздел Agents на боковой панели
  2. Нажмите Test на карточке агента (или Test Agent при редактировании агента)
  3. Playground откроется как боковая панель — начните диалог

Кнопка Test неактивна, если статус агента — Archived или Inactive. Измените статус на Active или Testing, чтобы включить тестирование.

Что тестировать

Базовая функциональность

  • Может ли агент отвечать на вопросы по вашим документам?
  • Точны ли ответы и релевантны ли они?
  • Соответствует ли тон вашим ожиданиям?

Граничные случаи

Протестируйте сценарии, которые могут вызвать затруднения у агента:

  • Вопросы, не охваченные вашими документами
  • Двусмысленные или нечёткие вопросы
  • Составные вопросы из нескольких частей
  • Уточняющие вопросы, требующие контекста

Ход диалога

Протестируйте многоходовые диалоги:

  • Запоминает ли агент контекст из предыдущих сообщений?
  • Корректно ли он справляется со сменой темы?
  • Задаёт ли он уточняющие вопросы при необходимости?

Оценка ответов

Для каждого ответа обратите внимание на:

АспектВопросы для проверки
ТочностьВерна ли информация?
РелевантностьОтвечает ли он на заданный вопрос?
ПолнотаНе упущено ли что-то важное?
ТонСоответствует ли он стилю вашего бренда?
ДлинаДостаточно ли он краток или подробен?

Итеративное улучшение

Выявление проблем

Распространённые проблемы и решения:

ПроблемаРешение
Неверная информацияПроверьте содержимое документов, улучшите поиск
Слишком многословноДобавьте «будь краток» в персону агента
Слишком формально/неформальноНастройте тон в персоне агента
Не знает ответаДобавьте соответствующие документы
Выдумывает фактыУсильте ограничения в промпте

Внесение изменений

  1. Выявите проблему при тестировании в Playground
  2. Настройте соответствующие параметры (промпт, документы, конфигурацию)
  3. Повторите тест с теми же вопросами
  4. Убедитесь, что исправление не нарушило другое поведение

Чек-лист тестовых сценариев

Создайте набор стандартных тестовых вопросов:

## Test Scenarios for [Agent Name] ### Basic Questions - [ ] Q: "What is [product]?" — Expected: Clear description - [ ] Q: "How much does it cost?" — Expected: Pricing info ### Edge Cases - [ ] Q: Random unrelated question — Expected: Polite redirect - [ ] Q: Competitor comparison — Expected: Stays on topic ### Follow-ups - [ ] Q: Initial question, then "Tell me more" — Expected: Expands on previous answer

Сохраняйте тестовые сценарии и перезапускайте их после внесения изменений, чтобы выявить регрессии.

Готовность к развёртыванию

Ваш агент готов, когда:

  • ✅ Точно отвечает на частые вопросы
  • ✅ Корректно обрабатывает граничные случаи
  • ✅ Поддерживает подходящий тон
  • ✅ Соблюдает установленные ограничения
  • ✅ Многоходовые диалоги работают хорошо

Далее разверните агента в каналах, где пользователи будут с ним взаимодействовать.

Last updated on