Тестирование в Playground
Playground — это среда для тестирования и доработки агентов перед развёртыванием.
Доступ к Playground
- Перейдите в раздел Agents на боковой панели
- Нажмите Test на карточке агента (или Test Agent при редактировании агента)
- Playground откроется как боковая панель — начните диалог
Кнопка Test неактивна, если статус агента — Archived или Inactive. Измените статус на Active или Testing, чтобы включить тестирование.
Что тестировать
Базовая функциональность
- Может ли агент отвечать на вопросы по вашим документам?
- Точны ли ответы и релевантны ли они?
- Соответствует ли тон вашим ожиданиям?
Граничные случаи
Протестируйте сценарии, которые могут вызвать затруднения у агента:
- Вопросы, не охваченные вашими документами
- Двусмысленные или нечёткие вопросы
- Составные вопросы из нескольких частей
- Уточняющие вопросы, требующие контекста
Ход диалога
Протестируйте многоходовые диалоги:
- Запоминает ли агент контекст из предыдущих сообщений?
- Корректно ли он справляется со сменой темы?
- Задаёт ли он уточняющие вопросы при необходимости?
Оценка ответов
Для каждого ответа обратите внимание на:
| Аспект | Вопросы для проверки |
|---|---|
| Точность | Верна ли информация? |
| Релевантность | Отвечает ли он на заданный вопрос? |
| Полнота | Не упущено ли что-то важное? |
| Тон | Соответствует ли он стилю вашего бренда? |
| Длина | Достаточно ли он краток или подробен? |
Итеративное улучшение
Выявление проблем
Распространённые проблемы и решения:
| Проблема | Решение |
|---|---|
| Неверная информация | Проверьте содержимое документов, улучшите поиск |
| Слишком многословно | Добавьте «будь краток» в персону агента |
| Слишком формально/неформально | Настройте тон в персоне агента |
| Не знает ответа | Добавьте соответствующие документы |
| Выдумывает факты | Усильте ограничения в промпте |
Внесение изменений
- Выявите проблему при тестировании в Playground
- Настройте соответствующие параметры (промпт, документы, конфигурацию)
- Повторите тест с теми же вопросами
- Убедитесь, что исправление не нарушило другое поведение
Чек-лист тестовых сценариев
Создайте набор стандартных тестовых вопросов:
## Test Scenarios for [Agent Name]
### Basic Questions
- [ ] Q: "What is [product]?" — Expected: Clear description
- [ ] Q: "How much does it cost?" — Expected: Pricing info
### Edge Cases
- [ ] Q: Random unrelated question — Expected: Polite redirect
- [ ] Q: Competitor comparison — Expected: Stays on topic
### Follow-ups
- [ ] Q: Initial question, then "Tell me more" — Expected: Expands on previous answerСохраняйте тестовые сценарии и перезапускайте их после внесения изменений, чтобы выявить регрессии.
Готовность к развёртыванию
Ваш агент готов, когда:
- ✅ Точно отвечает на частые вопросы
- ✅ Корректно обрабатывает граничные случаи
- ✅ Поддерживает подходящий тон
- ✅ Соблюдает установленные ограничения
- ✅ Многоходовые диалоги работают хорошо
Далее разверните агента в каналах, где пользователи будут с ним взаимодействовать.
Last updated on