Анализ результатов нагрузочного теста — это процесс сопоставления фактических метрик (Response Time, TPS, Error Rate, ресурсы)
с целевыми показателями SLA, чтобы понять, где начинаются сбои и узкие места системы.
Пример:
При нагрузке 5000 пользователей:
Средний Response Time = 1.9 сек ✅
Error Rate = 0.8% ✅
CPU = 85% ⚠️
→ значит, приложение стабильно, но нужно оптимизировать сервер.
Главная задача анализа — понять:
Выдержала ли система заданную нагрузку (по SLA);
Где находится точка деградации;
Какие узкие места требуют оптимизации.
Нагрузочный тест не просто “пройден / не пройден”,
а даёт диагностику производительности.
| Этап | Что делаем | Пример |
|---|---|---|
| 1. Проверяем корректность теста | Нет ли ошибок в сценарии, данных, логине | Проверить, что авторизация не падала |
| 2. Сравниваем результаты с SLA | Сопоставляем Response Time, Error Rate и TPS | 95% запросов < 2 сек, Error Rate ≤ 1% |
| 3. Анализируем графики нагрузки | Смотрим зависимость Response Time / TPS / ошибок | При росте пользователей TPS стабилен, RT ↑ после 4000 пользователей |
| 4. Анализируем ресурсы | CPU, RAM, Disk I/O, Network | CPU > 85% — узкое место |
| 5. Определяем точку деградации | При какой нагрузке система перестаёт держать SLA | После 5000 пользователей RT > 3 сек, Error Rate > 2% |
| 6. Ищем корневые причины (RCA) | Где возникло ограничение — код, БД, сеть | База данных медленно обрабатывает SELECT-запросы |
| 7. Формируем выводы и рекомендации | Что улучшить и как | Добавить кеширование, оптимизировать SQL |
| Метрика | Что оцениваем | Интерпретация |
|---|---|---|
| Response Time (avg, P95) | Быстродействие | Рост при нагрузке → узкое место |
| TPS / RPS | Производительность | Стабильный TPS при росте нагрузки = хорошо |
| Error Rate | Надёжность | Ошибки > 1% → деградация |
| CPU / RAM / Disk I/O | Использование ресурсов | CPU > 80% → сервер на пределе |
| 95th Percentile | Консистентность отклика | 95% запросов < SLA → ок |
| Throughput (MB/s) | Пропускная способность | Стабильность передачи данных |
Условия: 5000 пользователей, длительность теста — 20 мин.
| Метрика | Результат | Цель (SLA) | Оценка |
|---|---|---|---|
| Средний Response Time | 1.9 сек | ≤ 2 сек | ✅ |
| 95-й перцентиль | 2.4 сек | ≤ 2.5 сек | ✅ |
| Error Rate | 0.8% | ≤ 1% | ✅ |
| TPS | 270 | ≥ 250 | ✅ |
| CPU | 85% | ≤ 80% | ⚠️ |
| RAM | 72% | ≤ 75% | ✅ |
📊 Вывод:
Система выдержала 5000 пользователей, SLA выполнено частично (перегрузка CPU).
Рекомендации: увеличить количество серверов приложений или оптимизировать код API /balance.
Используются графики из JMeter, Grafana, InfluxDB, k6 Cloud и др.:
Response Time vs Time — растёт ли задержка со временем.
TPS vs Users — где TPS перестаёт расти.
Error Rate — скачки при достижении пика.
CPU/RAM — ресурсное потребление.
📈 Идеальный график: TPS растёт → стабилизируется → RT остаётся стабильным.
📉 Плохой график: TPS падает, RT резко растёт → деградация.
| Пользователи | TPS | Avg RT | Error Rate | CPU | Вывод |
|---|---|---|---|---|---|
| 1000 | 220 | 1.2 сек | 0% | 45% | Норма |
| 3000 | 260 | 1.8 сек | 0.2% | 70% | Норма |
| 5000 | 270 | 2.3 сек | 0.8% | 85% | На пределе |
| 7000 | 230 | 3.5 сек | 3.5% | 95% | Деградация началась |
📍 Точка деградации: 6000 пользователей.
Описание теста (сценарий, нагрузка, ramp-up, длительность).
Графики и таблицы метрик.
Сравнение с целевыми SLA.
Точку деградации.
Рекомендации (что оптимизировать).
💡 Итог:
Анализ результатов нагрузочного теста — это оценка стабильности и пределов системы на основе метрик.
Главное — определить,
📈 при какой нагрузке система остаётся в SLA,
📉 где начинается деградация,
и 💡 что нужно оптимизировать (код, БД, инфраструктуру).
Чтобы пожаловаться или сообщить об ошибке, войдите в аккаунт или зарегистрируйтесь.