Incident Evidence Uptime + Eyeball Proof
Incident Evidence е комбинирана услуга, която свързва Uptime Monitoring с Eyeball Monitoring. Когато сайтът даде DOWN или влезе в нестабилно състояние, системата автоматично активира Eyeball и прави скрийншотове за доказателство – за да се вижда какво реално е видял потребителят по време на инцидента.
- Incident log (start/end + duration)
- Скрийншотове по време на инцидента
- „Recovery proof“ screenshot след възстановяване
- Multi-confirm (по избор) за по-малко фалшиви аларми
- Идеално за SLA, спорове с хостинг, QA и DevOps
Защо това е важно
Сайт може да връща HTTP 200, но да показва „Maintenance“, CAPTCHA, празна страница или грешен редирект. Uptime само по себе си може да пропусне тези случаи.
Eyeball показва какво вижда потребителят, а не само какъв е HTTP статуса. Това дава сигурност при инциденти.
Скрийншотовете и timeline-ът са доказателство за хостинг/доставчик, за вътрешни екипи и за SLA отчетност.
Как работи Incident Evidence
Системата прави проверки на URL по интервал и следи статус, latency, timeouts и TLS проблеми.
При поредица от fail проверки се отваря инцидент. По избор: multi-confirm от втори регион/нод.
Автоматично се пускат 2–3 Eyeball проверки със screenshots, които документират как изглежда проблемът.
Системата записва старт/край, duration, статуси, и прикачва доказателството като част от инцидента.
При възстановяване се прави финален screenshot, който доказва, че сайтът е отново достъпен и работи.
При инцидент изпращаме известия и даваме директен линк към инцидента + доказателствата.
Trigger Rules (Автоматично задействане)
За да има качествени доказателства и минимални false positives, Incident Evidence използва правила за задействане. Те са конфигурируеми според SLA и чувствителност.
| Условие | Действие |
|---|---|
| DOWN (1 check) | По избор: игнорира се като временен glitch или се маркира “suspect” |
| DOWN ≥ 2 последователни | Отваря инцидент и задейства Eyeball → първи доказателствен скрийншот |
| DOWN от ≥ 2 региона/ISP | Потвърден инцидент → серия от скрийншотове + “confirmed” статус |
| HTTP 500 / blank page | Eyeball прави capture за визуална диагностика (дори да има HTTP отговор) |
| Recovery (UP) | Финален “recovery proof” скрийншот → end time + duration |
Препоръчителни настройки
За да избегнем false positives и да имаме качествени доказателства:
- Interval: 5 мин (бизнес стандарт)
- Trigger: 2–3 последователни fail проверки
- Confirm (по избор): втори нод/регион
- Evidence shots: 2–3 screenshots в рамките на 1–2 мин
- Recovery shot: 1 screenshot след възстановяване
- eCommerce (checkout / плащания)
- SaaS системи (login / dashboard)
- Медии и новинарски сайтове
- Финтех / корпоративни приложения
- SLA и отчетност към клиенти
Примерен incident flow
Какво ще видиш в системата при реален проблем:
- Uptime check отчита 502/timeout → следва повторна проверка
- Инцидентът се потвърждава → записва се start time
- Автоматично се активира Eyeball evidence (2–3 screenshots)
- Алармата съдържа линк към incident + доказателства
- При възстановяване се прави recovery screenshot → end time + duration
Quick win
Тази услуга често “спестява часове” дебъг и спорове, защото показва истината: какво е било на екрана, не само какъв е бил статуса.