Tipy pro efektivní vyhledávání chyb (Troubleshooting)
Jak najít jehlu v kupce sena pomocí postupného vylučování od vrstvy 1 po 7.
Tipy pro efektivní vyhledávání chyb (Troubleshooting)
“Nefunguje mi tisk, proč se to netiskne?” zeptá se uživatel. Odpověď může znít jednoduše, ale pod kapotou se skrývá řada míst, kde se mohla stát chyba. Vyplýtvat dvě hodiny na instalování ovladačů tiskárny, když byl celou dobu jen uvolněný síťový kabel v tiskárně (nebo jí chyběl papír) je velmi frustrující zkušenost, kterou si ale někdy musel podle mého názoru projít každý “ajťák”.
Zde je můj návod, jak při lovení chyb nezešílet. Jmenuje se: Postupujte podle OSI modelu.
Zákon OSI modelu: Odspodu nahoru
Než se začnete hrabat v nastavení složitých programů na Aplikační vrstvě (Layer 7), ujistěte se, že funguje základní fyzika a síť.
graph TD
Layer1((1. Fyzická vrstva)) --> Layer2((2. Linková vrstva))
Layer2 --> Layer3((3. Síťová vrstva))
Layer3 --> Layer7((7. Aplikační vrstva))
Layer1 -. "Je to zapojené do elektriky? Jde tím proud? Je kabel zacvaknutý?" .-> Layer1
Layer2 -. "Svítí kontrolka na Switchi? Je vidět MAC adresa?" .-> Layer2
Layer3 -. "Dostalo to přes DHCP přidělenou IP adresu? Pingne se to?" .-> Layer3
Layer7 -. "Je spuštěn program? Máme na něj licenci?" .-> Layer7
Konkrétní příklad s nefunkčním telefonem:
- Vrstva 1 (Kabeláž): Je telefon vůbec v zásuvce? Ne? (Tady by Troubleshooting končil o 20 minut dřív, než instalace nového firmwaru SIP protokolu na Vrstvě 7).
- Vrstva 3 (Síť): Má telefon IP adresu? Pokud ne, restartujeme port, nebo zkontrolujeme DHCP.
- Vrstva 7 (Aplikace): Po kliknutí v softwaru na PC to nevytočí číslo klienta na stole. Teprve teď zkoumáme, zda se nepřejmenovala ústředna.
Rozděluj a panuj (Divide and conquer)
Když už vím, ve které vrstvě hledat, snažím se problém co nejvíc izolovat.
Rozdělení napůl: “Z mobilu na oné Wi-fi to uživateli funguje. Z notebooku nefunguje.” => Chyba logicky neleží ve vysílači routeru ani ve firemním internetu, ale s 99% jistotou v ovladači Wi-Fi na notebooku nebo nesprávném heslu (či certifikátu). Tím jste právě osekali rozsah hledání o polovinu!
Nikdy nic neměňte zároveň
Vyměníte kabel, restartujete Switch a nasadíte pevnou IP adresu. Najednou to začne fungovat! Jste génius! Ale víte vůbec, PROČ to funguje? Ne. Tím pádem to příště nedokážete včas vyřešit a ani napsat dokumentaci do znalostní báze (Knowledge Base).
Testujte vždy s jedinou změněnou proměnnou.
- Vyměním kabel -> Otestuji -> Nejde.
- Restartuji switch -> Otestuji -> Nejde.
- Vymažu certifikáty v Windows z profilu -> Otestuji -> Jde!
Problém nalezen. Čas na dobrou kávu.