Összefoglaló: A platformunk magas rendelkezésre állásra lett tervezve az áramellátás, hűtés, hálózat, számítási kapacitás és tárhely területén. Célunk az évi 99,9%-os rendelkezésre állás az alapvető infrastruktúra esetében. Ebben a célban nem szerepelnek az előre bejelentett karbantartások és a rajtunk kívülálló események (pl. természeti katasztrófák, szolgáltatói problémák, mint az optikai kábelek sérülése vagy áramkimaradások).
Mit jelent a "99,9% SLO"
- Cél: 99,9%-os rendelkezésre állás éves szinten mérve
- Hatókör: az infrastruktúra elérhetősége és a platform szolgáltatásai a hálózat szélén és a hipervizor szinten
- Ez SLO, nem SLA: átláthatósági célról van szó, nem szerződéses kötelezettségvállalásról kártérítéssel
Az infrastruktúra redundanciája
Áramellátás (kettős A/B útvonalak)
- UPS egységek és generátorok biztosítják a zavartalan áramellátást és a hosszú működési időt áramkimaradás esetén
- Minden szerver két tápegységgel rendelkezik, amelyek külön elosztóhoz kapcsolódnak különböző fázisokon
- Rendszeres tesztelés, figyelés és dokumentált átkapcsolási eljárások az áramforrások között
Hűtés (N+1 konfiguráció)
- Két független légkondicionáló egység (N+1); mindegyik képes a teljes hűtési igényt kielégíteni, míg a másik karbantartás alatt áll
- Folyamatos hőmérséklet- és páratartalom-figyelés automatikus riasztással
Hálózat
- Kettős optikai kapcsolatok különböző szolgáltatókon át, dinamikus útválasztással a gyors átkapcsoláshoz hiba esetén
- Redundáns hálózati kapcsolók és DDoS védelem magasabb szinten
Tárhely és Ceph
- Ceph alapú tárhely elérhető a Cloud VPS és Nextcloud szolgáltatásoknál
- Ceph nem érhető el dedikált szervereknél és AMD VPS esetében
Működés
- Folyamatos figyelés az áramellátás, hűtés, hálózat, számítási kapacitás és tárhely területén
- Megelőző jellegű karbantartás visszaállítási tervekkel; a legtöbb munka nem befolyásolja a működést a redundanciának köszönhetően
- A problémák kezelése dokumentált eljárások és felelősségi lánc szerint történik
Tervezett karbantartás (nem része a 99,9%-os célnak)
- A karbantartási időpontokat előre bejelentjük és csúcsidőn kívülre időzítjük
- Ha várható hatással lesz a működésre, azt feltüntetjük a bejelentésben; a munkák többsége a rendszer működése közben történik megszakítás nélkül
Kivételek (rajtunk kívülálló események)
- Bejelentett karbantartási időpontok
- Természeti katasztrófák és vis maior (földrengések, árvizek, viharok, tüzek)
- Szolgáltatói problémák (optikai kábelek véletlenszerű sérülése, felsőbb szintű szolgáltatók meghibásodása, áramkimaradások)
- Ügyféloldali okok (az operációs rendszer vagy alkalmazás hibás beállítása, kimerült erőforrások, tűzfal beállítások vagy az ügyfél illetve beszállítói által végzett módosítások)
Összegzés
A többszintű felépítésünk kettős áramellátás, N+1 hűtés, különböző optikai kapcsolatok és hibatűrő tárhely az évi 99,9%-os rendelkezésre állás elérésére lett tervezve. Egyetlen rendszer sem képes teljes rendelkezésre állást garantálni, de ez az építészet minimálisra csökkenti az alkatrészhibák hatását és lehetővé teszi a karbantartást minimális működési zavarral. A 99,9%-os cél éves szinten kerül mérésre, és nem tartalmazza az előre bejelentett karbantartásokat valamint a rajtunk kívülálló eseményeket.