Riepilogo: La nostra piattaforma è progettata per garantire alta disponibilità di alimentazione, raffreddamento, rete, capacità di calcolo e archiviazione. L'obiettivo è una disponibilità annuale del 99,9% per l'infrastruttura principale. Questo obiettivo esclude le manutenzioni programmate e gli eventi al di fuori del nostro controllo (ad es. calamità naturali, problemi di terze parti come tagli di fibra o blackout elettrici).
Cosa significa "99,9% SLO"
- Obiettivo: disponibilità del 99,9% misurata su base annua
- Ambito: raggiungibilità dell'infrastruttura e servizi di piattaforma al margine della rete e a livello di hypervisor
- Si tratta di SLO, non SLA: è un obiettivo di trasparenza, non un impegno contrattuale con diritto a rimborso
Ridondanza dell'infrastruttura
Alimentazione (percorsi doppi A/B)
- Gruppi di continuità e generatori garantiscono alimentazione ininterrotta e lunga autonomia in caso di interruzione
- Ogni server dispone di due alimentatori, ciascuno collegato a un quadro elettrico indipendente su fasi separate
- Test periodici, monitoraggio e procedure documentate per il passaggio tra le fonti di alimentazione
Raffreddamento (configurazione N+1)
- Due unità di condizionamento indipendenti (N+1); ciascuna può gestire l'intero carico termico mentre l'altra è in manutenzione
- Monitoraggio continuo di temperatura e umidità con allarmi automatici
Rete
- Collegamenti doppi in fibra ottica tramite operatori diversi con routing dinamico per il passaggio rapido in caso di guasto
- Switch di rete ridondanti e protezione DDoS a livello superiore
Archiviazione e Ceph
- L'archiviazione basata su Ceph è disponibile per i servizi Cloud VPS e Nextcloud
- Ceph non è disponibile per i server dedicati e AMD VPS
Gestione operativa
- Monitoraggio continuo di alimentazione, raffreddamento, rete, capacità di calcolo e archiviazione
- Manutenzione preventiva con piani di ripristino; la maggior parte degli interventi non causa interruzioni grazie alla ridondanza
- La gestione degli incidenti avviene secondo procedure documentate e catene di responsabilità
Manutenzione programmata (esclusa dall'obiettivo del 99,9%)
- Le finestre di manutenzione vengono comunicate in anticipo e pianificate negli orari di minor traffico
- Se sono previste ripercussioni, verranno indicate nell'avviso; la maggior parte degli interventi viene eseguita a sistema attivo senza interruzioni
Esclusioni (eventi al di fuori del nostro controllo)
- Finestre di manutenzione comunicate
- Calamità naturali e cause di forza maggiore (terremoti, alluvioni, tempeste, incendi)
- Problemi di terze parti (tagli accidentali della fibra, guasti degli operatori di livello superiore, blackout elettrici)
- Cause lato cliente (configurazione errata del sistema operativo o delle applicazioni, risorse esaurite, impostazioni firewall o modifiche effettuate dal cliente o dai suoi fornitori)
Conclusione
La nostra architettura a più livelli alimentazione doppia, raffreddamento N+1, collegamenti in fibra diversificati e archiviazione tollerante ai guasti è progettata per raggiungere una disponibilità annuale del 99,9%. Nessun sistema può garantire una disponibilità totale, ma questa architettura riduce al minimo l'impatto dei guasti dei componenti e permette la manutenzione con interruzioni minime. L'obiettivo del 99,9% viene misurato su base annua ed esclude le manutenzioni programmate e gli eventi al di fuori del nostro controllo.