Riepilogo: La nostra piattaforma è progettata per garantire alta disponibilità di alimentazione, raffreddamento, rete, capacità di calcolo e archiviazione. L'obiettivo è una disponibilità annuale del 99,9% per l'infrastruttura principale. Questo obiettivo esclude le manutenzioni programmate e gli eventi al di fuori del nostro controllo (ad es. calamità naturali, problemi di terze parti come tagli di fibra o blackout elettrici).

Cosa significa "99,9% SLO"

  • Obiettivo: disponibilità del 99,9% misurata su base annua
  • Ambito: raggiungibilità dell'infrastruttura e servizi di piattaforma al margine della rete e a livello di hypervisor
  • Si tratta di SLO, non SLA: è un obiettivo di trasparenza, non un impegno contrattuale con diritto a rimborso

Ridondanza dell'infrastruttura

Alimentazione (percorsi doppi A/B)

  • Gruppi di continuità e generatori garantiscono alimentazione ininterrotta e lunga autonomia in caso di interruzione
  • Ogni server dispone di due alimentatori, ciascuno collegato a un quadro elettrico indipendente su fasi separate
  • Test periodici, monitoraggio e procedure documentate per il passaggio tra le fonti di alimentazione

Raffreddamento (configurazione N+1)

  • Due unità di condizionamento indipendenti (N+1); ciascuna può gestire l'intero carico termico mentre l'altra è in manutenzione
  • Monitoraggio continuo di temperatura e umidità con allarmi automatici

Rete

  • Collegamenti doppi in fibra ottica tramite operatori diversi con routing dinamico per il passaggio rapido in caso di guasto
  • Switch di rete ridondanti e protezione DDoS a livello superiore

Archiviazione e Ceph

  • L'archiviazione basata su Ceph è disponibile per i servizi Cloud VPS e Nextcloud
  • Ceph non è disponibile per i server dedicati e AMD VPS

Gestione operativa

  • Monitoraggio continuo di alimentazione, raffreddamento, rete, capacità di calcolo e archiviazione
  • Manutenzione preventiva con piani di ripristino; la maggior parte degli interventi non causa interruzioni grazie alla ridondanza
  • La gestione degli incidenti avviene secondo procedure documentate e catene di responsabilità

Manutenzione programmata (esclusa dall'obiettivo del 99,9%)

  • Le finestre di manutenzione vengono comunicate in anticipo e pianificate negli orari di minor traffico
  • Se sono previste ripercussioni, verranno indicate nell'avviso; la maggior parte degli interventi viene eseguita a sistema attivo senza interruzioni

Esclusioni (eventi al di fuori del nostro controllo)

  • Finestre di manutenzione comunicate
  • Calamità naturali e cause di forza maggiore (terremoti, alluvioni, tempeste, incendi)
  • Problemi di terze parti (tagli accidentali della fibra, guasti degli operatori di livello superiore, blackout elettrici)
  • Cause lato cliente (configurazione errata del sistema operativo o delle applicazioni, risorse esaurite, impostazioni firewall o modifiche effettuate dal cliente o dai suoi fornitori)

Conclusione

La nostra architettura a più livelli alimentazione doppia, raffreddamento N+1, collegamenti in fibra diversificati e archiviazione tollerante ai guasti è progettata per raggiungere una disponibilità annuale del 99,9%. Nessun sistema può garantire una disponibilità totale, ma questa architettura riduce al minimo l'impatto dei guasti dei componenti e permette la manutenzione con interruzioni minime. L'obiettivo del 99,9% viene misurato su base annua ed esclude le manutenzioni programmate e gli eventi al di fuori del nostro controllo.

Hai trovato utile questa risposta? 0 Utenti hanno trovato utile questa risposta (0 Voti)