Categories
Cose interessanti

Si ritorna alla normalita’…

Anche questo blog come migliaia di altri siti e’ stato messo al tappeto dal blackout di tophost durato quasi 48 ore.

Ecco il calvario descrito dal blog della stessa tophost:

21 Giugno ore 23:01

A causa di un guasto grave occorso pochi minuti fa tutti i siti dei diversi nodi non sono raggiungibili.

Per evitare inutili code di messaggi ridondanti, il servizio dei ticket è temporaneamente sospeso.

Vi terremo aggiornati attraverso il presente “stato dei servizi”.

22 Giugno ore 8:31

Il problema che si presenta e’ che non sono piu’ visibili i dischi attraverso la SAN in fibra ottica. Il guasto non e’ ancora stato individuato con precisione in quanto e’ anomalo e non riteniamo che sia un problema dei dischi rigidi, ma sullo switch di collegamento ad essi. Stiamo aspettando l’intervento di IBM che avverra’ oggi in mattinata.

ore 12.19

Al momento stiamo ancora aspettando i tecnici e naturalmente stiamo sollecitando per una veloce soluzione del problema. Abbiamo fatto anche ulteriori controlli e probabilmente il problema riguarda l’alimentazione ridondata dello storage.

ore 15.25

I tecnici IBM hanno effettuato i dovuti controlli. Il componente difettoso e’ proprio un componente interno della parte di alimentazione dello storage IBM DS4300.

L’aspetto sfortunato e’ che IBM non ha il pezzo di ricambio disponibile in Italia prima di domani; quindi stiamo cercando qualche distributore che ha una macchina del genere in deposito e magari, con l’intervento di IBM, avere una sostituzione entro oggi.

ore 21.55

IBM non e’ stata in grado di farci avere il pezzo di ricambio e quindi dobbiamo aspettare la mattinata di domani.

Ringraziamo anche Lorenzo Riccucci il titolare del dominio www.limenet.it per un suggerimento atto a far si che le mail che vengano inoltrate in questo periodo di down non vengano perse. Presi dal guasto e protesi alla sua risoluzione non avevamo pensato di disattivare l’SMTP.

23 giugno 2006 ore 11.03

IBM e’ intervenuta e hanno gia’ sostituito la macchina, adesso stiamo ripartendo, appena possiamo respirare seguira’ un comunicato esaustivo su tutto l’accaduto.

ore 11.40

Stiamo ripartendo con tutti i servizi, tutti i dati sono consistenti e senza errori. Adesso ci sara’ un problema di lentezza legata al tempo di riassestamento di tutte le cache.

Io non incolpo tophost. Un servizio da 10 euro l’anno, che nella maggior parte dei casi funziona bene e’ da leccarsi i baffi.

Invece sono dell’idea che la responsabilita’ sia di ibm: I guasti possono capitare, ma su apparecchiature che costano decine di migliaia di euro (se va bene) e’ inaccettabile che non ci sia una componentistica di riserva prontamente disponibile.