Bilgi Teknoloji
merkezlerinde, beklenmedik bir bozulma veya doğal felaketler işletmenin rekabet
avantajlarına ya da kurumların hizmet altyapısına kısmen veya tamamen zarar
verebilir. Bu gibi durumlara hazırlıklı olmak ve veri kaybını önleyecek, hizmet
sürekliliğini sağlayacak gerekli önlemlerin önceden alınması gereklidir. Kurum
ve kuruluşlar, kritik verilerini verimli bir şekilde koruyacak ve riskleri
azaltacak şekilde BT altyapılarına iş sürekliliği ve felaket kurtarma
planlamalarını da yapmalıdır.
Felaket denince çoğunlukla
büyük ölçekli, deprem, yangın, sel gibi kontrol edilemeyen doğal afetler akla
gelir ama günlük hayatta rastlanan felaketler daha küçük ölçekte, kontrol
edilebilir, önlenebilirdir ama zararları çok büyük boyutlarda olabilmektedir.
1991’den bu yana devam eden profesyonel çalışma hayatı boyunca karşılaştığım
felaketlerin/hizmet kesintilerinin çoğu önlenebilir, kontrol edilebilir
özelliklere sahiptir. Örnek vermek gerekirse; bir bankanın bilgi işlem sistem
yönetim merkezine giren çay servisi yapan küçük çocuk, “Bu kırmızı nedir, ne
işe yarar?“ diye sorup kimsenin engel olmasına meydan vermeyecek bir hızda
Emergency Power Off düğmesine basıp merkezi Mainframe sistemini kapatmıştı.
Sistemlerin tekrar tam anlamıyla hizmet verebilir hale gelmesi yaklaşık 1 saat
sürmüştü. Bir baska problem yine bir baska büyük bir bankada olmuştu. Bankada
tüm sistemler yedekli, her türlü iş sürekliliği planı hazırdı. Kesintisiz güç
kaynakları (UPS) yedekteydi ama UPS’leri besleyen elektrik kaynağı tekti.
Elektrik sistemindeki bir arızadan dolayı UPS’ler devreye girdi ama UPS’lerdeki
bir arızadan dolayı her iki UPS sistemi devre dışı kaldı. Sistemlerin tekrar
çalışır hale gelmesi 4-5 saati buldu fakat sistemlerden bir tanesine erişim çok
daha uzun zaman aldı. Çünkü açılması gereken sistem standart garanti
dahilindeydi ve müdahale ancak garantiyi veren firma tarafından
sağlanabiliyordu. Yetkili firmanın personeli Anadolu Yakası‘nda oturduğu için
trafik yoğunluğu nedeniyle Avrupa Yakası‘na ulaşamadı ve banka personeli
garanti dahilindeki makinede olabilecek herhangi bir arıza riskine karşılık
donanıma müdahale edemediler ve firma personelini beklemek zorunda kaldılar.
Bir başka ilginç felaket, büyük bir kuruluşun felaket kurtarım merkezinde
meydana geldi. Felaket kurtarım merkezlerinde genelde çok fazla personel
bulunmuyor. Özellikle mesai sonrasında genelde sadece güvenlik görevlileri
bulunuyor. Sistem odasını su basıyor.
Sel sensörleri durumu farkedip alarm sinyalleri üretiyor fakat güvenlik
görevlisinin bulunduğu mekanda bu alarmları duyabileceği bir düzenek
bulunmaması nedeni ile güvenlik görevlisi yüksek ısıdan haberdar olamıyor.
Alarm uzun bir süre sesli uyarıya devam ediyor. Müdahale edilmeyince, alarm
sistemi ısınıyor ve yanıyor. Sistem odasında yangın çıkıyor. Dumanlar çıkmaya
başlayınca söndürme sistemleri devreye giriyor. Olabilecek her türlü felaket
aynı anda gerçekleşiyor.
Bu olaylardaki ortak yön,
felaketlerin büyük bir kısmının engellenebilir ve kontrol edilebilir olması.
Doğru planlama, olabilecek her duruma karşı aksiyonları belirleme ve bunları
periyodik olarak denemek gerekiyor.
Verilerin uzaktaki felaket kurtarım
merkezlerine kopyalanması, sistemlerin birer yedeklerinin bu merkezlerde
oluşturulması, sistemlerin ne şekilde açılacağı, devreye alınacağı, FKM
projelerinin temel bileşenleri. Tüm bu konuların yanı sıra önemli olan; insan
faktörü, felaket anında personelin ne şekilde hareket edeceği, kimlerin ne
görev alacağı.
Her bir kurum/kuruluşun kendine özgü
yapısı, kuralları, prosedürleri olması nedeni ile kurulacak FKM teknik
altyapısı da konsept olarak aynı kalsa da detayda çok fazla farklılık içeriyor.
Uygulanmış tek bir modelin her müşteriye uyarlanması maalesef mümkün olmuyor.
Bunu hazır giyim ve kişiye özel terzi dikimi gibi düşünebilirsiniz. Her bir
proje müşteriye uygun detaylar içeriyor; çok iyi dökümante edilmesi ve test
edilmesi gerekiyor. FKM projelerinde dokümantasyonun güncel tutulması çok
önemli; personel değişebiliyor, uygulamalar, veriler değişebiliyor. FKM’ lerin
sürekli güncel tutulması ve her an kullanıma hazır bir şekilde tutulması yüksek
yatırım maliyetine katlananlar için en önemli beklenti.