28 Nisan ve 5 Mayıs tarihlerinde TIER II veri merkezimizde meydana gelen kesinti vakalarıyla ilgili bize ulaşan soru ve yorumlarınız ışığında bir doküman hazırladık. Bu doküman ile özellikle sosyal medyada konuşulan bazı konulara açıklık getirerek tüm taraflara doğru bilgilendirme yapmayı hedefliyoruz.

Konuyla ilgili merak edilen başlıkları aşağıda bulabilirsiniz.

 

Radore veri merkezi salonlarının standartları neler? Kesintiden neden bütün müşteriler etkilenmedi?

Radore’de toplam 1.040 m2’lik beyaz alanda TIER II ve TIER III standardına sahip iki farklı veri merkezi salonu mevcut. TIER II ve TIER III veri merkezi salonlarının hizmet ve altyapı standartlarında ise farklılıklar bulunuyor. Bu farklardan bahsedersek:

  • Radore TIER II veri merkezinde, TIER II standartlarını karşılamanın ötesinde jeneratör, UPS ve klima bileşenleri, ihtiyacın dışında 1 adet daha yedeği bulunacak şekilde (N+1) kurgulanmış durumdadır. Ayrıca her bir UPS kendi içinde de en az N+1 yedeklilik sağlayacak şekilde modüler yapıdadır. Dünya genelinde kabul gören standartlara göre, TIER II kurgusundaki veri merkezi alanlarında senelik toplam 22 saate kadar kesinti yaşanma ihtimali mevcuttur. (TIER standartları ve uptime kavramı ile ilgili detayları bir sonraki başlıkta görebilirsiniz.)
  • TIER III veri merkezi standartlarını sağlamak için ise jeneratör, UPS ve klima bileşenlerinin tümünün ihtiyacı karşılayacak miktarın dışında 1 adet de yedeği bulunacak şekilde (N+1) kurgulanması gereklidir. Bileşenlerin güç beslemesi ise 1 tanesi aktif diğeri de yedek olacak şekilde çift hat üzerinden yapılmalıdır. Radore TIER III veri merkezinin altyapısı ise tüm kabinlere iki farklı UPS odasından aktif-aktif şekilde çalışan çift hat üzerinden güç beslemesi sağlanacak şekilde kurgulanmıştır. Ek olarak UPS’lerin her biri de kendi içinde en az N+1 yedeklilik sağlayacak şekilde modüler yapıdadır. TIER III standartlarındaki veri merkezi alanlarında ise senelik toplam 1,6 saate kadar kesinti yaşanma ihtimali mevcuttur. (TIER standartları ve uptime kavramı ile ilgili detayları bir sonraki başlıkta görebilirsiniz.)

Hizmet Seviyesi Anlaşması (SLA) sürecinde TIER II ve TIER III standartlarının hem maliyet hem de hizmet kapsamında farkları olduğunun bilinmesi gerekiyor. Başka bir deyişle anlaşmanızı TIER II standartları için yapmışsanız, TIER III’ün sunduğu çözümlerden yararlanmak mümkün olmuyor. Bu nedenle yedekleme, felaket kurtarma ve acil durum aksiyonlarının, hizmet alınan TIER standartlarına uygun şekilde planlanması gerekiyor.

Bahsi geçen kesinti TIER II veri merkezinde gerçekleştiği için TIER III veri merkezinde barınan müşteriler tarafından hissedilmedi. Yalnız TIER III’de barınan kısıtlı sayıda müşteri tarafından iletilen geribildirimleri detaylandıracak olursak, durum şöyle gerçekleşti:

TIER III veri merkezi alanlarının güç beslemesi A ve B güç hatları üzerinden, TIER II veri merkezinin güç beslemesi ise B güç hattı üzerinden sağlanıyor.

Bahsi geçen kesinti vakası ise TIER II veri merkezine güç yedekliliği sağlayan UPS-B odası ve UPS-B odasından TIER II veri merkezine elektrik iletimi sağlayan B güç hattını etkiledi. Bundan dolayı TIER II veri merkezinden hizmet alan müşteriler mevcut durumdan etkilendi. Bunun yanında TIER III Veri Merkezi’nde kullanılan donanımların bazılarının TIER III anlayışına uygun olmayan şekilde, tek güç kaynaklı ve sadece B güç hattına bağlı olmaları sebebiyle güç kesintisi oluştu. Yaşanan aksaklık sonrası kurulumu bu yönde yapılan donanımların güç bağlantıları düzenlenerek A hattından enerji almaları ve çalışmaları sağlandı.

Kesinti vakası sırasında A güç hattına bağlı olan alanlarda herhangi bir aksaklık görülmedi.

Radore Veri Merkezi salonları hakkında daha detaylı bilgi için web sitemizi ziyaret edebilirsiniz. Buna ek olarak Radore Veri Merkezi’nin yüksek güvenlikli ve ulaşımı kolay konumdaki MetroCity’de bulunması stratejik bir tercih. Çok sayıda fiber optik kablo güzergahına yakınlık sayesinde hızlı ve yedekli İnternet erişimi, kesintisiz güç, güvenlik ve doğal afetlere karşı dayanıklılık avantajları sebebiyle Radore Metrocity’de.

radore.com/data-center

 

Uptime nedir? TIER standartları nedir?

Uptime, bir sunucunun garanti edilen minimum çalışma zamanıdır. Bu çalışma zamanı yüzdelik oran ile ifade edilir. Uptime’ı aynı zamanda veri merkezinden aldığınız hizmetin erişilebilirlik veya kesintisizlik oranı olarak da ifade edebiliriz. Bir veri merkezinin uptime oranı, hizmet kalitesini gösteren en önemli göstergelerden biridir. ABD merkezli özel bir kurum olan Uptime Institute tarafından düzenlenen TIER standartları ise veri merkezlerinin uptime oranlarının ve hizmet kalitesinin belirlenmesi konusunda tüm dünyada öne çıkıyor.

“TIER” sertifikaları, elektrik, soğutma, fiziksel güvenlik, yangın, bina sağlamlığı, network yapısı gibi konularda, doğal afet, felaket ve benzeri olağanüstü hallerde dahi veri merkezinin ayakta kalabileceğinin ve hizmet vermeye devam edebileceğinin yeterlilik ve yetkinlik seviyesini gösterir. Toplamda dört adet TIER standardı vardır.

  • Tier I: Temel Kapasite – Küçük işletmelere hizmet verir. Sistemlerin elektrik ve mekanik yedeği yoktur. Güç kaynakları 10 dakikadan fazla enerji kesintisine dayanıklı değildir. Uptime oranı % 99.671.
  • Tier II: Yedek Kapasite Bileşenleri – Güç ve soğutma sistemlerinin belli bir seviyeye kadar yedeği mevcuttur. Sahip olduğu güç kaynakları 24 saatlik elektrik kesintilerine dayanabilir. Uptime oranı % 99.741.
  • Tier III: Eş Zamanlı Bakım Yapabilme – Donanımların yenileme ve bakımı için bileşenlerin kapatılmasını gerektirmez. Güç ve soğutma sistemlerinin yedeği vardır. Güç kaynakları 72 saat süren elektrik kesintisine dayanabilir. Uptime oranı % 99.982.
  • Tier IV: Hata Toleranslı – Tier III’ün üzerine inşa edilen hata toleransı kavramına sahip altyapı topolojisinden oluşur. Yer seçiminde çok katı kuralları bulunur. Güvenlik önlemleri yüksek seviyededir. Güç kaynakları 96 saat süreli enerji kesintilerine dayanabilir. 7/24 çalışabilecek personeli bulunur. Uptime oranı % 99.995.

Uptime oranları arasındaki fark az gibi gözükse de, standartlar kapsamında yaşanabilecek senelik kesinti sürelerinin toplamı bu oranlara göre, TIER I için 28,8 saat, TIER II için 22 saat, TIER III için 1,6 saat ve TIER IV içinse 0,4 saattir.

Kritik iş uygulamaları için uygun olan veri merkezi standardı TIER III ve TIER IV’tür. Yaşanabilecek kesintiler nedeniyle kayıplara neden olabilecek kritik uygulamaların TIER II standardındaki veri merkezlerinde barındırılmaları tavsiye edilmemektedir. Bu gibi uygulamaların aynı veri merkezinde başka bir bölüm (zone) içinde veya farklı noktadaki bir başka veri merkezinde bulunan sistemlerle eş zamanlı şekilde, hızlı ve sürekli replikasyon gibi yöntemlerle desteklenerek yüksek çalışabilirlik (High Availabilty) sağlayan konfigürasyonlarla çalışılmalıdır. Aksi durumlarda ise kesinti riski gerçeği göz önünde bulundurulmalıdır.

TIER standartları hakkında detaylı bilgi için aşağıdaki bağlantıyı kullanabilirsiniz:

https://radore.com/blog/veri-merkezlerinin-sehir-efsanesi-tier.html

 

Radore’nin enerji altyapısının özellikleri neler?

Güç altyapımız, Radore’ye ait olan ikisi ana, biri yedek olmak üzere üç farklı dağıtım transformatöründen beslenir. Güç yedeklemesi için de 3 adet 1.100 kVA’lık dizel jeneratör bulunur. Bu jeneratörler için Radore’ye ait 3 adet 3,5 tonluk yakıt tankı ve 1 adet 70 tonluk MetroCity’ye ait paylaşımlı yakıt tankı mevcut. Bu altyapı ile hiç yakıt ikmali yapılamadığı ve elektrik tedariğindeki aksaklığının giderilmediği bir senaryo düşündüğümüzde bile sadece yakıt tanklarımız ve jeneratörlerimizle toplam 48 saat boyunca çalışır durumda kalabiliyoruz.

Sunucu kabinlerine iletilen güç TIER III veri merkezinde yedekli, TIER II veri merkezinde tek olmak üzere “busbar” hattı ile sağlanıyor. Buna ek olarak sunucu kabinleri iki ayrı UPS grubundan beslenen iki farklı PDU (Power Distribution Unit) ile de yedeklenmiş durumda. UPS sistemine ait akü grubu ise minimum 15 dakika besleme sağlayabilme kapasitesine sahip.

UPS sistemimiz biri yedek olmak üzere 5 x (N+1) şeklinde kurgulanmıştır. TIER III veri merkezi alanları için A ve B güç hatları ile çift besleme sağlıyoruz. A güç hattı 1. ve 2. Grup, B güç hattı ise 3. grup UPS’ler ile besleniyor. TIER II veri merkezinde ise 4. Grup UPS sistemini kullanıyoruz. Ayrıca ofis ve network altyapımız da bu alanlara özel minimum 120 dakika güç sağlayan 5. grup UPS’ler ile besleniyor.

 

Kesinti vakalarında veri kaybı yaşamamak için ne yapmalıyım?

Veri merkezinde yaşanabilecek kesintiler sırasında veri kaybını engellemenin en temel yolu dijital verilerinizin yedeğini almaktır. Mevcut sunucunuzdaki ve depolama aygıtlarınızdaki verilerinizi belirli aralıklarla başka bir ortama kopyalayarak veri kaybına karşı önlem alabilirsiniz. Ya da sizin yerinize bu işlemi yapması için veri merkezinden profesyonel bir yedekleme hizmeti talep etmeniz gerekir. Veri merkezinden herhangi bir veri yedekleme talebinde bulunulmadığı durumda ise verilerin sorumluluğu veri sahibindedir.

Yedekleme servisleri ile sadece sunucudaki verileri değil, paranızı ve zamanınızı da yedeklemiş olursunuz. Hizmetlerin sürekliliğini garanti altına almak için yedekleme ve felaket kurtarma servislerini kullanmanız hayati önem taşır.

Yedekleme süreçleri sadece dijital verilere değil, BT ekipmanlarından internet erişimine kadar bütün bileşenlere uygulanabilir. Enerji altyapısı, iklimlendirme, yangın söndürme, kablolama, güvenlik, izleme gibi bütün altyapı hizmetleri yaşanabilecek aksaklıklarda işlevini yerine getirebilecek yedekli bir yapıda kurgulanmalıdır.

Radore’nin yedekleme servisleri hakkında detaylı bilgi için aşağıdaki bağlantıyı kullanabilirsiniz:

radore.com/yonetim-servisleri#yedekleme

 

Radore’de bakım çalışmaları müşteri bilgilendirme süreçleri nasıl işliyor? 5 Mayıs’taki çalışma neden haber verilmedi?

Altyapı ve diğer tüm bileşenler Veri Merkezi Altyapı ve Veri Merkezi Operasyon ekibimiz tarafından anlık olarak takip ediliyor. Veri merkezi işletmeciliğinin doğal dinamikleri gereği müdahale gerektiren anlık durumlarla her an karşılaşılabiliyor. Bu nedenle kesinti yaşanması muhtemel olan müdahaleleri niteliğine göre sınıflandırıp duyuru zorunluluğumuzun bulunduğu en uygun vakitte müşterilerimize haber vermeyi esas alıyoruz.

Radore’de bakım çalışmaları planlı ve plansız olarak iki şekilde sınıflandırılıyor. Planlı bakım çalışmaları web sitesi, blog, sosyal medya ve e-posta gibi iletişim kanalları ve Müşteri İlişkileri ekibinin birebir temasları ile tüm müşterilere 48 saat önceden duyuruluyor. Acil durumlardan kaynaklanan plansız bakım çalışmalarında ise 24 saat önceden yine aynı iletişim kanalları kullanılarak müşterilere duyuru yapılıyor.

Veri merkezi altyapı ve donanım bileşenlerine yönelik tüm müdahale ve bakım çalışmaları müşterileri etkileyecek nitelikteyse önceden mutlaka duyurusu yapılıyor. Fakat müşterileri etkileyecek bir durum ya da kesinti öngörülmüyor ise duyuru yapılmadan çalışma gerçekleştiriliyor. 5 Mayıs’ta yaşanan anlık kesintiler müşteriyi etkilemeyecek şekilde yedekli ve kesintisiz olarak kurgulanmış ama montaj ve geçiş aşamasında oluşan ve öngörülmeyen aksaklıklar nedeniyle ne yazık ki müşterilerimiz kısa süreli olarak (4 dakika) durumdan etkilenmiştir.

 

Radore’de yangın mı çıktı?

Kesinti sırasında veri merkezinde gerçekleşen bir yangın vakası söz konusu değildir.

Radore Veri Merkezi Operasyon ve Veri Merkezi Altyapı ekiplerimiz, güç altyapısı tedarikçi ve servis sağlayıcılarımızla birlikte güvenlik süreçleri de dâhil olmak üzere 30 Nisan tarihinde detaylı inceleme ve tespitlerini yaptı. Aksaklığın güç taşıyıcı hattı olan busbar’ın eklem noktasında oluşan yanmadan kaynaklandığı netlik kazandı. Ayrıca vaka sürecinde saat 4.43’te yangın algılama sistemi Akü Odası B’de 4 adet akünün yanmaya başladığını algıladı. Otomasyon sistemi gazlı yangın söndürme altyapısını devreye alarak yanmaya başlayan 4 aküyü de söndürdü.

Konuyla ilgili teknik detayları içeren vaka raporuna aşağıdaki bağlantıdan erişebilirsiniz:

https://radore.com/blog/radore-tier-ii-veri-merkezi-altyapi-teknik-arizasi-28-nisan-5-mayis-2018-vaka-degerlendirme-raporu.html

Ayrıca ek tedbirlerden bahsedersek, Radore’nin konumlandığı MetroCity, gelişmiş güvenlik sistemleri, yangın ihbar, yangın söndürme ve duman tahliye sistemleri ile 7 gün 24 saat kontrol altında tutuluyor. MetroCity binası, NFPA (Amerikan Ulusal Yangın Önleme Birliği) standartları dikkate alınarak inşa edilmiş bir yapı.

 

Bu olay sadece Radore’de mi yaşandı? Dünyadaki diğer veri merkezlerinde kesintiler yaşanıyor mu? Tamamen kesintisizlik mümkün mü?

Veri merkezinde kesinti yaşanması hem Radore’nin hem de tüm müşterilerinin asla karşılaşmak istemediği bir durum. Kesintisi sonrasında hazırlanan vaka raporuna göre değerlendirmeler yapılmış ve bu durumun bir daha yaşanmaması için gereken tüm önlemler alınmıştır.

Alınan tüm önlemlere ve uygulanan teknolojilere rağmen buna benzer durumlar ne yazık ki tüm dünyada da yaşanabiliyor. (https://radore.com/blog/googledan-amazona-10-buyuk-veri-merkezinde-yasanan-10-sira-disi-kesinti.html)

Veri merkezinin altyapı ve hizmet kurgusu bu gibi durumları mümkün olan en alt seviyeye indirerek kesintisizliği sağlamayı temel alır. Fakat kesinti olmayacağına yönelik %100 garanti vermek ne yazık ki hiçbir veri merkezi kurgusunda mümkün değildir. Buna rağmen veri merkezleri, yaşanabilecek krizlere karşı hazırlıklı bir altyapıya sahip olduğu için teknoloji altyapılarının en güvenli şekilde barındırılacağı yerlerdir.

Radore olarak kesintisiz bir hizmet sağlayabilmek için tüm imkânlarımızı kullanıyor ve hassasiyetle çalışmaya özen gösteriyoruz. Tekrardan yaşanan kesintiler için özür diler, anlayışınız için teşekkür ederiz.