Білки, якорі та недопалки: найнеймовірніші причини збоїв у роботі дата-центрів
Сучасні дата-центри — надійні конструкції, які не просто вивести з ладу. Проте в маси досить часто просочується інформація про збої в роботі ЦОДів. Найпоширеніші причини простою — перебої в електроживленні, неполадки в системі охолодження, роботі мережевого обладнання, недбале ставлення до технічного обслуговування серверних ферм. Однак іноді робота дата-центрів зупиняється і з інших причин, про які не заведено розголошувати широкому загалу. Ми розглянули найкурйозніші та найбезглуздіші випадки збоїв у роботі, здавалося б, таких злагоджених систем, як ЦОДи.
- Зміни в часі
Через нерівномірність обертання Землі астрономічний та атомний час розходяться на 1 секунду кожні 1000 днів. Тому стрілки годинника по всьому світу іноді підводять на 1 секунду. Додавання секунди до атомного часу може призвести до колапсів у роботі ІТ-систем. Так сталося 2012 року, коли найбільші сайти, включно з LinkedIn, Mozillа, Reddit, The Pirate Вау, перестали працювати. В Австралії внаслідок збою в роботі дата-центрів із цієї причини понад 400 рейсів Quantas було затримано на дві години. Авіакомпанії довелося перейти на ручний режим управління. - Атака білок
Білки жують усе, що їм натрапить під ніс. Зокрема й дроти, які використовуються для передачі інформації. У 2010 році представники Yahoo повідомили про те, що білки в буквальному сенсі слова з’їли половину їхнього дата-центру в Санта-Кларі, США. - Якорем по кабелю
Про довговічність підводних комунікаційних кабелів для передачі трафіку з континента на континент ніхто не сперечається. Вони розміщені на глибині десятків тисяч метрів під водою. Проте існують випадки, коли надміцні кабелі пошкоджувалися. Наприклад, 2008 року корабель кинув якір, який потрапив у комунікаційний кабель, що негативно позначилося на роботі дата-центрів. - «Кожна стіна — двері» Ральф Емерсон
Виявляється, потрапити в деякі дата-центри не так вже й складно. Робота данського провайдера Nianet зупинилася, коли в його ЦОД проникли злодії. Вони прорізали отвори в стінах, потрапили всередину, забравши з собою коштовності у вигляді мережевих карт. Залишається сподіватися, що стіни цього сховища серверів зроблені не з гіпсокартону. - Ретельно вибирайте, де викинути недопалок
Інакше ризикуєте спровокувати зупинку дата-центру. Саме так і сталося з центром обробки даних Perth iX, який закрили протягом години після того, як спрацювала його система безпеки. Спеціальні детектори виявили дим біля будівлі дата-центру, ідентифікувавши його як палаючу клумбу в саду біля зовнішньої стіни об’єкта. Як з’ясувалося пізніше, найімовірніше, це був недопалок, недбало кинутий кимось зі співробітників ЦОДу.
Ось так завжди: поки вчені пихтять у своїх лабораторіях над новими відкриттями, у двигуни літаків потрапляють птахи, у турбіни ракет — космічний пил. Трапляються катастрофи, які часом призводять до незворотних втрат. Якраз саме час розридатися від усвідомлення недосконалості навколишнього світу, але не виходить. Мабуть, тому, що ця сама недосконалість якраз і є потужним стимулом до розвитку, прагнення до нових технологій, нових відкриттів.
За матеріалами статті Дж. Верджа «10 найдивніших причин збоїв у роботі дата-центрів»