Сривът на Amazon в уеб: какви са изводите от него?

September 27, 2011 by pcmag

Великият срив на Amazon в интернет наскоро засегна стотици, може би дори хиляди уебсайтове и услуги. Проблемите на един от петте центъра за данни на Amazon – този, който се намира близо до град Вашингтон – засегна Foursquare, Quora, Zynga, Reddit и много други сайтове. На този инцидент или скоро ще се гледа като на поредния срив в интернет, или ще бъде забравен от мнозина. Но дотогава си заслужава да отбележим, че последиците от тази повреда са особено неприятни.

Amazon е известен най-вече като сайт за търговия на дребно онлайн и като създател на устройството за четене на електронни книги Kindle (и вероятно на нов таблет с Android). Но той предлага и сървърно пространство – носещо името Amazon Web Service – на много компании, които иначе не биха могли да си го позволят. Голямото предимство на Amazon в уеб е неговата измерваема услуга: компаниите плащат само за постоянната памет на сървърите, която използват, а тя може да се увеличава бързо при нужда, тъй като центровете за данни са огромни. Amazon поддържа и управлява пет такива центъра по света. По време на срива Amazon отбеляза в таблото за бележки относно състоянието на услугата, че вижда „значителен прогрес“ при възстановяването й и очаква огромна част от данните да бъдат възстановени онлайн за часове. Засегнатите сайтове, изглежда, работеха, макар че не бе ясно дали потребителите от някои региони, опитващи се да получат достъп до тях, не са все още „на тъмно“.
Сривовете в интернет не са новост. През миналата година Skype преживя подобен срив (той се повтори  само преди няколко дни – бел. ред), който продължи цяло денонощие. При Twitter те са редовно явление. Дори търсачката гигант Google страда от сривове – спомнете си блокирането на Gmail през 2009 година, което имаше катастрофални последици. Като се има предвид общата картина на всички интернет сривове, двудневното блокиране на Amazon Web Services съвсем не изглежда необикновено.
Но има две неща, които правят този инцидент по-значим от останалите сривове в интернет: едното е големият брой на засегнатите уебсайтове. Тъй като много компании зависят от Amazon Web Services, много сайтове (повечето големи) останаха блокирани за часове, вероятно дни. Не съм виждал изчислени в пари загубите от този инцидент, но не се съмнявам, че те възлизат на милиони долари.
Другият, по-важен проблем е надеждността. Тя се отнася до такива наглед незначителни подробности, като начина, по който Amazon архивира своите данни, както и до обещанията, които тя дава на своите доставчици. Но Джъстин Санта Барбара, основател на FathomDB, прави много добър анализ на срива в един свой постинг в блог. В основни линии, в един център за данни Amazon има по няколко зони, за да е сигурно, че ако една от тях се срине, друга ще влезе в действие. Това е общоприетата представа за резервиране (redundancy). На практика нещата са малко по-сложни, но концепцията, общо взето, е ясна. Каквато и да е била причината за срива, той е засегнал много зони в един и същ център за данни, а това не е бивало да се случва.

Повреда в резервирането

Разбира се, ако се направи паралел със земетресенията и цунамитата, които засегнаха Япония, и се приеме, че и  в двата случая става дума за Божия намеса, може да се случи много зони да се сринат наведнъж, дори в един и същ център на данни – дори при положение че данните се съхраняват в различни сгради (както бе в случая с Amazon). Но случаят не бе такъв. Amazon Web Services очевидно работи по начин, при който един изолиран проблем може да засегне различни зони на един и същ център за данни, а това определено обезсмисля резервирането.
Урокът, който трябва да си извлекат от този случай всички самоуважаващи се компании, правещи бизнес с Amazon Web Services, е, че те трябва да имат свои собствени планове за архивиране. Без съмнение много от тях имат такива планове. Но ако те разчитат на по-малко достъпно или непълно архивиране, или по-лошо – на резервираността на Amazon – тези планове имат нужда от преработка. Използването на втора услуга за архивиране онлайн определено ще струва пари, но тези разходи може и да са оправдани в сравнение с потенциалните загуби, които могат да понесат компаниите. Помислете си за клиентите на Skype, които си скъсаха нервите по време на срива през почивните дни.
За всички останали мога само да се надявам най-после да се разкрие, колко относителен е терминът „облак“ (cloud), който се употребява често вместо термините „уеб“ или „интернет“. Данните не съществуват във въздуха, в етера, нито в пространствено-временния континуум. Те се съхраняват на твърди дискове и сървъри – разбира се, свързани в мрежа, но тук, на Земята.
В крайна сметка „облакокалипсисът“ на Amazon приземява срива в „облака“ на твърда земя. Поне сега го видяхме отблизо, макар и не по най-приятния начин.

ПОГОВОРЕТЕ С ПИЙТ Изпратете му вашите мисли на адрес pete_pachal@pcmag.com.

 

 

Коментари

Публикувай нов коментар

Съдържанието на това поле е поверително и няма да бъде показвано публично.
Premium Drupal Themes by Adaptivethemes