Výpadek Skype postihl miliony uživatelů a ukazuje na fatální slabinu v architektuře

Včerejší výpadek se dotkl milionů uživatelů komunikačního software Skype. Ten byl nejenom velký, co se počtu postižených uživatelů týče, ale i délkou – Skype se podařilo problém začít řešit až po několika hodinách. A na jeho odstranění se podle všeho ještě stále pracuje

V historii Skype se naposledy podobně velký výpadek odehrál někdy v roce 2007. Včerejší výpadek se projevoval  náhodným odpojováním a pády klientského software. A to prakticky bez ohledu na používanou platformu.

Skype si v průběhu výpadku s informováním uživatelů moc hlavu nedělalo, Problems signing in to Skype informuje pouze o „problémech s přihlašováním do Skype“ a tím jakákoliv snaha informovat uživatele na Skype.com skončila.  O něco více informací nabízel @Skype účet na Twitteru, ale to s ohledem na složení uživatelů této služby není přijatelné řešení.

Our engineers and site operations team are working non-stop to get things back to normal – thanks for your continued patience

Většinu funkčnosti se podařilo, opět pouze podle účtu na Twitteru, obnovit až dnes ráno. Tedy pokud zhruba 40 minut starý zápisek na Twitteru můžete brát jako závaznou informaci.

Thanks for your continued patience while we get everyone back online – sorry especially to those of you who are still waiting

Skype downtime today, ke kterému se jednoduše dostanete také jenom přes Twitter, je zajímavým pohledem do toho, jak problematická je architektura  Skype. A připomíná i to, že všichni co Skype používají ho vlastně také provozují.

… it relies on millions of individual connections between computers and phones to keep things up and running. Some of these computers are what we call ‘supernodes’ – they act a bit like phone directories for Skype.

Under normal circumstances, there are a large number of supernodes available. Unfortunately, today, many of them were taken offline by a problem affecting some versions of Skype.

Zajímavá a stěžejní informace i pro případ, že by se kdokoliv chtěl pokusit Skype odstavit útokem – stačí odstavit určité množství počítačů, na kterých je Skype závislé. A zbytek už se dostaví sám.

What are we doing to help? Our engineers are creating new ‘mega-supernodes’ as fast as they can, which should gradually return things to normal. This may take a few hours, and we sincerely apologise for the disruption to your conversations. Some features, like group video calling, may take longer to return to normal.


Tumblr už několik hodin mimo provoz

Populární sociální blogovací web www.tumblr.com je už několik hodin mimo provoz. A pokud se problémy nepodaří odstranit, bude brzy mimo provoz jeden den.

„We’ll be back shortly,“ poněkud mění význam slova „brzy“. A uživatelům ani moc nepomáhá informace, „We’re working quickly to recover from a major issue in one of our database clusters. We’re incredibly sorry for the inconvenience„.

Google Analytics má výpadek pro 2.listopad 2010

Google Analytics ukazuje pro velké množství uživatelů „nulu“ za včerejší den, tedy za 2.listopadu 2010. A uživatelé GA samozřejmě propadají panice, včetně řady spekulací o tom, že Google chystá zpoplatnění GA.

Jediné co se prozatím dozvíte v Google Analytics Status Dashboard je informace o výpadku z 1.listopadu 2010. Může mít souvislost :

“We are continuing to investigate this issue. We will provide an update by November 6, 2010 12:00:00 AM UTC detailing when we expect to resolve the problem.

Starting Oct 25th, a 24hr delay with processing in sampled reports was identified in some accounts. No data has been lost and a fix is in progress.

Aktualizace 12:25 – „11:42 AM – We’re investigating reports of an issue with Web Report. We will provide more information shortly.“