03 de dezembro Office 365 interrupção da Microsoft: O que deu errado

Pouco menos de duas semanas atrás, um número de Office 365 clientes na Europa foram atingidos por uma queda de energia que durou várias horas.

Microsoft lançar Australian Azure região hospedagem; gigante Defesa valas em nuvem da Microsoft citando temores Patriot Act; Sim, as autoridades dos Estados Unidos podem espionar dados em nuvem da UE. Veja como

Representantes da Microsoft recentemente compartilhou alguns dos detalhes por trás das cenas sobre o que deu errado através de um relatório de incidente disponível a partir do Office 365 Dashboard.I descoberto pela primeira vez o relatório, PIR IS3496, graças a um post no blog de Tony Redmond no Windows IT Pro local. (Eu não era capaz de encontrar o relatório de incidente em meu próprio Painel Office 365, por qualquer motivo, mas eu tive de olhar para uma cópia completa do mesmo.)

Segundo este relatório, o 03 de dezembro Office 365 interrupção durou cerca de quatro horas, a partir de cerca de 9:00 UTC. O relatório reconheceu que “muitos clientes servidos a partir da região da Europa foram afetadas por esse problema.” E alguns clientes de outras regiões que autenticadas pela Europa também pode ter problemas experientes naquele dia.

Aproximadamente 1% dos Outlook e 35% das OOTW (Outlook na Web) pedidos foram impactadas “, observou o relatório.

“Os usuários afetados não foram capazes de entrar no portal Office 365. Além disso, alguns usuários não conseguiram acessar 365 Serviços de escritório, incluindo o serviço SharePoint Online, Poder BI, Microsoft Intune, Yammer e Exchange Online. Para o Exchange Online, o Outlook em os usuários (OOTW) web experimentou o maior impacto, mas o impacto para o Outlook e Exchange ActiveSync (EAS) dispositivos móveis foi mínima “, diz o relatório do incidente.

Além disso, o acesso ao Painel de Saúde Serviço também foi atingido. Mesmo que a Microsoft tem um backup “Emergency Broadcast System,” (EBS) clientes da região Europeia não foram capazes de ver as atualizações para esta página devido a uma falha EBS.

Na sua raiz, a 03 de dezembro interrupção foi um problema / identidade de login. A causa era duplo, o Softies disse

1. Uma atualização recente expôs um problema de configuração entre a produção e infra-estrutura de autenticação de pré-produção. Isto resultou em algumas solicitações sendo misrouted e criando uma carteira de pedidos de autenticação no Azure Active Directory (AAD) front-ends.

2. A carteira de pedidos misrouted em AAD teve um efeito em cascata que resultou em elevada utilização de recursos do sistema, que agravado ainda mais o problema, como o aumento do tráfego durante o horário comercial na região europeia. Isto levou a falhas intermitentes pedido de autenticação dentro dos Data Centers da Europa e causou falhas no serviço de autenticação AAD, o que resultou em impacto aos serviços do Office 365.

Empresa Software; SUSE doce! senões HPE-se uma distro Linux; Nuvem; Twilio lança novo plano empresarial prometendo mais agilidade; nuvem; Intel, Ericsson ampliar parceria para se concentrar em indústria de mídia; Nuvem;? Xero lança parceria com a Macquarie Bank para pagamentos BPAY

O que vem por Microsoft para evitar problemas semelhantes avançar?

A empresa planeja adicionar técnicas de falhas de injeção adicionais para melhorar os seus procedimentos de teste, bem como mecanismos de fallback adicionais para permitir que ele use uma versão mais antiga do serviço de autenticação, disse o relatório.

Para frustrar o potencial para solicitações de mis-encaminhados causados ​​pela alta utilização da CPU, a Microsoft planeja adicionar mais detecção de sobrecarga e mecanismos de recuperação e melhorar o isolamento através de terminais de serviço para dirigir fora falhas em cascata, acrescentou o relatório.

Como um link incorreto rede de distribuição de conteúdo (CDN) impediu que os usuários vejam as atualizações em http://status.office.com, a Microsoft planeja rever as suas opções de transição para os casos em que o acesso ao portal do Office 365 é impactado.

O relatório da Microsoft relaciona a data de conclusão para todos esses próximos passos como “de Dezembro de 2015.”

Perguntei funcionários da Microsoft se os usuários afetados pela interrupção de 03 de dezembro será compensado de alguma forma e foi dito que a empresa não teve nenhum comentário.

Eu também estou curioso por que a Microsoft fez este post mortem disponível como um relatório de painel em vez de como um post enfrentando publicamente, já que tem em casos anteriores do Office 365 e Azure interrupções. Novamente, nenhum comentário da empresa sobre isso, também.

SUSE doce! senões HPE-se uma distro Linux

Twilio lança novo plano empresarial prometendo mais agilidade

Intel, Ericsson ampliar parceria para se concentrar em indústria de mídia

? Xero lança parceria com a Macquarie Bank para pagamentos BPAY