大規模クラウド障害からの教訓 KDDIの対応は?

テクノロジー
スポンサーリンク
スポンサーリンク

みなみです!みなさんは、昨年のKDDIのクラウド障害について覚えていますか?そんな大規模な障害から約2週間で回復したこの出来事について、一緒に振り返ってみましょう!
2023年ももうすぐ終わりですね。IT業界ではさまざまな出来事がありましたが、その中でも大きな話題となったのがKDDIのクラウド障害です。KDDIは1月28日に発生した障害に対して、迅速かつ適切に対応しました。それでは、具体的にどのような対応が行われたのか、詳しく見ていきましょう!

この障害は、KDDIのクラウドサービス「KDDIクラウドプラットフォーム」の「jp2-east05」ゾーンで起きました。原因はハードウェアメモリの故障で、ストレージに不整合なメタデータが発生したことがわかりました。この不整合なメタデータの影響で、データの処理が正常に行われず、CPUの負荷も上がりました。ストレージの制御機器もアクセスできなくなったため、障害が発生したとのことです。

KDDIは障害発生後、迅速に対応策を講じました。まず、新たなストレージ機器を構築し、データの移行作業を行いました。そして、2月8日までに障害を完全に解消しました。また、復旧後には再発防止策の実施、メモリの調査・交換、メモリのエラー監視の自動化など、さまざまな対策を行っています。これにより、顧客に対する安心して利用できるサービスを提供することができました。

さらに、KDDIは顧客への対応策としても返金措置を講じました。仮想サーバの稼働率が目標であるSLA(99.99%)に満たなかった場合は、利用料の一部を返金するという取り組みを行いました。また、仮想サーバが全く利用できない状態が24時間以上続いた場合には、利用料金全額の返金も行っています。これにより、顧客への補償措置やサービスの品質向上に努めています。

KDDIは公式サイトで「ご迷惑をお掛けしたことを、改めて深くお詫びする。再発防止を徹底するとともに、安心して利用してもらえるサービスを提供する」としています。このようなトラブルが発生した際には、素早い対応と迅速な情報提供が重要です。KDDIの対応は非常に評価されるべきですね。

今回のKDDIのクラウド障害からは、大切な教訓が得られました。まずは、設備の適切な管理や定期的なメンテナンスが必要であることがわかりました。また、復旧後には顧客への補償措置や再発防止策の実施など、迅速かつ具体的な対策を講じることが重要です。これからもKDDIは、顧客の信頼を失わないために努力を続けていくことでしょう。

以上、みなみがお伝えしました!IT業界での出来事はいつも瞬く間に広まりますね。今回のKDDIのクラウド障害からは、迅速かつ適切な対応の重要性を学ぶことができました。これからも情報を正しく把握し、安全・安心なサービスを利用していきましょう♪(*´▽`*)でわわ、みなさん、また次回お会いしましょう!

タイトルとURLをコピーしました