Microsoft 365 ขัดข้อง: การเชื่อมต่อกลับมาเป็นปกติหลังจาก ISP ขัดข้องและส่งผลกระทบต่อผู้ใช้หลายพันคน
สร้างเมื่อ 12 กันยายน 2024 • ข่าวสาร • เข้าชม 1,304 ครั้ง • อ่าน 5 นาที
Microsoft 365 ขัดข้องส่งผลกระทบต่อผู้ใช้หลายพันคน การเชื่อมต่อกลับคืนมาหลังจาก ISP ย้อนกลับการเปลี่ยนแปลง
เมื่อวันที่ 12 กันยายน 2024 บริษัท Microsoft Corporation (MSFT.O) ได้รายงานเหตุขัดข้องร้ายแรงซึ่งส่งผลกระทบต่อชุดโปรแกรมเพิ่มประสิทธิภาพการทำงานบนคลาวด์ Microsoft 365 ที่ใช้กันอย่างแพร่หลาย ซึ่งรวมถึงแอปพลิเคชันยอดนิยม เช่น Word, Excel, Teams และ Outlook การหยุดชะงักดังกล่าวส่งผลกระทบต่อผู้ใช้หลายพันคนทั่วสหรัฐอเมริกา โดยมีรายงานมากกว่า 90,000 รายการที่ไหลบ่าเข้าสู่ Downdetector ซึ่งเป็นแพลตฟอร์มที่ติดตามเหตุขัดข้องแบบเรียลไทม์ เหตุการณ์ดังกล่าวซึ่งเกิดจากการเปลี่ยนแปลงภายในผู้ให้บริการอินเทอร์เน็ต (ISP) ของบุคคลที่สาม ได้รับการแก้ไขในที่สุด โดย Microsoft ยืนยันว่าบริการต่างๆ กลับมาเป็นปกติภายในช่วงสาย
รายละเอียดและระยะเวลาการหยุดให้บริการ
ปัญหาขัดข้องเริ่มต้นขึ้นในช่วงเช้าของวันพฤหัสบดี โดยผู้ใช้รายงานว่าไม่สามารถเข้าถึงบริการ Microsoft 365 หลายอย่าง รวมถึง Outlook, Teams และบริการบนคลาวด์อื่นๆ ได้ ทีมงานฝ่ายสื่อสารของ Microsoft ยอมรับปัญหาดังกล่าวในบัญชี X (เดิมคือ Twitter) ของตนอย่างรวดเร็ว และระบุว่าบริษัทกำลังดำเนินการตรวจสอบสาเหตุที่แท้จริง
ภายในเวลา 9 น. ET Downdetector ได้บันทึกรายงานผู้ใช้มากกว่า 23,000 รายเกี่ยวกับปัญหาในการเข้าถึงบริการ Microsoft 365 การหยุดให้บริการส่งผลกระทบต่อแพลตฟอร์มหลัก เช่น Outlook, Teams, SharePoint และ Exchange Server เป็นหลัก โดยประมาณ 75% ของปัญหาที่รายงานเกี่ยวข้องกับ Outlook บริการอื่นๆ เช่น Skype for Business Server และ Microsoft Store ก็พบรายงานการหยุดให้บริการที่เพิ่มขึ้นเช่นกัน
ปัญหาเกิดจากการเปลี่ยนแปลงในสภาพแวดล้อมที่จัดการโดย ISP บุคคลที่สามที่ Microsoft พึ่งพาในการเชื่อมต่อ การเปลี่ยนแปลงนี้ทำให้เกิดการหยุดชะงักในวงกว้าง ส่งผลกระทบต่อผู้ใช้หลายพันคน โดยเฉพาะในภูมิภาคที่พึ่งพาโครงสร้างพื้นฐานของ ISP เฉพาะนี้ Microsoft ได้ทำงานอย่างใกล้ชิดกับ ISP เพื่อระบุและแก้ไขปัญหา และในที่สุดผู้ให้บริการบุคคลที่สามก็ย้อนกลับการเปลี่ยนแปลงดังกล่าว ซึ่งนำไปสู่การกู้คืนบริการอย่างค่อยเป็นค่อยไป
ความพยายามตอบสนองและการกู้คืนของ Microsoft
ตลอดช่วงที่เกิดการหยุดให้บริการ Microsoft ได้แจ้งให้ผู้ใช้ทราบผ่านช่องทางโซเชียลมีเดียและพอร์ทัลผู้ดูแลระบบ โดยคำชี้แจงเบื้องต้นของบริษัทระบุว่าบริษัทกำลังดำเนินการตรวจสอบการหยุดชะงักดังกล่าว และขอให้ลูกค้าตรวจสอบการอัปเดตในศูนย์ผู้ดูแลระบบ Microsoft 365 ภายใต้รหัสเหตุการณ์ MO888473 วิศวกรของ Microsoft ทำงานอย่างไม่รู้จักเหน็ดเหนื่อยเพื่อตรวจสอบการวัดระยะไกลของเครือข่ายและการเปลี่ยนแปลงล่าสุดที่เกิดขึ้นกับโครงสร้างพื้นฐานเครือข่าย ซึ่งให้ข้อมูลเชิงลึกอันมีค่าเกี่ยวกับสาเหตุของปัญหา
ความคืบหน้าที่สำคัญในกระบวนการกู้คืนเกิดขึ้นเมื่อ Microsoft ระบุการเปลี่ยนแปลงของ ISP ว่าเป็นสาเหตุโดยตรงของเหตุขัดข้อง ผู้ให้บริการบุคคลที่สามได้ย้อนกลับการเปลี่ยนแปลงดังกล่าว ส่งผลให้มีสัญญาณที่เห็นได้ชัดในการกู้คืน เมื่อเวลา 10 น. ตามเวลา ET รายงานเหตุการณ์ลดลงอย่างมากเหลือไม่ถึง 30 รายงาน จากจุดสูงสุดที่ 2,000 รายงานในช่วงเช้าของวันเดียวกัน
Microsoft ยืนยันว่าปัญหาการเชื่อมต่อได้รับการบรรเทาลงในโพสต์ติดตามผลบน X โดยระบุว่า "เราสามารถยืนยันได้ว่าปัญหาที่ส่งผลต่อการเชื่อมต่อกับบริการของ Microsoft ได้รับการบรรเทาลงแล้ว" การระบุปัญหาอย่างรวดเร็ว ร่วมกับขั้นตอนเชิงรุกที่ดำเนินการโดย ISP ทำให้มั่นใจได้ว่าการหยุดชะงักจะถูกควบคุมไว้ภายในเวลาไม่กี่ชั่วโมง
ผลกระทบและนัยสำคัญที่กว้างขึ้น
แม้ว่าการหยุดให้บริการจะเกิดขึ้นเพียงช่วงสั้นๆ แต่ก็ส่งผลกระทบต่อผู้ใช้และองค์กรจำนวนมากที่ต้องพึ่งพา Microsoft 365 อย่างมากในการดำเนินงานประจำวัน Microsoft 365 เป็นส่วนสำคัญของธุรกิจต่างๆ ในหลายภาคส่วน โดยมอบเครื่องมือที่จำเป็นสำหรับการสื่อสาร การทำงานร่วมกัน และประสิทธิภาพการทำงาน การหยุดให้บริการดังกล่าวได้รบกวนกิจวัตรประจำวันของธุรกิจ โรงเรียน และสถาบันอื่นๆ เป็นการชั่วคราว ส่งผลให้เกิดความไม่สะดวกอย่างกว้างขวาง
เหตุการณ์นี้ยังดึงความสนใจไปที่การพึ่งพาโครงสร้างพื้นฐานของบุคคลที่สามของบริการบนคลาวด์ การพึ่งพา ISP และผู้ให้บริการภายนอกรายอื่นหมายความว่าการเปลี่ยนแปลงเพียงเล็กน้อยภายในสภาพแวดล้อมเหล่านี้อาจส่งผลกระทบเป็นลูกโซ่ได้ ดังที่เห็นในกรณีนี้ แม้ว่าระบบภายในของ Microsoft จะมีความแข็งแกร่ง แต่ปัจจัยภายนอกยังคงเป็นจุดที่อาจเกิดความล้มเหลวสำหรับบริการบนคลาวด์
การหยุดให้บริการดังกล่าวเกิดขึ้นเพียงสองเดือนหลังจากเกิดเหตุการณ์ขัดข้องครั้งใหญ่ที่เกี่ยวข้องกับบริษัทด้านการรักษาความปลอดภัยทางไซเบอร์ CrowdStrike เมื่อเดือนกรกฎาคม การอัปเดตซอฟต์แวร์ที่มีข้อบกพร่องจาก CrowdStrike ส่งผลกระทบต่ออุปกรณ์ Windows เกือบ 8.5 ล้านเครื่อง ส่งผลให้การดำเนินงานในอุตสาหกรรมต่างๆ เช่น สายการบิน ธนาคาร และการดูแลสุขภาพต้องหยุดชะงัก เหตุการณ์ก่อนหน้านี้ได้เปิดเผยช่องโหว่ภายในระบบนิเวศของ Microsoft โดยผู้ใช้จำนวนมากมองว่าเหตุการณ์ขัดข้องทั้งสองครั้งนี้มีความคล้ายคลึงกัน อย่างไรก็ตาม เหตุการณ์ขัดข้องครั้งล่าสุดนี้ได้รับการแก้ไขได้เร็วกว่า ซึ่งต่างจากเหตุการณ์ในเดือนกรกฎาคม เนื่องจาก ISP ตอบสนองอย่างรวดเร็วในการย้อนกลับการเปลี่ยนแปลงที่ทำให้เกิดปัญหา
ความร่วมมือระหว่าง Microsoft และ ISP
ขณะที่ Microsoft ดำเนินการแก้ไขปัญหาดังกล่าว AT&T (TN) ซึ่งเป็นผู้ให้บริการอินเทอร์เน็ตรายใหญ่ที่สุดแห่งหนึ่งในสหรัฐอเมริกาได้ยืนยันถึงบทบาทของตนในการก่อให้เกิดความขัดข้องดังกล่าว โฆษกของ AT&T ยอมรับว่าการเชื่อมต่อกับบริการบางอย่างของ Microsoft บนเครือข่ายเกิดความขัดข้องชั่วคราว แต่ก็รับรองกับลูกค้าว่าปัญหาได้รับการแก้ไขอย่างรวดเร็ว
"เราประสบปัญหาการหยุดชะงักในการเชื่อมต่อกับบริการ Microsoft บางอย่างบนเครือข่ายของเรา ปัญหานี้ได้รับการแก้ไขแล้ว และการเชื่อมต่อก็ทำงานได้ตามปกติ" ตัวแทนของ AT&T กล่าว
ความร่วมมือระหว่าง Microsoft กับ ISP เช่น AT&T เน้นย้ำถึงความสัมพันธ์ที่ซับซ้อนระหว่างบริษัทเทคโนโลยีรายใหญ่และพันธมิตรด้านโครงสร้างพื้นฐาน เนื่องจากภูมิทัศน์ดิจิทัลยังคงเติบโตอย่างต่อเนื่อง ความร่วมมือเหล่านี้จึงมีความสำคัญอย่างยิ่งในการส่งมอบบริการคลาวด์ที่ราบรื่นให้กับผู้ใช้หลายล้านคน อย่างไรก็ตาม ความร่วมมือเหล่านี้ยังก่อให้เกิดจุดอ่อนอีกด้วย ดังจะเห็นได้จากเหตุขัดข้องครั้งนี้ ซึ่งการเปลี่ยนแปลงที่เกิดขึ้นจาก ISP อาจส่งผลกระทบโดยตรงต่อการทำงานของบริการคลาวด์ เช่น Microsoft 365
ปฏิกิริยาของลูกค้าและรายงานเครื่องตรวจจับดาวน์
Downdetector ซึ่งรวบรวมรายงานที่ผู้ใช้ส่งมาและแหล่งข้อมูลอื่นๆ เพื่อตรวจสอบการหยุดให้บริการมีบทบาทสำคัญในการติดตามขนาดของการหยุดชะงัก ในช่วงที่ประสบความสำเร็จสูงสุด แพลตฟอร์มนี้บันทึกรายงานมากกว่า 90,000 รายงานสำหรับบริการต่างๆ ของ Microsoft รวมถึง Azure, Teams, Xbox, Bing และ Microsoft Store ผู้ใช้แสดงความหงุดหงิดของตนเองทางออนไลน์ โดยหลายคนแสดงความกังวลเกี่ยวกับความถี่ของการหยุดให้บริการที่ส่งผลกระทบต่อบริการบนคลาวด์
ผู้ใช้บางรายยังแสดงความกังวลเกี่ยวกับผลกระทบที่กว้างขึ้นของการหยุดชะงักดังกล่าว โดยเฉพาะอย่างยิ่งสำหรับองค์กรที่ต้องพึ่งพาการเข้าถึงเครื่องมือ Microsoft 365 อย่างต่อเนื่องสำหรับการดำเนินการที่สำคัญ การหยุดชะงักดังกล่าวเน้นย้ำถึงความสำคัญของการวางแผนฉุกเฉินและกลยุทธ์การสำรองข้อมูลสำหรับบริษัทที่ต้องพึ่งพาแพลตฟอร์มบนคลาวด์เป็นอย่างมาก
ในช่วงสายๆ Downdetector รายงานว่าจำนวนรายงานเหตุขัดข้องลดลงอย่างมาก ซึ่งบ่งชี้ว่าผู้ใช้ส่วนใหญ่กลับมาใช้งานได้ตามปกติแล้ว เมื่อเวลา 10 น. ตามเวลา ET จำนวนรายงานเหตุขัดข้องลดลงเหลือประมาณ 28 รายงาน จากเดิมที่มีหลายหมื่นรายงานในช่วงเช้าของวันเดียวกัน การลดลงอย่างรวดเร็วของจำนวนรายงานนี้สะท้อนให้เห็นถึงการแก้ไขปัญหาขัดข้องและฟื้นฟูบริการให้กลับมาเป็นปกติได้สำเร็จ
แม้ว่าการหยุดให้บริการของ Microsoft 12 เมื่อวันที่ 2024 กันยายน 365 จะเป็นเพียงช่วงสั้นๆ แต่ก็ถือเป็นการเตือนใจถึงความซับซ้อนและช่องโหว่ที่มักเกิดขึ้นในการให้บริการบนคลาวด์ เหตุการณ์ดังกล่าวซึ่งเกิดจากการเปลี่ยนแปลงสภาพแวดล้อมที่จัดการโดย ISP ได้ก่อให้เกิดการหยุดชะงักแก่ผู้ใช้หลายพันคนก่อนที่จะได้รับการบรรเทาผลกระทบอย่างรวดเร็ว การตอบสนองอย่างรวดเร็วของ Microsoft ร่วมกับความร่วมมือของ ISP ทำให้มั่นใจได้ว่าบริการต่างๆ จะได้รับการคืนค่าภายในไม่กี่ชั่วโมง
เนื่องจากความพึ่งพาแพลตฟอร์มบนคลาวด์ยังคงเพิ่มขึ้นอย่างต่อเนื่อง ความสำคัญของโครงสร้างพื้นฐานที่แข็งแกร่งและแผนฉุกเฉินเพื่อป้องกันและบรรเทาปัญหาการหยุดชะงักก็เพิ่มขึ้นเช่นกัน แม้ว่า Microsoft จะแก้ไขปัญหานี้ได้อย่างรวดเร็ว แต่เหตุการณ์นี้เน้นย้ำถึงความจำเป็นในการทำงานร่วมกันอย่างต่อเนื่องระหว่างบริษัทเทคโนโลยีและพันธมิตรภายนอกเพื่อลดการหยุดชะงักและรับรองการให้บริการที่ราบรื่น
กระทู้ยอดนิยม
-
-
OpenAI เปิดตัวโมเดล AI ใหม่ “o1” พร้อมความสามารถในการใช้เหตุผลขั้นสูง• เข้าชม 1,876 ครั้ง
-
Meta เปิดตัว Orion: อนาคตของแว่นตาเสมือนจริง• เข้าชม 1,859 ครั้ง
-
หุ้น Micron พุ่งสูงขึ้นเนื่องจากความต้องการ AI ส่งผลให้คาดการณ์ไตรมาส 1 ได้ดี• เข้าชม 1,859 ครั้ง
-