کوینبیس کا پوسٹ مارٹم AWS کی کیسکیڈ فیلیور کے خطرات کو ظاہر کرتا ہے

icon MarsBit
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
کوینبیس کا 7 مئی، 2026 کے آؤٹیج پر پوسٹ مارٹم رپورٹ دکھاتا ہے کہ ایک منفرد دستیابی زون پر انحصار کے خطرات کیا ہیں، جس کے دوران 8 گھنٹے کی خلل کے دوران فیئر اینڈ گریڈ انڈیکس متاثر ہو سکتا ہے۔ ایک AWS ڈیٹا سینٹر میں کولنگ سسٹم کی خرابی کی وجہ سے EC2 اور EBS کے آؤٹیج ہوئے، جس کے نتیجے میں طارئہ اصلاحات کی ضرورت پڑی۔ انجینئرز نے ڈیٹا فلوز کو بحال کرنے کے لیے کافکا پارٹیشنز کو مینوئل طور پر منتقل کیا۔ کمپنی ایک تین-دستیابی زون والے کافکا سیٹ اپ کو اپنانے اور بحران کے وقت کے ریکوری ڈرلز کو بڑھانے کا منصوبہ بناتی ہے۔ آلٹ کوائن جو دیکھنے کے قابل ہیں، شاید بڑے مارکیٹ میں اس طرح کے سسٹمک خطرات کے رد عمل میں آئیں۔

مارس فنانس کی خبر کے مطابق، کوینبیس نے 7 مئی 2026 کو واقع ہونے والی بڑے پیمانے پر سروس کے خرابی کا جائزہ رپورٹ جاری کیا ہے۔ اس خرابی کا دور تقریباً 8 گھنٹے تک رہا، جبکہ مکمل بحالی میں تقریباً 12 گھنٹے لگے، جس دوران ٹریڈنگ، جمع کرانا، نکالنا اور زیادہ تر مرکزی سروسز دستیاب نہیں تھیں یا شدید طور پر متاثر ہوئیں۔ کوینبیس نے کہا کہ خرابی کا سبب AWS us-east-1 علاقے کے ایک دستیاب زون (use1-az4) کے ڈیٹا سنٹر میں کولنگ سسٹم کے متعدد ریفریجریٹرز ایک ساتھ خراب ہو جانے کی وجہ سے ہوا، جس نے کابینوں کے حرارتی حفاظتی بند ہونے کا باعث بنایا، جس کے نتیجے میں EC2 ادارے اور EBS والومز آف لائن ہو گئے اور متعدد انٹرنیٹ سروسز متاثر ہوئیں۔ بحالی کے دوران، کوینبیس کا ٹریڈنگ میچنگ انجن جو AWS ڈیٹا سنٹر میں منفرد کلัสٹر آرکٹیکچر پر مبنی تھا، اس نے زیادہ تر نوڈز کھو دیے اور quorum کھو دیا، جس کے نتیجے میں اسے فوری طور پر کوڈ میں تبدیلیاں کرنی پڑیں اور نئے نوڈ گروپس بنانے کے بعد ہی سسٹم دوبارہ شروع کرنے پڑے، اور بحالی کے دوران مارکٹ ٹریڈنگ تدریجی طور پر دوبارہ شروع کی گئی۔ علاوہ ازیں، AWS پر مبنی Kafka (MSK) سروس کے کنٹرول پلین میں خرابی آئی، جس کے نتیجے میں پارٹیشن ماسٹرز خودکار طور پر دوبارہ الیکشن نہ ہو سکے، جس سے قوت، فees اور کچھ سیٹلمنٹ اور ڈیٹا فلو سسٹمز بلاک ہو گئے، جس سے مجموعی اثرات وسعت حاصل کر گئے۔ کوینبیس اور AWS انجینئرنگ ٹیم نے مل کر مینوال پارٹیشن مائگریشن کی، جس کے بعد سسٹم تدریجی طور پر نارمل ہوا۔ کوینبیس نے کہا کہ اس واقعہ نے ان کی跨可用区 آٹوماتک فلوبک اور مینجڈ مڈل ویر کے ردعمل میں کمزوریوں کو ظاہر کر دیا۔ کمپنی跨 رجائنل ہارم بیک اپ آرکٹیکچر کو اپ گرید کرے گی، منظم فائل ٹرائلز کو مضبوط بنائے گی، اور Kafka سسٹم کو دو可用区 سے تین可用区 پر منتقل کر دے گی، ساتھ ہی AWS کے ساتھ مل کر بنیادی وجوہات کو درست کرنے اور بہتر بنانے پر عمل درآمد کرے گی۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔