62% kỹ sư trực sẵn sàng kiệt sức trong vòng 12 tháng (PagerDuty 2026). Đây không phải là vấn đề về con người. Đây là vấn đề về thiết kế kỹ thuật. Ba nguyên nhân cốt lõi mà mọi ca trực kiệt sức đều có: 1. Cảnh báo dựa trên triệu chứng thay vì nguyên nhân Tăng đột biến CPU, độ sâu hàng đợi, tỷ lệ yêu cầu – những thứ này đều không phải sự cố. Chúng đều đánh thức con người lúc 3 giờ sáng. 2. Sổ tay vận hành lỗi thời Cảnh báo kích hoạt. Sổ tay chỉ dẫn đến một dịch vụ đã đổi tên. Kỹ sư phải tự phân tích ngược hệ thống trong trạng thái adrenaline và không ngủ. 3. Ca trực đồng đều cho tải không đồng đều Cuối tuần là Super Bowl. Ngày thường là cuộc đua nước rút. Cùng một ca trực xử lý cả hai như nhau. Bốn giải pháp mà các đội xuất sắc triển khai: 1. Ngân sách lỗi Giới hạn công việc trực ngoài kế hoạch ở mức 25% mỗi tuần. Vượt mức này, công việc phát triển tính năng sẽ dừng lại. Google SRE đã viết hướng dẫn này. 2. Cảnh báo liên kết với SLO Nếu không liên quan đến vi phạm SLO có thể quan sát được bởi người dùng, thì đó là tiếng ồn. 23% thời gian trực là cảnh báo giả (Blameless 2026). 3. Sổ tay hoặc xóa Mỗi cảnh báo sản xuất phải đi kèm sổ tay cập nhật, nếu không thì xóa cảnh báo đó đi. Bạn sẽ mất một nửa số cảnh báo. Đó chính là mục đích. 4. Ca trực dựa trên tải Các khung giờ cao điểm cần sự hỗ trợ dày đặc hơn hoặc ca ngắn hơn. Cách tiếp cận “một kích cỡ phù hợp tất cả” sẽ trừng phạt người phải trực vào giờ cao điểm. Nếu bạn là người dẫn dắt kỹ thuật, thiết kế hệ thống trực là trách nhiệm của bạn. Không phải của HR. Không phải của EM. Của bạn. Tuần này: mở bảng điều khiển, đếm số cảnh báo, hỏi xem có bao nhiêu cảnh báo nên được nền tảng xử lý thay vì con người. #EngineeringLeadership #OnCall #SRE

Chia sẻ








Nguồn:Hiển thị bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.