スプリント中の障害や割り込みはどう管理すればいいでしょうか?
スクラムの価値基準は、透明性、検査、適応です。 これを踏まえて考えると、障害や割り込みが起こったことをスクラムチーム全員が知っている状態であることが望ましいです。
例えば、開発者が障害や割り込みを受けて、プロダクトオーナーに知らせることなく対処している場合、最終的にスプリントゴールの達成があやうくなった時点で初めてプロダクトオーナーがその事実を知ることになります。 その時点でなんとかスプリントゴールを達成する別の方法が見つかって、スプリントゴールを達成できればよいですが、スプリントゴールを達成できなかった場合、プロダクトオーナーとしては今後の作戦が影響を受けてしまいます。
一方で、障害や割り込みを分析してみると、なかにはそのスプリント中に急いで対応しなくてもよいものが含まれていることは多々あります。バグだからといって軽微であればすぐに直す必要はありませんし、偉い人からの問い合わせだからといって次のスプリントまで待てないわけではないのです(もちろん本番環境の障害で影響が大きいならすぐに対象するでしょうが)。
したがってお勧めのアプローチは次のようになります。
障害や割り込みが来た時点で、プロダクトオーナーと相談する。対処するかどうかはプロダクトオーナーが最終判断する(もちろん判断できるだけの情報を開発者は提供しなければいけません)。このとき対処のためにプロダクトバックログアイテムを追加することもある
別のアプローチとして、定常的に軽微な運用対応や割り込みがあって、おおよそ対応の要否の見当がつくような場合は、以下のようなやり方もあります。
あらかじめ障害や割り込みが起こることを前提として、一定のキャパシティ(例えば10%の時間)を確保しておき、それを考慮した計画を立てる。レトロスペクティブなどで改善を行う(根本原因を見つけて対処する)ために、いつどんなことが起こったのかは記録しておくこともある