#Conference [[📒開発生産性Conference 2024]] ## 📝MEMO ### [[🗃️開発生産性]]が高い状態? - リリースしたあとに障害なく、安定稼働していること - [[🗃️DevOps]]のサイクルがちゃんと回っている ### [[🗃️DevOps]]のサイクルを正常化するアプローチ - リリース後に障害が発生している - 稼働状況を見ながら品質向上に取り組み障害を減らす - 障害が発生した場合はすぐに気付ける - [[🗃️オブザーバビリティー]] ### DMMの事例 - [[🗃️NewRelic]]を活用 - アプリケーションの細かな動き - Logsの活用 - 踏み台サーバーの運用、複数人での確認をしなくてよくなくなる - ダッシュボードの活用 - 朝会でダッシュボードを確認して、日々の異変に気付けるようにする - 意思決定ができる人も朝会で同席してもらっているので、すぐに対応できる - 導入当初は隔週で、「監視ツールを眺める会」を行った - AWS料金も可視化することで、いとしないコスト増加にも対応できるようにした - ダッシュボード - 日々のエラー率 - 過去からの相対的な増加率 - 日々のエラー数Top20を表示 - デプロイメントマーカーを活用して、デプロイ前後の状況変化に気づけるようにした - [[🗃️NewRelic]]のアラートメッセージにRunbook(手順書)のリンクを付与することでアラート発生時に迅速に対応できるようにしている - 初動でなにをすればいいのか?という心理的な不安も軽減された - 想定していた効果 - ツールの集約や設定のセルフコントロールなどによる運用の最適化 - 副次効果 - 変化に気づけるようになった - 速やかな初動対応ができる - より開発ができるようになった - 障害件数の大幅な減少 - 障害の未然防止や、開発品質の向上などが障害件数削減につながった - 今後の展望 - SLOを土に有していく取り組みを進めている