generated at
DevOps の第 3 の道 : 継続的な学習と実験の原則
個人がコンスタントに知識を生み出し、チーム組織の知識に転化していくこと
Westrum 博士による 3 種の組織文化のモデルでいうところの、発生的な文化が重要
例えば、非難なしのポストモーテム (事後検証)
日常的な改善
ローカルな発見をグローバルに転化
日常業務の中で回復力を鍛える
リーダーが学習する文化を奨励する
非常に高い目標をはっきりと掲げる

5 部 第 3 の道 : 継続的な学習と実験の技術的実践
19 章 日常業務での学習の実現と日常業務への学習の注入
複雑系 (本書では複雑なシステムと書かれている) の中での仕事では、予期せぬ事故が起こりうる
安全に仕事を進めるために、自己診断自己改善の能力を引き上げる必要
誤りから再発防止策を導くダイナミックな学習システムの形成
Steven Spear 博士が、「問題の発見・解決の能力に優れ、解決策を組織全体で使えるようにして効果を倍加させられる」 自己回復力を持つ組織、と呼んでいるもの
例 : Netflix
AWS のアベイラビリティゾーンが全て落ちても実行し続けられるようにするという目標
緩やかに品質を落とす (CPU 使用率のスパイク時にはキャッシュを活用して CPU 利用率を落とす、など)
Chaos Monkey により自発的にエラーを起こして回復力を向上
20 章 一部門の発見を全社的な進歩につなげる
標準やプロセスは組織として得た知識の総和
それらは Word 文書などではなく再利用しやすい実行可能な形式にすべき
組織全体でひとつの共有ソースコードリポジトリ
Google の例
ドキュメントとしての自動テスト
非機能要件を体系化して、運用に優しい設計を実現
遠隔測定データ依存関係、回復力が高くて障害時に速やかにダウングレードできる、互換性、ログとその検索、ユーザーからのリクエストのトレース、機能フラグなどによる実行時設定
完全な自動化ができない運用作業は、できる限り決定論的に正確に繰り返せるように
できる限り標準化、自動化し、文書にまとめる
21 章 組織的な学習と改善を生み出すための時間を確保する
日常業務の改善をする
実践を広めるために社内にコンサルティングコーチングの組織を作る