Observability 分科会 【第一回】MeetUp開催しました!
Observability 分科会 第一回MeetUp開催しました!
皆様、こんにちは。Observability分科会の岩田です。
今回初のObservability分科会でのMeetUpの開催というになりましたが、僭越ながら今回のBlog 担当を拝命しました。
よろしくお願いいたします。
この投稿では先日おこなわれたObservability 分科会 第一回MeetUpを振り返っていきたいと思います。
=================
4月5日に Observability 分科会がオンラインで開催されました。
今回は第一回ということもあり、GoogleのDeveloper Advocate山口さんから、
SREとは?Observabilityとは?
という点について、まず参加者の皆様にご説明いただきました。
システムの信頼性を保つ、その信頼性を測定する。ただし、信頼性を決めるのはユーザーだ!!
山口さんからSREとしての考え方として、一番肝になる信頼性の測定ついてお話いただきました。
ポイントとしては以下かなと思っております。
・信頼性を見える化しよう:SLI(Service Level Indicator: サービスレベル指標)とSLO(Service Level Objective: サービスレベル目標)
・SLIを決めるのに必要なことはCUJ(Critical User Journey: クリティカルユーザージャーニー)
・そうしていけば、コンポーネントごとの動き、トランザクションがわかってくる
・とはいえ、目標値を決める方程式はない、それは過去データから見ていこう
・SLOが決まれば、エラーバジェットも決まり、健全なシステム運用ができる
非常に丁寧にわかりやすく、私個人としてもよく理解できました。
難しくないか?どう始めれば良いのか?
とはいえ、「明日から、君、SREとして頑張ってね」と言われても、できる自信がありません・・・。
ということで皆さんに感想を聞いてみました。
大日本印刷 宮本さん(ワクチン接種後)「最初の一歩の踏み出し方がわからんです」
いやー、いいですねー、私の心声を代弁していただいたようでした。
宮本さん自身は非常に良く勉強されており、SREを始めるノウハウをお持ちです。
とはいえ、まだまだ一般的ではないSRE、どう始めていき、どう拡めていくことができるか、そういった率直で素晴らしい疑問だったと思います。
経験からのディスカッション
非常に良いお題をいただいたので、本お題について皆さんでディスカッション、ご意見をいただきました。
以下簡単に纏めてみました。
Google 山口さん
パターン1:トップダウンで「そういうことやる!」とメッセージを出す。上層部の理解がある場合。
パターン2:限られた組織内だけでまずはやってみる、SLI、SLOを決めて、それに沿ってやってみる
その実績をもって上を説得していき、取り組みを広げようとする。
Splunk 大谷さん
SREの導入は実際に苦労することが多い。ビジネス上のメリデメを説明できることが大事。
障害による損失や機会損失が可視化しやすい状況であれば、上層部にも説得しやすくなり、導入しやすくなることもある。
New Relic 瀬戸島さん
エンプラでは開発、運用、ビジネスなどロールごとにお互い牽制し合っているパターンが多く、SRE導入が難しい。
SREをきっかけにワークショップなどをやり、すべてのチームが一緒になって議論する場を作るのが大事。
スクウェアエニクス 橋本さん
ビジネスを巻き込むことが大事。商習慣によってはSREの考え方が合わないことがある。
ユーザージャーニーは真面目に考えると30-40個とどんどん増える。
数を増やしたくなるのをグッと堪えてスモールスタートするのが良く、お金に関わるとこ及びユーザーの離脱に関わるところのような
ミッションクリティカルである方が、より効果は大きい。
Belong 福井さん
SLI/SLOの部分はどうやるかが難しい。
Operation で全体のエラー率はとれていても、ユーザージャーニーに関わる部分の指標を取るのが大変。
そのようなプラクティスやプロダクト側のサポートが増えると、活用も広がっていく。
Elastic 草間さん
B2B2Cの会社でSREの経験に基づけば、対クライアントではSLAで会話チーム内ではSLOで会話という意識が重要
SLIがどうビジネスに影響するかをLOBに説明を地道に行っていくことも重要
Iret 高橋さん
どこまで品質を追求すればよいか? の考え方が分かって良かった、どこに向き合うか、冷静になれる。
冷静に向き合うために、SLIの設計例などを学びつつ、データを取るとこからチャレンジしている。
まず試しにやってみる、というのも良いと考える。
今後に向けて
初回から、素晴らしい議論ができたのではないかと思っています。
最後に、この議論の次のアプローチとして、Google 中丸さんからこんなアドバイスがありました。
SLIにはいくつか分類があり、SLIのメニュー化がされています。
「目的に応じて」そこから選ぶと選びやすいかもしれませんね。
本日二回目の、いいですねー。次回の議論内容が決まりました。
目的に応じたSLIの設定と一歩目の踏み出し方。
Google 中丸さんにSLIメニューのご説明をいただき、今回のようなディスカッションをしていきたいと思います!