Observability 分科会 【第一回】MeetUp開催しました!

Observability 分科会 第一回MeetUp開催しました!

SREの探求」という本が出版されました #seekingsre - YAMAGUCHI::weblogオブザーバビリティ(可観測性)がなぜ必要だと考えるのか - YAMAGUCHI::weblog

皆様、こんにちは。Observability分科会の岩田です。

今回初のObservability分科会でのMeetUpの開催というになりましたが、僭越ながら今回のBlog 担当を拝命しました。

よろしくお願いいたします。

この投稿では先日おこなわれたObservability 分科会 第一回MeetUpを振り返っていきたいと思います。

 

=================

4月5日に Observability 分科会がオンラインで開催されました。

今回は第一回ということもあり、GoogleのDeveloper Advocate山口さんから、

SREとは?Observabilityとは?

という点について、まず参加者の皆様にご説明いただきました。

 

システムの信頼性を保つ、その信頼性を測定する。ただし、信頼性を決めるのはユーザーだ!!

山口さんからSREとしての考え方として、一番肝になる信頼性の測定ついてお話いただきました。

ポイントとしては以下かなと思っております。

・信頼性を見える化しよう:SLI(Service Level Indicator: サービスレベル指標)とSLO(Service Level Objective: サービスレベル目標)

・SLIを決めるのに必要なことはCUJ(Critical User Journey: クリティカルユーザージャーニー)

・そうしていけば、コンポーネントごとの動き、トランザクションがわかってくる

・とはいえ、目標値を決める方程式はない、それは過去データから見ていこう

・SLOが決まれば、エラーバジェットも決まり、健全なシステム運用ができる

 

非常に丁寧にわかりやすく、私個人としてもよく理解できました。

難しくないか?どう始めれば良いのか?

SREってなんだろう - Speaker Deck

とはいえ、「明日から、君、SREとして頑張ってね」と言われても、できる自信がありません・・・。

ということで皆さんに感想を聞いてみました。

 

大日本印刷 宮本さん(ワクチン接種後)「最初の一歩の踏み出し方がわからんです」

いやー、いいですねー、私の心声を代弁していただいたようでした。

宮本さん自身は非常に良く勉強されており、SREを始めるノウハウをお持ちです。

とはいえ、まだまだ一般的ではないSRE、どう始めていき、どう拡めていくことができるか、そういった率直で素晴らしい疑問だったと思います。

 

経験からのディスカッション

非常に良いお題をいただいたので、本お題について皆さんでディスカッション、ご意見をいただきました。

以下簡単に纏めてみました。

 

Google 山口さん

パターン1:トップダウンで「そういうことやる!」とメッセージを出す。上層部の理解がある場合。

パターン2:限られた組織内だけでまずはやってみる、SLI、SLOを決めて、それに沿ってやってみる
その実績をもって上を説得していき、取り組みを広げようとする。

 

Splunk 大谷さん

SREの導入は実際に苦労することが多い。ビジネス上のメリデメを説明できることが大事。
障害による損失や機会損失が可視化しやすい状況であれば、上層部にも説得しやすくなり、導入しやすくなることもある。

 

New Relic 瀬戸島さん

エンプラでは開発、運用、ビジネスなどロールごとにお互い牽制し合っているパターンが多く、SRE導入が難しい。

SREをきっかけにワークショップなどをやり、すべてのチームが一緒になって議論する場を作るのが大事。

 

スクウェアエニクス 橋本さん

ビジネスを巻き込むことが大事。商習慣によってはSREの考え方が合わないことがある。

ユーザージャーニーは真面目に考えると30-40個とどんどん増える。

数を増やしたくなるのをグッと堪えてスモールスタートするのが良く、お金に関わるとこ及びユーザーの離脱に関わるところのような

ミッションクリティカルである方が、より効果は大きい。

 

Belong 福井さん

SLI/SLOの部分はどうやるかが難しい。
Operation で全体のエラー率はとれていても、ユーザージャーニーに関わる部分の指標を取るのが大変。
そのようなプラクティスやプロダクト側のサポートが増えると、活用も広がっていく。

 

Elastic 草間さん

B2B2Cの会社でSREの経験に基づけば、対クライアントではSLAで会話チーム内ではSLOで会話という意識が重要
SLIがどうビジネスに影響するかをLOBに説明を地道に行っていくことも重要

 

Iret 高橋さん

どこまで品質を追求すればよいか? の考え方が分かって良かった、どこに向き合うか、冷静になれる。
冷静に向き合うために、SLIの設計例などを学びつつ、データを取るとこからチャレンジしている。

まず試しにやってみる、というのも良いと考える。

今後に向けて

 

初回から、素晴らしい議論ができたのではないかと思っています。

最後に、この議論の次のアプローチとして、Google 中丸さんからこんなアドバイスがありました。

 

SLIにはいくつか分類があり、SLIのメニュー化がされています。

「目的に応じて」そこから選ぶと選びやすいかもしれませんね。

 

本日二回目の、いいですねー。次回の議論内容が決まりました。

目的に応じたSLIの設定と一歩目の踏み出し方。

Google 中丸さんにSLIメニューのご説明をいただき、今回のようなディスカッションをしていきたいと思います!

最新ポスト