エンジニア奮闘記】 | TAG:

5分でわかる「Google提唱のSREって結局こういうコト」

Webサイトのシステム運用や、サービス開発に伴うプログラムや各種機能改善などに携わったことがある方なら、「SRE」という言葉を耳にしたことがあるでしょう。

Site Reliability Engineeringは、Googleが提唱したサイト運用における考え方で、2015年から大企業のサイトを管理するエンジニアを中心に浸透していきました。

SREは、具体的なマニュアルや手法そのものではなく、PDCAサイクルのような概念と機能を言語化しているので、さまざまな解釈がなされています。

なかには、「SREとはどんな人?」などと、新たな職種のように伝えている記事もあり、「何となくイメージはあるんだけど、どうすればいいかわからない」と思っている人も多いのではないでしょうか。

pixta_63403989_S.jpg

SREがベースに置いているのは、「サービスレベル目標をもって、達成に向かうこと」「システム障害などのトラブルをネガティブに捉えず可視化し、履歴を残して改善を進めること」「本番環境におけるさまざまなトラブルを管理できる体制があること」。

めざす姿は、「サービスの価値・機能の向上」「信頼性の向上」「自動化などによる効率化・省力化」を並行して実現することです。

リライアビリティ、すなわちシステム運用体制における「信頼性」を担保するためには、ヒト・モノ・カネをコントロールできる組織と、運用に関する明確な手順やマニュアルがなければなりません。

新サービス・新機能のリリースやセットアップのプロセスが明文化され、トラブルが生じた際の対応方法について、共有・検証できてなければなりません。

2019年1月にGoogleが日本語訳を配信した「SREチームの評価に役立つレベル別チェックリスト」によると、ここまでが初級チームがクリアすべき条件です。

さらに上をめざすためには、SREチームが自らの実績や導入効果を計測・評価し、サービスレベルの目標をアップデートしていくことが求められます。

一般的には、機能が増えてシステムの規模が大きくなれば、運用は複雑化して手間がかかるようになり、トラブルが発生するリスクは高まります。

中級レベルのチームは、システムを統合的に管理し、自動化・省力化を行いながら、トラブル対応のプロセス整備や定期的なテストなどを実施できる体制を構築しなければなりません。

簡単にいえば、「初級チームよりもマネジメントのクオリティが高まっている状態」をめざすことになります。

bar_sankaku_blue

運用の効率が高まり、トラブルに対して迅速・的確に対応できるようになったチームは、「ビジネスへの貢献度UP」「多様なサービスを束ねて改善する手法の確立」「定期的かつ汎用性の高い業務や、トラブル対応のためのテスト等のさらなる自動化推進」を実現させる必要があります。

開発チームとの目標共有と連携や、信頼性担保と効率化を見据えた長期的なロードマップの設計は必須条件です。

Googleのレベルチェックリストを見ていると、「信頼性が高いエンジニアリング」を構築するためには、風通しのいい組織風土やフラットな業務評価、人間の都合に左右されない意志決定システムが重要です。

今の体制を見渡したとき、自分たちはどのレベルにいて、何が足りないと感じますか?最初の1歩は、現状と課題を適切に把握し、サービスレベル目標を明確にすることです。

エンジニア奮闘記 と同一カテゴリの記事

コミュニケーション上手に共通する7つの「〇〇」上手とは?

2020-08-20 06:00:57

5分でわかるITトレンド2020(1)金融編

2020-08-14 06:00:22

私の評価はどうなるの?テレワークで変わる人事評価「笑える話」「情けない話」

2020-08-06 06:20:08

私の評価はどうなるの?テレワークで変わる人事評価「楽しみな話」「前向きな話」

2020-08-05 06:00:25

令和に求められる「IT人材」のプロフィール③チャレンジ人材

2020-07-15 06:00:18

令和に求められる「IT人材」のプロフィール②満足度向上人材

2020-06-15 06:00:40

令和に求められる「IT人材」のプロフィール①最先端人材

2020-06-10 06:00:38

AI&IoTインフラの成長を支える 「アクセラレーテッドコンピューティング」に注目!

2020-05-25 06:00:06

テレワークでも怖くない!「Web会議コミュ障」から脱出する方法

2020-05-19 06:00:44

「モバイル」「クラウド」「コミュニケーション」 テレワークを効率化する「3種の神器」の最先端機能まとめ

2020-05-13 06:00:42

あのガートナージャパンが緊急リリース!「コロナウイルス対策でCIOがすぐに行動すべき16項目」【後編】

2020-05-08 06:00:11

あのガートナージャパンが緊急リリース!「コロナウイルス対策でCIOがすぐに行動すべき16項目」【前編】

2020-05-07 06:00:07

2020年にどこまで進化する?話題のテクノロジーの近未来予測~AI

2020-04-09 06:00:01

5Gでさらに増殖!「スマート〇〇選手権2020」【スマートインフラ編】

2020-04-08 06:00:08

5Gでさらに増殖!「スマート〇〇選手権2020」【スマートライフ編】

2020-04-07 06:03:33

音フェチ集まれ!ASMR勝手にランキング【ぞわぞわ編】

2020-04-06 06:00:28

気になるテーマから 発想力UP と同一カテゴリの記事

アフターコロナとソルクシーズ④ イー・アイ・ソルの未来予知

2020-09-14 09:00:04

アフターコロナとソルクシーズ③ いまイルモの未来

2020-09-11 06:00:00

アフターコロナとソルクシーズ② エクスモーションの挑戦

2020-09-09 06:00:07

アフターコロナとソルクシーズ① Fleekdriveを取り巻く環境

2020-09-07 06:00:56

テレワーク大好き派・つらい派、それぞれの言い分

2020-09-03 06:00:41

人事・研修担当者たちが語る「初めてのオンライン研修奮闘記」

2020-09-02 06:00:53

ソルクシーズが第2新卒を歓迎する理由!

2020-08-26 06:00:07

コミュニケーション上手に共通する7つの「〇〇」上手とは?

2020-08-20 06:00:57

5分でわかるITトレンド2020(1)金融編

2020-08-14 06:00:22

コロナ時代の新人研修 どっちがよかった?リモート研修と集合研修

2020-08-12 06:00:46

コロナ時代の新人研修…いかがでした?受講者側から結果発表!

2020-08-11 06:00:34

私の評価はどうなるの?テレワークで変わる人事評価「笑える話」「情けない話」

2020-08-06 06:20:08

私の評価はどうなるの?テレワークで変わる人事評価「楽しみな話」「前向きな話」

2020-08-05 06:00:25

テレワークで注目度UP!「ビジネスチャット」活用 現場の声

2020-07-20 06:00:23

令和に求められる「IT人材」のプロフィール③チャレンジ人材

2020-07-15 06:00:18

SE必見!IT現場で求められる「ドキュメンテーション」スキル

2020-07-14 06:00:40
ページTOPへ