Internet Week 2016 レポート(その3)「シン・インフラ監視戦略~品質低下を見逃すな~」

こんにちは、さくらインターネット クラウドチームの大喜多です。

2016年11月29日~12月2日の間、Internet Week 2016が開催されました。本記事では12月1日に行われたセッション「シン・インフラ監視戦略~品質低下を見逃すな~」をレポート致します。

見えないモノを見ようとしてSNMP MIBを覗き込んだ

グリー株式会社 北内薫氏より、モバイル向けゲームプラットフォームのインフラ運用者としての視点から、 モニタリングの重要性についての説明がありました。

まずはじめに「ゲーム事業者における品質」について定義。

品質はお客様の環境により異なり、必ずしも自社のインフラがボトルネックになるとは限らないとしつつも、事業者として自社のインフラの品質管理するためにモニタリングが重要であることを強調されていました。


このあと同社のモニタリングにおける方針と、実際にモニタリングに使用しているツールの紹介があり、「品質は相対的なものであり、状況や環境によって変化する。モニタリング環境を作って終わりではなく改善し続けること」が重要であるとして締めくくっておられました。

ゲームインフラの監視について

グリー株式会社 堀口真司氏より、障害に気づくための監視戦略についての説明がありました。

さまざまなプラットフォームのゲームインフラに携わってきた立場から、MMORPG・アーケードゲーム・ソーシャルゲーム・マルチプレイの4種類を例に挙げ、アプリの種類によってアーキテクチャや求められる品質が全く異なることを説明。

障害の定義と問題が起きる場所の説明のあと、早期発見や予防のために何が必要かの解説がなされました。


また対象によってPush型/Pull型を使い分けたり、複数の通知方法を適材適所で使っていくなど、具体的な手法についての解説もありました。

クラウドの監視について

さくらインターネット株式会社 山田泰史より、クラウド事業者における品質の定義と、品質低下を見逃さないためのチェックポイントについての説明がありました。

様々なコンポーネントから構成されているクラウドインフラにおいて、監視すべき部分、正しくあるべき状況が各々のポイントにあり、多岐にわたることを説明。

また、クラウドのインフラおよびエンジンを内製していることから、監視ツールもOSSをメインに使用しているとのこと。オペレーションミスが起きないようにするための具体的な工夫や、障害発生時の適切な対応フローについても触れられていました。

目標が報告と違う~MVNOのインフラを見つめて

株式会社インターネットイニシアティブ 堂前清隆氏より、MVNOのビジネスモデルおよびユーザー体験から、適切にサービスを提供するための監視のポイントについての説明がありました。

同氏はまず「MVNOのビジネスモデル」について説明。通信量ではなく接続点の通信帯域によって費用が決定すること、その上で適切な品質のサービスを提供し続けること、自社のサービスについて良い評判を維持することを監視の目的であるとされていました。

MVNOのトラフィックはピーク時と平常時の差が激しく、ピークに耐えうるインフラを常時維持しておくことは不可能であることから「最初から負け戦のインフラ」と定義し、「どこまで負けていても大丈夫か」という、他事業者にない独自の観点について紹介されました。

また、MVNOの品質は「自社で管理している部分だけを監視していても品質低下が発見できない」として、ユーザーと同じEnd-Endによる品質監視と、SNS/2ch等のインターネットにおける情報収集も重要であるとしていました。

質疑応答

その後登壇者と参加者の間で質疑応答が行われました。その中から主なものを以下にまとめました(以下敬称略)。

質問:
監視の閾値や、取得するパラメータを変更する場合、社内での手続きはどのようにしているか?

回答:
比較的簡単にできる(北内)
とはいえ、経営判断に委ねる必要があるところもある(堀口)
すぐ変更できるが変更した内容を共有しておく必要はある、変更しすぎて暴発ということもあるので気をつける(山田)

質問:
ツールの選定はどのような基準で行っているか?

回答:
個人の好みや、詳しい人が構築し、周囲に伝授していったりしている(北内)
IIJの創業期には他にISPが存在せず、ツールを自作していた(堂前)

まとめ

ゲーム事業者・クラウド事業者・MVNOといった、全く性質の異なるサービスを運営する3社によるサービス品質のセッションは会場からも好意的に受け取られ、活発な質疑応答が行われるなど、有益なセッションになったと感じられました。