クラウド環境におけるTCO削減と安定稼動の実現
TIS株式会社 上野 仁 氏
IT基盤サービスメニュー 「IT@VSOP」
弊社ではIT@VSOP(Valuable Services for Outsourcing Practices)というサービスを提供しております。これは、弊社が提供するIT基盤サービスメニューの総称です。これまで弊社が培ってきた基盤構築・運用構築のノウハウを集約して、サービスとして提供するものです。
昨今では、増え続けるIT資産、運用の複雑化、リスク・法制度への対応によるIT管理コストの増加が、情報システムの大きな課題になってきています。そこで、ITインフラの最適化によるTCO削減が急務になります。
ITインフラを最適化するためには、目指すべき状態の定義とその実現手段の計画を立て、設計・構築し、運用、評価まで一連の流れで検討することが必要です。IT@VSOPは計画から評価までの、どのフェーズからでも適用することが可能です。
IT@VSOPには各フェーズで適用できるサービスを用意しておりますが、性能管理を支援するサービスはES/1を使って提供しています。
ES/1採用の経緯
2009年のIT基盤サービス事業部立ち上げに際し、TISのノウハウを活かせるメニューを検討していました。その際に、汎用機運用で活用していたES/1のオープン版であるES/1 NEO CSシリーズが候補に挙がりました。
そして、導入実績、性能管理に特化した独自性、ノウハウ共有とIIM社のサポート協力の相乗効果、VMware対応がTISの戦略とマッチしたことがポイントとなり、ES/1 NEO CSシリーズを使って運用管理サービスを展開することに決定しました。
ES/1による仮想環境の可視化
あるお客様へ提供した運用管理サービスの事例を紹介いたします。ES/1導入前は、vCenterでの過去データの蓄積が不十分である、レポーティング機能が詳しい人でなければ十分に扱えないといった課題がありました。
しかし、ES/1導入後はレポートが自動で出力されるようになりました。さらに、日本語での分析結果も出力されるため、何がポイントなのか誰でもわかる状態になりました。
また、ES/1導入によりノウハウ共有、技術力の底上げもできました。具体的には、IIM社が開催しているパフォーマンス管理セミナーに参加することで、キャパシティプランニングのスキルを底上げすることができました。
また、ツール自体にもノウハウが詰まっているので、ES/1のアウトプットを見ることでもキャパシティプランニングの情報を得ることができます。
セミナーとツールを活用することにより、サービスを提供する側だけでなく、ユーザ側でも効率的にキャパシティプランニングの運用ができる人材を育成することができます。
ES/1による仮想環境の最適化
ES/1は、サイジング評価と今後の見通しにも活用することができました。
あるお客様に導入したシステムをサイジングした際に、socketやVMkernelのオーバーヘッドを考慮した設計を行いました。3GHzQuad core×2socketのCPUを搭載した、合計24GHzのESX Serverです。当初は13.50GHzでCPU使用率が100%に達すると想定していました。
しかし、ES/1のグラフを使って考察してみると、オーバーヘッドはほとんど確認されず、当初の設計より余裕があることがわかりました。今後の集約率向上を検討するきっかけになりました。
データセンターのご紹介
TCO削減のための選択肢として、2011年4月に御殿山で次世代データセンターを開業いたします。拡張性のある設備・利便性の高い立地だけではなく、環境技術の導入や社会貢献活動に積極的に取り組んでいることが特長です。
他にもデータセンターを運営しており、事業継続やグローバル対応といった面でお力添えできればと考えております。
仮想化サーバにおけるES/1 NEO CSシリーズ活用事例
北電情報システムサービス株式会社 森原 匠 氏
仮想化サーバの導入
北陸電力では、コスト削減を目的に仮想化サーバの導入を行いました。始めに2008年4月から10月の期間で、調査・検討を実施しました。次に2009年6月から8月の期間で、要件定義から設計、構築、テストなどを経て、2009年8月に運用を開始しております。
仮想化の対象は、Windows・LinuxのWebサーバ、APサーバです。本番サーバ4台に17ゲストOS、開発サーバ1台に7ゲストOSが稼動しています。
ES/1 NEO導入の背景と経緯
仮想化サーバは、ハードウェア資源を複数のゲストOSで使用するため、物理サーバ以上に慎重なリソース管理が必要になります。そこで、以下の要件を満たすツールを調査しました。
・仮想化サーバ群のリソース使用状況が一元的に把握可能なもの
・一括してレポート出力が可能なもの
・将来、ゲストOSの稼動数が増加し、リソース使用状況が過密化した場合、
仮想サーバ間でのゲストOS再配置の判断材料となるもの
上記の要件を満たし、弊社でメインフレームとSAPシステムで活用実績があることから、ES/1 NEOを採用することにしました。
ES/1 NEOを用いた月例報告書の作成
北陸電力向けに、各仮想化サーバのリソース使用状況が確認できるグラフ(以下の4種類)を貼り付けて、月例報告書を作成しています。
・ゲストOSごとのプロセッサ使用率
・ゲストOSごとのメモリ使用率
・仮想化サーバ(ホスト)のディスク使用率
・仮想化サーバ(ホスト)の物理アダプタごとのネットワーク使用率
グラフは24時間分、各月の1日・10日・20日の3日分としています。従いまして、グラフの枚数は48枚(グラフ4種類×3日分×本番サーバ4台)となります。
以前は、ES/1 NEOで自動作成されたグラフを手作業で貼り付けていましたが、作成工数がかかることと、グラフの貼り間違えが発生することが問題となっていました。そこで、現在はCS-REPORTを活用し、グラフ貼り付け作業を自動化しています。
さらに、PWS(Performance Web Service)の活用により、自席からサーバの稼動状況を確認できます。また、仮想化サーバ管理者は仮想化サーバのグラフのみ閲覧可能、SAP管理者・開発者はSAPのグラフのみ閲覧可能といったID別の権限設定も行っています。
ES/1 NEO CS-VMware導入効果
ES/1 NEO CS-VMwareの導入により、以下のような効果がありました。
・リソース使用状況の明確化
・ゲストOS不具合時の原因究明
・リソースデータの情報共有
・月例報告書の作成工数の短縮
・月例報告書の作成誤り防止
今後のES/1 NEO CS-VMware活用
今後は、リソース負荷の分散化とPWS閲覧範囲の拡大という点で、ES/1 NEOをさらに活用していきたいと考えています。
具体的には、ゲストOSが増加した場合に、ゲストOSの再配置を実施してリソース負荷の分散を行う、また各ゲストOSの管理担当者および主管箇所による、PWSグラフ閲覧を可能にするということです。
FIT-iDC(データセンター)のご紹介
2011年5月よりデータセンター事業を拡大し、北陸電力グループのシステム運用で培った高い技術力と堅牢なファシリティにより、24時間365日、高い安全性と信頼性を確保したサービスを提供します。
富山県という優れた立地環境は、システム運用のアウトソーシングおよびバックアップサイトとして最適です。それ以外にも、環境への配慮、選べるネットワーク、高信頼のファシリティが特長です。
グループ・キャッピングによるコスト削減への取り組み
T&D情報システム株式会社 若山 博和 氏
IBMメインフレームのソフトウェア使用料金の抑制は、コスト削減という観点において大きな課題です。近年CPUの使用量は増加傾向にあり、ソフトウェア使用料金は増え続けています。当社ではこの課題対応への取り組みとして、グループ・キャッピングを活用したキャパシティ制限を実施し、約2400万円のコスト削減効果を得ることができました。
背景・経緯
当社のソフトウェア課金体系は、平成17年度よりWLCを採用しています。当初、営業職員の成績に繋がるオンラインピーク時間帯を基準にCPU能力を設計しましたが、実際には月1回程度の特異日に高負荷の非クリティカル・バッチの稼動時間帯がWLCの課金対象となり、目的と実態のアンマッチが発生していました。
そこで、このアンマッチを解消し、適切なWLC課金によるコスト削減を目標に、グループ・キャッピングを活用したキャパシティ制限を計画しました。
キャパシティ制限の計画
当社環境のIBMメインフレームはCPU1号機(z9)、CPU2号機(z990)の2台構成であり、z/OSは7区画存在します。グループ・キャッピングは、適用するCPUモデルがz9以上、およびz/OS V1.8以上との制限がありますが、この条件はCPU1号機しか満たしていないため、CPU2号機についてはCF区画を利用したハードウェア・キャッピングを実施しました。
グループ・キャッピングは、複数区画をグループ化し、グループ内で合計された4時間平均MSU値に対して制限を掛けます。4時間平均のMSU値が制限値に達した場合、その後のCPU使用を制限し、課金されるMSU値が制限値を超えないように制御します。当社のピーク時間帯は4時間以内に終了するため、制限を掛けた状態でもフルキャパシティに近いCPUを使用することが可能となります。
一方、CF区画を利用したハードウェア・キャッピングはCF区画以外の能力を複数区画でシェアできるため、区画ごとに制限が掛かるIBM提供のイニシャル・キャッピングと比べ、CPU能力を有効活用することができました。
キャパシティ制限の適用
年間約1000万円の削減を目標とし、現在までのMSU実績値とソフトウェア使用料金の比率から、当社にて制限値を概算したところ、MSU値1割削減で目標達成が見込まれました。
さらに、IIM社へ本番業務に影響がでない限界まで低減した際の制限値の見積りを依頼し、この見積り値に余裕を持たせた形で制限値の適用を実施しました。
コスト削減効果
IBM社へMSU値を1割削減した場合の削減金額の試算を依頼したところ、年間約1700万円削減可能との結果でしたが、実績としては適用後1年間で約2400万円の削減に成功しています。
今後の展望
CPU1号機については、IIM社の評価サポートを利用し、さらなる制限値の引き下げを検討しています。CPU2号機については、最近マシン更改が完了したため、2011年にグループ・キャッピングの適用を予定しています。
また、グループ・キャッピングのメリットの1つである簡易なオペレーションによる制限値の変更、解除を活用して、半期ごとの業務ピーク月への対応を検討予定です。
【COMPUS事務局より補足】
CPU2号機については、2010年12月にマシン更改(z10)を完了し、2011年1月にグループ・キャッピングの適用を実施することで、更なるコスト削減に成功されました。
富士通メインフレームにおけるパフォーマンス改善への取り組み
株式会社あいおい保険システムズ 矢島 勝人 氏
会社概要
当社は、2010年10月に合併したあいおいニッセイ同和損害保険株式会社の100%出資の子会社です。
損害保険・生命保険システムをコア事業として、コンピュータソフトウェアの開発、保守および販売、コンピュータシステムの管理運営、コンピュータシステムに関連する文書・帳票・その他の印刷製本および発送業務を行っています。
富士通メインフレームのパフォーマンス改善に向けた当社の取り組みの成果と事例を紹介いたします。
事例:代理店オンラインのレスポンス改善
背景:2003年の合併によるデータ量の増加に伴い、CPU使用率が増加し、代理店システムのオンライン
のタイムアウトが発生していました。
対策:PDLサンプリング間隔の見直しや業務アプリの改修により、オンラインレスポンスが改善し、コスト
をかけずにCPU使用率を低減しました。
事例:ジョブ数によらない総実行時間の増加
背景:2008年3月以降、ジョブの総実行時間が増加していました。処理件数はほとんど違わないにもか
かわらず、時間帯や曜日によって極端に実行時間が違うジョブが存在しました。
原因:SDMパラメータが20年前に設定されたままになっており、ハードの性能に見合う最適値から乖離
した状態でした。そのため、同じパフォーマンスグループの多くのジョブがI/Oバウンドと見なされて
、一部のCPUバウンドジョブにCPUがディスパッチされない状態になっていました。
対策:SDMパラメータをメーカ推奨値に変更しました。これにより、同じパフォーマンスグループのジョブ
はすべてCPUバウンドジョブとなりました。その結果、CPUが均等にディスパッチされて、特定のジ
ョブが大幅に遅れることがなくなりました。
事例:メモリのサイジング
背景:2008年の代理店オンラインシステムの刷新により、オンラインジョブが増えて、それに伴いページ
イン回数が増加していました。
原因:オンラインアプリがメモリを使用すると、優先度の低いバッチジョブのメモリ使用が制限されて、バ
ッチジョブのページングが増加していました。
対策:オンラインアプリのメモリ使用率とページインの相関関係から、メモリ割り当ての不足分を算出し
ました。未割当のメモリを追加することで、ページイン回数を削減することができました。
事例:ページング激増の原因調査
背景:2010年10月のニッセイ同和損害保険との合併に向けて、CPUのCP数を2から4に増強しました。合
併前には増強分を使わず、全体のCPU能力は増強前と同等にしたところ、ページイン回数が激増
しました。
原因:割り当てのCPU能力は変化ありませんが、CP数の増加により多重度が高まり、CPU待ちが解消さ
れました。その結果、アクティブなアドレス空間が増えて、メモリの競合が高まり、ページインが増
加しました。
対策:近年はディスクの性能が向上しており、ページイン発生回数が増加しても業務への影響が見られ
ませんでした。そのため、ページイン回数の閾値を見直し、メーカの見解をもとに閾値を400回/
秒、警告値を200回/秒と定めました。ニッセイ同和損害保険との合併に向けて、CPUとメモリの
増強、ストレージの入れ替え、リソース使用状況の比較を実施してまいりました。
この結果、適切なリソースの増強により、システム統合後も安定した稼動状況を維持しています。
今回の合併統合に、IIM社の性能評価を十分に利用することにより、工数を削減することができました。
今後さらなる業務増加が見込まれるため、IIM社のサポートを利用しながら、引き続きピーク日稼動状況の比較確認を実施していきたいと考えております。 |