AIOpsとは?活用の背景や導入メリットを紹介
- AIOps

近年、DX推進やデジタル化に向けた取り組みが進む一方で、デジタル人材は社会全体において不足しています。限られた人的リソースを最大限に活用するには、IT部門の業務もITツールによる自動化・効率化が欠かせません。本記事では、AIに基づいてITリソースの管理運用を自動化する方法「AIOps」について詳細に解説します。
AIOps(エーアイオプス)とは何か
「AIOps」とは、AI(人工知能)を活用したIT運用管理の方法です。正式名称は「Artificial Intelligence for IT Operations(IT運用のためのAI)」で、「エーアイオプス」と読みます。この概念は、2016年頃にアメリカの調査会社である「Gartner(ガートナー)社」が初めて提唱しました。
AIOpsは、“ビッグデータ”と“AIの機械学習機能”を組み合わせた仕組みで、運用ワークフローの自動化・効率化を実現します。機械学習は簡単に言えば、過去の経験を活かす人間の学習能力を疑似的に再現することで、AIの知的能力を向上させる技術です。この機械学習により、AIは利用されればされるほど、積み重なったその能力が向上する特性を発揮します。こうした特徴をもつAIOpsは、例えば以下のような用途での活用が望ましいです。
【データの収集・分析などの自動化】
さまざまなデータソースからの情報を自動で収集・分析し、そこから得たインサイトを管理者に提供します。この自動化プロセスによって、IT部門における業務負担の大幅な軽減が可能です。
【ITリソースのパフォーマンス監視・分析】
サーバーのメモリやCPUの使用量、各アプリケーションの利用状況、ネットワークの速度など、組織内のITリソースの情報を監視・分析し、そのパフォーマンスを可視化します。
【異常検知】
過去のインシデントに関するイベントデータのパターンなどから、組織内のITリソースに対する潜在的な脅威を特定し、管理者に警告します。
【問題への自動対応】
インシデントの種類によっては、人間の手を介すことなく、自動で問題解決に導きます。人間による手作業が必要な場合でも、トラブルの原因や修復方法、対応の優先順位などの情報を提示してくれるので、トラブル対応を効率的に進められます。
このようにAIOpsでは、従来なら手作業で行われていたIT運用に、AIによる自動化・効率化を取り入れます。これによりIT運用チームは、業務負担が軽減され、コア業務や既存課題の解決業務へ注力しやすくなるメリットも得られます。
AIOpsが活用されてきている背景
AIOpsの活用が広がってきている背景には、社会全体でIT環境の急激な変化が起きていることに関係しており、特に「エンジニア不足」や「ヒューマンエラー」などの課題発生が大きく影響しています。
急速なIT化に伴うエンジニア不足

IT運用管理を担うエンジニアの不足が、多くの企業で問題になっています。つまり現代では、企業のDX推進やデジタル化が広がっている状況であるのに対し、中心的な役割を果たすエンジニアの人材が不足しています。特に日本の場合は、その傾向が顕著に表れています。
例えば、総務省が2022年に公表した「令和4年 情報通信に関する現状報告の概要/第2部 情報通信分野の現状と課題」によると、「人材不足がデジタル化の障害になっている」と回答した企業が67.6%、との結果が出ました。近年では、エンジニアに求められる技術レベルが高度化しており、この問題を解決する難易度をさらに上げています。
参照元:総務省
「令和4年 情報通信に関する現状報告の概要/第2部 情報通信分野の現状と課題」
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r04/html/nd238210.html
こうした状況下において、登場したものがAIOpsです。長らくIT運用は、人間の手作業に依存せざるを得ませんでした。しかしAIOpsを活用すればその状況から脱却し、限られたデジタル人材はより創造的な業務に専念できます。このような事情から、エンジニアの人材不足を補うための手段、またはエンジニアをより有効活用するための手段として、AIOpsは多くの企業から注目されるようになりました。
IT活用シーンやデータの多様化によるヒューマンエラー
エンジニアが不足している状況と反比例するように、ITの活用シーンやデータの多様化が急激に進んでいる状況もまた、AIOpsが必要とされる大きな理由です。
多くの企業では、部署ごとに異なるツールやルールのもと、ITシステムが運用されています。扱うデータの種類も、スプレッドシートのような構造化データだけではなく、テキストや画像、映像のような非構造化データまで多種多様です。
複数のクラウドサービスを使い分けたり、オンプレミスとクラウドを横断的に利用したりする企業も少なくありません。さらにこの数年では、新型コロナウイルスの影響でテレワークが普及したことにより、オフィス勤務を前提にした従来のITリソースや管理運用体制にも変化が求められつつあります。
こうした状況下で、IT運用チームが処理すべきデータの量や種類は膨大であり、ヒューマンエラーが発生しやすくなっています。業務スピードを維持しようとするばかりに、ベテランエンジニアの経験や技術に頼った運用を実施してしまい、属人化を進めてしまう企業も少なくありません。業務量の急激な増加と、属人化の傾向の強まりは、ヒューマンエラーにつながり得る大きなリスクです。
その点、AIOpsを導入すれば、人間の手では到底扱いきれない膨大なデータも、迅速かつ正確な処理が可能になると考えられます。今後、デジタル活用がさらに広がり、自ずとIT運用チームの業務量や管理範囲も増えることが予想されるので、将来的に見てもAIOpsの需要は高まっていく見込みです。
AIOpsを導入するメリット

AIOpsは、多くの企業が直面する上記で挙げた課題を解決し、企業へ大きなメリットをもたらします。その主な内容は以下の通りです。
異常検知の精度の向上と迅速な障害対応
AIOpsは、人間の手作業とは比較にならないほど膨大なデータを自動で収集・分析し、異常を検知します。AIの特徴は、多くのデータを処理するほど、機械学習効果によって対応の正確性が向上していく点です。異常検知の精度もこうした機械学習により向上していきます。例えば発生したインシデントに優先順位をつけて、それらに対する適切な対処法をそれぞれ割り出せるようになります。
システムによっては、異常を管理者にアラートで伝えるだけではなく、自動で異常を特定して対処する機能も備わっています。人間の手に頼ってIT運用するよりも迅速かつ正確です。異常に対する早期検知・早期対応が可能になることは、システムの可用性とエンドユーザーのデジタル体験を向上させるために欠かせません。
運用コストの削減とコア業務への集中
AIOpsによって、ITリソースの監視やインシデントへの対応を自動化することで、エンジニアの人的リソースの削減が叶います。AIOpsが多くの業務を代行してくれるため、エンジニアはその分の空いたリソースを、より複雑な判断が求められるコア業務に注力できる点も魅力です。加えてコア業務を進めるに際しても、AIOpsの収集・分析したデータが活用可能なケースが多々あります。
このように、AIOpsはさまざまな方法でエンジニアの業務負担を軽減し、生産性の向上に寄与してくれるシステムです。
DX推進とビジネス価値の向上
AIOpsでは、各サービスへのアクセス状況やサーバーのメモリ利用率、ネットワーク速度など、各種のITリソースのパフォーマンスデータを収集・分析できます。さらに、このデータの活用により、自社のデジタル価値を阻害しているボトルネックを特定し、効率的にITリソースの最適化を図れる点がポイントです。
例えば、各クラウドサービスへのアクセス状況を分析し、従業員があまり利用していないサービスを特定すれば、「ほかのより良いサービスとの契約に切り替える」といった施策も検討しやすくなります。インシデントの早期特定・早期対応による安定稼働とともに、こうした機能を活用することで、企業はますます効率的なDXを推進しつつ、デジタル技術をビジネス価値の向上に役立てられます。
代表的なAIOpsツールを紹介
ひと口にAIOpsと言っても、実際にはさまざまな製品があります。AIOpsで高い成果を発揮するには、各製品の特徴を把握した上で、自社のニーズにもっとも適したものを導入することが重要です。以下では、参考として代表的なAIOpsツールをいくつか紹介します。
OpsRamp
「OpsRamp(オプスランプ)」はアメリカに本拠を置き、グローバルにビジネスを展開する「OpsRamp社」が開発した、SaaS型のAIOpsソリューションです。OpsRampは、既存の管理システムと連携し、アプリケーションやサーバー、ネットワーク機器など、IT環境で一般的に利用されるリソースの自動検出・監視・管理業務を一元的に行います。インシデントへの自動対処も備わっているので、広い範囲にわたるIT運用チームの業務の自動化が可能です。
また、オンプレミスとクラウドを組み合わせたハイブリッド環境やマルチクラウド環境でも利用できるため、各企業の幅広いニーズに適応します。導入が容易なクラウドサービスであることから、実際に1,000社以上の豊富な導入実績を持っている点も特筆すべきポイントです。
Watson OpenScale
「Watson OpenScale(ワトソン オープンスケール)」は、世界的に事業を展開する「IBM社」が、独自のAI技術を用いて開発したAIOpsツールです。AIが判定に用いたデータを簡単に参照できるほか、AIが正しく作動していることを誰でも確認できる仕様になっており、透明性が高い状態でAIOpsの機能を発揮します。その結果、IT運用の高水準な正確性を担保した上で、効果的に業務効率化を進められます。こちらもまた、オンプレミス環境とクラウド環境の双方に適応します。
Splunk
「Splunk(スプランク)」は、「Splunk社」が開発したAIOpsツールです。2003年に創業した比較的歴史の浅い企業ですが、急激に業績を伸ばしてきたことで大いに注目を集めています。さまざまなITシステムからデータを収集する点が特徴であり、特にデータの検索や分析、可視化を重視したい企業におすすめです。医療現場や金融機関、公共機関など、システムへの厚い信頼性が求められる業界でも、豊富な導入実績を誇るため、セキュアに利用できます。
AIOpsを導入する手順

導入すべき具体的なAIOpsツールを選定できたら、次はツールの導入ステップに進みましょう。細かな手順はもちろんツールごとに異なりますが、共通する重要なポイントはあります。AIOpsを最大限に活用するために、IT管理部門は以下の手順に沿って、導入を進めていくことが必要です。
限定した領域でスモールスタートする
AIOpsなどの革新的なソリューションを導入する際は、小規模なテスト領域を設定して、限定的に利用を開始することが推奨されます。テストを繰り返し、ツールの可能なこと・不可能なことを理解した上で、微調整を繰り返していきましょう。この方法を採っていれば、万が一何らかのトラブルが発生したとしても、被害拡大につながりづらくなります。
特に、AIOpsはAIの機械学習の特性により、最初からさまざまな領域のデータを取り込ませると、間違った学習を行ってしまうリスクがあります。間違った機械学習を行えば、AIの分析精度は低下します。したがって、導入当初はデータを収集する領域を限定し、AIOpsが正常に作動していることを確認しながら進めていくことが求められます。
具体的なテスト領域としては、例えばシステムログの稼働ログの場合、学習効率の高さや結果判定の容易さなどが優れています。AIOpsの利用目的なども考慮した上で、領域を絞ってテストしてみましょう。
データを収集し分析する
上記のステップを通して、AIOpsが問題なく作動することを確認できたら、次はさまざまなソースから大量のデータを取り込んでいきます。AIOpsは、膨大なデータソースの中から関連性の高いデータを特定して分析できるので、単一のデータソースに絞らずに機械学習させた方が有利です。
ただし、この際にはデータ品質の確保が重要です。AIOpsはシステムログやイベントログ、過去またはリアルタイムのパフォーマンスデータなど、さまざまなデータを適切に整理し、機械学習させなくてはなりません。学習用に必要なデータが十分に収集されている点や、学習しやすいように適切な方法で整備されている点について、エンジニアが十分に確認してから学習を実施します。
データ収集・整備が完了したら、問題を引き起こす原因やトリガーを学習させてテストしていきます。優先度の高い課題のデータ分析から自動化することで、IT運用チームにおける業務負担の効率的な軽減が可能です。
徐々に領域を拡大する
ここまでのステップが順調に進んだら、AIOpsの活用範囲を他の領域へと広げていきます。トラブルのリスクを下げるためには、システム停止などのリスクが低い分野から始め、中程度の分野まで徐々に展開していくことがポイントです。
リスクは低いものの手作業で行うと手間がかかる業務は、自動化の優先度を設定しておけば、効率的に進められます。その際も、AIOps の異常検知の精度やその支援を受けることにより「問題解決までの時間がどれほど短縮されるか」を測るなど、効果測定を適宜行うとよいでしょう。
まとめ
AIOpsとは、組織のITリソースに関する、さまざまなデータをAIに機械学習させることで、運用管理業務の自動化または効率化を実現する方法です。
多くの企業が、ビッグデータも含めたITリソースの活用を進めていく一方で、その担い手であるデジタル人材の不足に悩まされています。こうした状況下において、IT担当者は人海戦術や技術的なスキルアップに頼るだけではなく、自分自身の業務もITツールを活用して効率化していくことが重要です。本記事で紹介した、「OpsRamp」をはじめとするAIOpsツールの導入は、そのための有効な手段のひとつとしておすすめします。
OpsRampの活用により、IT担当者は組織内のITリソースの状況を一元的に管理し、障害対応を効率化させる他、どのようにITリソースを整備すれば、ビジネスに貢献できるかを考えやすくなります。従来のIT運用の方法に限界を感じている企業は、導入を検討してみてはいかがでしょうか。