Azure Cognitive Servicesとは?主な機能や活用例を解説
更新日 : 2023年08月01日
AIの活用が活発になってきている昨今。Microsoftのクラウドサービス「Azure」でも「Azure Cognitive Services」というAIサービスが提供されています。基本的には深い専門知識がなくても使えるサービスであり、情報システム管理者としては、概要だけでも知っていて損はありません。 当記事ではAzure Cognitive Servicesが持つ各機能について、簡単にご紹介します。 |
目次 |
Azure Cognitive Servicesとは
Azure Cognitive Servicesは、Microsoftが提供するクラウドベースのAIサービスです。「Cognitive(コグニティブ)」とは「認知」あるいは「認知機能」を意味します。
Azure Cognitive Servicesを利用すると、開発者にAIやデータサイエンスのスキルや知識がなくても、AIを活用したアプリケーションを構築できます。
Azure Cognitive Servicesの主な機能・サービス
Azure Cognitive Serviceで使える機能・サービスは、大きく視覚・音声・言語・意思決定・OpenAIの5つの分野に大別されます。それぞれの分野ごとの、機能・サービスについて簡単にご紹介します。 |
Vision API サービス(視覚)
Computer Vision
視覚情報に関するサービスです。テキスト抽出の自動化やリアルタイムのビデオ分析、空間内における人の動きの分析といった機能を有します。これらの機能により、画像の説明を生成する、空間内の人物の移動を把握する、といったことが可能です。
Custom Vision
画像解析を行えるサービスです。ユーザーが独自にラベルを設定し、それらを検出するためのモデルを少ない教師データで作ることが可能です。そのため、Computer Visionではできないカスタマイズを行うことができます。
Face
画像内の顔を分析するサービスです。顔全体やマスク、眼鏡などを認識する顔検出機能があり、サービス利用により画像保存がされないというプライバシーへの配慮や使いやすさにも特徴があります。
Speech APIサービス(音声)
Speech
音声機能全般に関わるサービスです。音声テキスト変換の書き起こし、自然な音声でのテキスト読み上げの生成、音声の翻訳、話している人の認識といった機能があります。
Language APIサービス(言語)
Language
テキストを理解し分析するための、自然言語処理 (NLP) 機能を提供するサービスです。Text Analyticsや後述のLUIS、QnA Makeを統合した機能です。
Translator
機械翻訳機能です。100 以上の言語間で、テキストを瞬時に一括翻訳することができます。コールセンターやアプリ内通信など、広く活用されています。
Language Understanding (LUIS)
アプリやIoTデバイスと対話するための会話言語理解(NLU)の機能を提供しています。LUISでは、チャットボットの埋め込み・運用やIoTデバイスの制御といったことが可能です。
(※LUISは2025年10月1日に廃止される予定です)
質問応答
自然言語処理(NLP)サービスです。チャットボットや音声対応のアプリケーションで使用されています。
Decision APIサービス(意思決定)
Anomaly Detector
時系列データを取り込み、データの異常を検出できるサービスです。収益やコスト推移の異変を検出したり、不具合や未知の脅威などの問題が起こる前に予測したりすることができるほか、トラフィックの監視や不正行為の管理にも使えます。
Content Moderator
テキストや画像、ビデオなどを対象に、不快感を与える可能性があるものやリスクのある内容など、望ましくない表現を管理できる AI サービスです。
Personalizer
ユーザーの行動にもとづいて、ECサイトでユーザーに合った商品を推奨したり、Webコンテンツ上で適切な広告位置を提案したりなど、さまざまなシーンで最適なアクションを提案してくれるサービスです。
Azure OpenAIサービス
世界的に展開されている「OpenAI」のAzure版です。ChatGPTをはじめ、複数のOpenAIの大規模言語モデル(LLM)をAzureで活用できます。
Azure Cognitive Servicesのメリット・デメリット
Azure Cognitive Servicesのメリット・デメリットは次の通りです。
メリット
深い専門知識が不要
一般的なAIの開発においては、教師データでAIに学習をさせ、精度の向上を図っていきます。これには専門知識と多くの時間が必要です。
Azure Cognitive Servicesの場合には、基本的には機械学習を済ませているAIモデルを活用することになります。したがって利用者側に、機械学習に関する専門知識は不要となります。
WebAPIとして活用できる
Azure Cognitive ServicesではAIをゼロから開発するのではなく、APIを呼び出すだけで、見る・聞く・検索するなどの高度な機能を活用できます。クライアントライブラリはC#、Java、JavaScript、Pythonが用意されています。またDockerコンテナーも用意されており、オンプレミスでAPIを利用することも可能です。
各機能のバリエーションが豊富
各機能のバリエーションが豊富で、たとえば「Decision API(意思決定)」のジャンルでもAnomaly DetectorやContent ModeratorといったAPIがあります。実現したい機能に対して複数のAPIのなかから適切なものを選べる利点があります。
デメリット
AIモデルを修正できない
Azure Cognitive Servicesは内部のアルゴリズムが非公開で、基本的にはカスタマイズができません。もし開発したアプリケーションの精度が上がらず、AIモデルを改善したい場合でも手を加えることはできません。
ランニングコストがかかる
Azureは基本的に、月々でランニングコストが発生します。基本はトランザクション量を基準に料金が課されることになるため、利用する前に概算でトランザクション量を見積もることが推奨されます。
Azure Cognitive Servicesの料金の例
Azure Cognitive Servicesの料金は、サービスごとに料金設定が異なります。例としては、次の通りです。
- 0~100万トランザクション:1000トランザクションあたり $1
- 100万~1000万トランザクション:1000トランザクションあたり $0.65
- 1000万~1億トランザクション:1000トランザクションあたり $0.60
- 1億トランザクション~:1000トランザクションあたり $0.40
また使用量によっては無料となるサービスもあります。
- 1か月あたり5音声時間は無料
その他料金についての詳細はMicrosoft公式ページ「Azure Cognitive Services の価格|Microsoft Azure」をご参照ください。
Azure Cognitive Servicesの活用例
Azure Cognitive Servicesの活用シナリオとして、コールセンターでの活用方法をMicrosoftが公開されているのでご紹介します。 |
コールセンターにおいては、「Azure Cognitive Service for Speech」と「Azure Cognitive Services for Language」が活用できます。
Speechを用いると、音声をリアルタイムで認識し、文字起こしを行えます。また返答のテキストを人間の声のような合成音声に変換するというように、会話を作り出すことも可能です。
Languageではその記録をもとに、会話の概要を作成したり、会話の感情を分析したりすることができます。通話処理の品質改善や最適化などを継続的に行える点がメリットです。
これらにより、お客様とのやり取りの部分的あるいは完全な自動化が可能となり、継続的な記録や分析を行うことで通話処理の品質改善も期待できます。
まとめ
Azure Cognitive Servicesは深い専門知識を持っていなくても活用ができるうえ、将来的にも技術の進歩が期待できるものです。コールセンターの事例のように、応答の情報収集や対応後の分析など、これまで手動で時間がかかっていた業務を効率化することが可能となります。
AI活用については、JBサービス株式会社までお気軽にお問い合わせください。