現在、第4次産業革命でもヘルスケアは最も注目されている分野の1つです。FPTソフトウェアは、国内外のお客様向けに多くの製品とヘルスケアソリューションを開発し、提供を行ってきました。最近では、PoC(概念実証)ソリューションとして、ヘルスケア分野におけるチャットボットプロジェクトを完遂しました。
ビジネスニーズ
お客様は、製薬/医療技術のビジネスユーザーがデータから知見を得られるように、すぐに使えるダッシュボードをプラットフォーム上で提供したいと考えていました。お客様は、ダッシュボードの一部として会話分析用の「データ探索」モジュールを統合し、ビジネスユーザーがデータに関する質問をするだけで、会話をフォローして、AIエージェントが自然言語処理(NLP)を使用して質問をクエリに変換し、ユーザーに即時に回答するようにしたいと考えています。そのため、ユーザーが異なるチャートを見てドリルダウンしたり、さまざまなデータテーブルからデータを取り出すために独自のクエリコードを書いたりする必要はありませんでした。
そこで、FPTソフトウェアは、現在のダッシュボードポータルに分析モジュールを直接組み込んで、以下の必要な機能を備えたプロジェクトを完成させる必要がありました。
- ユーザーがデータの問合せを自然言語クエリで実行できること
- 質問の処理に基づいてNLPをベースにした能力を構築すること
- 複数の関連テーブルを照会し、サブクエリ結果を結合できること
- 質問・発話に基づいて、結果を特定の複数のチャートに視覚化すること
さらに、お客様はプロジェクトをわずか5週間で完成させ、その後に行われる重要な製品デモ会議に間に合わせることを当社に要望されました。これはまさにFPTソフトウェアにとって、AI分野における力量が問われる重要なポイントです。
FPTのソリューション
作業時間の不足を補うために、機械学習を採用することで、お客様の問題を解決しました。最近のディープラーニングの人気にもかかわらず、統計的学習手法を採用したのです。これは、膨大な量の学習データを必要するディープラーニングと比べて、機械学習は学習データが少なくて済み、手動でのチューニングが容易なためです。
分析プロセスは次の3つの段階で構成されます。それはトレーニング、予測、および回答抽出です。
トレーニング
トレーニング段階の入力はトレーニングデータです。この段階は、新しい発話ごとの単語のスロット(ラベル)を予測するために使用するトレーニングされたモデルの作成を目的としています。たとえば、インテントスロット、フィルタスロット、テーブルクエリするスロットです。
トレーニングデータセットは、スロットラベルに関連付けられる数千のセンテンスのコレクションです。モデルをトレーニングするために、スロットの数をあらかじめ定義しておく必要があります。他のスロットが必要な場合は、モデルを再度トレーニングする必要があります。
トレーニング段階はオフラインモードで実行する必要があり、以下のステップが含まれます。
- 前処理:トレーニングデータを次のステップで使用できる形式に変換する。これには、大文字の変更や一般的な単語(a、an、theなど)と特殊文字の削除が含まれる。
- 特徴抽出:前処理されたデータに基づき、テンプレートを定義することによって単語の特徴を構築する。その結果、各単語は有用な情報量で表現され、ラベル名を使って手動でタグ付けされる。
- モデルトレーニング:トレーニングデータの単語を表現した後、トレーニングアルゴリズムを使用してトレーニングデータを分析し、トレーニングデータからトレーニングモデルを受け取る。このステップは最も重要であり、さまざまなテンプレートを改良し、トレーニングされたモデルを構築するための最適なテンプレートを選択するには、データサイエティストの専門知識が必要になる。
予測
予測段階の入力は新しい発話ですが、その出力は「スロット」です。予測段階はオンラインモードで動作し、トレーニング段階の後に受け取ったトレーニング済モデルを使用する必要があります。トレーニング段階には次のステップが含まれます。
- 前処理:このステップは、データ一貫性のためのトレーニング段階の前処理ステップと同じ。
- 特徴抽出:このステップでは、前処理して各単語を表現した後、新しい単語の特徴を抽出する。
- 予測:特徴抽出ステップの後に受け取った単語特徴と、トレーニング段階後に受け取ったトレーニングモデルに基づいて処理することで、単語がどのラベルに属しているかを予測する。
回答抽出
回答抽出の段階の入力は、予測段階から抽出されたスロットです。スロットが使用可能になったら、ルールベースでこれらのスロットをSQLクエリにマップします。その後、データベースから情報を抽出して質問を回答します。 最後に、結果は複数の統計図として形成され、顧客のダッシュボードポータルで視覚化されます。
プロジェクト結果
上述のシステムおよびアーキテクチャで、プロジェクトはお客様のリーダーシップチームミーティングで発表されました。そこでは、FPTソフトウェアのプロフェッショナルな姿勢に非常に満足され、当社の能力も高く評価されました。PoCは予定どおりに完了し、お客様は次のフェーズの製品でもFPTソフトウェアと協力していくことを確認しました。具体的には、PoCをプラットフォーム全体において、ヘルスケア分野における、より厳格で具体的な要件を備えた完全なモジュールとして構築することになります。
メリットと価値
- データベースを利用するための深い知識を必要とせず、またデータクエリコードを記述することもなく、シンプルで直感的な方法でビジネスユーザーを支援
- 自然言語で発話してデータの問い合わせができるため、フレームワークはQ&Aチャットボットシステムとして動作可能
- 非常に短い時間でお客様の難問を解決することにより、NLP分野でのFPTソフトウェアの能力を実証
FPTが提供する、医療・ヘルスケア業界向けITサービスについては、こちら!
FPTは、2021年2月24日~26日にかけてインテックス大阪にて開催される、「第6回 医療IT EXPO 大阪:リード エグジビション ジャパン 主催」にも出展します。現地でのブース出展に加え、オンラインブースへも出展します!
出展紹介のページはこちら!
【Written by Vu Thanh Hai 2019年5月9日】