現在、4次産業革命ヘルスケア最も注目されている分野の1つです。FPTソフトウェア国内外のお客様向けに多くの製品とヘルスケアソリューションを開発し、提供を行ってきました。最近ではPoC(概念実証)ソリューションとして、ヘルスケア分野におけるチャットボットプロジェクトを完遂しました。 

 

ビジネスニーズ 

お客様は、製薬/医療技術ビジネスユーザがデータから知見を得られるように、すぐ使えるダッシュボードをプラットフォーム上で提供したいと考えていましたお客様は、ダッシュボードの一部として会話分析用の「データ探索」モジュールを統合し、ビジネスユーザデータに関する質問をするだけで会話をフォローして、AIエージェント自然言語処理(NLP)を使用して質問をクエリに変換し、ユーザに即時に回答するようにしたいと考えています。そのため、ユーザ異なるチャートを見てドリルダウンしたり、さまざまなデータテーブルからデータを取り出すために独自のクエリコードを書たりする必要ありませんでした 

そこで、FPTソフトウェアは、現在のダッシュボードポータルに分析モジュールを直接組み込んで、以下の必要な機能を備えたプロジェクトを完成させる必要がありました 

  • ユーザデータの問合せを自然言語クエリ実行できること 
  • 質問の処理に基づいてNLPをベースにした能力を構築すること 
  • 複数の関連テーブルを照会し、サブクエリ結果を結合できること 
  • 質問・発話に基づいて結果を特定の複数のチャートに視覚化すること 

さらに、お客様はプロジェクトをわずか5週間で完成させ、その後に行われる重要な製品デモ会議に間に合わせることを当社に要望されました。これはまさにFPTソフトウェアにとって、AI分野における力量が問われる重要なポイントです。 

FPTのソリューション 

作業時間の不足を補うため、機械学習を採用することでお客様の問題を解決しました。最近ディープラーニング人気にもかかわらず、統計的学習手法を採用したのです。これは膨大な量の学習データを必要するディープラーニングと比べて、機械学習は学習データが少なくて済み、手動でのチューニングが容易なためです。  

分析プロセスは次の3つの段階で構成されます。それはトレーニング、予測、および回答抽出です。  

トレーニング 

トレーニング段階の入力はトレーニングデータです。この段階は、新しい発話ごとの単語のスロット(ラベル)を予測するために使用するトレーニングされたモデルの作成を目的としています。たとえば、インテントスロット、フィルタスロット、テーブルクエリするスロットです。 

トレーニングデータセットは、スロットラベルに関連付けられる数千のセンテンスのコレクションです。モデルをトレーニングするために、スロットの数をあらかじめ定義しておく必要があります。他のスロットが必要な場合は、モデルを再度トレーニングする必要があります。 

トレーニング段階はオフラインモードで実行する必要があり、以下のステップが含まれます。 

  • 前処理:トレーニングデータを次のステップで使用できる形式に変換する。これには、大文字の変更や一般的な単語(a、an、theなど)と特殊文字の削除が含まれる。 
  • 特徴抽出:前処理されたデータに基づき、テンプレートを定義することによって単語特徴を構築する。その結果、各単語は有用な情報量で表現され、ラベル名を使って手動でタグ付けされる。 
  • モデルトレーニング:トレーニングデータの単語を表現した後、トレーニングアルゴリズムを使用してトレーニングデータを分析し、トレーニングデータからトレーニングモデルを受け取。このステップは最も重要であり、さまざまなテンプレートを改良し、トレーニングされたモデルを構築するための最適なテンプレートを選択するに、データサイエティストの専門知識が必要になる。 

予測 

予測段階の入力は新しい発話ですが、その出力は「スロット」です。予測段階はオンラインモードで動作し、トレーニング段階の後に受け取ったトレーニングモデルを使用する必要があります。トレーニング段階には次のステップが含まれます。 

  • 前処理:このステップは、データ一貫性のためのトレーニング段階の前処理ステップと同じ。 
  • 特徴抽出:このステップでは、前処理して各単語を表現した後、新しい単語の特徴を抽出する。 
  • 予測:特徴抽出ステップの後に受け取った単語特徴と、トレーニング段階後に受け取ったトレーニングモデルに基づいて処理することで、単語がどのラベルに属しているかを予測する。 

回答抽出 

回答抽出の段階の入力は、予測段階から抽出されたスロットです。スロットが使用可能になったら、ルールベースでこれらのスロットをSQLクエリにマップします。その後、データベースから情報を抽出して質問を回答します。  最後に、結果は複数の統計図として形成され、顧客のダッシュボードポータルで視覚化されます。 

プロジェクト結果 

上述のシステムおよびアーキテクチャで、プロジェクトはお客様のリーダーシップチームミーティングで発表されました。そこでは、FPTソフトウェアのプロフェッショナルな姿勢に非常に満足され、当社の能力も高く評価されましたPoCは予定おりに完了し、お客様次のフェーズの製品でFPTソフトウェアと協力していくことを確認しました。具体的には、PoCプラットフォーム全体においてヘルスケア分野におけるより厳格で具体的要件を備えた完全なモジュールとして構築することになります。 

メリットと価値 

  • データベースを利用するため深い知識を必要とせず、またデータクエリコードを記述することもなく、シンプルで直感的な方法でビジネスユーザを支援 
  • 自然言語で発話してデータの問い合わせができるため、フレームワークはQ&Aチャットボットシステムとして動作可能 
  • 非常に短い時間でお客様の難問を解決することにより、NLP分野でのFPTソフトウェアの能力を実証

 

FPTが提供する、医療・ヘルスケア業界向けITサービスについては、こちら!

FPTは、2021年2月24日~26日にかけてインテックス大阪にて開催される、「第6回 医療IT EXPO 大阪:リード エグジビション ジャパン 主催」にも出展します。現地でのブース出展に加え、オンラインブースへも出展します!

出展紹介のページはこちら

 

【Written by  Vu Thanh Hai  2019年5月9日】