ファインチューニングでChatGPTに社内文書を学習させたら、業務利用がさらに進化!

2023年07月11日 07:30

AI技術の革新が、わたしたちのビジネス環境を変革しています。特にOpenAI社のChatGPTは優れた大規模言語モデル(LLM)として有名であり、その会話能力で業務効率化の可能性を広げています。しかし、ある課題が立ちはだかります。それは、ChatGPTが非公開の社内情報や専門知識に対応できないという問題です。ある程度の専門性や独自性を持つ情報に対して、このAIが適切に回答できるようにするにはどうしたらいいのでしょうか?本記事の目的は、その解決策を探るというものです。最新のAI技術を業務に使用し、効果を引き出すための具体的な手法を紹介していますので、ビジネスへのAI導入をよりスムーズで効果的なものにするための参考にしてください。

ChatGPTを社内業務などに活用する新たな可能性

AIの進化が急速に進行しており、特に言語生成AIの進化によって、私たちの業務内容は以前にも増して大きな変革の時代を迎えています。この進化の中心に位置するのがOpenAI社の「ChatGPT」です。自然言語による会話や文章を理解し、お問い合わせ対応等の業務への大いなる貢献が期待されています。

しかしながら、ChatGPTは公開されている情報を学習するため、非公開の社内情報や専門的な情報に関する知識は獲得していません。これは、例えば社内のITヘルプデスクで特定の社内システムに関する質問に応答したい時や、製品開発部門が特定の技術や規格についての情報を迅速に取得したい時など、限定された情報を必要とするシチュエーションで課題となります。これらの問い合わせに適切に対応できないと、労働力の浪費や業務の遅延、情報の非効率的な共有など多くの課題が生じる可能性があります。

その一方で、ChatGPTが社内情報や専門的な情報を回答できるようになれば、それらの課題を解決するだけでなく、新たなメリットを生み出します。例えば、社内の情報が一元化され、誰でも必要な情報に簡単にアクセスできるようになります。これにより、社員の生産性の向上、業務効率化、情報の迅速な共有などが可能になります。また、ChatGPTは24時間365日稼働するため、時間帯や地理的な制約なしに情報取得が可能となります。

これらのメリットを享受するためには、ChatGPTを社内ヘルプデスクなどに活用するための新たなアプローチが求められます。本記事では、社内文書の内容をChatGPTに回答させる方法とその最適な組み合わせについて説明します。

具体的な方法としては以下の3つが考えられます。

  1. ChatGPTとは別のAIチャットボットを社内文書の質問に利用する
  2. ファインチューニングでChatGPTに社内文書の内容を学習させる
  3. エンベディングでChatGPTへ社内情報を付与した質問をし、回答させる

以下にそれぞれの特徴と活用方法について詳述します。

1. ChatGPTとは別のAIチャットボットを社内文書の質問に利用する

ChatGPTは汎用的な質問に対する回答力に優れていますが、特定の社内情報に対する回答力は限定的です。ここで活用するのが別のAIチャットボットです。例えば、弊社のAIチャットボット製品「CB3」の併用により、ChatGPTが答えられない質問に対する回答力を補完できます。

ChatGPT 社内文書

CB3はChatGPTと連携する機能を持ち、質問者が投げかけた質問に対して自動的に最適な回答先を選択します。これにより、ユーザーはCB3とChatGPTのどちらを使うべきかを意識せずに、スムーズに情報を得られます。また、質問者が投げかけた質問内容はChatGPTの学習内容に利用されないようにCB3は設計されており、情報漏えい等のセキュリティ対策も万全です

このように、ChatGPTだけでは対応できない社内文書の内容については、別のAIチャットボット製品を利用すると回答が可能になります。ただし、社内文書をAIチャットボットに学習させるためには、事前にデータの用意や学習プロセスが必要となります。具体的には、社内文書を元にした質問文・回答文の生成になります。これらは一定の手間がかかるのですが、CB3には多様な学習ツールが用意されており、簡便に学習プロセスを進められます。

メリットや活用のポイントを分かりやすく解説!
AIチャットボット 社内活用入門ガイド

2. ファインチューニングでChatGPTに社内文書の内容を学習させる

既存のChatGPTに更に社内文書の内容を学習させる方法があります。これを「ファインチューニング(Fine-tuning)」と呼びます。ファインチューニングを実施すると、ChatGPTだけで社内文書の内容に対する回答が可能となります。

ChatGPT ファインチューニング

ファインチューニングはChatGPTのモデルに追加のデータを入力して、特定の業務やタスクに適応させるプロセスです。この過程ではトークンレベルの特徴量が調整されて、特定の文脈や状況に合わせた回答が可能となります。最新モデルの性能を最適化すると同時に、定期的にデータの品質を確認し、必要に応じて修正を加える重要なプロセスです。

しかし、ファインチューニングは専門的な知識を要し、再学習のプロセスが必要となるため、実用化までには一定の時間と工夫が必要となります。また、学習プロセスに必要な訓練データは、機密性の問題を引き起こす可能性もあります。ファインチューニングをマスターできれば、ChatGPTだけで社内文書の内容を反映した回答が可能となりますが、その達成は少しハードルが高いと言えるでしょう。

3. エンベディングでChatGPTへ社内情報を付与した質問をし、回答させる

ChatGPTに行う質問に必要な情報を付与し、その情報と質問をChatGPTに与え、適切な回答を得る方法もあります。これを「エンベディング(Embedding)」と呼びます。今回は、図書館の利用を例にあげて説明します。図書館では資料や情報を探すために分類や索引が整備されています。その索引一覧を用いて、利用者は必要な情報を検索し、見つけ出します。この場合に、図書館の資料全てを覚えて答えるのがファインチューニングとなり、質問ごとに回答に必要な資料を図書館からピックアップして答えるのがエンベディングと言えます。

ChatGPT エンベディング

エンベディングは、事前に用意された社内文書を取りまとめたデータベース(先の例では図書館にあたります)を作成しておきます。質問の内容に従い関連する社内文書の情報を選択し、その情報を質問とともにChatGPTに渡すという方法がエンベディングです。このアプローチは通常のChatGPTのチャット画面では実行ができず、エンベディングのAPIを利用したアプリケーションの開発が必要です。弊社AIチャットボット製品CB3はこのエンベディングの取り込み(CB3 RAG with GPTオプション)を開発し2023年10月24日にリリースいたしました。

エンベディングの利点は、学習データを特別に用意する必要がない点です。ファイルそのものがあれば問題なく、例えば、社内規定のPDFファイルをまとめて一つのフォルダに入れてしまえば、あとはエンベディングのAPIを利用してデータベース化されます。また、社内文書の内容が更新された場合も、最新のファイルをまとめているフォルダに上書きで格納し、データベースを再構築すれば、新しい内容でChatGPTが回答として出力してくれます。

まとめ

以上、ChatGPTに社内文書の内容を含めて回答できるようにするための方法として3つを提示しました。ファインチューニングの活用は専門的な知識を要するため、ChatGPTとは別のAIチャットボットを併用する方法とエンベディングの利用を推奨します。

弊社AIチャットボット製品CB3を活用すれば、社内文書を含めた回答が可能なAIチャットボットを構築でき、エンベディングの利用もできます。これらの手法を駆使し、生成系AIの進化に遅れぬよう、価値あるソリューションの提供を続けます。

社内文書の内容をChatGPTに回答させたいニーズがある方にとって、CB3はベストな製品と言えるでしょう。社内ヘルプデスクの業務効率化、AI活用の推進に是非お役立てください。

AI技術の発展は社内の業務効率化だけでなく、企業が顧客に提供するサービスの多様性と質の向上にもつながっています。これらの技術を最大限に活用し、顧客満足度の向上や新しいサービスの創出の可能性も視野に入れたAI活用の推進に是非お役立てください。

※本記事はWeb版ChatGPTでの利用に限らず、GPT APIを利用することで実現できる内容についても記載しています。
 

当サイトでは、AIチャットボット、kintone活用、ChatGPT、総務DXに関するダウンロード資料をご用意しております。ご興味のある方はダウンロードいただき、資料をご活用ください。また、チャットボットトライアルもご用意しておりますので、ぜひお試しください。

ChatGPT guide

 

HRGA_footer02kintyabo_footer02