2024年10月10日 07:30
生成AIは近年、多くの業界で注目されており、その応用範囲は日々拡大しています。しかし、その機能やChatGPTとの違いが不明確で、どのように活用すれば良いのか悩んでいる方も多いのではないでしょうか。
この記事では、生成AIの基本からChatGPTの特徴、さらには実際のビジネスシーンでの活用方法まで、図解を交えてわかりやすく解説します。本記事を読み終える頃には、生成AIを自身の業務で使いこなせる基本的な知識が得られるでしょう。
※本記事は2024年10月の情報に基づいて記載しています。
生成AIは人工知能の中でどのような役割を果たしているのか、を知ることが全体像を理解する近道となります。まずは生成AIについて、他のAI(人工知能)との比較をしながら理解を深めていきましょう。
生成AIは近年の技術の進歩によって注目されている分野であり、その始まりはニューラルネットワークやディープラーニング技術の発展にあります。初期のAIプログラムの一例として1960年代に登場した「ELIZA(イライザ)」がありますが、これはキーワードに基づいた応答を返す対話型プログラムであり、生成AIとは異なります。
従来のAI(人工知能)は主にデータの分類や予測に使用されるのに対して、生成AIはニューラルネットワークを利用して既存のデータ内のパターンと構造を識別し、新しいテキスト、画像、音楽、ビデオなどのコンテンツを生成する能力があります。
両者は機械学習技術を共有していますが、生成AIは「新たな創造」を重視する点で特徴的です。
つまり、生成AIとは単にデータを処理するだけでなく、まったく新しいコンテンツを生み出す能力を持つAIのことを指します。
生成AIを司るのは、生成モデルです。
生成モデルとは、「データがどのように生成されるかを理解する」ことに重点が置かれ、「データ自体の分布を学習する」ことを目的とします。
たとえば、猫と犬の写真を見ると、生成モデルは猫が猫らしく、犬が犬らしく見える理由を理解しようとし、“それらしさ”を作るデータの分布を理解します。この理解を基に、猫または犬に似た新しい画像を生成できるようになります。
このような特徴を持つ生成モデルは、データの理解と生成に独自のアプローチを採用しています。以下は主な生成AIモデルの種類です。
生成モデル | 概要 |
ベイジアンネットワーク | 一連の変数間の確率的関係を表すグラフィカルモデル。因果関係分析で活用できる。たとえば、医療診断では、一連の症状に基づいて病気の可能性を判断するのに役立つ。 |
拡散モデル | 物事が時間の経過とともにどのように拡散または進化するかを計算するモデル。ネットワーク内で噂がどのように広がるかを理解したり、集団内でのウイルスの拡散予測に活用される。 |
GAN (敵対的生成ネットワーク) |
生成器(Generator)と識別器(Discriminator)の二つのニューラル ネットワークで構成。生成器はデータを生成しようとし、識別器は実際のデータと生成されたデータを区別しようとする。リアルな人間の顔やアート作品の作成などの画像生成などで使われる。 |
VAE (変分オートエンコーダー) |
入力データの圧縮表現を生成し、それを復元して新しいデータを生成するオートエンコーダーの一種。画像のノイズ除去や、入力データと似た特徴を持つ新しい画像の生成などのタスクでよく使用される。 |
RBM (制限付きボルツマンマシン) |
データの確率的な生成規則を学習する2層のニューラルネットワーク。例としてユーザーの好みに基づいてストリーミングプラットフォームで映画を提案するなど、レコメンドで使われる。 |
PixelRNN (ピクセルリカレントニューラルネットワーク) |
前のピクセルのコンテキストを使用して次のピクセルを予測し、画像生成する自己回帰型のモデル。画像を 1 行ずつ描画するなど、データの連続生成が重要なタスクで特に重宝される。 |
マルコフ連鎖 | 以前の状態を考慮せずに、現在の状態のみに基づいて将来の状態を予測するモデル。例えば現在の単語に基づいて、文中の次の単語を予測するテキスト生成でよく使用される。 |
フローベース生成モデル | 単純な確率分布に適用され、より複雑な分布を生成する一連の可逆的な変換を指す。財務モデリングなど、データの変換を理解することが重要なタスクで活用される。 |
ここで、LLMと生成AIの違いが気になる方もいるかもしれません。
まず、LLMとは膨大な量のテキストデータで事前にトレーニングされた、ディープラーニング(深層学習)アルゴリズムの一種で、さまざまな自然言語処理(NLP)タスクを実行できる言語モデルです。
LLMも生成AIの一部ですが、LLMは中でも自然言語処理に特化しており、例えば翻訳、要約、質問応答、テキスト生成の対応を得意としています。
生成AIは、画像生成、音声生成、テキスト生成など、さまざまな形式のデータを生成することを目的とした広範な技術を指します。LLMはその中でもテキスト生成に特化したモデルであり、生成AIの一部として位置づけられます。
生成モデルを見てもわかる通り、生成AIは膨大なデータから学習し、斬新で独創的な新規コンテンツを生み出せる力を持っています。
現在ではこのモデルによって、数多くの業界に影響を与えています。例えば、芸術系分野では、AIによって音楽やグラフィックデザインを制作、あるいは書籍等を始めとする文章制作にも積極的に使われ始めています。また技術分野においても、その影響は複雑なプロセスのシミュレーション、機械設計、コスト予測などといった範囲にまで及び、今後の影響度についても目が離せません。
さらに生成AIの推進度や社会の関心度も実際に高まっていることが分かっています。
コンサルティングファームPwCコンサルティング合同会社が実施した2024年6月の調査結果によると、国内企業での生成AIの活用は既に2023年秋以降に大幅に伸び、その後も緩やかな伸びを見せていることから、先行して導入した企業が試行錯誤しながら既にさまざまなユースケースを見出していると推察されています。
【出典】PwCコンサルティング合同会社「生成AIに関する実態調査2024 春」
さらに業界ごとでみてみると、やはり通信/テクノロジー業界はパイオニアとしていち早く業務に生成AIを取り入れている動きがありますが、次いでサービス、公益事業/エネルギー分野、金融業などでも生成AIの活用が急速に進んだことが分かります。いわゆる生活基盤に関わる分野に生成AI導入の波が押し寄せてくるのも、遠い未来ではないと言えるでしょう。【出典】PwCコンサルティング合同会社「生成AIに関する実態調査2024 春」
ここまでは生成AIの概要を解説しました。それではChatGPTとは他の生成AIとどう異なるサービスなのでしょうか。この章では、ChatGPTを中心に、生成AIとの違いや特徴を見ていきましょう。
ChatGPTは生成AIの一種で、OpenAIの提供するサービスです。ChatGPTが生成AIの一種でありながら、独立して扱われることが多いのは、その自然な会話能力により、非常に高い注目を集めた存在だからでしょう。
ChatGPTと他の生成AIは、どちらも新しいコンテンツを生成できるという点で共通していますが、得意とする領域や生成できるコンテンツの種類が異なります。
まず、ChatGPTは前の章で解説した、LLMをベースにした生成AIですので、「テキスト生成や自然な対話が得意なツール」と言えます。まるで人間のように会話ができ、自然言語のテキストを生成能力がある点が、ChatGPTの大きな強みです。
ChatGPTは文脈を理解しながら、人間らしい応答を生成するように設計されていますので、例えば、自然な会話ができる仮想アシスタントを開発することが目標であれば、ChatGPT が理想的な選択肢となります。
一方で、高度な画像制作や音楽制作といったタスクが必要であれば、各領域に特化した別の生成AIを使用したほうが良い場合もあるでしょう。このように、生成AIはそれぞれ得意な分野が異なるため、目的や用途に合わせて使い分けることが重要です。
リリース当初のChatGPTはテキストだけの会話でしたが、2022年11月に音声モード付きがリリースされました。さらに2024年5月からは利用者がマイクに向かって音声で質問や指示をし、音声で回答を得ることができる高度な音声モード「Advanced Voice Mode」がリリースされ、ますます人間と対話するようにChatGPTを利用できるようになりました。
また2023年3月のGPT-4のリリース以降は、テキストだけでなく、画像やURLなどの異なる形式のデータを理解し、処理できるマルチモーダル機能が追加されるなど、会話のクオリティは日々進化を遂げています。
開発元のOpenAI社は今後も継続的なモデルの改善やさらなるマルチモーダル機能の強化を目指しているといいます。
今後は、例えば手書きの段階でのラフスケッチを読み取り、コーディングを実現したり、財務チャートから会社の経営状況に対する分析を行ったりする日も遠くない未来にありそうです。
【参考】OpneAI最新のリリース情報
ChatGPTを日常業務の中で取り入れれば、これまで数時間かかっていた作業、頭を悩ませていた課題、目視では確認しきれない膨大なデータ処理を一瞬で解決してくれる、といったメリットがあります。
例えば、以下のようなタスクはChatGPTで解決できます。
ChatGPTを扱う際のポイントとして、特定の個人や法人を指定してしまうと関連するデータが出てこない、また社内機密情報は入力を控える必要があります。
またプロンプト次第では、より複雑で独自のニーズに応じた結果を返してくれるようになります。最近では過去の会話履歴も残しつつ、会話を進められるため、過去のやり取りを維持しつつ修正を繰り返し、より良い成果物を出せるといった点も、社内リソースを逼迫せずに作業ができるため、特に優れた魅力と言えるでしょう。
ChatGPTの概要がわかったら、まずは実際に触って使い勝手を試してみましょう。以下では、最初に取っ掛かりを掴むヒントをご紹介します。
これまでの章で見てきた通り、ChatGPTは「テキスト生成を得意とする専用ツール」です。従って、テキストで出来る成果物作成をする際に業務で利用してみることからやってみましょう。
無料版はGPT-4o版が利用可能ですが、利用回数に制限があり、制限に達するとGPT-4o miniに切り替わって利用を継続することができます。
GPT-4o版ではテキスト、画像に加え音声、動画も対応していますが、mini版だとテキストと画像のみの対応となります。しかしながら、機密情報などを扱わない程度のテキスト作成、翻訳、要約作業、Excel関数やプログラムコード生成、調べもの程度なら無料版から始めてみるので十分でしょう。
以下は、テキスト生成でできる、一般的な利用例となります。ぜひ、ご自身の業務の中でできることから取り入れてみてはいかがでしょうか。
No | 一般的な用途 | 概要 |
1 | ビジネスメールの下書きの生成 | 適切なメールの書き方やフレーズを自動生成。 |
2 | レポート作成の支援 | データの解析結果の解説文を生成。 |
3 | レポートやミーティング議事録整理 | 議事録のテキストを整理し、要点を抽出。 |
4 | 問い合わせ対応の効率化 | よくある質問や問い合わせに対する自動回答の生成。 |
5 | プレゼンテーションの準備 | 主要なポイントや要約文を作成。 |
6 | 営業レターや広告のコピーライティング | 効果的な広告文を提案。 |
7 | ビジネスプランの策定・分析 | 戦略の大枠や要点を作成。 |
8 | チュートリアルの作成 | 製品やサービスの使い方に関するガイドの生成。 |
9 | 翻訳支援 | 短い文章や単語の翻訳。 |
10 | アイデアブレインストーミング | 新しいプロジェクトや製品についてのアイデア創出。 |
ChatGPTはテキストベースのやり取りですが、「画像を生成したかったらどうすれば良いの?」とお悩みの方もいることでしょう。
そんな時は、OpenAIが提供しているDALL-E3を使ってみるのも一つの方法です。
DALL-E3は、自然言語処理からニュアンスを掴んで画像に落とし込む機能を持っており、テキストだけでなく画像データをもとに新たに画像を生成することもできます。
ChatGPTと連携して利用する場合には有料版しか現在対象とされていないため、無料で試してみたい場合は、BingブラウザCopilotを利用すると良いでしょう。(※ただし商用利用としてはご利用いただけません。)
メリットや活用のポイントを分かりやすく解説!
AIチャットボット 社内活用入門ガイド
ChatGPTで何かをしようとする時、テキストを送信します。この命令文を「プロンプト」と呼びます。
しかし思いつくままにプロンプトを書いてしまうと、自分が思っていたような結果が得られないなどといったリスクが生じてしまうので、言語化する能力が大切です。
以下では、OpenAIが発表しているプロンプトの書き方のコツの例をピックアップしてご紹介します。
なんでもできるように見える生成モデルですが、さすがに私たちの心まで勝手に推測してくれる能力はありません。ですから、結果次第ではこちらの希望を明確に伝えて、希望の結果へ導いていく必要があります。
もし出力結果が短すぎる場合は、専門レベルでの出力をしてほしいと伝え、逆に長すぎる場合、例えば文字数を指定する、出力イメージの例を伝える、といった具体的な指示を出すと良いでしょう。
悪い例 | 良い例 |
Excel で数字を追加するにはどうすればよいですか? | Excel で「金額」行を合計するにはどうすればいいですか? シート内の行全体に対して自動計算し、すべての合計が右側の「合計」という列に表示されるようにしたいです。 |
大統領は誰ですか? | 2021 年のメキシコ大統領は誰でしたか? また、選挙はどのくらいの頻度で開催されますか? |
フィボナッチ数列を計算するコードを記述してください。 | フィボナッチ数列を効率的に計算する TypeScript 関数を記述してください。さらに、コードに自由にコメントを付けて、各部分の動作と、そのように記述されている理由を説明してください。 |
会議の議事録を要約してください。 | 会議のメモを 1つの段落にまとめてください。次に、講演者とそれぞれの要点を箇条書きにしてください。 最後に、講演者が提案した次のステップやアクション項目があれば、それをリスト化してください。 |
特に高度なトピックなどを聞いている場合、言語モデルも毎回正しい情報を提供してくれるとは限りません。時には正しくない情報を生成してしまうことも考えられます。
正しい情報を使って回答を望む場合、参照文献のテキストを一緒に提示する、あるいは参考文献を提示し、回答は文献情報のみからしか行わない、情報不足の場合は「情報不足であること」を回答してもらう、という方法で、間違いを防ぐことができます。
実は弊社内でも、ChatGPTを使ったチャットボットシステムを業務で利用しています。今では皆が当たり前のように使っていますが、社内に展開する際は最初に勉強会を開き、どんなプロンプトで指示できるのか、チュートリアルを示すことで、社員がスムーズに使えるようになりました。
中でも、品質向上については以下のような紹介を最初にすることが肝心です。例をご紹介しましょう。
以下3つは、回答の精度を上げるためのTipsです。
諸説あるものも存在しますが、知っておくと使える知識も、NDIS社内では実際に共有しています。
例: あなたはプロの編集者です。以下の制約条件と入力文をもとに最高の要約を出力してください。 #制約条件: ・文字数は100文字程度 #入力文: ChatGPTは、OpenAIによって訓練された大規模な言語モデルです。このモデルはGPT-3アーキテクチャに基づいており、大量のテキストデータから学習して自然言語生成タスクを達成します。ChatGPTは、文章の作成、質問への答え、会話の生成など、多様なテキストベースのタスクに対応できます。しかし、ChatGPTは2021年までの知識しか持っていませんし、自己意識や意図を持たず、また、情緒や個人的な経験もありません。人間の会話のパートナーのように思えるかもしれませんが、それはあくまでプログラムによって生成された結果です。 |
<出力結果> ChatGPTは、OpenAIが作った大きな「学習機械」で、たくさんの文章を学んで、自分で文章を作ったり、質問に答えたりします。 でも、2021年までのことしか知らないし、人間のように感情や経験はありません |
もし出力結果の情報が足りなくても、追加質問することでより知りたい情報を引き出せます。
出力されたテキストに対し、以下のように追加で質問してみましょう。
生成AIは、各企業のサービスに組み込み別機能とコラボレーションすることで、さらにその価値を高めていっています。
この章では、生成AIが搭載された有名なサービスについて見ていきましょう。
Microsoftは2023年3月、Microsoft365の一部の機能に GPT-4 を統合した「Microsoft 365 Copilot」を発表しました。例えば、Wordでは、ユーザーが入力したキーワードに基づいて自動的に文章を生成する機能が追加されており、Outlookでは下書き機能のほか、読み手が正確に理解できるようなトーンのサジェストも行ってくれるのです。
また、有料版に加入することで、PowerPoint上での画像生成が可能となり、大幅な業務効率向上につながります。
例えば、Copilot ProやCopilot for Microsoft 365に加入することで、DALL-E 3を利用した高品質な画像生成が可能です。
ChatGPTの開発元であるOpenAIは、社内でのやり取りをSlackで行っていたことから、新たにChatGPT for Slackβ版アプリをリリースしました。社内コミュニケーションツールであるSlackには元々、Slackbotというリマインダーや指定ワードが投げかけられた際に応答するbot機能が組み込まれていましたが、このリリースによってChatbotに質問したり、文章作成をSlack上でできるようになりました。
語学学習に興味のある方なら、一度は使ったことがある語学学習アプリ「Duolingo」も、 GPT-4 を利用してユーザーとの対話を通じた学習をサポートしています。ユーザーは、AIと自然な会話を楽しみながら、実際のコミュニケーションスキルを向上させることができます。特に、発音や文法のチェックがリアルタイムで行われるため、効果的な学習が可能です。有料プラン「Duolingo Max」では、AIとの対話を通じたシナリオ練習ができ、高度な機能も提供されています。
海外旅行好きの方なら、航空券やホテルの予約をExpediaから一度は取ったことがあるかもしれません。以前は手動で検索していたこれらの機能も、いまではAIアシスタントによって、まるで旅行代理店と会話をしながらプランを練るような体験ができるようになっています。さらにアプリでは、顧客が興味を持っているホテルや、アトラクションのスマートリストを自動的に作成してくれる、といった痒い所に手が届くような機能も追加されています
実は弊社NDISも、社内で使うだけでなくお客様にご利用いただけるソリューションとして、ChatGPTを組み込んだチャットボットサービス「CB3」を展開しています。
CB3は、企業固有の業務システム連携や社内文章を取り込むことで自社専用のチャットボットを実現します。さらに、ChatGPT連携をさせることで、自社オリジナルのChatGPT環境構築も可能です。
大手企業様をはじめ、ご導入いただいた企業様には大変ご好評をいただいており、今後さらに進化したチャットボットサービスのリリースに向け、日々社内エンジニアが研究・開発を行っています。詳細は以下の動画をご覧ください。
いかがでしたでしょうか。本記事では、生成AIとChatGPTそれぞれの特徴と、ChatGPTの業務での活かし方について解説しました。
生成AIは、文章や画像、音声などの多様なコンテンツを自動生成する能力を持ち、ChatGPTは中でも対話形式のテキスト生成に特化した役割を果たす、といった特徴がありました。
国内企業でも、2023年秋から積極的に生成AIを業務に取り入れ始めた傾向があり、今後はビジネスと生活圏両方でAIサービスの利用が当たり前となる日も、非常に近いことがうかがえます。
最後に、生成AIやChatGPTの効果を実感するために、CB3無料トライアルを利用してみることをお勧めします。CB3は生成AIと対話AIを組み合わせて幅広い業務でご利用いただける、AIチャットボットです。これにより、自社の業務にどのように生成AIを適用できるか、具体的に理解することができるでしょう。無料トライアルを通じて、生成AIの可能性をぜひ体験してみてください。
当サイトでは、AIチャットボット、kintone活用、ChatGPT、総務DXに関するダウンロード資料をご用意しております。ご興味のある方はダウンロードいただき、資料をご活用ください。
また、チャットボットトライアルもご用意しておりますので、ぜひお試しください。