『生成AIで世界はこう変わる』 企業ホームページ運営参考書籍レビュー
特に重要なポイント・内容
「ある技術が歴史の表舞台に登場したときの世間の反応」という観点で見ると、生成AIは良い面も悪い面も含めて、これまででもっとも大きな反応を引き起こした技術ではないか。
2022年11月に公開された言語生成AIであるChatGPTは、史上最速(5日間)で100万人ユーザーを獲得したサービスとなった。
- 「生成AI」とは何か?
生成AIは新たに文章や画像、音楽などをつくり出すことができる人工知能技術の一種。ディープラーニング(深層学習)は機械学習という人工知能の要素技術のなかでも、特に人間の脳を模倣した深いニューラルネットワークを学習する手法を指し、現在の生成AIはこのディープラーニングによって実現されている。
ChatGPT(GPT4)はすでに司法試験や医師国家試験に合格できるレベルに達している。数学、化学、物理、歴史など大学受験の主要な科目のほとんどの問題でも、人間より上のレベルで解答ができる。英語から日本語、アラビア語まで30近い言語を操ることができ、プログラミングについてもGoogleのコーディングテストをパスできるレベルである。これは総合的に地球上でもっとも賢い知的存在とまで言えるかもしれない。
- 史上最速で社会変化をもたらす「生成AI革命」
生成AIはその影響があまりにも大きく、これまでの汎用技術とは比較にならない速度で変化が起きている。これは数十年分の技術革新があったかの様相。ChatGPTの発表直後、Google社は社内にコードレッド(厳戒警報)を発令したとされる。1つの技術によって、世界一の企業の地位が脅かされる事態になっている。 - ChatGPTはどのように情報処理をしているのか?
ChatGPTのような言語モデルをまとめて「大規模言語モデル(LLM:Large Language Model)」と呼んでいる。言語モデルを一言で説明すると、「生成される単語・文章に確率を割り当てるモデル」となる。ChatGPTなどが実際に行っている情報処理をかんたんに再現したものを紹介する。
- 言語モデルは「穴埋め問題」を解いて学習する
われわれ人間が英語や国語のドリルを使ってやっていたような文章の「穴埋め問題」をひたすらAIに解かせることが、高性能AI実現の核心である。これくらい単純な学習でも相当高性能な文章生成AIがつくれることがわかっている。
- 人間によるチューニングと半自動的な学習
「教師ありファインチューニング」
なんらかのプロンプトに対して人間が理想的な回答をつくってやり、AIがそれを正解データとして学習するもの
「人間からのフィードバックに基づく強化学習」
とあるプロンプトを言語モデルに入力して、何個か回答を生成させる。これらの回答に対し、人間にとっての好ましさに応じてランク付けするといったフィードバックを行う。
- 大規模言語モデルで起こる「能力創発」
言語モデルを大規模化することで、小型のモデルにはなかったような能力が突然現れる。言語モデルは一般的に論理的・数学的なタスクが苦手だが、なぜかモデルサイズを大きくするとある段階で能力が開花して、今までできなかったことが突然できるようになる。
- 良い回答を引き出す「少数例プロンプティング」と「思考の連鎖」
少数例プロンプティングは、言語モデルから望む出力を得るため、本命の入力とは別に、出力の例を含めたプロンプトを入れる手法。
〈プロンプト〉
以下の文章を逆さまにしてください。ただし出力は全部ひらがなでお願いします。
文章:いい国家
〈回答〉
× 逆さまにした文章:かじくにいい
以下の文章を逆さまにしてください。ただし出力は全部ひらがなでお願いします。
文章:いい国家
〈回答〉
× 逆さまにした文章:かじくにいい
「いい国家」を逆さまにしてひらがなにした文章は「かっこいい」となるが、ChatGPTは見事に間違えてよくわからない回答をしている。では、ここで少数例プロンプティングを実行してみる。
〈プロンプト〉
以下の文章を逆さまにしてください。ただし出力は全部ひらがなでお願いします。
文章:新潟
文章のひらがな:にいがた
逆さまにした文章:たがいに
文章:いい国家
〈回答〉
文章のひらがな:いいこっか
〇 逆さまにした文章:かっこいい
ここでの「文章:新潟/文章のひらがな:にいがた/逆さまにした文章:たがいに」の部分が少数例プロンプティングにおける少数例となる。実際にどのように回答するか、人間のほうであらかじめプロンプトにお手本として入れてあげることによって、言語モデルはこちらの希望する出力をしやすくなる。
思考の連鎖プロンプティングは、言語モデルに対して段階的に出力を考えるようなプロンプトを与えることにより、最終的な出力の精度を向上させる。たとえば、「Let's think step by step(一歩一歩考えよう)」といったプロンプトを数学的な問題を解かせるプロンプトの最後に追加するだけで、正当率が大幅に増加する効果がある。
- 発展の先にある「マルチモーダルモデル」と「AIエージェント」
マルチモーダルモデルとは名前の通り、単一のモデルで複数のモダリティを扱うモデル。たとえば、画像と言語をセットで入力できたり、出力が言語と画像の両方であったりするもの。この技術が進めば、われわれ人間のようにあらゆる情報を処理し、しかも人間にはできないような高度な回答をするAIが実現できる。
言語モデルで生成された言語は、それだけでは計算機上の画面に表示された情報にすぎず、コードを書いたとしてもそれを実行することまではできない。生成された言語は、人間が読み取って解釈し、行動を起こすことで初めて意味をなす。
AIが自律的に生成された言語から必要な電子的ツールを選択し、その機能を実行できると、私たち人間は本当に、AIに仕事の指示をするだけで作業をほとんどしなくて済むようになるかもしれない。
ChatGPTのような高度な言語生成AIに複数の役割や人格を持たせ、その複数のエージェントに作業を分担させて討論させる「マルチエージェント」の手法は、さまざまな分野で圧倒的な性能を出せることが示されてきており、今後のトレンドとなる可能性がある。 - 永らく議論が続く「AIによる労働への影響」
生成AIが登場する前のコンピュータ/AIが労働に与える影響を分析する研究で、永らく共有されてきた主張は「特別なスキルを必要としない賃金が低い仕事であるほど、コンピュータ/AIによる自動化の影響を受ける可能性が高い」というもの。
生成AIが登場した2023年現在に広く共有されている主張は「高学歴で高いスキルを身につけている者が就くような賃金が高い仕事であるほど、コンピュータ/AIによる自動化の影響を受ける可能性が高い」となっている。
1つの研究分野の主張が、ここまで完全にひっくり返ることは歴史的にも稀である。たった10年の間でここまで変化した背景には、コンピュータ・AIにできること/できないことの前提が、生成AIの登場でひっくり返ってしまったからである。
- 「ポランニーのパラドックス」が示唆するコンピュータの限界
「ポランニーのパラドックス」とは、哲学者マイケル・ポランニーの言葉をもとに提唱されたもので、「人は言葉で表現できる以上のこと(暗黙知)を知っている」というもの。人間の言葉で作業内容を明確に記述できないようなもので、暗黙知が関わる作業を「非定型作業」という。
たとえば、運転は交通状況や天候などに左右され、同じルートであっても作業内容は毎回異なる。もっと簡単な例で言うと、猫と犬を見分けるといった識別も非定型作業である。実は犬と猫を見分けるルールを言葉で明確に表すのはかなり難しい。異常検知も非定型作業の1つ。人間の「なんか変だなぁ」という感覚の「なんか」は、言葉で表すことの難しさを端的に表している。 - AIなら「非定型作業」でも代替できる?
以前から将来的にもAIには難しいとされていた能力「創造的知能」と「社会的知能」というものがある。
「創造的知能」:作曲や科学研究など、新しく価値あるアイディアを思いつく能力
「社会的知能」:交渉や説得のように、人間の感情を重視した対人コミュニケーションを行う能力
これらの能力は従来の機械学習・ディープラーニング技術をもってしても「できないだろう」と思っていたが、生成AIではなぜできてしまったのか。
まだ研究途上の部分も多くあるが、現時点である程度の説得力のある説を述べるとすると、人間の創造的な作業とされてきたものの大半は、実は「過去の経験のなかから、価値のある新しい組み合わせを見つけること」であり、生成AIは膨大なデータ学習からこれを見つけられるようになった、というもの。 - 機械化・AI化によって「仕事が奪われる」とは限らない
研究者の間でも意見が分かれるがどちらかというと、生成AIは労働置換型ではなく労働補完型の技術であり、既存の労働をより生産的に、より快適で質が高いものにするという説が多い。ただし、完全に今の雇用が維持されるという楽観的な考えもまた少ない。
- すでに生成AI導入が進む「カスタマーサービス」分野
カスタマーサービスは、現時点で生成AIが最も威力を発揮するとされている分野。カスタマーサービスにおける生成AIの強みは、サービスの質を落とさず、場合によっては高い顧客満足度と高速化を達成しつつ、顧客とのやりとりを半自動化できることにある。
生成AIシステムがカスタマーサポートの労働者に対して回答の候補を提案するものでは、質・生産性・満足度が向上したという実例もある。 - すでにプログラマーの仕事の半分は自動化されている
「ChatGPT以前のソフトウェア開発は石器時代だった」とは、ある開発者の言葉である。言語生成AIが持つプログラミングコードの生成能力は驚異的なものだ。ソフトウェア開発における生成AIの導入は、以下の3つの形態に分けられる。
①逐次的にコードの続きを提案してくれるシステム
②対話的にコードを生成してくれるシステム
③指示を出すと実行結果を含め、全部のコードを生成してくれるシステム
生成AIを利用することで仕事のほぼ半分が自動化され、タスク完了までの時間も短縮して生産性を向上させている。
- 営業や販促における生成AIの活かし方とは?
マーケティングや営業は、文章や視覚によって顧客に積極的に働きかける分野であり、特に生成AIの恩恵が期待できる分野の1つ。簡単なところでは、製品説明の初稿を作成するためのアイディア出しとして使える。
営業では、顧客との会話を促進するスクリプトを、生成AIを使って事前に得るという使い方も考えられる。また、言語モデルを人格を持った仮想的な顧客と見なし、反応を分析することもできる。
- 健康管理や趣味にも活かせるツールに
ChatGPTのような言語生成AIは、膨大な知識を持っており、食や栄養学、健康など日常的に必要な情報も例外ではない。健康や栄養のバランスを考えた食の提案、生活習慣の見直し、トレーニングメニューの策定などといった活用法が考えられる。
- AIに聞けば、すべての疑問が解決する?
将来的には、Google検索や現在のChatGPTがパワーアップする形で「AIに聞けばなんでも解決する」世界がやってくると思われる。日常の悩みも、リアルタイムに起きていることも、ゲームの裏技も、仕事で行き詰まったことも、人類の積み上げた科学知識も含めた「なんでも」である。
- 人間は「人間にしかできない」ことに集中する?
言語生成AIなどを日々の業務に組み込むことで、今までは人間がやっていた多くのことが自動化され、より短時間でこなせるようになる。本来は人間が行っていた作業がなくなり、人間は別の活動に時間を割ける。業務であれば、ルーチン的な事務作業や資料作成ではなく、根本的な事業改革のアイディアを生み出すことや、社会や人類の未来に対してどう貢献すべきかを考え直すことなどである。
楽しみにしているのは、この機械の知能が、人間の思考の限界を超えて、人にとって嬉しい、価値のあるものを生み出してくれるという未来。そして、恐れているのはこの機械の知能が、人間の想像のはるか外にある脅威を持ち込んでくるという未来である。
かつて蒸気機関や電力が世界を大きく変革したように、生成AIは私たちの生活、仕事などを根本から変革する可能性を秘めています。
しかし同時に、生成AIがもたらす潜在的なリスクも見逃せません。倫理的な問題、偽情報の拡散、人間の創造性への影響など、多くの課題が山積みしているのが現状です。これらの課題を正面から捉え、楽観的な未来像だけでなく、潜在的なリスクについても理解しておく必要があるでしょう。
生成AIのメカニズムや私たちの労働に与える影響など、一般向けに生成AIを広く解説した書籍となっており、これから生成AIについて知識を深めたい方にピッタリの1冊です。
この記事を書いた人
高島 耕
株式会社ディーエスブランド Webマーケター
ディーエスブランド入社後、メールマーケティングやセミナー運営、社内業務のDX化に携わる。現在はメタバースや生成AIなどの、先端技術分野のライティングを担当。