2022年の終わり頃に出現して大評判となっている「ChatGPT」について、本質をどう理解して今後どうなっていくのかを考えるための、知識や教養をまとめます。
「手っ取り早く儲けよう!ベンリに使って楽しよう!」という記事が数多く出ていますが、今回は「ChatGPT」の使い方を取り上げません(笑)
「ChatGPT」の沸騰ぶり
「ChatGPT」は、2022年11月に出現して2023年初頭からネット上で話題沸騰しています。
どれぐらい話題かというと、NHKのニュースに取り上げられるぐらい(!)です。
公開されて2~3か月ほどの間に100万人を超えるユーザーが集まるほど話題になったのは、だれでも無料で使える形になっていたことが大きく貢献しているでしょう。
「Try CHATGPT」ボタンを押すと、ユーザー登録などの画面に誘導されて体験することができました。
ちょうどこの記事を書いている間に、「ChatGPT Plus (USD $20/mo)」つまり有料プランが出現しました。ネット上のマーケティングではもはや伝統的手法となった「フリーミアムモデル」です。
結論:いま流行りのAIは「テキトー」
レポートが書ける、企画書が書ける、プログラムもできちゃう、などその回答を称賛する記事がたくさん出てきます。
しかし、この記事ではあえてこう結論します:
いま流行りのAIは、「テキトー」
「ChatGPT」は単に適当に答えているだけです、というと各方面からお叱りを受けそうですが、
むしろ0と1の二進数でできているコンピュータが「テキトー」な答えが出せること自体が革命的だったのです。
人間にもたまにいますよね、あまり考えずに「テキトー」に答えて会話を成立させています。ただ、今回のAIの場合、答えられる知識の範囲・量が普通の現代人に比較して非常に大きく、ものすごく大きなデータベースの中から「テキトー」に「いい感じの」答えを引っ張ってくるイメージです。これをみた人間は、そこに知性や論理性を感じます。
「適当さ」が絵で見てわかりやすい「Stable Diffusion」
「テキトー」の理由を説明する前に、どんな感じで適当なのか、イメージをつかむ方法を紹介します。
「ChatGPT」出現の半年ほど前、2022年8月に「Stable Diffusion」というシステムが発表されました。
「Stable Diffusion」は、言葉(テキスト)を入れると絵を描いてくれる人工知能・AIです。
AIに命令する言葉のことを、プロンプト、と言いますが、「呪文」と呼んで遊ぶ人が大量発生しました。
なぜかアニメ風の美少女が大量発生しています。
「Stable Diffusion」で生成されたこれらの画像を見て、違和感を感じませんか?
検索結果から各記事を少し眺めると、同じ「呪文」で何回も画像を生成し、試行錯誤をしていることがわかります。
画像を作るたびに違うものが出てくるのは、初期値が毎回違う仕組みのためですが、うまくいかない画像は体の一部が異様に大きかったり、指が三本だったり、腕が4本だったり、ヒトの形として普通は描かないものが含まれています。デッサンが狂っている、というレベルを超えています。
比較対象としての「ジョジョ立ち」
話しはものすごく飛ぶのですが、比較のために「ジョジョ立ち」を取り上げます。
「ジョジョの奇妙な冒険」という40年ぐらい続いているマンガのキャラが、独特のポーズを作っているので名前が付いて「ジョジョ立ち」と呼ばれます。
実はこのポーズ、すべて実際に人間が実施可能なものだ、ということで実際にやってみた人がSNSなどで一時期話題になりました。
上述の画像検索結果には、人間が同じポーズをとっている写真も混ざっています。
「ジョジョの奇妙な冒険」を描いた荒木飛呂彦先生は、人間の骨格や筋肉を考慮して、構造上可能なはずの絵を描いたと思われるのです。
「Stable Diffusion」には、そういう論理性や配慮は無さそうです。
言われたことを「テキトー」に組み合わせて生成しているように見えます。
「ChatGPT」の答えは、この「Stable Diffusion」の「テキトー」な感じに、非常によく似ていると思うのです。
ニューラル・ネットワーク
昨今話題になっている「人工知能」「AI」はほぼすべて「ディープラーニング」という技術の応用です。
「ディープラーニング」は、「ニューラルネットワーク」という技術がもとになっています。
「ニューラルネットワーク」とは、「人間の脳や神経の構造を数式に置き換えてみよう!」という考え方です。
人間(生き物、と言ってもいいかもしれませんが)の脳や神経は、「ニューロン」という細胞が大量につながってできています。
「ニューロン」を模倣した数式をつくって計算させたら、いいこと起こるんじゃない!?!? というノリで作られたのが「ニューラルネットワーク」という技術です。
「ノリ」というとまた専門家の方々から叱られるかもしれませんが、なぜうまくいくのか/なぜいい感じの答えが出るのか、について理由を説明することはできていないでしょう。
人間の脳がなぜ機能するのか、よくわかっていないのと似ています。
つまり、「ChatGPT」の答えが「テキトー」に見えるのは、その基盤となっている「ニューラルネットワーク」の「テキトー」さに通じています。
なぜいま急に始まったのか
「Stable Diffusion」や「ChatGPT」は、2022年に突如出現して一気に話題になりました。
他の組織や企業からも、類似の技術が数多く出てくるようです。
なぜいま、急に始まったのかについては、いくつかの理由がありそうです。
たとえば、「Transformer」という考え方・テクノロジーは、大きな前進となりました。
しかし、ここでは、このようなソフトウェアの発展とは別のところに着目します。
それは、「ハードウェアの進化」です。
「パラメータ」→計算の量と精度は、指数関数的
「計算する量を一定以上増やすと、急激に精度が上がる」という現象が出ています。
上述の記事にも引用されているのが、たとえばこのグラフです。
縦軸は精度、横軸は「パラメータ」となっていますが、「計算する量」と置き換えてよいでしょう。
「パラメータ」の意味
「ディープラーニング」あるいは、「ニューラルネットワーク」でいう「パラメータ」の意味は、ウェイトの数を言っているようです。
つまり、このような図でいうと、〇と〇の間にある線(矢印)1本が、パラメータ1個、と考えて
この矢印1個=ウェイト値1個=掛け算1回 → ニューロンに集まった分足し算、という構造になっています。
前述のグラフで言うと、この矢印を13ビリオン=130億個以上にすると精度が飛躍的に上がって、今回の「ChatGPT」「GPT-3」は1750億個を計算する、ということです。
次世代の「GPT-4」ではパラメータが100兆個(!)になるという噂も出ています。
ハードウェアの発展にぴったりマッチしたソフトウェアが起こすブレイクスルー
IT系のテクノロジーは、「ハードウェア」の性能進化にぴったりマッチした「ソフトウェア」が出現して組み合わさることで、イノベーションが繰り返されてきた歴史があります。
この1年ぐらいで出てきたブレイクスルーも、「ハードウェア」の進化が背景にあるはず、という仮説のもと、その経緯を探ります。
CPU、2つの発展形態:CISCとRISC
コンピュータは、「CPU」⇔「メモリ」⇔「ディスク」という部分が連携して動きます。パソコンはもちろんのこと、スマホもまったく同じ構造です。
「CPU」は、計算するところで、パソコンの中でも一番高価な部品です。
この「CPU」の仕組みとして、大きく分けて二つの流れがあります。それが、「CISC」と「RISC」です。
(※30年以上前に学んだ知識ですが、いまも通用しているようですので、おそるおそるこの言葉を使います(笑)
「CISC:Complex Instruction Set Computer」
「CISC」は、複雑な計算を一発でやって速くしよう! という考え方です。
「一発」というのは、現代のCPUでいうと2GHzぐらい、つまり、「20億分の1秒」ぐらいで行います。
従来の大半のパソコンはこの「CISC」で作られています。王者は「Intel」です。
「インテルはいってる!」のアレです。
「RISC:Reduced Instruction Set Computer」
「RISC」は、単純な計算だけでいいから、ものすごく速くやろう、という考え方です。
単純な計算とは、掛け算と足し算、と考えるとわかりやすいです。
実際、0と1の二進数の世界で行う計算は、すべて掛け算と足し算の組み合わせに変換できます。
CISCは1回で複雑な計算を目指しますが、RISCは掛け算と足し算だけに特化してめちゃめちゃ速くやる、と考えてよいと思います。
掛け算と足し算を大量にやる技術
掛け算と足し算を大量に行う技術が、いくつか出現して発展しました。
その一例が、CG、つまり、描画・表示する部品=GPUです。
コンピュータの画面表示は、色の粒々でできています。一つの粒を何色にするかを、1画面分(たとえば1920個✖1080個)を30秒に1回ぐらい計算すると人間の眼にはわからないぐらい滑らかに描画することができます。
「ゲーミング・パソコン」と称されて売られているパソコンは、この「GPU」の性能を押し出して競っています。ゲームは表示速度の違いがゲーマーの反応に直結しますから非常にシビアに追求されるわけです。
また、このGPUを大量に利用して、仮想通貨の「マイニング」に利用されるようになりました。
GPUが世界的に品不足に陥るほど、このニーズは一時高まりました。
そして、今回の「ディープラーニング」AIの計算でも、このGPUが活用されます。
「ディープラーニング」は、前述のとおり、掛け算と足し算、言い換えると、ベクトル演算、あるいは、行列演算(テンソル:Tensor)を大量に行います。
そのニーズの大きさから、AIに特化したハードウェアが開発されています。
たとえば、Googleはクラウドで「TPU」というディープラーニング計算に特化したサービスを提供したり、自社のスマホ「Pixel」のCPUとして「Google Tensor」を出しています。
Appleのパソコンに入っているIntel製ではない独自開発のCPUである「M1」「M2」には、AI特化の「Neural Engine」というハードウェアを搭載しています。
「iPhone」のCPUである「A16」などのチップにも「Neural Engine」が入っています。
従来は、AIの計算はクラウド・ネットワーク側で行って、結果をスマホやパソコンに返してくる使い方が主流でした。しかし、これらのハードウェアがスマホやパソコンに搭載されている世界が普通となった場合、ネットワーク無しでAI機能を使うケースが増えそうです。
予想される近未来:ホワイトカラー平社員全滅
「ChatGPT」の答えを眺めていると、たとえば、大学の先生が困るだろうというのは多くの人が指摘しています。
しかし、このままAIが進化発展した場合、パソコンに向かって行う仕事の大半はAIが行うようになるのでは、という気がしてきます。
つまり、いわゆる「ホワイトカラー」の仕事の大半を人工知能・AIがこなすようになるのでは、という予測が現実になった感じがします。
「ホワイトカラー」の仕事はなくなるか?!
しかし、前述のとおり、原理的・仕組み上、AIの回答は「テキトー」です。その回答をチェックする仕事は必須です。
チェック自体もAIにやらせることができるかもしれませんが、最終的には人間が責任を持つ必要があるでしょう。
つまり、「AIの仕事をチェックする仕事はなくならない(なぜならテキトーだから)」と言えそうです。
言い換えると、ホワイトカラー平社員の仕事はAIが行って、その仕事をチェックして監督するマネージャー・管理職の仕事はなくならないでしょう。
しかし、これは複数の事象が組み合わさって相当なインパクト、社会変革を起こすと予想します。
「大卒」の増加
もはやAIと関係なくなりますが、いわゆる「大卒」は増加傾向です。
少子化にも関わらず、1980年頃に年間40万人だった大学進学者は、2020年までに20万人以上増えています。(代わりに激減しているのが高卒就職者です。)
また、少子化で大学が余る、などと言われていますが、人気の大学ほど定員数は増加しています。
そして、これに拍車をかける政策が続きます。
東京23区内の大学(東京大学や早稲田大学など人気校含む101大学が該当)の定員規制を緩和します。
「デジタル人材」なるものを増やしたいそうで、文系学部を理系に転換させる政策もやるそうです。
「社内失業」者の流出
この他、終身雇用の崩壊、年功序列で上がっていく給与制度の崩壊、同一労働一賃金の法制度、ジョブ型雇用の普及、産休制度の定着による女性の雇用継続など、ホワイトカラーに対する圧力は高まるばかりです。
この結果予想される現象は、社内失業者の流出です。
社内失業者は、400万人を超えると予測されています。
終身雇用・年功序列の世界では、大組織ほど多くの社内失業者を抱えることができました。
日本国内の大手企業でも、頻繁に希望退職者が募集されているのは、このような背景があります。
(省庁や自治体はどうするのでしょうか。)
まとめ
「ChatGPT」の本質は「テキトー」だ、という暴論の理由と、これら進化の結果起こることの一端を予想しました。
お役に立てば幸いです。
コメント