こんにちは、ほんパパです。
ChatGPTとかAIの作った画像が話題になっているけど、いまいちよくわからない。
ニュースとかでは見かけるけど、周りにはそんなに詳しい人がいないし、 このままで本当にいいのかなと悩んではいないでしょうか。
そんな不安に駆られているパパにおすすめの本をご紹介します。 生成AIで世界はこう変わるになります。
|
この本をお薦めする理由
・AIに関する知識がわかりやすく学べる
・AIによる変化が網羅的に理解できる
・様々な参考文献をもとにしているので、説得力がある
続いて、著者のプロフィールをご紹介します。
【著者プロフィール】
今井翔太 1994年、石川県金沢市生まれ。東京大学大学院工学系研究技術経営戦略専攻松尾研究室に所属。博士(工学、東京大学)。人工知能分野における強化学習の研究、特にマルチエージェント強化学習の研究に従事。ChatGPT登場以降は、大規模言語モデル等の生成AIにおける強化学習の活用に興味を持つ。著書に『深層学習教科書 ディープラーニングG検定(ジェネラリスト)公式テキスト 第2版』(翔泳社)、『AI白書2022』(角川アスキー総合研究所)、訳書にR.Sutton著『強化学習(第2版)』(森北出版)など。
続いて、私の読みどころをご紹介します。
【私の読みどころ】
第三次ブームを起こした「ディープラーニング」とは?
よく勘違いされますが、AIは学習に使ったデータ自体をデータベースのような形で保持しているわけでありません。あくまでデータは、ニューラルネットワークのパラメータの調整に使われるだけです。p45
「人間がつくったかどうか」が最大の価値基準?
手軽に高品質な作品を生み出せるようになったことで、われわれの作品鑑賞における常識がうまく機能しなくなっているといのが、現在の状況だと思います。p193
メタ認知を上げて、戦略的思考を身につけろ
松尾、(「私たちは何を望みたいのか?」)が本質的だと思います。p231
よく勘違いされますが、AIは学習に使ったデータ自体をデータベースのような形で保持しているわけでありません。あくまでデータは、ニューラルネットワークのパラメータの調整に使われるだけです。
私もAIはデータベースを持っていると思っていました。
AIについて学ぶと、AIが生成を行う高性能システムであることが理解できます。
大量のデータから、正しい答えを探し出す作業を行っているのではありません。
多くの学習から、正しい答えの考え方を蓄積しているシステムと捉えることができます。
手軽に高品質な作品を生み出せるようになったことで、われわれの作品鑑賞における常識がうまく機能しなくなっているといのが、現在の状況だと思います。
この一文が最も印象に残っています。
現在の私たちのAIへの戸惑いを的確な表現。
自分の中でのAIに対する違和感がすっきりしました。
松尾、(「私たちは何を望みたいのか?」)が本質的だと思います。
生成AIの発達と普及は止まらないと考えられます。
そんな時代の変化に、警鐘をならしながら、思考を止めることは得策ではありません。
技術革新によってもたらされる変化と向き合い、自分や子どもたちにとって、望む未来をしっかりと考える必要があります。
その他の私の読みどころもご紹介します。
【その他の私の読みどころ】
今後普遍的に重要だと考えられる生成AIの技術的基礎と、確実に起こるであろう社会的影響の話題に集中して取り上げる p6
自分の声を好きな声質や言語にできる音声生成AI、動画・アニメーション、3Dモデル、さらには分子構造といったものを出力できる生成AIなど、さまざまな生成AIがすでに存在します。p24
GPT-4は、すでに司法試験や医師国家試験に合格できるレベルに達しています。p26
生成AIを使って声を変換した電話による、詐欺や政府高官へのなりすましといった事件も発生しています。p30
ChatGPTを開発したOpen AI社は、未来の超知能の実現を見すえて、AI開発におけるIAEA(国際原子力機関)のような機関の設立を訴え、自らも超知能を制御する研究に着手すると発表しています。p33
生成A Iは、その性能から突然別次元の技術が出てきたように思われがちですが、その基盤となっている技術はこれまでの人工知能研究の延長線上にあるものです。p41
これからChatGPTなどが実際に行っている情報処理を、みなさんの頭の中で体験してもらいます。最先端の人工知能だからさぞ難しい情報処理をしているのだろうと思われるかもしれませんが、やっていることは直感的に理解できるものです。p50
自分が出力した確率に従って解答とした単語を補いつつ、次に続く単語に対する出力を行うという操作を繰り返すことで、文章を最後まで出力できます。p55
ChatGPTなどの最近の超高性能な言語モデルを実現する核となった最後のコア技術が、「人間のフィードバックに基づく強化学習(RLHF) p62
人工知能研究の最前線が、「いかに賢いアルゴリズムを設計するか」という問題から、「いかにお金をかけられるか」という問題に変わってしまったのです。p71
少数例プロンプティングは、言語モデルから望む出力を得るため、本命の入力とは別に、出力の例を含めたプロンプトを入れる手法です。p74
最近では、従来の3D生成手法と拡散モデルを組み合わせ、質の高い3D構造を生成する手法も提案されています。p87
マルチモーダルモデルは名前の通り、単一のモデルで複数のモダリティを扱うようなモデルです。たとえば、画像と言語をセットで入力できたり、出力が言語と画像の両方であるようなモデルです。p90
ChatGPTのような高度な言語生成AIに複数の役割や人格を持たせ、その複数のエージェントに作業を分担させたり討論させる「マルチエージェント」の手法は、さまざまな分野で圧倒的な性能を出せることが示されてきており、今後のトレンドとなる可能性があります。p93
ChatGPTのような高度な言語生成AIに複数の役割や人格を持たせ、その複数のエージェントに作業を分担させたり討論させる「マルチエージェント」の手法は、さまざまな分野で圧倒的な性能を出せることが示されてきており、今後のトレンドとなる可能性があります。p93
人間の創造的な作業とされてきたものの大半は、実は「過去の経験のなかから、価値のある新しい組み合わせを見つけること」であり、生成AIは膨大なデータ学習からこれを見つけられるようになった p111
完全に今の雇用が維持されるという楽観的な考えもまた少ないようです。新たなスキル獲得に向けた教育の提供や、雇用が失われた場合のセーフティーネットの整備など、社会的、政治的な取り組みの必要性が強調されています。p117
いくら生産性の向上などが強調されていても、雇用や賃金などは外部要因によって決定されることを理解しておく必要があります。p121
生成AIシステムの導入は、労働当事者の満足感を上げつつ、仕事の質も向上させ、さらに顧客の満足度も上げるという非常に良い影響があることになります。p125
人間の開発者がどれだけ知識を持っていても、人間の脳の処理能力の限界から、どうしても時間がかかる作業でした。しかし、ChatGPTは数秒でこなすことができます。p134
ChatGPTには、すでにChatGPTプラグインという形で、趣味の補助を目的とする多くの追加機能が公開されています。p141
創造性に関する3つの定義を考えた場合、生成AIは明らかに「組み合わせ的創造性」「探索的創造性」の2つの「創造性」を持っているように思えます。p157
私はこの、個人の感情や思想、ストーリーが反映された創造行為こそが「創作」と呼ぶに値すると考えています。p162
歴史上、ある技術の出現によってクリエーターとなるハードルが下がり、結果として文化の発展が促進された例は数多くあります。p168
ボーカロイドは通常、歌わせたいメロディーを入力するだけではイメージ通りの歌い方を実現することはできません。ボカロPなどと呼ばれるボーカロイドのクリエイターは、職人芸的とも言える技量で調声を行い、理想的な歌唱を実現しています。p172
現時点でいえば、創作の高速化・負担軽減とアイデア出しにおいて、生成AIを利用する例が多く見られます。p181
人間がコンテンツを鑑賞する場合、コンテンツそのものではなく、その作品に付与される背景情報に大きな影響を受けていること、そして「人によって生み出された」という背景情報に対して肯定的な傾向を示す p190
実現能力や金銭、人脈などの問題で実現されなかった世界中の人の頭の中のアイディアが、もし生成AIによって解放されれば、それは世界全体にとって大変価値があることです。p198
労働の義務がなく自由な思索に集中できたために、古平ギリシャの哲学者が革新的な思想を生み出せた歴史や、資産家に保護されることによって、ルネサンス期の文化人が活躍できた歴史などが示すように「自由な時間」は人間が創造性や独創性を発揮させ、新たな発見や発明、芸術的な表現を創出する源泉となります。p200
おそらく生成AIの学習自体を規制するものではなく、その使用段階が対象としたものが主になると思われます。p202
そもそも生成AIが行っているような学習は、本来そこまで特別なものではなく、人びとがそれと意識せずに利用していた多くのITサービスの背後で動いているAIにも適用されているのです。p206
Open AI社は、学習に使うデータを収集する「GPTBot」のクローリングをブロックするための手順を公開しています。p208
私の意見としては、生成AIのサービスを提供する側が、検知のための機能も同時に提供する、という形になっていくことが妥当だと思われます。p211
今後は出力結果から類似度検索を実行し、できる限り出典を開示するようなシステムの需要が出てくるでしょう。p213
言語の柔軟性によって、情報共有の幅が広がるだけでなく、現実には存在しない概念を表現し理解できるようになった。p216
ハラリの言葉を借りて、「AIの認知革命」と表現してもいいでしょう。ChatGPTの台頭から約1年、その短い間に起こった生成AIや社会の加速的な変化を考えると、まさに今目の前でこのような革命が進行している気がします。p218
AIの発展の速度は、このようなことを考えてきた研究者の過去のたくましい想像を、何度も超えているという事実です p221
今、松尾研究室で行っている研究(運動系AIの研究)は、2023年11月時点でまだ裏付けが取れていない段階です。これを数年かけて実証し、さらにそこから5年くらいかけて広がっていくというのが、研究成果が一般社会に普及していく標準的な流れです。p226
2022年のChatGPT登場以前、著名な先生方がさまざまな未来予想をされていましたが、以降の革命的な流れを考えると、それらの予想はほとんど外れていると言っていいかもしれません。p229
松尾、簡単なことではありませんが、行動することを厭わず、できるだけ動いたほうがいいし、新しいものを見たり試したりしたほうがいいですね。p232
松尾、日本の置かれた状況に対して杞憂するよりも、「自分が活躍するためにはどうしたらいいか。」という問いを立てたほうがいい。p236
われわれ人間が単純な効率や生産性を中心とした大半の知的活動の主役の座から降りるときが現実のものになろうとしています。p240
第1章では、生成AIの概要と本書の目的と構成がまとめられています。
具体的には、生成AIの現在と未来。現在の技術の生みの親の警告。著書の目的は、生成AI革命のなかで「どう生きるか」を考える材料をみなさんに提供するといった内容が書かれています。
第2章では、現在における生成AIの主な技術が解説されています。
具体的には、第三次ブームと呼ばれる現在のAIの学習アプローチ法、ディープラーニング。
ChatGPTの情報処理の方法をこのりんごは()に入る言葉の探し方を用いての説明。「トランスフォーマー」、「スケーリング則」、「少数例プランプティング」。
動画作成の拡散モデルについての詳細な説明と図解。
ChatGPTの情報処理方法や拡散モデルの説明は大変わかりやすく、内部に引き込まれていきます。
第3章では、生成AIが身近なことへ与える影響が書かれています。
具体的には、ChatGPTの発展に伴い高度な頭を使う作業に影響を及ぼすこと、影響を受けることが仕事をなくすことを直接意味しているわけてわはないこと、現時点でカスタマーサービスやプログラミングにおいては歓迎すべき結果が出ていること。
暮らし、教育、医療といった分野での展望が紹介されています。
第4章では、生成AIが文化や芸術に与える影響を中心に記載されています。
具体的には、創造とはどんな定義と考えるべきか、AIにおける創造性はどんなものか、AIを利用した創造の革新的なものはなにか。
AIが登場したことにより、今後の文化の発展のあるべき姿とはどんなものか、AIの作品に対する一般的な反応とその価値基準とは何かが説明されています。
第5章では、長期的な生成AIの発展と人類との関わり方が述べられています。
具体的には、自由な時間が新たな発見や芸術の創出に役立つ、学習データに規制をかけることはできるのか、AIによって一人で問題解決できてしまうことでの弊害、AIによる認知革命などが説明されています。
最後に、師匠の松尾豊との対談が収録されています。
具体的には、5年以内の短期、15年以内の中期の予測が話し合われています。
続いて、目次をご紹介します。
ご参考になれば幸いです。
【目次】
はじめに
第1章 「生成AI革命」という歴史の転換点 生成AIは人類の脅威か?救世主か?
「生成AI」とは何か?
「この世にない新しいもの」を生み出せる
ChatGPTは「汎用技術(GPT)」?
史上最速で社会変化をもたらす「生成AI革命」
人間を超えた「超知能」の誕生も現実的に
本書の目的と構成
第2章 生成AIの背後にある技術 塗り替わるテクノロジーの現在地とは?
第一次ブームの「探索と推論」第二次ブームの
「エキスパートシステム」
第三次ブームを起こした「ディープラーニング」とは?
機械学習の分類と「自己教師あり学習」
ChatGPTはどのように情報処理をしているのか?
言語モデルは「穴埋め問題」を解いて学習する
「正しい回答」が「好ましい回答」とは限らない
人間によるチューニングと半自動的な学習
言語モデルを実現するニュートラルネットワーク
「トランスフォーマー」
AI研究をお金の問題に変えた「スケーリング則」とは?
大規模言語モデルで起こる「能力創発」
良い回答を引き出す「少数例ぷろ」と「思考の連鎖」
言語生成に次いで伸長する動画像生成AI
ノイズを除去して画像を生成する「拡散モデル」
ノイズを予測する学習をもとに除去を繰り返す
拡散モデルの「条件付き生成」とは?
音声・音楽生成AIの発展も進む
発展の先にある「マルチモーダルモデル」と「AIエージェント」
言語生成AIにとっての新しい検索エンジン
第3章 AIによって消える仕事・残る仕事 生成AIを労働の味方にするには?
長らく議論が続く「AIによる労働への影響」
「雇用の未来」が示した「全職業の47%に影響」という衝撃
「ホワイトカラーこそが影響を受ける」とした「GPTs are GPTs」
「ポランニーのパラドックス」が示唆するコンピューターの限界
AIなら「非定型作業」でも代替できる?
生成AIでも代替できないのは、頭を使わない簡単な作業?
機械化・AI化によって「仕事が奪われる」とはか生成AIによる生産性向上を示す複数の実験結果
すでに生成AI導入が進む「カスタマーサービス」分野
AIにより「カスタマーサポート」の質・生産性・満足度が向上
すでにプログラマーの仕事の半分は自動化されている?
プログラミング言語を使わなくてもプログラミングが可能に?
営業や販促における生成AIの活かし方とは?
研究者は積極的に生成AIを取り入れている
健康管理や趣味にも活かせるツールに
生成AIは教師や教材の代わりになる?
AIが医師の診断を上回る項目も?
第4章 AIが問い直す「創作」の価値 生成AIは創作ツールか?創作者か?
素人にもイラスト制作の依頼がくる時代に?
「AIは創造性を持つか?」をめぐる長い議論
「組み合わせ」「探索」「革新」という3つの創造性
人間が行う無意識のインプットは、AIにとっての「学習」?
人間ならではの「ストーリー」抜きに「創作」はできない?
「創作ツール」としての生成AIの画期性
新技術は新たな文化の発展をうながす
ビジュアル制作も音楽制作も生成AIで自由自在に
「AIキャラクター」や「AITuber」も登場
プロのクリエイターにも、多大な恩恵をもたらす
アイディア出しツールとしての利用も進む
AIがつくった作品に価値を感じられるのか?
「人間がつくったかどうか」が最大の価値基準?
第5章 生成AIとともに歩む人類の未来 「言語の獲得」以外の革新になるか?
AIに聞けば、すべての疑問が解決する?
アイディアさえあれば、なんでも実現できる?
人間は「人間にしかできない」ことに集中する?
生成AIは学習データを無断で使用していいのか?
強く規制すると、あらゆるサービスの利用が阻害される
デジタルコンテンツは本物と偽物の区別がつかなくなる?
情報の送り手と受け手のつながりが希薄化する?
人類の歴史を劇的なものにした「言語の獲得」
ディープラーニングが「眼の誕生」なら、生成AIは「認知革命」
「超知能」の前で、凡人とアインシュタインの差すらも無意味に?
特別対談 松尾豊×今井翔太 生成AI時代に求められるスキルとマインドとは?
AIがもたらす未来は、予測不能な高次の領域に
メタ認知を上げて、戦略的思考を身につけろ
国に頼るのではなく、未来の舵は自分で握れ
おわりに
本書で使用した生成AIまとめ
参照サイト
参考文献
いかがでしたか?
生成AIで世界はこう変わるを購入してみたくなってきましたか?
明日は、残酷すぎる人間法則の書評を掲載予定です。
|
おすすめの本や紹介のリクエストなどはお待ちしています。
お問い合わせからご連絡ください。
とても良い本でした。
今井翔太さんありがとうございます。
次の本も楽しみです~
コメント