社会人のためのデータサイエンス入門
https://lms.gacco.org/courses/course-v1:gacco+ga031+2023_06/about
上記演習にて、安宅さんが大人がデータサイエンスを学ぶべき理由を解説されており、そちらの文字お越しとなります。
今日はですね 今どういう世界というか世の中になっていて
こんにちは シン・ニホン作者の安宅です
皆さんにとってですね データや数理サイエンスのようなものが
いったいどのような価値があるか という話をできたらと思います
ちょっと簡単にバックグラウンドを言うと 僕は神経科学系のことを元々やってまして
あと その前後でコンサルタントを11年ほどやり ヤフーにやってきてですね
今それらを束ねるZホールディングスという会社にいます
慶應SFC(慶應義塾大学 湘南藤沢キャンパス)でも 2016年以降教えてまして
18年以降正規の教員もやってます
雑多な啓蒙活動等をやってきたんですが それはそれとしてですね
中身の話に行くと
今一番世界でイケてる会社って皆さんどこを思い浮かべるか
よくわからないんですけれども
アメリカのエンジニアリングスクールでは 過去3年ぶっ続けである会社が1位 2位を占めています
それは Space X(スペースエックス)とTesla(テスラ)です
これはApple(アップル)とかGoogle(グーグル)とか いわゆるGAFA(ガーファ)みたいなところよりも
ずっと上にいて 彼らが一番上なわけです
あとは軍事 航空系の企業が並んでいる
企業じゃないNASA(ナサ)もありますけど
ガチガチのハイテク企業ですね
こういう人たちがどういう ポスティング(求人)しているかっていうのを
一度ご覧になると良いと思うんですが ほとんどあらゆる職種でポスティングをしています
ここの中で例えばTeslaのですね あるポスティングを見るとですね
このサプライチェーンに関する戦略の人を採ろうとしていて こういう一連の数理データサイエンス系の能力と
一方でですね サプライチェーンについての詳しい人が 要求されたりしますし
あるいは工場現場のところにおいてはですね 同じく数多くの統計・数理的な素養に加えてですね
製造業務に非常に詳しいという 複数のドメイン知識がいることがわかります
これからわかる通りですね 今一番イケている世界を見れば 未来が見えるわけですけども
ほとんどあらゆる職種が データプロフェッショナルになるのはほぼ確定です
ではなぜこうなのか?ということをさらに考えてみますと
例えばですね 今のTeslaっていうのは 世界最大の企業価値になって
もう何年も経っているんですけども
その勢いというのは非常に強いものであってですね
トヨタ GM(ゼネラル・モーターズ) フォルクスワーゲンという 3大自動車メーカーをぶち抜いていったわけです
明らかに台数というよりも 世の中を変えている感っていうのが
富を生み出す流れになるということがありですね
そういうところに非常に注目が集まっているということは 間違いなく
恐らくこれを聞かれて 皆さんも未来を創られる方々だと思うんで
こういう風な企業が未来を創っているというのを 頭に置いてみた上でですね
「じゃあ自分たちは何をやっていったら良いんだろうか?」 というのを考えるのが
多分良いんじゃないかなって思います
ちなみによく言われる企業価値のランキングを見てもですね 上の方は軒並みAIだとか
データ・プラットフォームに直結した会社 もしくはそれを使い倒した会社がほとんどです
その他のところがあると今石油がですね 特殊な事由で上がってますけども
そういったところだったりするわけですね
ですから 直視すべき事実としてはですね データやAIを使い倒す企業がトップであるし
そここそが一番価値が生み出されていると 世界は信じているということです
この背景はコンピュータをみんなが持ち歩いたり 昔のスパコンよりも速いこういうスマートフォンなどもそうですし
(通信)帯域がこの20年あまりで1万倍とかに上がってます
通信が劇的に変わったおかげでインターネットや クラウドだとかですね
モバイルフォンといった変化が起きていて
そこで計算キャパシティが上がりですね
情報科学が進化して ビッグデータが生まれるとともにですね
産業革命級の変化が今起きていると言うのが 実態だと思います
ここまでは皆さんご案内だと思うんですが
いったい何が起きているかっていうと 例えば顔を見ただけでですね 遺伝病がわかるとかですね
あるいは読唇術というのがありますけれども 人間なんか遥かに超えた読唇能力を持つ
機械が生まれてきたりですね
歩いている人だけでですね その人が誰かわかるとかですね
はたまたですね 贋作を一発で見破るとか
さらにですね 心臓の拍動だけからその人が 誰かわかるみたいなことが起きてたりします
情報の識別系はおそろしく自動化されつつあるわけですね
ほぼ人間を超えてしまいました
さらにその人がどこに向かっている? みたいなことを予測するであるとかですね
どの機械が壊れるとか これ実は余命が短い方が
いつぐらいに危ないかというのを 予測するという研究も行われているんですが
人間を遥かに超える精度が出ています
同じようにですね どこのスタートアップが当たるか当たらないか?というのも
人間を超える能力を出しています
ここの延長にあると思うんですけれども 実際に天才棋士たちが軒並みコンピュータに負けると
いうことをみなさんもニュースでご覧になっていると思います
これはですね AIというのは探索能力が圧倒的に広いので ここのベースにあるのが統計数理モデルなんですけれども
非常に広いところが見えると言うのがあり 予測能力は極めて高いと
さらにですね こういったもの(モノクロ写真)に 色をつけるとかお茶の子さいさいですし
こういったこと(線画に色をつける)も簡単です
さらにですね 顔だとか音声も合成するというのは
実際問題そんなに難しい話ではないと
またこれまで暗黙知と言われてたですね 人がものをつかむみたいなことも
機械に教え込むことも可能になってしまいまして
これは深層強化学習という 特殊な学習方法を使っているんですけれども
非常に優れたアウトプットが出ています
というようなことでですね 多くのものが自動化していく過程にあり
これらをどんどん生み出していく またこれを使い倒すというのが我々の未来なわけです
ここはものすごく良いことなんですよね
かつての我々の先輩たち 100年 200年前の人たちは 多くが手作業か もしくは肉体労働をやってたわけです
それらは消え去って行って我々はフリーアップしたんで いろいろ面白いことをやっているわけです
今はもう人間の脳を使わないと判断できないとか 何かできないということのかなりがフリーアップしますので
またもう一発来ると思います
「シンギュラリティ」という言葉を聞かれたことが あるかもしれないんですけども
これは人間が技術的な力で生物学的な限界を超える時と これを言い出したですね カーツワイル先生は言っています
この視点で言うとですね 人間レベルの翻訳あるいは ほとんどの人を超える機械翻訳が可能になっていっているという
のは皆さん日々体験されていると思いますし
そこの背後にあるですね 数理データサイエンスの力が凄まじいおかげでですね
人間では聞き取れないようなスピードでもですね キャプショニングをするとかですね
それどころか言葉を打っただけでですね 画像を10秒 20秒で作ると
いうことが今可能になっていってます
この延長で可能なのは音楽を作るとか テキストを作るとかそういったことで
これはたった今起きてまして
恐らくここから数年間は人類史に残る おそろしいぐらいの自動化が進むと思います
これは まあ言ってみればですね シンギュラリティというべきものが
今 来つつあるという風に考えることができる
と思います
実際今ですね AIによって書かれて 査読されている論文のようなものもありますし
非常に驚異的なことです
このAIと言われているものは何かというと ものすごい速いコンピューティング環境に莫大な
様々な数理データサイエンスのモデルを差し込んで 訓練を行なったものです 基本的には
それをさらに組み合わせた複合的なAIもありますけども もとはこういう構造なんですね
ですからデータとは表裏一体にあるということは明らかです
ということを考えるとですね 単なるAIをただ使っているという
そっち側も含めてですね同時に学習するというのが 非常に重要だと思われます
データは21世紀の原油だという話は この5〜6年ずっと言われてきたわけですが
その話は今のような話が背後にあるということになります
その結果ですね 全ての産業がデータ×AI化する過程にありますし
これは産業革命におけるですね 新しい技術がいろんなところに広がっていって
つながり合ったのと同じタイプのものが今起きつつあると いう風に考えられます
ですから めちゃめちゃ面白い時に皆さんは生きてるんです
これをただ使っているユーザー側だったら ただデータジェネレータで終わっちゃうんで
ぜひ仕掛ける側に行った方が楽しいんじゃないかというのが この話ですね
アパレルも変わりつつありますし またお店も変わりつつあります
また農業も変わりつつあるということで この小売だとか農業だとか
アパレルっていうのは最古の産業だと思うんですけれども
こういったものも変わることから分かる通りですね
いわゆるハードなアセットを 中心としたオールド・エコノミーと
サイバーなアセットを中心とした ニュー・エコノミーと言っていた時代は
遠く過ぎ去りつつあって
新しく両方の力を持った産業 第三勢力というべきものが産業の中心になっていっています
実際に皆さんの体験ベースで最も人の命を ここのところずっと救ってきたのは
普通に考えれば mRNA(メッセンジャーRNA)ワクチンだと思います
これはいわゆる薬草だとか化学合成だとか
はたまたカビから取ってきたような抗生物質とかと 全く違っていて
これはデータドリブンに作られた ジェネティックエンジニアリングだけではなくて
バイオインフォマティクスのデータドリブンで 作られたものであって
全く違うものなんですね
このような形で産業は根本的に変わろうとしていて 先ほどのTeslaもそうですし
銀行も激変しつつあります
またウクライナでですね 被災されているところでどんどん
通信が可能になっていっているというような 通信網の完成というのもここにありますし
従来の腕時計がスマートウォッチに切り替わっていっている というやつも すごく大きいところだと思います
ということで見て分かる通り 明らかに第三勢力の時代に突入していて
マーク・アンドリーセン氏ですね Webブラウザを発明した彼が
「ソフトウェアが世界を飲み込んでいる」 という話をしましたけれども
飲み込んだというよりも そこを切り分けて議論する時代は終了してしまって
ソフトといわれているものの背後にあるもののかなりの部分は 数理データサイエンス的なモデルであって
それを使い倒す能力になります
したがって よくあるAI vs 人間みたいな話は 正直ベースで嘘っぱちであってですね
自分の経験だけから学んでいるような人と データやAIのような力を使い倒せる人の
戦いになることは間違いありません
ちなみに中国ではですね 中等教育 要は高校ぐらいの時からですね
結構なところまで教えているというのが実態です
ですから みんなやっておいた方が良いんです
だから データとAIの持つ力を解き放つことは めちゃくちゃ重要だと皆さんご理解いただけると思います
ざっくり言えばですね 一般的なデータサイエンスと言われているような
統計数理や分析 解析能力だけではなくて 情報科学だけではなくて
コンピュータにちゃんと指示を書ける力でありですね また実際に問いを整理する力が必要で
この3つを組み合わせるのがめちゃくちゃ重要だと思います
どの一つが欠けてもダメであることは 論理的に言ってほぼ明らかなんですがちょっと割愛します
ということを考えるとですね 今まで言ってみれば
人を使う側と使われる側みたいな視点で言うと 自分の言葉あるいは世界語でちゃんと物を考えて
明実的に伝える力と 正しく問いを立ててそこに対する答えを出す力
というのがかなり重要な能力だったんですけれども
ここに恐らく データxAIに関するリテラシーが
加わると言うのが私の見解です
ちなみにですね 今回コロナで出てきたあるデータなんですけれども
これは元東大の総長の五神先生が出されたデータなんですが システィ(CSTI)で持って来られたんですが
総合科学技術・イノベーション会議でですね これは何かわかりますか?
これはコロナで発生した日時が並んでて 縦軸は感染者数なんですね1日の
これ縦軸がですね 片対数であるっていうことで
ここで直線っていうのは同じような 指数関数的変化だっていうことはわかると思います
こういうことを見てわかる通りですね 実は我々の世の中を正しく理解しようとすると
数学が必要なんですね
ということをちゃんと一つの言語であって こういったことをわかった上で
学んでいくっていうのがめちゃくちゃ大事なんじゃないかな という風に思います
まあこれが結果としてですね
今すごく指数関数的変化が実際起きてるんですけれども 昔もそうで
あっという間にこういう風に変わったんですね
T型フォードができてたった5年で こういう風景にニューヨークが変わったようにですね
別に昨日今日の話ではないです だからそんなに焦る必要はないです
我々は指数関数的変化に慣れていますので そこを楽しみながら乗り越えていくと
データxAIを使い倒せばかなりのものは自動化できるので
その上で人間らしい力を持ってですね
未来を創っていったらいいんじゃないかなと思います
ということで
「ワイルドに未来をつくっていきましょう!」
私の投げ込みというか 皆さんへのお話は以上です!