第五のUI


Izumo Ooyashiro, Izumo, Japan
1.4/50 Summilux ASPH, LEICA M (Typ 240)


気がついたら年末。半年もブログ更新ができていない*1。その上、最近、色々な場で人に色々聞かれるたびに思うことが随分と多い。澱(おり)のようにためておくのもどうかと思われ、色々書き出すモメンタムになればと少し書けたらと思う。

-

毎週何回か登壇、取材が続いているが、このところ、繰り返し聞かれることがいくつかある。

  1. LLMによって仕事はなくなるんですか?
  2. 今後AIでどんな仕事がなくなるんでしょうか?
  3. OpenAI & MicrosoftGoogle/DeepMindのglobal big playersがガンガンとやる中、日本はなにかやれることはあるんですか
  4. Pivotなどで言われていた物魂電才について教えてください。
  5. 今後の学校教育はどうあるべきですか?(3月の文科省への投げ込みを受けて)
  6. 今後の学力についてどう考えたらいいですか?
  7. 風の谷の運動論ってなんですか?
  8. 風の谷の原型的な土地はあるんですか?

というあたりだ。ほかにもいまの景気、これからの金利上昇と景気の見立て、今の株価水準のようななんで僕に聞いているのだろうか的な質問も色々ある。

最初の2つ、仕事系の質問は随分と多く、これは後ろの方の教育系の話となかば裏表のように聞かれることが多い。

-

最後の風の谷の話は、ずっとステルス活動として最初の数年やっていたのは事実であり、ほとんど検討内容を開示してこなかったのも事実であるが、このブログでこのプロジェクトの存在を公開して久しく、ホームページもステルス的に立ち上がって久しい。国プロになるのを固辞し続けては来ているが、環境省国交省でも強い要望があり何度かイントロ的な話や部分的な話を共有した。

kaz-ataka.hatenablog.com
aworthytomorrow.org
安宅和人「残すに値する未来を考える」(中央環境審議会 April 1, 2022)
安宅和人「残すに値する未来を考える」(中央環境審議会 総合政策部会 June 30, 2023)

加えて、立ち上げメンバーかつコアメンバーの一人でもある宇野常寛さんが「遅いインターネット」に半ばポータル的に相当の量のコアメンバーとの対話記事をまとめられている。総合的なperspectiveは今鋭意執筆中の風の谷本を待って頂ければと思うが、ご関心のある方は、そこまでは次に相当の情報リンクがあるのでまずは見て頂ければと思う。

slowinternet.jp
aworthytomorrow.org

それらを読んで頂ければ最後の問いには意味がないことがわかってもらえるのではと思う。そもそもそれが何かをぶわっとしたところからソリッドに定義していくという取り組みであり、少なくとも太い要件的に必須の条件を満たす土地はこの世にはおそらく存在しない、が本当のところだからだ*2

-

話を戻し、どこから話を始めようかと思うが、まずは3月の文科省で話したLLM*3の時代的な意味合いについて、recapするところから始められればと思う*4

昨今のLLMの進化は凄まじい、これはおそらく業界の中に以前からいた人から見ても、ちょっとした驚きのレベルと言える。ChatGPTの有料モデルを使っている人じゃないと実感しづらいかもしれないが、多くの主要言語に対応し、多くの学術分野についても相当レベルで精通しているが*5、plug-inをつなぎこむことで分析的な力、外部のAPI化された様々な機能や目的特化型のAI機能も飲み込んでいる。GoogleがBardの立ち上げを全力で行っていることから分かる通り、Portal, Search, Socialに続く、新しいinternet ゲートウェイの一つになる過程にあると言っても良い状況だ。

だいたいのことを聞けば、全く休むことなく、相当のスピードで、相当レベルのアウトプットを出すことができる。一年前に問題視されたhallucination(幻覚)問題はOpenAIのalignment workの結果、すでに多くが解決した*6。検索を元にしたGoogleのBardは当然のことながらかなり正確だ。ChatGPTは入り組んだ背景のお悔やみの文章なども相当のレベルで書いてくれる。話し手の立場を意識した翻訳もできる。「異常」によくできる知的なアシスタント*7が生まれたことは間違いない。

何が驚きと言って、人間の人間たる能力の最たる部分である「言葉」を、あたかも僕ら人間の大半を超えるレベルで使いこなせることだ。言葉は半ば魔法と言っていいものであるが、これは2012年の春、東京大学で行われた最初のTEDxUTokyoでの松尾豊さん(当時、東京大学准教授。現 東京大学教授)の話をまずは聞いていただくことをオススメする。今はもう時の人と言って良い松尾先生だがこの動画はおそらくあまり知られていない至高の話の一つだ。*8

youtu.be

これは別の視点で見れば、全く新しい知的生産UI*9の出現と言える。人間の知的生産のUIは紙とインク、黒画面、GUI*10、マルチタッチスクリーンと変化し、それぞれが巨大な産業と富を生み出してきた。


安宅和人「これからの人材育成を考える」令和5年3月24日
文部科学省 今後の教育課程、学習指導及び学習評価等の在り方に関する有識者検討会(第3回)

紙とインクについては言うまでもないだろう。これがなかった時代は、文字はあっても残せる場所は限定的であり、前エントリで触れた稗田阿礼のような極端に記憶に秀でた人間に人間の知識の伝承が依存していた。紙の出現により桁違いの脳の開放が起きたこと、思考が客観的に読める文字になったインパクトは途方もなく大きかったことは間違いない。唐朝から宋朝にかけて発展し、清朝の終わりまで約1300年間にわたって使用された世界初の能力による官僚の選定機構、中華大陸の科挙システム、もこの地で発明された紙と世界最初のインク*11なしでは生まれなかったはずだ。

kaz-ataka.hatenablog.com

黒画面と呼んでいるワープロ、オフィスコンピュータ、PC*12の出現はNECがC&C*13を掲げた計算機と通信の融合を生み出し、ホワイトカラーの労働前提を刷新し、莫大な富をDEC、IBMNECなどの企業にもたらした。

Appleが一般市場に持ち込み、Windows95によって一気に広まったGUIはブラウザを生み出し、それまで概念的な存在であったマルチメディアが形になり、インターネットエコノミーを生み出した。インターネット自体は相当に古いものであるが、ここまでは軍事・学術的な存在でありエコノミーと言えるものは何もなかったと言っていい。ついにビット(デジタル)の力でテキスト、画像、音楽、映像が全て溶け合った瞬間でもあった*14

en.wikipedia.org

ソニーCSL/東大の暦本先生のスマートスキンを源流とするマルチタッチスクリーンはスマートデバイス、とりわけスマホを生み出し、世界を根底から変えた。スマホを持つことはもはや多くの文明社会では基本的人権に近い存在となり、現在の企業価値トップ7企業を見れば何やかやでスマホを前提とした事業に関わっている企業が5社もいる状況だ*15


Companies ranked by Market Cap - CompaniesMarketCap.com
(as of 12/16/2023 12:35 JST

そしていま、人間にとって最も使い勝手の良い思考ツールであり、人間そのものの特徴と言っていい「言葉」で僕らは計算機とのやり取りが可能になった。これが巨大な変化と富を生み出さない理由がない。で、世界は湧き立ち、動揺しているわけで、それは半ば当然だとは思う。第五のUI革命だからだ。

それも人間の原点に戻る形で、だ。


追記)これを書いた数日後、某社のアドバイザー会議で今のLLMはガートナー社によるハイプ・サイクル(hype cycle)のどこにあたるのか、という質問が出た。僕の答え「スマホの登場に近い基盤的な変化でありhype cycleで扱えるような代物ではない。自然言語で計算機と直接やり取りできるようになった世界は元にはもう戻れない。スマホは登場後、幻滅期などなかったはずだ」。きっと読者の方々の多くも同意してくれるのではないだろうか。

en.wikipedia.org

*1:毎日夜遅くまでミーティングが入っているのと、次々とキャパオーバーしている中、雑然とした依頼が来て、その対応のためになけなしの時間すら細切れになって、その残りも書き上げねばならない「風の谷本(谷本)」の原稿に追われていたりする。当然のことながら忘年会のたぐいもミニマムでしか出ていない

*2:この質問を受けるたびに、つくづく答えを求める国民性なんだなということも実感する。手本はどこかにあると思っている。答え合わせではなく、未来を創る、考えること自体が鍵なんだということが落ちていない。なので、国や公的団体の議論ですぐにバックキャスティング議論みたいな発想になる。それ自体は、最終的にプランを考える手順として間違ってはいないが、その像を描くことが本当のところ最も難しく価値があることを多くの人がわかっていない。そして安易に答えを求めてしまう。未来は僕らの手に委ねられている。他に答えを求めるのはそろそろやめにするべきだ。

*3:large language model 大規模言語モデル

*4:注:not exhaustive: 網羅的ではないです。

*5:このいずれかだけでこれだけの能力を持つ人間はいないと言える

*6:これを誘導しやすい方法で論文が出るレベルまで来たといえばいいか

*7:古代ローマ人なら奴隷と呼ぶだろう

*8:ちなみに、最後スタンディングオベーションで終わる。自分もたまたま話者の一人として会場にいたが、あまりにも内容がハイブラウだったので、当日、終わったあと、一緒にいた周りの人達にわかりましたか?と聞いてみたところ、多くの人が「何を言われているのか分からなかった」というコメントだったことを付け加えておく。今なら多少分かる人が増えたのではないだろうか。笑

*9:user interface

*10:graphic user interface

*11:墨:油煙や松煙と膠の混合物

*12:personal computer

*13:Computer & Communication

*14:MIT Media lab初代所長ネグロポンテ先生による歴史的な著作であるBeing Digitalを参照

*15:Apple, MS, Alphabet, Amazon, Meta