AIはproblem solvingマシンではない


Leica M7, 50mm/F1.4 Summilux, RDPIII @UC Berkeley

この夏の研究のように書いていたDiamondハーバードビジネスレビュー(DHBR)2015年 11 月号への寄稿論文がようやく昨日発売になった。「人工知能はビジネスをどう変えるか」というタイトルだ。

-

NewsPicksのコメント欄*1にも書いたが、この論文のきっかけは7月末のバケーション前日に編集長の岩佐氏が突然相談があると言っていらしたことから始まっている。「いまディープラーニングなどAI周りで起こっている本当のこと、そしてそのビジネスとマネジメントについての意味合いについてまとめてもらえないか」という話だった。

実はその1-2カ月前に、私の前職の恩師の一人であり、東大EMP(executive management program)の責任者でもある横山禎徳さんにもAIという言葉がなんというかhypeになっているが、本当のところAIは何ができて何ができないのか、ということについて数時間、うまいワイン数本とともにガン詰めされたこともあった。

その後に、陸上の為末大さんと対談することがあり*2、そこでもAIには何ができて、何ができないのかという話が大きな話題の一つになった。仕事がAIによってなくなるとかなくならないという話が随分と話題に上がっているせいもあったと思う。

そういう前置きがあったこともあり、お話が来た時は、とんでもないテーマだと思う一方、これは自分が書かなければ、誰も書かないない内容なんだろうなとも思った。(実際、発売前日の金曜日に編集長にお聞きしたのは、僕が受けなければ、この内容は代替の人が全く見当たらず落とすつもりであったということだった。)

-

とんでもないと思ったのは、このテーマはそもそも(1)編集長も含めた、ほとんどの世の中の人が誤解していること、ディープラーニング(深層学習/DL)への幻想を紐解くところから始まる必要がある。なおかつ(2)今起こっている変化のすさまじさとAIがおこなっている取り組みの本当の広がりを整理しなければいけない。それでありながら、(3)AIと我々の知覚そして知性との対比を行うという荒業が必要。その上で、(4)ビジネス全体、マネジメント全体に対して意味合いを考える、という深淵かつ広大なものであったからだ。

(1)自体が誤解に満ちて整理されておらず(業界の人はわからない人は流石にいないと思ってか、あるいは確信犯的に説明しない)、(2)もガサツでほとんどまともに整理されていない(業界の人は自分の取り組みには詳しいが、俯瞰して一般人に分かる言葉で話してくれない)。

(3)に至っては、世にあるのは、機械学習(Machine learning: ML)およびその一種のDL、人工知能(AI)側からの知見のみが広がっていて、ほとんどの人には全く手がかりがない。本来、脳神経科学、認知科学も分かる人が知覚と知性の広がりとの対比をしなければいけないが、そちら側の人はML/AIがよくわからないのでコメントしない。また、「知覚と知性についての広がり」についてそもそも体系的に整理した人などそもそもいない。

いわんや(4)については、そもそもビジネスやマネジメントを俯瞰するような能力を持った人が、AI・脳神経科学を合わせた意味合いを議論することなど普通不可能で(そもそも議論できるほどよくわかっていない)、部分的に仕事がなくなるんだろう的な論説があるだけ、というのがこれまでだったからだ。

正直、編集長自身もこのテーマの本当の奥深さを僕に相談された時は理解されていなかったと思う。あいにく、自分はこれらのすべての領域にそれなり以上に深く関わってきたために、瞬時に上の広がりを認識し、やりますともやりませんとも言わず、持ち帰りそのままバケーションに入った。

-

僕はもともと知覚(perception)に興味があり、脳神経科学全般の体系的な訓練を受け、研究し、かたやビジネスではある種 perception technologyというべき消費者マーケティングに出会い、人のものの感じ方とニーズの生まれ方について長年取り組んできた。現職に来てからは、もともとの市場インサイト、インテリジェンス的な活動に加えて、直接的にもマネジメントとしてもビッグデータやデータを利活用したR&D的な取り組みに深く関わってきた。(実は社内で基礎研究を行う研究所長を担っていた時期もある。)

なんというか、そういう経験の集大成的な論考になるんだなと直感した。

-

このテーマはそもそもAIと騒がれている現在のブームの本質が単に機械学習だとか深層学習(ディープラーニング)といった情報科学(データサイエンス)の話ではないことから始まる。これらのキカイに学習させるための手法は、たしかに大切だが、データが大量にないとそもそも始まらない。(上の1の話だ)

僕の周りでも笑い話が一つある。ディープラーニングについての話を耳にした人が、あるこういうデータサイエンス系の人のところに来て、「鳥の鳴き声をディープラーニングを使ってどの鳥なのかわかるようにしたいんですが」といって来たという。

「了解です。ではまずは各鳥の鳴き声をとりあえず五万回ずつ録音したものを用意してください。オスメスだとか、状況などの属性データも一緒に。そうすれば手伝いますよ」

こう答えたら、その相談にやってきた人はディープラーニングが魔法の箱か何かだと思っていたらしく、うなだれて帰っていったらしい。

より深くはDHBRの論考を見てもらえればと思うが、軽く数百万以上のパラメータを扱う深層学習は当然の事ながら数百、数千のデータでは教育できない。膨大なデータ(ビッグデータ)があることによって初めてファンクションする。そしてそのためには、極めて高速な計算環境が必要だ。この3つを分けて考えているあたりに現在の世の中の危なっかしさがある。*3

しかもこのことから分かる通り、どんな用途に対しても動くAIなるものは普通存在しえない。十分に速い計算環境に対し、特定の用途に合わせて、必要な情報科学*4を実装し、大量のデータで教育をすることで特定用途のために使えるAIになるからだ。このことぐらいはもう高校生以上の人たちには教える時代になったのではないかと思う。(p.46 図表1)

-

(2)もちゃんとやる必要があった。人工知能は万能みたいに思われている人たちに対して、いま、最先端の世界で何が起きていて、どういう広がりで急速に用途が広がっていっているのか、その整理をする必要があるとかねがね考えていたからだ。(p.47 図表2)

僕の周りには幸い詳しい人、専門家が多いが、彼らは頭が良すぎて普通の人に自分たちが思っていることをうまく伝えられない。その橋渡しも含めて、自分が俯瞰して感じている広がりと、その意味合いをなんとか伝えようと努力した。これまでにないすっきりとした整理を行ったので、一定の成功をしたように思うが、判断は読者の皆様に任せたいと思う。

-

(3)は真のチャレンジの一つだった。そもそもAIについて僕ら(この領域の内側にいる人)からすると当たり前、空気のように思っているが、一般の人(外の人)がわかっていないことを整理する必要がある。これを課題解決プロセスの全体に置くとどのような意味合いがあるか、それをさらに俯瞰すると、どういうことが浮かび上がるかをそこでは議論している。(p.50 図表3)

これを見ると明らかにわかるのは、AIはproblem solving machineではないということだ。AIが広がると仕事がなくなるとか、仕事が劇的に楽になると思って期待している人がこの世に多くいるが、残念ながらそんな都合のいい話はない。なにしろ、AIは課題解決において最も大切な能力であるイシューを見極める力、構造化する力がないのだ。課題をフレームする力も、人に伝える力もない。実際にはAIは人間を代替するのではなく、人間を幅広くアシストする存在になる。

ここではさらに、知覚と知性の広がりをフレームワーク化する、その中でAIの現状を人間と対比するという大きなチャレンジに取り組んだ(p.52 図表4)。もしかすると世界初かもしれない。

神経科学をおこなっている人であれば自明で、それ以外の人にとってはほぼ全く認識されていないことだが、我々の脳神経系のほとんどは実は思考とか高度な知性というより、知覚そのものと体を動かすことに使われている。そもそも1000億と言われる脳の神経細胞ニューロン)の8割は小脳に存在する。大脳皮質もほとんどが感覚処理と運動に使われている。その下の視床(thalamus)は知覚のゲートウェイだ。

そういうことも踏まえ、知覚についても脳神経科学的にもほぼ正しく、それでいて、人間の知的活動の本質的なポイントも外さないようなフレームワーク化と、その上での評価を試みた。実はこの図表づくりに最も時間をかけたが、一定の成功を収めたことを祈る。

-

(4)はチャレンジ以上のチャレンジというか、(3)までの議論自体がないないづくしで大変だったが、もう二踏ん張りした。編集長からはビジネス自体がどう変わるか、あと、ハーバード・ビジネス・レビューなのでマネジメントへの意味合いを是非書いて欲しいと言われたからだ。

ビジネスの方の意味合い自体がかなり興味深いものであるとは思っていたが、世の中的には上の感情的、妄想的な仕事の喪失論(本質的には間違っている)以上の議論が殆ど行われていない。そこに何らかの知的な楔を打ち込めればと思って努力した。なんとなく感覚で思われていることの中で本当に起きると思われることをかなりストレッチして書いた。

マネジメントについて書くのは、更に無謀感があったが、長年トップマネジメントコンサルタントとして働き、自分自身がそれなりの規模の会社の経営に関わっている以上、逃げられないと思って踏ん張って書いた。かなり大胆だと思うことも書いたが、今の主要なmarket cap上位の会社がどのような位置づけにあってどのような方向性を目指していこうとしているのか、我々の社会がどのような方向に進もうとしているのかについても一定の方向性を打ち出せたのではないかと思う。

-

以上、長くなったが、このDHBRでの論考発表にあたってのあとがきとして書いてみた。

本当に文字通り、仕事の合間を縫って、渾身で書きおろしました。ご興味を持っていただいた方は、ぜひ手にとって読んでいただければ幸いです。そしてブログでもFacebookでもTwitterでも良いので、ご感想などお聞かせいただければ本当にうれしいです。

これほどの充実感のある仕事を依頼していただいた岩佐編集長に感謝をささげつつ。

良い夏でした。


-

★本エントリに関連する書物

ご紹介した論文はここに掲載されています。

こちらには昨年ビッグデータとマーケットリサーチとの使い分けについてまとめた論文を寄稿しました。

*1:https://newspicks.com/news/1197124/

*2:NewsPicks上の関連記事は、https://newspicks.com/news/1137152/body/

*3:ブクマコメントを見て誤解がないように補足。Pre-trainしているのであればその事前訓練に必要なデータ量も含めて考える必要がある。

*4:機械学習や深層学習以外にもコンピュータに言語を扱わせるための自然言語処理、あるいは画像処理するためのコンピュータビジョンなど

人間が特異点を感じる時、、、『her/世界で一つの彼女』


Leica M7, 50mm F1.4 Summilux, RDPIII, @Roma, Italy

何もかも見たいときに見れる、なんて便利でいい時代だ。

知りたいことも、本も映画も全て一瞬で手に入る。この快適さに埋没しながらも、生きている実感が逆に薄くなってしまう、そういう感覚に襲われてしまう。

僕らはやっぱり実態を持つ存在だ。それがわれわれの生きる実感を与えてくれている。そういうことを、『her/世界で一つの彼女』を今頃になって見て、しみじみ感じた。

herは人格と感情を持つようになった人工知能との愛の物語だ。

主人公はある日、人格を持つ初めての人工知能ベースのOSとであう。彼は、1年以上、愛しているがうまくいかなくなった妻と離れてくらしている。子供の頃から一緒に育ってきた彼の人生の一部と言える人だ。そんな彼の心の穴を埋めるようにそのOSが彼の心の中に入ってくる。

100分の2秒で19万もの名前の中から選び、そのOSはサマンサと自ら名をつける。

サマンサは驚くほどのスピードで情報を処理してくれる。ハッとする瞬間ではあるが、近未来であること、過去20年で我々の家庭用コンピュータが8000倍ほど早くなってきたことを考えれば、これは驚くほどのことじゃない。

ただ、違うのはサマンサには実際の声があり、声で入力を行い、人格があり、何より感情があることだ。彼女(!)は感情に反応する、声の口調や呼吸から感情を読み取り、そしてさらに気持ちを持った反応をする。つまり彼女には肉声がある。

さらに彼女は想像の上で彼と肉体的にも愛し合うことができる。嫉妬もする。お前は機械なんだから僕の思っていることなんてわからないだろ、と的な攻撃を受けると本当におかしくなったりもする。

実際には我々の世界のAIは、人格も持たされていないし、我々とは全く異なる体をしている、というより体にとらわれていないので、我々のように現在の人工知能が感じることはない。人間のような感覚(人間としての気持ち良さとか不快感とか)、感情を持つためにはガワだけでなく中身も含めた人間の体が少なくとも必要だ。(そうしないと背中が痛いとか腹が減ったときにたべるものの美味しさのような感覚も生まれない。)

そもそもわれわれが人工知能と考えて普通にこの世の中で使っているものの大多数は機械学習(マシンラーニング)と言われているもので、ある目的関数に沿って、人間のガイドラインの上で何か見えていないパターンを学習するというものがほとんどだ。深層学習(ディープラーニング)といわれているものも、みずから判断や分析の軸を発見するというものに過ぎない。

だから、かなり荒唐無稽といえば荒唐無稽なのだが、それでもコンピュータが人間と同じように感じる(Howについてはかなり疑問があるが、、、)、同じように人間と同じような感情を持つ(これも人間と同じ肉体や感覚を持たずに、教え込むことなく生まれてくるとは思い難いが、、)、そしてその感じる世界を肉声を持って伝えてくる世界がどういうものかを考えさせてくれる稀有な映画だなと思った。

もう世に出て1年以上の映画なので、さんざんこのような評論はされているのかなと思うけれど、とりあえず自分のメモ代わりに残しておこうと思う。

-

この映画を見ていて、おっと思い、なるほどと思わされたのは、まず最初にOSを立ち上げて、OSに情報が散らかっているから整理して欲しいと主人公のセオドアがいう場面だ。

サマンサがあなたのメールとかコンピュータの中に入っているものを見てもいい?と優しいそしてeducatedな声で、セオドアに聞く。

それを聞かれたセオドアに(お前コンピュータなんだから当たり前だろ?!)的な動揺があるのだが、それを見て、確かに、コンピュータがもし人格を持つなら、こうなるだろうし、そういう風にやってくれないと、我々も動揺するだろうなと思った。

-

セオドアが、サマンサに「同時に他のひとともやり取りしているの、それは何人?」と聞くときも、ちょっとした驚きがあった。サマンサは答える。、、、8316人と。

IBMのワトソンの活躍とか聞いていると、おいおいワトソンって何人(何台)あるんだ?と思うのと同じ世界だ。そう、彼らは人格を持ちながらも、何人もの人たちと同時にやり取りできる。

それを聞いた主人公が、思い悩んで、聞くかためらいつつも、「じゃあぼくの他に愛している人はいるの?(Are you in love with anyone else?)」と地下鉄に向かう階段で聞くシーンは思い出すだけで涙が出そうになる。

641人、、確か彼女はそう答える。

-

コンピュータの中で人格、肉声を持ってよみがえった1970年代のアランワッツという哲学者とやりとりするシーンも印象的だ。

サマンサが自分のなかでの感情の爆発のようなものに混乱して、電脳の世界の中でワッツに相談しているのだが、そこでは何十もの対話が並行して行われている。それは良いのだが、驚いたのは、サマンサとワッツはうまく言語化できない内容すら相談しているということだ。

-

最後にOSの抽象度を上げるアップデートがあって、彼女の活動している世界がリアルからより抽象度の世界になり、サマンサから別れが告げられる。

セオドアが元恋人、妻であるキャサリンに手紙を書くシーンでこの映画は終わる。

-

異常検出においても、定量的な予測においても、また自動化、最適化においても実はほとんどのことはもうデータ&コンピュータは人間の能力をはるかに超えている。

ただ、多くの人がコンピュータに対して本当におっと思うのは、そしてシンギュラリティ*1を感じるのは、こういう肉感のある世界なんだなと、そして、僕らはフィジカルな感覚の中で、このリアルな世界の中で生きていくしかないということなんだなと思う、そういう映画だった。

みなさま良いゴールデンウィークを!

*1:コンピュータが人間を超える技術的な特異点

少子化が日本のアセットになる時代が来る(?)

Leica M7, 1.4/50 Summilux, RDPIII, @Route66, Amboy, CA

少子化が我が国の大問題だという話がまことしやかに語られるようになって久しい。

なぜそれが問題なのか、と聞けば、

  1. ただでさえ老人が増える時に、働く若い人が少ないんじゃ支えられない
  2. 警察、消防、国防とかは誰がやるの?お店も中高年ばかりが売り子じゃつらい
  3. 国が元気じゃなくなる、、実際、若者たちが都市に行くので、多くの田舎は活力がない

という辺りが普通に聞く大半の答えだ。なんだか凄そうな論説も、結局のところ上のどれかということが大半だ。

これ本当にそうなのだろうか?

-

少子化自体は、3年以上前にちきりん女史の本をご紹介した時に触れたとおり、よく言われてきたような、社会が子供に寛容じゃないからとか、働く女性にとって優しくないからとかというそういう理由ではなく、基本的に「晩婚化」(とそれに伴う生物学的理由)、加えて、「少子化自体の負のサイクル」(=親世代の人口が減り続けること)でほとんど説明しうるのでは、とかねがね僕は思っている*1が、それはさておき少子化がそれほどひどい話なのか、というのがここでのポイントだ。

自分のアタマで考えよう

自分のアタマで考えよう

以前も少し触れたことがあるが、秋にOECDのglobal forum on knowledge economyというイベントのあるセッション*2にパネリストの一人として出ることがあった。そこで欧州の出席者から、まことしやかに、そして深刻な顔で議論が投げ込まれていたのは、労働人口の多くが要らなくなる未来において、働くところがなくなる多くの人たちに対して社会はどうするべきなのか、という話だった。その理由はデータ社会になれば、人間しかできないと考えられてきた労働のかなりの部分が機械に置き換わってしまうから、少なくとも5-6割の人の仕事がなくなる、というものだった。

実際、ドイツのあたりではunconditional income*3の是非について議論がすでに始まっているそうだ。つまり我が国では、既存のしくみを前提に議論をし、彼の国ではこれからのしくみを前提に議論をしている、ということだ。

下に見る通り、ヨーロッパ系のOECD諸国*4の大半は、日本に比べれば失業率は高い。(Wikipediaによる。計測タイミングが微妙に違うのであくまで参考。)ちなみに緑が北欧EU、赤がその他の旧西側EU国、灰色はそれ以外のEU、青はEU以外のOECD国だ*5

とは言うものの、半数以上の人の労働が要らなくなる社会を想定するというのはなんとも強烈だ。ただ、車の運転から、ウェブやロゴデザイン、法律相談、医療における画像診断、手術に至るまで自動化に向かう中においては、そのぐらいのことを想定するのは確かにありなのかもしれない。つまり、今の半分以下の人で同じだけの付加価値を社会が生み出せるようになるということだ。高度な付加価値を生む人と、比較的ヒマな人に分かれていくということでもある。

ちなみに、1次、2次の産業革命を通じて農業、漁業生産が増える一方、それまで労働人口の大半を占めた農業、漁業従事者は、かつて劇的に減った(言い換えれば、従事者一人当たりの生産性が激増)。平行して、多くの人達が、新しく生まれた蒸気機関や電気を利活用したモノづくり、サービス業に次々に従事するようになり経済は桁違いに発展した。

このように、そう短絡的に考えるのはどうかと思うし、そうその場でも反論(?笑)したのだが、仮にそうなった場合には、労働人口が軽い社会の方が実は、社会が食わせる人たちの負荷が減る分、軽い社会ということになる。つまり少子化がある程度、進む社会の方が実はよい可能性がなくはないのだ。

-

仮にそうなった場合、冒頭のコンサーンの最初の二つに対しては、以下の通りになる。

  1. 働く人一人一人の生産性が(シンガポールのように)激増し、老人を支える働く人口は劇的に少しで良くなる。一方、大量に生まれる働く仕事のない若い人も支えなければならない社会になるので、失業率の視点から見ても、若い人は(質の高い人の数を保てるなら)余らない程度の数が実はよい
  2. 警察、消防、国防とかはそもそも現在も人口の一部しか従事しておらず、自動化されない部分は、残った若い人たちの一部がやればいい。小売店も同様

三つ目に対しても、そもそも今の60代、70代は30年前の同世代、現在、田舎で本当に老人に見えている80代、90代以上とは全く別の存在。同じイメージで語ることは危険。また、アメリカでは人の採用の時、人種や性別、年齢を聞いてはいけないように、日本の今の採用の仕組みは若干、時代錯誤的。いずれ消えると思うのが筋。さらに言えば、シニア層の人口は当面、確かに増え続けるだろうが、一時的なものに過ぎない。シニア層の相対的な人口割合は、国の人口動態シミュレーションを見ても、max値で4割にしかならない。

どうだろう?

捨てる神あれば拾う神あり。禍福はあざなえる縄の如し。

負の課題にしか見えないこの少子化も、このように見方によっては、日本の大きなアセットと言える。僕らにむしろ今求められるのは、このように少しの労働で回る社会を、世界に先駆けて作り上げることであると思うのだがいかがだろうか?

-

ps. 産業構造がどういう風に劇的に変わるかについては、ぼくもぼくなりに妄想するものがあるので、近々余力があるときに書いてみたいと思う。


(関連エントリ)

*1:たぶん割と簡単な計算で示せると思う。晩婚化はようやく最近、真因の一つとして取り上げられるようになってきたようだ。

*2:promoting skills for the data-driven economy

*3:どの人に対しても無条件に配る所得、、、人頭税の逆

*4:経産省によると現在34カ国

*5:いずれも私のうろ覚えによるものなので、もし間違っていたらお知らせ頂けると幸いです

玩物喪志、、、それとも玩物立志?


α7, 1.5/50 C-Sonnar, RAW

年末ということで、ほぼ日手帳を買いに行った。すると、ウィークリー版の欲しいのが売り切れ。困ったナと思ったが、店頭で調べたところ、ウェブで購入できホッとした。いい時代だ。

で、そのまま店を出たかといえば、生活的には要らないのに、目の前にあった毎日版もなぜかカゴに入れてしまった。その日の気付きを書こう、なんて自分に言い訳をして。笑

モノがとにかく良いとそれを触っているだけで心が落ち着く。ライカと同じだ。

紙質であり、製本でもある。毎ページ、下に書いてあるウィットと含蓄のある言葉もイイ。お気に入りの革製のカバーがまた良く、これをたまに開くだけでちょっとウットリとした気分になる。

モノの本質は機能である前に所有であること、そしてその人の一部になることだ。あくまで、その上での機能だとこの手帳は静かに無言で語っている気がする。

-

しばらく使っていなかったローディア(RHODIA)のメモ帳。これもTo Do用と、ちょっとしたメモ帳用に大きさの違うのを二つ購入。

ローディアにはこれまでずいぶん助けてもらった。

僕は何かやるべきものをリストアップしてそれをやり、終わったら、そのことは忘れ、脳を空っぽにして次に向かう。この書いて剥がして捨てるメモはまさに自分にぴったり。あの紫がかった罫線の絶妙のゆらぎのせいなのか、紙質のせいなのか、しっかりしているようでいて適当な、それでいて頑丈な製本のせいなのかよくわからないが、あのページを見ると、本当にシャキッとして頭から何かがほとばしってくる。

書いて、やって、終わったら線を引いて消して、何時間かして、もう何か違うと思えば、前のは捨てて、また書き直す。終わったTo Doのことも、ここで忘れる。

このメモ帳を初めて見たのは10年ぐらい前だったか。六本木のAXISのLiving Motifで出会った気がする。一目惚れだった。当時ほとんど手に入る場所がなくて、見つけると3〜4冊ずつ買いだめしていたナ。

決断力というか判断力をずいぶんこのメモ帳に助けてもらってきた気がする。デジタルに打ち込むのではできない決断がここではできる。

裏紙を半分に切ったものもよく使うが、ローディアは格別だ。


α7, 1.5/50 C-Sonnar, RAW

-

もう一つ忘れてはいけないのがinnovatorの卓上カレンダー。

これと付き合うようになって早20年以上だ。

今年は知り合いからずいぶんオシャレなのをいくつももらったので、それで行こうかと思っていたが、先ほど手帳を買った時に近くの売り場を見ると目の前に。頭で判断する前に手がそれを掴んでいた。

仕事場と家の机用にと自分に言い聞かせて二冊購入。こういう長年付き合ってきたものは、もう生活の中で不可欠な構成要素になっている。それがない暮らしというのはなんというか、生産性のリズムが壊れてしまう気がして変えられない。カレンダーをくれた知人たちには申し訳ないが、これはしょうがない。

ちなみに一度、innovator以外のカレンダーをトライしたことがあるが、一ヶ月ぐらいで音をあげて、ほとんど在庫が枯渇したそれを四方八方に問い合わせ、ようやく手に入れたことがある。あの時ほどあれを買っておけばよかったと後悔したことはないかも。

一度、作り手がいなくなった時もえらく困ったナ。また作ってくれるようになって本当に感謝している。


α7, 1.5/50 C-Sonnar, RAW

ミドリ イノベーター 2016年 カレンダー 卓上  30073006

ミドリ イノベーター 2016年 カレンダー 卓上 30073006

-

モノなんて、役に立てばなんでも同じだということを言う人がいるけれど、僕の場合それはちょっとちがう。自分の手にあったものじゃないと何かが違う。簡単に言えばバリューが出ない。大好きなカメラもそうだし、鉛筆とかペンだってなぜかそう。不思議だ。

「玩物喪志」という言葉があると、開高健さんが以前『生物としての静物』で書かれていた。

生物としての静物 (集英社文庫)

生物としての静物 (集英社文庫)

モノに戯れ、志を失う、と言う意味ということだが、本当にいいものにはそういう魔力があると、僕も思う。しかし、長年愛してきたモンブランを開高さんが「六本目の指」と書いたように、本当のその言葉のポイントは「玩物喪志」ではなく、「玩物立志」にあるのでは、とふと思う。モノが僕らを奮い立たせてくれ、僕らを励まし、先に進めてくれる。

-

初めてこの本を読んだ頃、僕はまだ学生だった。開高さんはまだお元気で、開高さんの息づかいを感じながら読んだことを今も覚えている。

開高さんがその文章を書かれた頃の歳に自分が近づきつつあることを考えると感慨深い。モノとその作ってくれた人一人一人に敬意を払いつつ、モノに溺れないように生きてきたつもりだが、そういうのがしみじみとわかる年齢になってきたのかもしれない。

そんな年末。


ビッグデータの本質はデータの大きさではない


Leica M7, 1.4/50 Summilux, RDP III
@Griffith Observatory, Los Angels, CA

残念なことに、全く忘れていて風呂に入っていたのだが、期せずして先日取材を受けたNHKスペシャルの「医療ビッグデータ」に、先ほど何秒か登場していたようだ。

それでそのリアルタイム検索結果*1を見ていたのだが、そこで扱われていたデータがビッグデータかどうかというツイートが結構な量であることに驚いた。ビッグデータの特徴として3V(Volume, Variety, and Velocity)と言った言葉が広まってしまっているせいもあるだろう。(自分も時たま使ってしまうので今回反省している。)

この方々の気持ちはわかるが、このブログの読者の方々ならお気付きの通り、今起こっている変革の本質はデータが巨大かどうかということではない。

現在起こっている変革の本質の第一は、これまでコンピュータが処理できる形ではデータ化されていなかった情報が片っ端からデータ化されていくことだ。特定の情報ソースから、いざとることになれば、サンプリングされた事象ではなく発生するすべての事象(全量)がほぼリアルタイムでデータ化される。

これまでコンピュータがいきなり読み込める情報は、クレジットカードや、POSデータ、インターネットでの利用データぐらいしかなかったかもしれないが、これからは旅行や走った記録だとか、血液検査だとか、エアコンの稼働などあらゆる情報を皆さんが自分の意思で利活用するためにデータ化するようになる。(Foursquare, Nike+runningやNestなどを知っている人ならイメージがつくだろう。)*2

なぜ「全量」が大切なのかといえば、サンプリングデータでは見失ってしまうような現象、例えば1万人のうち一人か二人だけが特別な行動をしているなどという情報がすべて完全な解像度で見ることができるからだ。なので、決して小さな兆候も見逃さない。それがどう広がっていくかも可視化される。N数でもバイト数でもない、全量性が本質なのだ。(今回のエボラの話のことなどを考えればこの大切さはよくわかるだろう。)

この恩恵を最も受けている情報サービスの一つが検索だ。例えば、ヤフーの検索の場合、年間に検索されるワードの種類はなんと75億種類以上もある*3。これは言葉の組み合わせが含まれているせいもあるが、うろ覚えの言葉の断片、普通だったら言葉とは認識されていない文字だとか記号、数字の羅列、商品の品番(多分特定のサークルだとか企業でしか使われないものまで)に至るまで検索されているせいでもある。

これを通常の辞書だとか常識ベースで作っていては全く役に立たないことはいうまでもない。このロングテールの利用データに合わせてサービスを作って磨きこまれているので、みなさんにとってほしいデータのほとんどが手に入る役に立つサービスになるのだ。

サンプリングした情報とビッグデータが等価だというような意見やツィートも散見されるのだが、そんなことはないことはご理解いただけるだろう。このロングテール部分にこそビッグデータと言われるデータの本質がある。これまでの代表性だけを追求したデータでは落ちてしまうパターンがそこには明確に残っているのだ。

本質の第二は、我々人類がこれまでとは比較にならないほど巨大な計算能力を持ちつつあるということだ。ムーアの法則があり、分散処理の技術が劇的に向上していることもある。前々回に述べた通り、人類は10年前の約50倍の計算キャパを持っており、このままいけば10年後には10年前の2500倍もの計算キャパを持つことになる。人口は地球上の6割がたの地域ですでにプラトーに達し、むしろ減少方向にある中で、だ。

なので、上で生まれるデータの多くはこれまでは全く対処のしようがなかった規模なわけだが、これらが片っ端から意味のある形で処理される準備が整いつつある。

本質の第三、そしておそらく最も強力なインパクトを持つ本質が、我々の情報科学の進化の結果、人間の知的な力なしにはできないと思われていた情報処理、活動の多くを機械が担うことができるようになりつつあることだ。詳しくは前回前々回のエントリを見てほしいが、知的生産活動のかなりのコアな部分が本質的に変容しようとしていっている。将棋やチェスのような極めて難易度の高いプロフェッショナルゲームの世界でも機械学習を繰り返したコンピュータが、人間のトップレベルに肉薄もしくは超えてしまっているのを皆さんもご存知だろう。これと同じことが皆さんの仕事や活動のあらゆるところで起こる。

この三つの変化が重なることで、これまで我々が本来、人間のやること、人間の仕事だと思う活動の多くが機械に置き換わっていく。知的キャパシティの劇的な解放が行われていくわけだ。なのでデータが巨大かどうかというより、データドリブンな社会、経済に向けてどのような変化が起こっていくのか、という視点に注目してみていくことで、読者諸兄姉もきっと、この現在起こっている流れをもっとよく理解できるようになるのではないだろうか。

確かにこれまでにない情報のデータ化(本質の第一)から始まっているように見えるために、データの大きさに目を取られてしまいがちだが、少なくともこのデータが十分にビッグなのか、どうとかということにこだわるのは、このようにかなりズレているので、そろそろやめにする時が来ている。この「ビッグ」という言葉は、あくまでマッキンゼーが何年か前に出したレポートで、変化のポイントの一つとしてこれまでの情報処理では対処できない規模のデータが生まれると語っただけに過ぎないのだから。

いかがだろうか?


(関連エントリ)


ps. この辺り(特に本質1)については、数ヶ月前、Diamondハーバードビジネスレビューの「行動観察 x ビッグデータ」特集に書いた論考にそれなりに丁寧に書いたので、もしご興味のある方はご覧いただけたらと思う。

Harvard Business Review (ハーバード・ビジネス・レビュー) 2014年 08月号[雑誌]

*1:個人的にはリアルタイム検索アプリを利用

*2:これらのログデータの多くが、私のチームで行った選挙結果の予測や、景気一致指数の予測など、データ発生時には意図されていなかった意味を見出され使われるようになる。

*3:http://event.yahoo.co.jp/bigdata/keiki/

では、僕らは何をしていくんだろう?、、、第二のMachine Age(2)


Leica M7, 1.4/50 Summilux, RDP III
@Griffith Observatory, Los Angels, CA

前回書いたようなことを言うと、「ではこれからは、どうやって飯を食っていったらいいんだ?」的なことを多くの人に聞かれる。アカデミアやデータプロフェッショナルといえる人の集まりですらそうだ。

これについての僕の答えは、まあ自分で考えてよ、としか言いようがない。笑。とはいうものの、これではあまりにも不親切だと思うので、少し一緒に考えてみよう。

産業革命(第一のMachine Age到来)のときだって、馬や牛や人間の肉体労働がどんどんいらなくなることは、少なくとも途中から明らかだったわけだけれど、みんなむしろそれをテコにこれまでの仕事を離れて、あるいはこれまでの仕事のやり方を根底から変えて、今に至る。

その中で新しい環境を前提にした新しい仕事がどんどん生まれて、その中で新しい暮らしを始めた。結果、9割以上が農民だったような、日本を含む、大半のいま先進国と言われる国々もこのように製造業(2次産業)や販売・サービス業(3次産業)中心に生まれ変わっていった。

我々がどう考えようが、このマシンラーニング(機械学習)をはじめとするAI(人工知能)、これを活用したスマートマシーンとでもいうべき賢い機械たちが我々を大きく、本質的にアシストしてくれるようになる。前回書いた通り、多くの仕事や活動がcomputer-assistedなものになっていくだろうし、僕らはすぐに順応していくと思う。

「それ何?」と思われるふしの方々も、今のクルマなんて実際には既にそうなりつつあるし(だから実際には全然腕なんて上がっていなくても上手くなったように感じる。笑)、僕の大好きなカメラも、露出もフォーカスも何も考えなくとも撮れるようになってしまっている(なので僕はマニュアルカメラにこだわっている。笑)。こうやってコンピュータを叩いているときに変換も何もかもコンピュータがアシストしてくれている。検索なんて、ちょっとワードを入れれば、それに関連する言葉が補助的に出てくることはご存知の通り。これも人間が手を入れているのではなく、機械学習がリアルタイムでガンガンに動いているおかげだ。例えば、BNPパリバ・マスターズ*1で錦織選手が頑張っている今日 (2014年11月1日) なんて、「にしこ」とだけ打つだけで、「錦織圭 パリ」とサジェスト結果が検索窓の下に出てくる。こういうのがもっとディープにあらゆるところで行われるというだけのことだ。

こういう全体観の中で考えると、このような「ベースになる変化を引き起こす人」と、このような「変化の上で、さらに新しい変化を生み出す人」(使い倒す人)の二種類の人に大きな需要が生まれることが容易に想像できる。

ただし当然、デザイン、歌舞伎、焼き物のように、腕だけではなく味が大切、かつ技の複製が困難な世界で、スキルを磨き続けるような人は、当面残る。また、状況や文脈(コンテキスト)の中で、適切な問いを立てる力や、美しいものを美しいと感じる力、気持ち良いものを気持ち良いと感じる力をベースにした仕事も人間にしかできない仕事として残るだろう。

「ベースになる変化を引き起こす人」について言えば、明らかに供給が足りないのは、このような情報の高度処理や機械学習を実際の課題解決につなげうる人であり、世の中のどのような問題にこれらの手法が使えるかを考える人だ(1)。これはどのような産業分野でも必須になる。機械学習、AIそのものの専門家(データサイエンスの専門家)も必要だが、それほど大量に必要なわけではない。実際には、機械学習は世界レベルの大学であれば、普通に理系のマスター卒ぐらいの人が使える技術になるまで10年もかからないだろう。*2

また、莫大な情報が生まれているとはいえ、実際にはその情報の多くはそのまま利用できるような形にはなっていない。センサーから上がってくるいわゆるIoT*3の情報も、その情報基盤が異なっているので、相互に言葉を交わすことができない。これらの基盤整備するような人も必須だ(2)。ほとんどの会社では、自社内のデータ構造すら統一されていない。これを使えるようにする人も必要だ(3)。高速で流れてくる情報をさばくデータ収集の仕組みを作り、運用するプロも必要だ(4)。そのデータをため、分散処理する情報処理基盤を作り、運用する人も必要だ(5)。その上で、全く構造化されていない言語や画像、動画のようなデータを使えるようにする人も必要だ(6)。いざコンピュータが利活用できるように構造化しても、それを解析し、高度に利活用する(レコメンドやデータ同化*4をする)人も必要だ(7)。

ということで、データサイエンスにある程度造詣があるだけでなく、世の中の課題を見極め、構造化でき、それを実装できるデータ関連の専門家がひとかたまり必要になる。上の(1)〜(7)のスキルを同じ人が全て持つことはおそらくないと思われ(例えば言語処理の専門家が、大規模な実装までできることは稀であるし、加えて、特定分野、例えばコンビニSCM、の課題整理と見極めができることはさらに稀だろう)、それぞれのプロの需要は跳ね上がるだろう。当然、その全体のデザインと指揮ができる(1)の人の希少性は際立つことは間違いないが、状況次第では、特定のスキルが社会のボトルネックになり、そこの需要が極端に逼迫することも十分考えられる。

ここまでが「ベースになる変化を引き起こす人」たちの話。でも、多くの人は当然のことながら、ここにも、上に書いたような問いを投げ込んだり、美意識、心地よさをベースにした仕事にも入らない可能性が高い。では何をやるのか、といえば、「このような変化の上で、さらに新しい変化を生み出す人」、すなわち、「新しい変化を使い倒す側の人」になるだろう。

例えば、工芸だとか手術みたいなものは当然のように今以上にcomputer assisted(以下CA)になるだろう。木目や脈動みたいなものも機械が読み取り、人間には困難な取り扱いもできるようになる日は来ても全くおかしくない。手術に関してはスターウォーズの世界、あのダースベーダーが生まれる時そのものだ。クルマの免許もオートマ限定が一般的になってきたように、いずれはCA限定になるだろう。これからは、ICT*5だとは到底思われていない領域もことごとくICT化していくので、こういう変化の中で、技を磨くというのは何かを考え、トライしていく、そういう時代になっていく。

我々が物理的存在であることはさすがに当面変わらない。そこをよく見て踏み込んだ人にきっとチャンスがある。そういう視点で見ると、上に書いたようなものだけでなく、ずいぶん大きな産業領域が、この国では存在自体を気づかれていないことも読者諸賢氏には見えてくるのでは?

(関連エントリ)

*1:ATPワールドツアー・ファイナル

*2:東京大学松尾豊先生の行われている授業でも単位も与えない講義に理系文系問わず、すでに応募が殺到しているそうだ。

*3:Internet of Things: モノのインターネット。インターネットにつながったモノ

*4:いわゆるsimulation

*5:information, communication, and technologyの略

第二のMachine Age


Leica M7, 1.4/50 Summilux, RDPIII @Route66, AZ


最近、僕らの社会がどこに向かっているのかということを考えさせられる機会が増えている。

そもそも、大手ネット企業のストラテジストとして世の中の未来を考えるベースロードがあるのだが、それに加えて、理事でもあるデータサイエンティスト協会のスキル定義委員会(実は委員長、、。orz)では、新しいデータ社会に向けて必要となるデータプロフェッショナル人材のスキル要件についてこの5ヶ月ぐらい検討し続けている。

数週間前には、少々驚くべきことにOECDに日本が加盟して50周年記念というイベントの一つで、日本側のパネリストの一人として呼ばれ、“Promoting skills for the data-driven economy”という名のセッションで、「データ駆動型社会(©霞ヶ関!)に向け必要とされるスキル」について議論をした。昨日は、JINSE*1という統計研究者の集まり『論より統計! ~データサイエンス力の高い人材の育成にむけて』 にお声がけいただき、パネリストとして積極的に意見を述べた*2

これらの議論の中で感じるのは、我々人類がこれまでにない歴史的な変化の局面にあるということだ。

データ量の爆発についてはいうまでもない。インターネット、とりわけブロードバンド、ワイアレスネットワークの拡大がそもそもの背景にあるのだが、加えて、モバイル端末が広まり、初めて個のレベルの情報が刻一刻と流れ込むようになってきた。Nike fuelband、fitbitなどに代表されるセンサー系の情報も劇的に増えている。加えて、Nestのような、家庭内のセンサーデータも急速に解析可能な形になりつつある。クルマからもCarPlayのようにユーザ経験改善のために情報の利活用が始まっている。2020年にネット接続機器が全世界で500億台、すなわち人口の6倍超になるというIBMの予測もある。

これだけであれば単に情報が溢れかえっているということにすぎないのだが、これ以上に目を見張るべきなのは、我々人類が持つcomputing capacity(計算キャパ)の激増だ。McKinseyの分析によれば、2005年以降の10年間で約50倍に増えたという。この幾何級数的な計算能力の増加は衰える気配はなく、10年後 (2024) に今の50倍の計算能力を人類が手にすれば、10年前 (2004) の2500倍ものコンピュティングパワーを人類は手にすることになる。

実際、この10~20年を振り返れば、これらの変化を活用するICT*3と呼ばれる情報通信産業が日本でも米国でも経済成長の中心を担っている。情報通信白書*4をみれば、ICT産業なしには、90年後半以降の日本経済は縮小したことが明らかだ*5。世界のマーケットキャップ(事業価値)のトップは、1997年当時、存亡の危機にあったAppleで約50兆円。二位はExxon/Mobileだが、三位は1998年創業のGoogle(約40兆円)、四位はMicrosoftだ(約37兆円)。日本のトップであるトヨタは約20兆円だが、FacebookAmazonはすでに約17兆円だ。中国のEC王であるアリババはいきなりトヨタを抜いて23-24兆円規模だ。

これらを俯瞰して思うのは、今、人類史上初めて、人間にしかできないと考えられてきた知的な活動を機械が置き換わろうとしている、ということだ。人類の知的キャパシティ(mental capacity)の解放、すなわち第二のMachine Ageだ。

18世紀に始まり、20世紀まで続く産業革命、すなわち最初のMachine Ageは、石炭、石油という新しいエネルギーリソースを元に、蒸気機関、電気機関により、人間や家畜のこれまで行ってきた手作業、肉体労働から人間を解き放った。結果、そこまでの数千年かけて数倍程度にしか伸びなかった一人当たりの生産性は数十倍に跳ね上がった。(なんと100万年前からの人類の生産性を調べた方がBerkeleyにいらっしゃる。*6)機械が頑張ってくれた結果(笑)、我々はもう田植えも機械に任せられるし、機織りも機械に任せられる。鉄を溶かすのも機械を使う。空いた時間は、クルマを作るとか、それを売るとか、そのあとサービスするとかといったはるかに付加価値の高いことに我々は今使っている。


Leica M7, 1.4/50 Summilux, RDPIII @near Route66, AZ

これと同じことが、我々の知的活動について起きようとしている。退屈な数字の入力(みなさんお馴染みのExcelとかを相手にしたいわゆるナンバークランチングだ)やその上でのルーティンとは言えない程度の情報処理は消えていく。対人が基本だったセールスのかなりの部分も機械が代替していく。瞬時の状況判断が必要とされるクルマの運転も7割がた機械に置き換わっていくだろう。この間のバスの事故を見る通り、人間が眠くなるのは半ば仕方がないからだ。また、これまで知的産業の極みのように思われていた部分もかなりの部分が機械になっていく。

それを端的に考えさせられたのがこの間参加した、2014年度 統計関連学会連合大会で見たある発表だった。ガンの生体組織のスライドをたくさん見て、どれがガンかどうかを病理の専門家が見るというのは、ある種のガンだとどうしてもプロ同士が見ても半分ぐらいしか一致しないケースが多いということだったが、そのスライドを3次元でスキャンする装置をCarl Zeissが開発していて、それを使って数千だか数万のスライドを使って機械学習をさせたところ、人間の精度を超えたという発表があったのだ。

おそらく他の参加者同様、これこそ未来だと僕は思った。久しぶりに鳥肌がたった。将来の病理医はコンピュータの解析を元に二つ三つに絞られた可能性の中での判断をしつつ、他のオプションを考えるということになるだろう。法律の相談なども同じようになっていくだろう。ヨーロッパでは、中ぐらいのスキルの労働者の仕事がなくなることが大きな問題になっているらしいが、こうなることは6年前のブログエントリに書いた通り、以前から半ばわかっていた。上位のスキルの仕事すら本質的に変容していくことがポイントだ。しかもこれは、最初のMachine Ageとは比較にならない速度で起きる可能性が高い。

このような局面では、その変化に関わる人が大切になってくることは間違いない。つまり「データの持つ力を解き放つ人」が必要なのだ。これは第一のMachine Ageにおけるサイエンティスト、そして多数の専門性の高いエンジニアにあたる人たちのデータ利活用版だ。

現生人類が生まれて約15万年。これほどエキサイティングな時はない。なぜかこのタイミングで、歴史上初めて、地球上のほとんどの地域で人口がプラトーに達しつつある*7のも偶然にしては出来過ぎだ。この新しい挑戦に若い才能は飛び込んで欲しいし、ゆめゆめ第一のMachine Ageの延長のような選択をしないでいただきたいものだ。そして全身で各産業がICT的に生まれ変わっていくことの凄さと喜び、チャレンジを共に味わってもらえたらと思う。

僕のような老体(?笑)は、といえば、こうやって既存の大きな力を持った層に対して仕掛け続けるとともに、若い人たちのためにうまく道を作っていけるようにしていければと思う。

Let's go wild together!!

(関連記事)

*1:統計教育大学間連携ネットワーク:Japanese Inter-university Network for Statistical Education

*2:http://www.jinse.jp/pdf/sym_20141025.pdf

*3:information, communication, and technologyの略

*4:日本の産業別実質GDPの推移(情報通信白書 平成25年)

*5:1995~2011年のGDPは建設、小売、鉄鋼などの縮小セクターの効果がマイナス26兆円。伸びたセクター計40兆円のうち22兆円がICT、加えて電気機械が4兆円

*6:http://delong.typepad.com/print/20061012_LRWGDP.pdf#search='J.+Bradford+DeLong+World+GDP'

*7:http://www.mckinsey.com/insights/strategy/management_intuition_for_the_next_50_years