2007年12月27日木曜日

第一回 Excelで情報に命を吹き込む

マクロ使いです。

といっても、大したことは本当にしていません。
ただ、時折効果を発揮することがあります。


そこで、今回から5回に渡ってExcel(表計算)を考察してみます。
毎度ながら我流の視点で物申します。本当に5回もあるのかは俺も知りません。

でもちょっと考えてみると。

第一回、Excelで情報に命を吹き込む
第二回、絵のかけるデータベース ExcelとRDB、XML
第三回、マクロなわけ。PerlでもRubyでもJavaでもPHPでもなく。
第四回、インターネットは先生、Excelは俺の相棒
第五回、Excelグラビトン

こんなところです。
ちなみに、対象は、パソコンに興味を抱き始めた中学生程度、と考えています。





それでは始めます。
第一回目の今日は、Excelで情報に命を吹き込む、です。



うーん。

はて。





我々の業界では、コンピューターが識別可能な情報を保持していることを、データが生きている、と言います。逆にコンピューターが識別不可能な情報は、データが死んでいる、と言います。

あ、言わないかな。

せっかく登録するなら生きたデータを登録したい。と誰もが思っているはずだと、

俺は思っています。

データは、識別情報が多ければ多いほど生きてきます。いろんな切り口、いろんな局面で使えるからです。生きたデータが蓄積されるとどうなるか。ウゴウゴうごめきだして、じわじわじわっとしだします。

どうなるのか。

想像つきますか?

そのシンプルな例として、グーグルサジェストがあります。

「あ」と入力すると、入力候補としてあびる優が一番上に出てくるあれか?

あびる優、あれで一躍有名になったんじゃねーか?

と思っていたのは俺だけじゃないと思うだけど、今、試しに「あ」と入力してみたらなんと。

朝日新聞

が候補のトップにきます。"あいのり"を抑えて。50音順じゃないです。じゃ、何順か?やるな、グーグル。

何れにしても大したことねーよな、と思っていたら考え方を改めたほうがいいかもしれません。また、世の中ではとかくAjaxの象徴として紹介されていますが、Ajaxってのは技術的な一側面に過ぎないです。

本質はなにか。

まあ、字のごとくなのですが、あれはサジェスチョンの象徴でしょう。
と俺は理解しています。今も既にそうなのだけど、これからより一層、ああいうサジェスチョンをコンピューターがしてくれる時代がきます。間違いなく。個人の能力だと信じていたノウハウも実は単なる一定の法則に過ぎなかったと気づかされる日が確実にやってきます。

行きつくと、弁護士も医者も政治家も99%いらなくなります。

え!彼らより次元の低い(?)俺の仕事はどうなるんだ?
飯が食えなくなるんじゃ!?

と思ってしまいそうだけど、心配無用です。
その時代の生き方については長くなるのでまた別途、空想してみたいと思います。
簡単に言うと、残りの1%が次の時代の100%になっている、というのかな。
実は今も昔の1%を100%として生きている、というのかな。





とかとかいう間にも、世界は少しずつビット化されています。
ビット化の対象は既に地球だけに留まっていません。

どっかの本で、

宇宙を完全にシミュレートできたらそれはもはや宇宙である


と言っていたけど、ひょっとすると、それがいわゆる一つのビックバンかもしれません。


『宇宙をプログラムする宇宙』





ところで、パソコンが超庶民的なものになって、どれぐらいたつでしょう。

俺は大学3年の頃に、確か兄と折半で富士通製のFMVなるものを買ったので、えええーっと。パソコン暦はかれこれ、何年?ゆうに10年以上か。ネットもチャットもメールも2ちゃんねるも何もかもとうにオタクのものではない時代になっています。こうして何気なく触っているパソコンですが、実は多くの情報がこのパソコンを通して収集されています。僕らが意識的に作るモノだけではなく、僕らの行動までもがデータ化されています。


仮にパソコンが超庶民的になって10年として。
10年分のビット量はけっこう多いです。





ただビットにも質がある。

このご時勢、初めから死んだデータを作るのは、それなりに時代遅れであるといえます。死んだデータは、続々現れる新しいデータの中に確実に埋没していきます。放置すれば江戸時代の庶民の日記のごとく、二度と人目に触れないものとなります。

そうです、死んだデータの代表例は、文章です。

あれ?さっきデータを生かした例でグーグルサジェストをあげなかったっけ?

確かに挙げたよね、俺。





ここからはややクオリア的な話になります。
コンピュータはなんだかんだいって文章を理解しているわけではないのです。グーグルは形態素解析の中でもそれなりにかしこく文節を解析してくれるようなんだけど、結局はキーワードを捜してくれるだけなのです。ページランクという評価も勝手につけてくれますが、けっして文章を魂で理解して、

うーん、これは実にいい!

と言っているのではなく、評価される文章はきっと評価されている文章から評価されるに違いない、というなんていうの、そういうstatistics的な判断でランク付けしているだけなのです。

もし論理的に文章を理解するコンピュータがいたら、既にパラメータとして本を渡しまくっているだろうし、そのコンピュータと人が普通に会話をしていると思うんです。瞬時に医者も作れるだろうし、弁護士だって作れる。

現実そうではない。

となるとやっぱり、統計学的な判断しかまだできていない。


世の中の評価ってまさにそういうことなのかもしれないのですが。





グーグルのアドセンスはWebページを自動解析し、広告を出していると誰かが大声で謳っていましたが、論理的に理解できない以上、その精度はたかが知れているでしょう。例えば、こんな文章があったとしよう。

「僕は、コーヒーが好きで好きでたまらなく、豆の炒り方、ひき方、お湯の注ぎ方、その一つ一つにこだわっている太郎くんのことがギザ好きになれません。」

この場合、アドセンスは、コーヒーに関連する広告なんかを出しにくるのではないでしょうか。ギザの意味を俺自身よく分かっていませんが、ここに仮にUCCの広告を出されたら、UCC勤務のきみは怒るんじゃないかと。

すいません、まだ実験していないので断定はまったくできません。

けど、コンピューターが文章を正確に理解する日が近い将来来るとはあまり期待できないと思います。なぜなら文章は、音楽の譜面がそうであるように多くの情報が欠落しているからです。ゆえ、どうにでも解釈できたりしてしまう。

人間の脳ってすごいなあ!

と思うこと、よくあります。





前置き長くなりました。

つまり、今日、コンピューターにデータを理解してもらうなら、もっとコンピュータにやさしい識別情報を付加してあげないといけない。

現時点、データを生かすってそういうことです。





例えば、流行のタグ付けなんかもその一つの手法です。
Youtubeの動画や、MP3に始まり、このブログにもタグがつけられます。
ちょっとそういった、動画、写真、音楽、音声データ、文章に、コンピュータが自動でタグ付けするのはまだちょっと先の話だから、ひとまず手動でタグつけて情報を整理しようぜ、ということなのでしょう。

こいつには「切ない曲」というタグをつけよう!

なんてコンピュータは思ってくれない。現時点では。





申し訳ない。話がそれます。すぐに。

データが生きるか死ぬか。

エクセルは、無意識にデータに命を吹き込んでいるのです。
ワードは、意識してもデータは死にゆきます。

どうして無意識に吹き込んでしまうのか?

二次元です。

この画面も二次元です。本もノートも表もグラフも二次元です。
行と列を持っています。
位置に意味があります。
文章を書けば、必ず文章以外の位置(何行目、何列)という意味を持ってしまいます。
宿命というか。

位置に意味があるからには、意味をそろえたい。
意味をそろえると表になります。
一貫性があると、非常にいい。

格好のエサになります。

ということで、そろそろ寝ようかと思います。
眠いです。

0 件のコメント: