「ITって、何?」質問2: ITを理解している人を見分けるにはどうしたらいいの?

< データと情報の違い >


「じゃあ、次の質問、いきます。
ITを理解している人を見分けるにはどうしたらいいの?」

--それはいい質問だね。見分ける方法か・・。
 そうだな、こういうふうに訊ねてみるといいかもしれない。『データと情報はどこがちがうか?』
 この質問にはっきり答えられる人はITの本質について洞察をもっている人だ。逆に、いかにパソコンにくわしくても、この質問の意味が分からない人は、ITの意義を理解できていないと思った方がいい。
 
「データと情報? それって何がちがうの? 同じものかと思ってた。」

--たいていの人は「データ」と「情報」という二つの言葉を、あまり区別せずにつかってる。専門書ですら、ときにはあいまいにしている。しかし、ITを理解する上では、この両者ははっきりと区別する必要があるんだ。
 「情報」とは、人間にとって意味をもたらすものさ。人間の話す言葉、書く言葉は意味を伝達するために発達した。
 これは逆の例を取ってみればわかるだろう。君がもし誰かから手紙をもらったとして、それが翻訳家の君でさえ全く知らない言語で書かれていたら、それに何の意味があると思う? ラブレターなのか? 脅迫状なのか? 招待状かはたまた予言書か? 意味が分からないものは、情報の役割をはたさないんだ。

「じゃ、データって何?」

--「データ」とは何か。データとは、数字や文字の規格化・定型化された並びのことなんだ。『規格化』・『定型化』の意味についてはおいおい説明するけど、いまはとりあえず「表のようにきちんと並んだ」というふうに理解しておいてほしい。

「なんか抽象的でよく分からないわ。例をあげてみてくれない?」

--たとえば、新聞の株式欄はデータだ。会社名と、株価の数字が整然と表になって並んでいる。駅の時刻表や電話帳もデータだ。野球のスコアブックもデータだね。

「スコアブックなんてコンピュータに入れておくものなの?」

--データというものは、必ずしもコンピュータの中に格納されていなくてもいい、ってことに注意してほしい。「あの野球監督はデータにもとづいて作戦を立てる」といったとき、そのデータは過去のスコアブックの集積を指しているので、それがパソコンに入っているかどうかは本質じゃない。その監督が単なる人情や勘だけで指示を出しているわけではない、ということをいっているのだから。
 ちなみに定型化され規格化されたデータをコンピュータに格納したものを、「データベース」とよぶ。

「わたし、数字のことをデータって呼ぶのかと思ってた。」

--データはべつに数字が並んでいる必要はない。文字だけでもデータなんだ。だから住所録や学校の卒業名簿だってデータさ。
 それと、図書館の蔵書カードなんか、カードがたくさん並んでいるだけで、全体が一枚の表の形にまとまっているわけではないけれど、それでもデータだ。1枚に書くべきことが決まっていて、それがきちんと並べられているからね。倉庫の入出庫台帳なんかもデータですな。

「ちょっと待ってよ、新聞の株式欄は『情報』じゃないの? ある株が上がったか下がったか、どの会社が今、注目株か。これはみな『意味』そのものなんだから、さっきの定義にしたがえばデータではなくて情報のはずじゃないかしら。」

--その答えはイエスでもありノーでもあります。というのは、数字の羅列から意味をくみ出すのは、人間の側の精神の働きにあるからね。ある株価の動きに君は意味を感じるが、別の人はその株価には無関心で、他の数字に意味を見いだすかもしれない。
 これは、証券アナリストが出す「今注目の株はこれ!」というレポートが、不特定多数の人に対してほぼ同じ意味を伝える「情報」そのものであることに対比して考えるとわかるとおもう。株式欄の数字自体は、受け取る人の意味づけに対して中立なものなんだ。

「なんだかまだごまかされているような気がするわ。人間の精神の働きが意味を汲み上げるって、どういうことよ。急にドイツ観念哲学の講義の時間になったみたい。」

--かりにいま、6月から9月までの毎日のビール消費量と、その日の気温との関係を日付順にならべて表をつくったとする。これはデータだ。ところで、そのデータを、横軸に気温・縦軸にビール消費量をとってプロットすると、こんな風に点が並んだとする(手でホッケースティックのような右肩上がりの図を描く)。図をよく見ると、消費量は気温がある点、具体的にいうと28℃あたりを超えるとぐっと上向きになることがわかる。
 しかし、これは人間が視覚的にデータから意味を読みとる力をもっているからこそ、わかることなんだ。コンピュータは、表の形になっていようが、グラフの形で表現されていようが、そこから自動的に意味をくみ取るようなまねはできない。
 つまり、「データ」とは中立な(いいかえれば無味乾燥な)もので、そこから意味を引きだして「情報」にするのは人間の認識力そのものなのさ。

「ふーん、それで?」

--ところで、ここから先が大事なんだけれど、コンピュータの中に格納して処理できるのはデータだけだ。機械にできるのは、定型化された数字や文字の並びをあれこれと加工することなんだ。意味は人間の側の働きだから、コンピュータは「情報」を取り扱うことはできません。
 これがデータと情報のちがいさ。そして、この両者の関係が分からない人は、ITがわからないといえるとぼくは思う。

<参考 JISにおける用語定義>

情報:事実、事象、事物、過程、着想等の対象物に関して知り得た事であって、概念を含み、一定の文脈中で特定の意味を持つもの

データ:情報の表現であって、伝達解釈又は処理に適するように形式化され、再度情報として解釈できるもの。(備考 データに対する処理は人間が行っても良いし、自動的手段で行っても良い)
by Tomoichi_Sato | 2010-10-07 03:23 | ITって、何? | Comments(0)
<< リスクとは(本当は)何を指すべきか リスクという言葉自体がリスキーである >>