データを情報に変える

ここに一つの数表がある。最近の企業業績に関するデータをもとに作成したものの一部だ。類似した業種の会社7社を選んで、並べてある。

    売上高 従業員数 粗付加価値額 付加価値生産性 労働装備率
--------------------------------------------------------------
企業1  36,499 | 2,039 | 25,859 |  12.68   |   12.6
企業2 709,554 | 5,661 | 184,161 |  32.53  |   29.5
企業3  87,752 | 2,031  | 26,411 |  13.00   |   12.2
企業4 282,091 | 3,358  | 64,769 |  19.29   |   23.0
企業5 257,471 | 2,509  | 29,808 |  11.88   |   17.1
企業6  80,080 | 2,170  | 46,328 |  21.35   |   16.4
企業7 194,356 | 3,343  | 76,324 |  22.83  |   28.2

これをみて、どのようなことを感じられるだろうか。たぶん、なんだか数字が並んでいるだけで、何も感じようがない、と思われるだろう。

それでは、この中の二つの項目を選んで、グラフにしたら、どうだろうか。

e0058447_22165376.gif


これをみると、どうやら企業の生産性(付加価値労働生産性)と、その企業の労働装備率との間には、一種の相関関係があるらしい、ということに気づくだろう。労働装備率は従業員一人あたりの固定資産額で、製造業の場合は主に工場設備に左右される。ここから、人を増やさずに生産性を上げたければ、工場の近代化投資が必要らしい、という仮説が浮かんでくる。

とはいえ、今回のテーマは工場の話ではない。上に上げた表は、定型化された数値や文字の並び、すなわち「データ」である。では、グラフの方はどうか? こちらもデータである。ただ、そこから、“生産性と労働装備率とは関係がありそうだ”という「情報」が浮かび上がってくる。データから情報を組み上げるプロセス、これは人間の心が持つ「気づき」という知的な働きによるものだ。コンピュータは、人間に情報をもたらしてくれたりはしない。

以前、出版社の人に、ITの本質を理解している人を見分ける方法はあるかときかれたとき、とっさに私はこう答えていた。『データと情報はどこがちがうか?』と訊ねてみてください、と。なぜなら、ITをよく分かっていると人とは、データと情報のサイクルを意識して活用できる人に他ならないからだ。

たいていの人は「データ」と「情報」という二つの言葉を、あまり区別せずにつかってる。専門書も、あいまいな場合がある。しかし、ITを理解する上では、この両者ははっきりと区別する必要がある。

「情報」とは、人間にとって意味をもたらすもので、ふつうは言語のかたちをとっている。逆にいえば、すぐに意味をくみ取れないものは、たとえ言葉で書かれていても、情報の役割をはたさない。

一方、「データ」とは何か。データとは、数字や文字の形式化・定型化された並びのことだ。「表のようにきちんと並んだ」と理解してもいい。たとえば、新聞の株式欄はデータである。会社名と、株価の数字が整然と表になって並んでいる。駅の時刻表や電話帳もデータだ。データはべつに数字が並んでいる必要はない。文字だけでもデータだから、住所録や学校の卒業名簿だってデータである。

データというものは、必ずしもコンピュータの中に格納されていなくてもいい。「あの野球監督はデータにもとづいて作戦を立てる」といったとき、そのデータは過去のスコアブックの集積を指しているので、それがパソコンに入っているかどうかは本質ではない。その監督が単なる人情や勘だけで指示を出しているわけではない、ということをいっているのだから。

いや、新聞の株式欄は『情報』じゃないか、という反論もあるかもしれない。ある株が上がったか下がったか、どの会社が今、注目株か。これはみな『意味』そのものだから、さっきの定義にしたがえばデータではなくて情報ではないのか? --とはいえ、株式欄の数字の羅列から意味をくみ出すのは、人間の側の頭脳や精神の働きである。

最初にあげた数表とグラフを思い出してほしい。図を見ると、労働装備率が高い企業ほど付加価値生産性も大きいことが理解される。データの中にある関係性(これを共分散構造と言ってもいい)を見いだし、人はそこに意味を発見する。しかし、コンピュータは、表の形になっていようが、グラフの形で表現されていようが、そこから自動的に意味をくみ取るようなまねはできない。

つまり、「データ」とは中立な(いいかえれば無味乾燥な)もので、そこから意味を引きだして「情報」にするのは人間の認識力なのである。だから、データそれ自体は価値を持たないが、それを利用できる人にとっては潜在的価値がある。データとは、見かけは荒れ地だが地下に石油の鉱脈が眠っているかもしれない土地のようなものだ。

もう一つ、データと情報には重要な違いがある。コンピュータの中に格納して処理できるのはデータだけなのである。機械にできるのは、形式化され定型化された数字や文字の並びを、あれこれと加工することに限られる。「IT=情報技術」という名称とは裏腹に、コンピュータは情報は扱えない。なぜなら、情報には決まった形がないからである。

物流の世界にたとえれば、コンピュータというのはデータという荷物の運送業者だ。データを受け取って、車に積んで、集積所にはこんだり車につみかえたりしたりして、相手先に届ける。だれかにものを送りたいときには、それが本であれ服であれ花束であれ、とにかく何かの箱に入れて宅配業者に渡すだろう。ばらばらで形の定まらないものを渡されても業者は困ってしまう。機械的にハンドリングできないからだ。また逆に、運送業者にとって、箱の中に何が入っているかは興味がない。箱の中身に人がどういう意味を託そうが、それは彼らにはあずかり知らぬこと、知りようのないことだ。

ではなぜ、「IT=情報技術」などという概念が生まれるのか? それは、情報という上層のレイヤーとデータという下層のレイヤーをとりもつための技術だからだ。情報という大事な品物を、データという形の決まった箱に入れて処理しやすくし、また逆にデータの箱の中から、うまく情報の品物を引きだすことで、

    →→情報→→
   ↑        ↓
    ←←データ←

という円環をつくってまわしていく。この、“データと情報のサイクルを回す”ということが、IT利用スキルの本質なのだと、私は考えている。

<参考 JISにおける用語定義>

情報:事実、事象、事物、過程、着想等の対象物に関して知り得た事であって、概念を含み、一定の文脈中で特定の意味を持つもの

データ:情報の表現であって、伝達解釈又は処理に適するように形式化され、再度情報として解釈できるもの。
by Tomoichi_Sato | 2009-02-15 22:18 | 考えるヒント | Comments(2)
Commented by うさみみ at 2009-02-16 20:33 x
はじめまして、うさみみといいます(^^♪
ピーターの法則を検索して、ここに行き着きました。
最近、時間を有効に使いたいなってことを考えて生活していたのですが、「時間管理術」に関して書かれておられ、過去ログを読みふけっております。
いろいろ学ばせていただきたく思います。
ますますのご活躍を期待しております(^^♪
Commented by Tomoichi_Sato at 2009-02-17 21:50
コメントありがとうございます。楽しんで読んでいただければ、何よりです。
なにか気づいた点がありましたら、よろしく。
<< Web連載記事のお知らせ マイルストーンは中点で測れ >>