人気ブログランキング | 話題のタグを見る

情報の電子化はデジタル化か?

読者諸賢は、『EDP』という言葉をご存知だろうか? Electronic Data Processingの略だ。電子的データ処理。つまり、コンピュータを使ってデータを処理することを意味する。それって・・当たり前じゃないか。何が新しいの? ようするにIT=情報技術のことじゃないの。

左様でござる。3文字略語を大量に消費し続けるIT産業において、EDPという言葉は四半世紀以前に陳腐化し、すでに死語となった。この言葉は、実は1960年代に、メインフレーム(汎用コンピュータ)が世の中に登場した頃、一緒に出てきた概念なのである。メインフレームという呼び方自体、その頃は、なかったはずだ。だって、対比すべきパソコンもオフコンも存在しなかったのだから。いや、コンピュータ自体、皆が「電子計算機」と呼んでいた時代であった、とも聞く。

ところで、EDP=「電子的データ処理」という言葉は、案外、含蓄が深いんじゃないかと、最近思うようになった。なぜか? 実は、この言葉は、「機械的データ処理」Mechanical Data Processingの対比概念として、(例によってアメリカで)登場してきたと思われるのだ。

機械的データ処理とは、どんなものか。その技術は、米国におけるセンサス(国勢調査)に由来する。

御存知の通り、米国ではあらゆる局面での意思決定において、客観的情報を体系的に収集し、分析した上で決断する、という思考と行動習慣を持っている。彼らは国政を決める際にも、同じアプローチを取る。すなわち、人口調査である。広大な国土をカバーし、開拓民が移動する社会において、彼らは国勢調査を憲法で義務付けた。

第1回は、1790年、つまり米国が独立を達成し、ワシントンが第1代大統領に就任した翌年だった。客観的な数値情報に、彼らがどれだけ重きをおいているか、分かると思う。そして以来、10年ごとに実施してきている。

当時は、紙とペンの時代である。独立時の米国の人口は、約400万人だった。集計作業がいかに大変だったか、想像に難くない。でも彼らは、それを必要な作業と考え、続けていった。センサスを開始してから100年後、19世紀末には、米国の人口は5千万人に達する。

5千万レコードの集計を、手作業かよ。皆さんはそう思われただろう。そのとおり。だから、ここで重要な技術革新が現れる。その立役者は、Herman Hollerith(ハーマン・ホレリス)という技術者だった。彼は、その少し前に、フランスの発明家Jacquard(ジャカール)が作った、ジャカード織機という機械にヒントを得て、「パンチカード」を考案する。

(参考:小暮仁「パンチカードシステムの歴史」 にホレリスの穿孔機やタビュレーターの写真がのっている)

ホレリスのパンチカードは、サイズがドル紙幣と同じだった。そして、そこに、英数字に対応する、12個の穴の位置をコード化した。この文字コードを、ホレリス・コードと呼ぶ。彼がパンチカードの文字の桁数を80桁と決めたので、以来、コンピュータの画面も長らく、横が80文字が標準だった。

そして彼は、パンチカードの穴の位置を機械的に検出する仕組みを持つ、リレー方式の電動作表機械(タビュレーター)を製作する。この機械にパンチカードを束にしてかけると、集計表ができるのである。これこそまさに、「機械式データ処理」だった。ホレリスのタビュレーターは、それまで7年かかった国勢調査の集計を、3年間に短縮した。まさにイノベーションである。

ちなみにホレリスは国勢調査職員だったが、数年後に会社を設立する。パンチカード・システムの有用性を、民間企業も認識し、ビジネスチャンスが広がったからだ。彼の会社はその後、タイムカードの会社などと合併し、1911年に「国際事務機会社」International Business Machineという社名になる。これがIBMである。

IBMは、電子計算機なるものが登場する前は、機械式データ処理マシンの最大手だったのだ。

技術者ホレリスの名前は後の時代にも、FORTRAN言語のH変換などに残った。初期のFORTRANでは、英文字の印刷出力に、11HHELLO WORLDなどと指定していた。11という桁数のあとのHが、ホレリス変換を意味する。

(ちなみに余計な話だが、ホレリスは国勢調査局と関係がこじれ、政府側はパワーズという技術者に、印刷機能付きのタビュレーターを開発させる。パワーズも後にすかさず会社を設立し、レミントンランド社に吸収されたりして、のちのUNISYS社になる)

文字コード、カードサイズ、穿孔機、集計機ーーここまで定型化されているので、ある意味、機械的処理を電子化していくのは、単に技術とコストだけの問題だった。UNISYS社は1951年、UNIVAC 1という世界初の商用電子計算機を発売する。1台で、100万ドル。もちろん最初の顧客は、国勢調査局である。

これが、電子的データ処理=EDP産業の、始まりだった。

さて。わたしは以前(と、いっても11年も前の話だが)、「『ITって、何?』質問2: ITを理解している人を見分けるにはどうしたらいいの?」 という記事の中で、データと情報の違いについて、説明した。簡単にまとめると、次のようになる。

情報」:人間にとって意味をもたらすもの
データ」:数字や文字の規格化・定型化された並び

念のため、JISの定義では、情報とは「事実、事象、事物、過程、着想等の対象物に関して知り得た事であって、概念を含み、一定の文脈中で特定の意味を持つもの」であり、データは「情報の表現であって、伝達解釈又は処理に適するように形式化され、再度情報として解釈できるもの」(データに対する処理は人間が行っても良いし、自動的手段で行っても良い)となっている。だから上記の定義は、ある意味、世の中の標準的な定義である。

そして、IT=情報技術とは、この「情報」と「データ」の間のサイクルを回す技術なのだ。ちょうど、ホレリスのパンチカードが、調査で入手した情報を定型化してデータ化し、機械的に処理し、結果を集計表という人間に理解可能な形に表示することで、人間に意味をもたらしているように。
情報の電子化はデジタル化か?_e0058447_18164191.png

図を見てほしい。上側は、人間の仕事の世界である。そこでは情報が取り扱われる。ただし、情報はそのままでは、大量・高速な処理や、検索に向かない。人間は、これを定型化することで、機械が処理しやすい形に入力する。つまりデータ化する訳である。

下側は機械の仕事の領域で、人間から受け取ったデータを処理し、蓄積・転送・検索・計算などを行う。そして、結果を、人間に理解できるよう出力する。出てきた出力は、人間が意味を汲み取って、さらなる仕事に役立てる。

このサイクルでボトルネックになりやすいのは、人間による情報のデータ化の部分だ。キーボードからの入力もかったるい作業だが、とくに、「定型化」の部分が問題になる。ここの意識が、わたし達の社会では特に、弱いのである。

たとえば、手書きのメモがある。これを、スマホのカメラで撮って、写真アプリに保存すれば、それは「電子データ」になったと考える人が、世の中には非常に多い。では仮に、ホレリスの時代にデジカメがあったとして、5000万件の国勢調査ヒアリング用紙を、5000万枚の電子的な写真データにしたら、彼の集計の仕事は助かっただろうか? そんなことはあるまい。

記録媒体が紙から、どこぞの電子媒体になったとしても、それは決して、IT的な意味での「データ」にはならないのである。なぜか。IT的な意味でのデータとは、
機械的に到達(検索)可能であり、
・それをインプットとして、機械的な処理や判断が可能なもの
を指すからだ。

そういう意味で、Excelの表の上の数字だって、データかどうかは微妙である。複数のシートに渡って、何かを集計しようと思ったときのことを考えればいい。表がきちんと形式化されていれば、同じ$B$56といったセル位置をたどって、合計することができる。だが、ほとんどの表は、人間が、列や行の見出しを読まないと、欲しい値の位置がわからないのだ。

あるいは、CAD図面などもそうだ。図面の右側に、よくNote欄があって、いろいろな設計技術者の注釈が書いてある。あれは、たしかにCADサーバのどこかに、電子的に保管されている。しかし、"No pocket"などといった記述をコンピュータが読み取って、それで具体的に何か処理できるだろうか? おそらく、できまい。だとしたら、少なくともこの部分は、読み手の人間にとっては情報であるが、計算機にとってデータではないのだ。

わたし達の社会には、おかしな誤解が蔓延している。情報を電子化したら、それはデジタル化だと思っている。まあ、たしかに2 bitの組合せで内部表現されているから、ミクロにはデジタルかもしれない。しかし、DXなる流行語を皆が語る今日、目指しているのは、仕事に役立つような「データ化」であろう。そのためには、定型化とか、標準化とか、はっきりいって日本企業がすごく不得意な作業が、必須なのである。

そしてまた、データとは数値的・客観的なもの、という理解(誤解?)も、蔓延している。データに基づく経営、とか。じゃあ情報に基づく経営は、定性的・主観的なのだろうか? 話している人は、そういうつもりではないのだ。おそらく経営判断は、個人の主観や印象によるのではなく、客観的・数値的な情報に基づいて行うべきだ、と言いたいのだろう。

そう。それならば、たしかに同意できる。18世紀末のアメリカ人たちも、そう信じていた。そして彼らは、とてもプラクティカルな人々だった。だからこそ彼らは、機械的データ処理を通じて、新しい巨大な産業と文明を生み出せたのである。


<参考エントリ>
 →「データと情報はこう違う」 (2012-07-24)


by Tomoichi_Sato | 2021-08-31 19:32 | ビジネス | Comments(1)
Commented by なんぶ at 2021-09-01 11:42 x
数年前、少しだけ開発部門が作成して製造部門に渡す手順書等の変更をお手伝いしたことがあるのですが、
すべてパソコンで扱える電子ファイルになっているものの、その中身は「印刷したら昔と同じ紙が得られる」ようになっていて、ヘッダーフッターまで直接入力で、あまりの不便さに愕然とした覚えがあります。(その数週間は「電子化したからってIT化じゃない!DXの前にITだろ!」と独り言を繰り返していました)
電子化した当初は印刷した紙を使って作業していた製造部門も、とっくにペーパーレスになっているのに。テンプレート改善を提案しても予算がないからと却下され、しょぼんとしました。
<< 『非定型的なデータ』と賢く付き合う法 書評:「哲学入門」 戸田山和久 >>