カテゴリ:ITって、何?( 37 )

「ITって、何?」 第5問 全角と半角は何がちがうの?

<< 文字コードと情報量の話 >>

「でもちょっと待ってよ。選択肢がデータの最小単位だとかおっしゃるけれど、請求書の金額は何かの選択じゃあないわ。好きにとれるもの。」

--もしそれが3桁の数字なら、ゼロから999までの千種類の選択肢から一つを選んだものだ。

「そんなの答えになってないわよ! 請求書の桁数なんて実際は上限はないもの。あったらうちの家計は大助かりだけれど。」

--たしかに上限はないさ。だけど、それが金額の数字である限り、数字が何個か並んだものだろ? 万は5桁、億なら9桁、兆なら13桁だけど、無限に数が並ぶってことはないわな。

「それで?」

--それが答えさ。金額の数は、桁ごとに区切っていくと、結局0から9まで10個ある数字の選択肢のうちどれかを選んだものが並んでいるわけだ。数値データはだから選択肢の並びなのさ。ただし実際にはそんな一桁ずつ区切ったりせずに、7桁とか14桁でのまとまりで二進数に変換してしまうけれどね。いずれにしても数値はつねに定型化されたデータの最小要素だといえる。

「二進数・・とうとう出たわね、二進数!」

--まあ二進数の話なんかしたくなかったんだけどねえ、行きがかり上・・。二進数表現なんて計算機のまるきり内部の話で、それこそITの利用者にとっては関係ないことさ。ガソリンエンジンのピストンの構造が、車のドライバーにほとんど関係ないように。
 でもまあ、もののついでだから説明すると、ふつう計算機は二進数を8桁ずつ区切って処理する。これを1バイトというんだ。1バイトは2の8乗で256通りの選択肢を意味する。
 
「何バイトとかって、文字の数のことじゃなかったの? てっきりそうかと思ってた。」

--文字の数といってもいい。どうしてかというと、アルファベット1文字をあらわすのに1バイトを必要とするからだ。文字は256通りの選択肢の一つなんだ。

「アルファベットは26文字しかないわよ、英語の場合。一桁ちがうんじゃないの?」

--でも大文字と小文字がある。これで52種類。それに数字が0から9まで。ほかにカンマやピリオド、セミコロンや$マーク等々が必要だし、それにタブだとか改行だとか(タイプライターにもあったけど)、それ自体は文字にはならない位置決めのための「制御記号」ってのも含めると100種類以上になる。

「でも256にはずいぶん間があるわ。」

--そうだね。それで、空いているすき間に、欧米系だと仏語のアクサンやドイツ語のウムラウトなんかを埋め込んでいる。日本だとそのスペースに半角のカタカナを割り当てていることが多い。

「ひらがなは?」

--コンピュータの世界には半角のひらがなは原則として存在しない。実はひらがなまで入れると256種類ではおさまらなくなっちゃうんだ。

「ねえそうだ、前から聞こうと思っていたんだけれど、ワープロにはどうして半角と全角ってあるの? あれって横幅以外に何かちがうの?」

--とってもいい質問だ。あれは漢字のせいなんだよ。漢字はとても256種類の選択肢ではおさまらない。そこで日本人は1バイトの倍、つまり二進数で16桁のまとまりで一つの文字をあらわすという選択肢のセットを考えた。

「256の倍って言うと、えーと、512種類? それじゃ入らないわよ。何千もあるんだから。」

--いや、256種類と256種類の組合せだから、256×256で6万5千以上の選択肢になる。これだったら漢字もひらがなも英数字も余裕で全部はいる。
 それでね、いわゆる全角の文字というのは、この6万4千種類のメニューから選んだ文字を指すんだ。一方、半角の文字というのは、256種類のメニューから選んだ文字ということになる。こういう文字の選択メニューのことを「文字セット」とよぶ。
 半角文字は1バイトであらわすことができるけれど、全角の文字は一つの文字をあらわすのに2バイト必要になる。だからこういう文字セットのことを「2バイト文字」といったりする。日本語だとか中国語だとか韓国語なんかは文字数が多いから、言葉を表すのに2バイト文字を使う。英語とかヨーロッパ系の言葉はほとんど1バイト文字ですむ。
 
「でも、それがどうして字の大きさと関係あるの?」

--うーん、それはねえ、ある意味じゃ偶然なんだ。コンピュータは米国で発達した。横1行にアルファベット80文字という画面をずっと使っていた。アルファベットは縦長の形をしている。ところで漢字はわりと真四角だろう? そこで、漢字の大きさをアルファベットの2文字分にすると、だいたい釣り合いがとれた。こうすると1行が40文字になって、これまたなぜか原稿用紙の升目の数の倍だからちょうどきりがいい。
 そこで、漢字やひらがなの文字の大きさをアルファベットの2文字分にして、これを全角と呼び、アルファベットや数字を半角と呼ぶことが定着した。

「ふんふん。」

--もっとも、初期のワープロとちがい、現代のワープロは文字フォントの大きさを好きに変えられるから、あまり全角とか半角とか言う意味はなくなってきている。でも習慣的に1バイト文字と2バイト文字を半角・全角というのが続いているんだ。

「ふーん、じゃあバイト数と文字の数はやっぱり関係があるのね。でも、それで少し分かったわ。世の中にはアルファベット用の、えーと、『文字セット』だったっけ? それと、漢字用の文字セットがあって、それで世界中が通信できるのね。」

--えーとね、その理解は7割正解だけれど3割はちがう。じつはアルファベットの文字セットは国ごとに少しずついろいろとちがう。漢字なんてもっと全然ちがう。それどころか日本には同じ漢字仮名まじりの文字のためにJISとシフトJISとEUCという3種類の全然ちがう文字セットが並立していた。

「似たような文字のメニューが何種類もあるの? ばっかじゃない?」

--人類は馬鹿なんだよ。実際には国ごとに違うどころかコンピュータ・メーカごとに違ったり、それを標準化しようとする動きがまた複数あったりした。それを解消するために、ユニコードと呼ばれる万国共通の巨大な単一文字セットを、主要IT企業が中心になって定め、インターネットとWebの普及と歩調を合わせる形で広がってきた。でも、まだ文字領域が足りないだのバージョン間で互換性がないだの、悩みは続いている。まあこの世界は未だにバベルの塔崩壊の余震の中にいるようなものだね。

「じゃあもしかして、文字化けってのも・・」

--ご明察。文字のコード体系、つまり選択肢のメニュー構成の違いが起こすトラブルなのさ。

(つづく)
by Tomoichi_Sato | 2010-10-27 23:06 | ITって、何? | Comments(0)

「ITって、何?」 質問4 定型と非定型はどこがちがうの?

<< 「セミIT」と選択肢の話 >>

「ねえ、そうすると、情報技術がいま説明してくれたようなものなら、利用者はもうデータの事は気にかけなくてもいいわけね?」

--とんでもない。その逆さ。
 もちろん、データの事は気にかけずともITを利用する事はできる。たとえば女子高生の携帯メールみたいにね。一対一の情報糸電話だったらそれでも結構。
 でもね、もしも情報技術をもっと上の次元で、うまく利用したければ、自分の情報をいかに機械の扱いやすい定型化した形式に持ち込めるか、が鍵となるわけだ。そしてまた、データから意味のある情報をくみ取るスキルがもう一つの鍵となる。
 人間は情報をデータの形にして機械に処理させ、機械のもつデータから情報を取り出す。このサイクルをうまくつくることこそ、IT利用の最大の勘どころなんだ。

「なんだかまだ話が抽象的でよく分からないわね。“自分の情報をいかに機械の扱いやすい定型化した形式に持ち込めるか”なんておっしゃるけど、それって具体的にはどういうこと。手書きの原稿はやめて全部キーボードから入力しろ、ってこと?」

--そうじゃないんだ。それって、ある意味では典型的な勘違いで、うちの会社の幹部なんかもよくそんなことを言ってるけど、それはちがう。
 データってのは、計算機の中に格納されているだけじゃダメなんだ。効率よく探し出せなければデータとはいえない。パソコンの中に、ワープロのファイルが山ほどあちこちのディレクトリの下にちらばっているけれど、いちいち中身を開けてみないと何がなんだか分からなくなってしまったものがほとんど、なんて状態じゃ、それはデータの用をなさない。こういうのは、ぼくは「セミIT」とでも呼ぶべきだと思う。

「セミIT?」

--データに関する理解が足りないまま、情報技術をほんの表層だけつかっている状態さ。本当にデータの力を生かしきる使い方をしていない。同じお金を計算機にかけながら、実際にはその半分の価値も引き出していない「セミIT」型利用者が多すぎる。

「じゃその、セミITから、フルITだか本格派ITだかなんだかのユーザに進化するにはどうすればいいの? せっかく機械が人間に歩みよって自由な情報を扱ってくれるようになったのに、ユーザの方から不自由なデータをさわれ、っていうわけ?」

--いや、それは少しちがう。自由と不自由、というとどうも価値判断めいてしまう。
 ぼくが言いたいのは、データは定型だが情報は非定型だ、ということ。そして情報は、非定型なる人間の世界に属している。人間さまはひじょうにフレキシブルだからね。その非定型な情報をいかに形式化するかがITのポイントなんだ。定型と非定型の区別はIT理解の中核をなす。この違いは分かるね?

「そんなの知ってるわ。あなたの毎朝の髪型は不定型で、私の髪型が定型。まったく頭ぐらいきちんととかしてから出社してほしいわ。」

--あのね、漫才やってるんじゃないんだよ。ぼくの時間単価は外販すると高いんだから。それを君だけのために使ってあげてるんだ。

「それはまた失礼しましたわ、先生。後で請求書とかくるんじゃないでしょうね?」

--もしお支払いいただけるんでしたら、請求させていただくのはやぶさかじゃありませんが。
 でもね、たとえば請求書一つを例にとってみても、手書きの請求伝票で送るのと、ワープロの手紙で「二百万円おしはらいください」と書いて送るのと、どっちがIT化に近いと思う?

「それはもちろんワープロの方でしょう?」

--そう思うでしょ。ところがちがう。ぼくらIT屋の目から見ると、手書きの請求伝票の方がずっとコンピュータのデータに持ち込みやすい。なぜなら請求書は形式が完全に決まっているからね。宛先があり、日にちがあり、品目と数量と金額が一行ごとにあって、最後に合計と振込先がある。どこをみればどの項目か迷うことがない。
 しかし、ワープロのファイルを開いてみて、文章(つまりテキスト)の中から「にひゃくまんえん」という数値をつかまえるのは容易じゃない。書く人により、書くたびにいろんなスタイルでまちまちの場所にでてくる可能盛が大だからね。
 つまり、手書き伝票は定型化されているからデータだけれど、ワープロのファイルは非定型だからデータではない。ここがポイントだ。

「罫線があって表になっている、ってこと?」

--いや、そうじゃない。どう説明したらいいのかな。
 たとえばね、請求書が何枚も何枚もあったとしよう。その合計金額を計算しなくちゃならない。手書き伝票ならまとめて順にめくっていって、決まった欄の数字を電卓でたたくだけだ。教えてやれば小学生でもできるね。これが「定型化されている」ことのメリットだ。
 でもワープロのファイルを一つ一つ開けていって、合計の金額を知るためには、中身の文章を一応読んで内容を判断しなければできない。これはかなり高度な知的作業だ。ちょっと小学生には頼みたくない。文章は非定型だからさ。

「ふうん、少し分かってきたわ。高度な知的判断を必要とするようなものを非定型情報というのね。」

--ごく単純で機械的な作業で処理できるようなものを定型的という。もちろんそのためには誰かがはじめにその形式をうまく考えて定義してやる必要はあるよね。しかしその形式化をおろそかにすると、データとしての取扱いの難しい、非定型な情報ばかりが行き交うことになる。

「だからさっきの『セミIT』になっちゃうのね。ふーん。」

--ぼくはセミIT自体が悪いとは思っていない。それは皆が入りやすい玄関みたいなものでね。昔みたいに大型計算機しかなかった時代よりずっと取っつきやすい。でも、なまじセミITを使って“これでITが分かった”と錯覚してしまう人は多いんだ。理解のレベルがそこでとまってしまうから、かえって本当のIT化のブレーキになりやすい。

「ねえ、だったら、仕事がどれくらいセミIT化にとどまってるか、なんて調べると面白いかもね。」

--そうだな、ある組織の『セミIT化度』みたいなのを計るには、そこで電子化されている帳票類がどこまで克明に紙の帳票をまねているかを調べてみるといいかもしれない。

「どうして?」

--セミITな人たちはね、ワープロや表計算なんかのITツールを、もっぱら『清書用の道具』としてとらえる傾向が強い。だから帳票類を電子化するときも、罫線や図形を神業的に駆使して、紙と見た目そっくりにすることに命をかける。その結果、たいていは入力も面倒、データとしての再利用にもひどく不便、てなものになってしまう。それどころか、管理職経由で電子メールで送ればすむものを、わざわざプリントアウトして判子をつくことを強制したりする。こういう病はあちこちではびこっている。
 なにしろ、日本では各人のスキルないし職人芸的判断に任せている部分が大きくて、仕事の流れが定型化していないところが多い。みんなが高度な知的判断をしなけりゃならなくなってしまう訳さ。だからITに乗せるにはけっこう苦労する。
 逆に、たとえばアメリカ社会なんか、人種や階層がかなりはっきり別れていて、単純労働は低賃金労働者にまかせてる。まかせるためには、形式化を徹底し、はっきりとした帳票や仕事の手順をあらかじめ管理者が決めておいて、あとは問答無用で働かせる仕組みになっている。
 
「そうねえ、たしかに力仕事なんてたいてい黒人の人がやってるわね。あれって言っちゃ悪いけれど奴隷制の延長みたいなもんかしら。」

--それは言い過ぎじゃないのかな。だけど、ああいう社会はIT化にのせやすい。仕事が定型化されているからね。
 もちろん日本だって形をきちんと決めて、アルバイトだろうがパートのおばさんだろうが単純労働として処理できるようにしている企業も多いから、人種や文化の問題ではないはずさ。ま、これは余談だけど。

「あら、どうかしら。昔、ウーマン・イズ・ア・ニガー・オヴ・ザ・ワールド、なんて歌がジョン・レノンにたしかあったわよねえ。『女は世界の奴隷か』。あなたの“パートのおばさんでもできる”なんて台詞を聞くとつい思っちゃうわ。」

--う、失言の段はひらにお許しを願うとして・・。
 話をITにもどすと、定型化の究極の姿は選択肢なんだ。
 
「選択肢?」

--うん。複数の選択肢から一つを選ぶ。決められたメニューにある選択肢以外は許されない。これがデータのもっとも単純化された、最小限の要素の形、つまりまあアトム(原子)みたいなものだと思ってほしい。
 たとえば、住所録ならば、性別は男か女か、とか、住所はどこの都道府県か、とか。こういうことは選択肢に決まった範囲があって、そのメニュー以外にはあり得ない。仕事の請求書だって、たとえばメーカーならば自社の製品カタログのどれかを売っているわけだしね。

「食べ物のメニューだったらハンバーグステーキかオムライスか、焼き方はレアかミディアムかウェルダンか・・。ははーん、なるほど、だからファミリーレストランって、あの手に持ってる小さな端末で全部注文を処理できちゃうのね?」

--ご明察。ファミレスじゃ、メニューにない特別料理なんて作ってくれないからね。だからああいう業務はIT化しやすい。

「どの選択肢も、ちっともおいしくないけれど。」

--それはITとは別問題。でも、お客さんの好みに合わせた好き勝手を許してくれないところは、たしかに味気ない。定型化すると味気なくなっちゃう面はある。

「非定型な情報が入り込まないから、っていうことね。」

--そのとおりです。そして、定型化されたデータとは、この選択肢の“アトム”が数珠つなぎになったものだ、と理解してほしいんだ。

(つづく)
by tomoichi_sato | 2010-10-20 23:22 | ITって、何? | Comments(0)

「ITって、何?」質問3: 情報技術という言葉はどこからきたの?

<<データの処理から情報の技術へ>>


「ちょっとまって。それじゃあなぜ、「情報技術」とかいう言葉があるの? これってIT=Information Technologyの訳でしょ。今の話じゃ、コンピュータで扱えるのはデータだけなんだから、情報技術なんて言葉はおかしいってことにならない? それに、「情報通信」という言葉もあるけれど、これは何なのかしら?」

--じつはこのITという言葉には多少の歴史がある。
 コンピュータ技術一般のことを、昔は「Data Processing(DP)」=データ処理、と呼んでいた。それが今ではIT=情報技術といっている。最近ではICT=情報通信技術という用語も広まっている。この言葉の変化の中に、情報の処理技術に関する進化が端的にあらわれているんだ。
 コンピュータはもともと弾道計算のために開発されたものだった。
 
「ダンドーケーサンって?」

--大砲をどういう向きで撃つと、弾がどこまで飛んでいくかを計算すること。空気抵抗を考えるとけっこう難しい計算になって数式じゃきれいに解けない。手計算でもかなり無理があるので、第二次大戦中に電気回路を使って計算する機械が発明された。これが計算機のはじまり。これはもう、純然たる計算だけの機械だ。
 これとは別に、米国の国勢調査統計を機械的に処理するため、パンチ・カード式ファイリング・システムの技術が米国で発明されていた。この技術なんかが加味されて、いまの電子計算機システムの原型ができた。すなわち、計算と文字列の入出力処理を中心とした仕組みだ。
 コンピュータがあらわれてから長い間、正確にいえば1940年代半ばから1980年代の半ば頃まで、コンピュータが扱えるデータはもっぱらテキストだけだった。
 
「ちょっとまって。そこでいっつも引っかかるのよねえ。あなたの言う「テキスト」って何よ。別に教科書のことじゃないんでしょう?」
 
--ITの世界で「テキスト」というのは、アルファベットの文字と数字だけからなる表現のこと。絵とか図とかではない、ただひたすら文字と数字が順に並んでいくものをテキストという。

「コンマとかピリオドもないの?」

--その種の、普通のタイプライターにあるような、よくつかう記号は文字の仲間にふくむ。ただし、文字の大きさとか字体のバリエーションとかはない。だから昔のタイプライターだけでつくった文書なんかが典型的なテキストだ。図表のない本もテキストだといってもいい。

「アルファベットの文字と数字だけって言うと、漢字やかなが混じっていてもだめ?」

--以前はNOだったけど、今はOKというのが答えだね。だけど今は話がややこしくなるから、とりあえず英語圏での話題にしておこう。
 ともかく、70年代までのコンピュータは、入力はタイプライタふうの端末機から行い、出力もラインプリンタかビデオの画面に英数字が表の形で並ぶ、無味乾燥なテキストだけの世界だった。それと、紙に印刷したときの1行の文字数は80桁か132桁と、これも決まっていた。これはパンチカードの技術から来たらしい。
 こういったわけで、計算機といえば数値計算か、あるいはもっぱら国勢調査みたいな表と集計値の用途が主だった。つまり意味的には中立なデータの世界だね。
 だからこのころはずっと、「データ処理技術」と呼ばれていた。電子的に処理するので、EDP = Electronic Data Processingという略語もよく使われた。

「それがどうして情報技術になったの?」

--このテキストの世界に「ワードプロセッサ」という技術があらわれて、ようやく少し「情報」らしさが入るようになった。

「なるほど! 事務所の先輩達の話によると、ワープロがはやりだしたのは80年代らしいわね。最初はPCじゃなくて専用機だったって。」

--初期のワープロは、あつかえる文字種は1種類だけだったし、せいぜい下線や太字がでるていどだった。それでもずいぶん便利なものとして普及した。
 ワープロで書くレターや報告書は、たしかに文字ばかりでできている。そういう意味では相変わらずテキストの世界だ。けれど、1行の字数の決まった時刻表のような窮屈な形式ではなく、改行や字下げや右寄せといった自由な、人間に読みやすい、「不定型な」テキストを扱える。そこが大きなちがいだった。

「不定形?」

--型にはめられていない、ってことさ。普通の文章は長さもまちまちで、ワン・センテンスちょっきり80文字というような枠には収まらないだろ?
 ワードプロセッサの技術の中核は、不定型なテキストを、コンピュータで処理可能なように内部で定型化の枠組みをはめる手法だ。人間の見た目には不定型な情報でも、コンピュータ内部では定型化されたデータである--これがワープロという技術の実現したことですな。ワープロは人間の不定型な情報とコンピュータの定型化されたデータを相互に変換し、橋渡しする技術なんだ。

「はあ。」

--その後、80年代のグラフィック端末の発展、記憶容量の爆発的進歩、90年代のマルチメディア技術・通信技術の進歩、といった要素を背景に、この「情報とデータの橋渡し」はおおきな進化、ほとんど革命的といっていい進化を遂げた。かなや漢字はもちろん、文字の大きさやフォント(つまり文字形のデザインだね)がいろいろ選べるようになり、図表や絵もはり込めるようになった。今じゃワープロで作る報告書もテキスト部分と図表が混在するのは当たり前、デジカメの写真をPCの画面に貼り付けたり、PCでビデオ映像を編集するのもなにも珍しくないだろ?
 その結果、人間の見た目にとっては、コンピュータは情報そのものを取り扱っているように見えるようになってきた。しかし、内部的な仕組みとしては、相変わらず定型化されたデータの機械的処理をしているだけで、べつだん機械が自分で判断したり意味をくみ取ったりできるようになったわけではない。人間が意味をくみ取りやすい形にデータを表現することが上手になったにすぎないのさ。

「機械が人間にすりよった訳ね。」

--まあね。でも、内部の仕組みが、定型化されたデータだけを扱える、という本質は何もかわっていない。

「じゃ情報通信っていうことばは?」

--情報通信って言葉はマスメディアが好きでよく使ってきたけど、曖昧すぎて、正直言うとぼくは好かない。情報&通信の意味だったり、ITないしICTの同義語として使われる事も多い。通信の分野でいわれるときは、まあデータ通信の上で情報を配信する仕組みを意味するんだろう。
 通信の世界は永い事、電気通信とデータ通信とに分かれていた。昔の黒電話は電気通信と呼ばれる技術だ。受話器のマイクがしゃべる音声を電気の強弱に変えて、交換機経由で電線をつなげて相手側のスピーカーを鳴らす。この間はずっと電流で、いってみれば糸電話と本質は変わらない。

「糸電話!」

--途中にデータが介在しないからさ。つまり

  人間→(情報)→→(情報)→人間
 
という構図だ。情報は電流の強弱で直接伝えられた。
 一方、データ通信とは主にコンピュータが端末と信号をやり取りするのに使われていた。二つの世界はまったくばらばらだった。
 ところが、データ通信が高速化し、電話の技術がデジタル化すると両者はだんだん融合していった。音声信号をデータに変えて送ることが実用的になった。日本の今の電話は、糸電話とは全然ちがう。まず、電話局間の幹線は皆デジタル回線になっている。局の交換機は、あれはじつは全部コンピュータなんだ。
 それに最近の電話機もまた、携帯も留守電もFAXもみなじっさいはコンピュータなのさ。今じゃ電気はせいぜい局から各家庭までの電話線の一部分に残っているだけだ。これだってADSLや光ケーブルなどデジタル媒体にどんどん置きかえられてきているけれど。
 つまり今や、

  人間→(情報)↓              ↑(情報)→人間
           ↓(データ)→→(データ)↑

という構造になっている。情報は一度、定型化されたデータの小さなブロックにかえられて運ばれ、また情報の形に組み立てられて人間に届けられる。データ通信の上で情報を配信する、っていったのはそういう意味さ。

「でも途中でデータに変わるからって、本質的には糸電話と同じじゃない? 一対一で話している以上は。」

--とんでもない。データってのは蓄積できる。検索加工転送も瞬時にできる。雑音や劣化の心配も少ない。これがデータの特徴さ。電気や糸の振動じゃそうはいかない。

「たしかに、声はテレコにも蓄積できるけど、検索には不向きね。」

--音声だけじゃない、静止画像も、ビデオも、まあ要するに人間が目と耳をつかって受けとる情報の生な形を、定型化したデータのフォーマットにする技術や規格が、この10年間に発達した。おまけにデータ通信の速度が速くなってリアルタイムに送ることができるようになってきた。
 そういう意味では、別に電話同士にかぎらず、インターネットでも同じなんだけど、複数のコンピュータ同士が高速にデータをやり取りできるようになったので、情報と通信の垣根がなくなってどんどん相互乗り入れしはじめている。
 だからこそ、利用者の目には情報そのものを扱うように見えながら、その底辺では機械がデータの形で処理しているという、いわゆる「情報技術」が生まれたのさ。
by Tomoichi_Sato | 2010-10-13 22:54 | ITって、何? | Comments(0)

「ITって、何?」質問2: ITを理解している人を見分けるにはどうしたらいいの?

< データと情報の違い >


「じゃあ、次の質問、いきます。
ITを理解している人を見分けるにはどうしたらいいの?」

--それはいい質問だね。見分ける方法か・・。
 そうだな、こういうふうに訊ねてみるといいかもしれない。『データと情報はどこがちがうか?』
 この質問にはっきり答えられる人はITの本質について洞察をもっている人だ。逆に、いかにパソコンにくわしくても、この質問の意味が分からない人は、ITの意義を理解できていないと思った方がいい。
 
「データと情報? それって何がちがうの? 同じものかと思ってた。」

--たいていの人は「データ」と「情報」という二つの言葉を、あまり区別せずにつかってる。専門書ですら、ときにはあいまいにしている。しかし、ITを理解する上では、この両者ははっきりと区別する必要があるんだ。
 「情報」とは、人間にとって意味をもたらすものさ。人間の話す言葉、書く言葉は意味を伝達するために発達した。
 これは逆の例を取ってみればわかるだろう。君がもし誰かから手紙をもらったとして、それが翻訳家の君でさえ全く知らない言語で書かれていたら、それに何の意味があると思う? ラブレターなのか? 脅迫状なのか? 招待状かはたまた予言書か? 意味が分からないものは、情報の役割をはたさないんだ。

「じゃ、データって何?」

--「データ」とは何か。データとは、数字や文字の規格化・定型化された並びのことなんだ。『規格化』・『定型化』の意味についてはおいおい説明するけど、いまはとりあえず「表のようにきちんと並んだ」というふうに理解しておいてほしい。

「なんか抽象的でよく分からないわ。例をあげてみてくれない?」

--たとえば、新聞の株式欄はデータだ。会社名と、株価の数字が整然と表になって並んでいる。駅の時刻表や電話帳もデータだ。野球のスコアブックもデータだね。

「スコアブックなんてコンピュータに入れておくものなの?」

--データというものは、必ずしもコンピュータの中に格納されていなくてもいい、ってことに注意してほしい。「あの野球監督はデータにもとづいて作戦を立てる」といったとき、そのデータは過去のスコアブックの集積を指しているので、それがパソコンに入っているかどうかは本質じゃない。その監督が単なる人情や勘だけで指示を出しているわけではない、ということをいっているのだから。
 ちなみに定型化され規格化されたデータをコンピュータに格納したものを、「データベース」とよぶ。

「わたし、数字のことをデータって呼ぶのかと思ってた。」

--データはべつに数字が並んでいる必要はない。文字だけでもデータなんだ。だから住所録や学校の卒業名簿だってデータさ。
 それと、図書館の蔵書カードなんか、カードがたくさん並んでいるだけで、全体が一枚の表の形にまとまっているわけではないけれど、それでもデータだ。1枚に書くべきことが決まっていて、それがきちんと並べられているからね。倉庫の入出庫台帳なんかもデータですな。

「ちょっと待ってよ、新聞の株式欄は『情報』じゃないの? ある株が上がったか下がったか、どの会社が今、注目株か。これはみな『意味』そのものなんだから、さっきの定義にしたがえばデータではなくて情報のはずじゃないかしら。」

--その答えはイエスでもありノーでもあります。というのは、数字の羅列から意味をくみ出すのは、人間の側の精神の働きにあるからね。ある株価の動きに君は意味を感じるが、別の人はその株価には無関心で、他の数字に意味を見いだすかもしれない。
 これは、証券アナリストが出す「今注目の株はこれ!」というレポートが、不特定多数の人に対してほぼ同じ意味を伝える「情報」そのものであることに対比して考えるとわかるとおもう。株式欄の数字自体は、受け取る人の意味づけに対して中立なものなんだ。

「なんだかまだごまかされているような気がするわ。人間の精神の働きが意味を汲み上げるって、どういうことよ。急にドイツ観念哲学の講義の時間になったみたい。」

--かりにいま、6月から9月までの毎日のビール消費量と、その日の気温との関係を日付順にならべて表をつくったとする。これはデータだ。ところで、そのデータを、横軸に気温・縦軸にビール消費量をとってプロットすると、こんな風に点が並んだとする(手でホッケースティックのような右肩上がりの図を描く)。図をよく見ると、消費量は気温がある点、具体的にいうと28℃あたりを超えるとぐっと上向きになることがわかる。
 しかし、これは人間が視覚的にデータから意味を読みとる力をもっているからこそ、わかることなんだ。コンピュータは、表の形になっていようが、グラフの形で表現されていようが、そこから自動的に意味をくみ取るようなまねはできない。
 つまり、「データ」とは中立な(いいかえれば無味乾燥な)もので、そこから意味を引きだして「情報」にするのは人間の認識力そのものなのさ。

「ふーん、それで?」

--ところで、ここから先が大事なんだけれど、コンピュータの中に格納して処理できるのはデータだけだ。機械にできるのは、定型化された数字や文字の並びをあれこれと加工することなんだ。意味は人間の側の働きだから、コンピュータは「情報」を取り扱うことはできません。
 これがデータと情報のちがいさ。そして、この両者の関係が分からない人は、ITがわからないといえるとぼくは思う。

<参考 JISにおける用語定義>

情報:事実、事象、事物、過程、着想等の対象物に関して知り得た事であって、概念を含み、一定の文脈中で特定の意味を持つもの

データ:情報の表現であって、伝達解釈又は処理に適するように形式化され、再度情報として解釈できるもの。(備考 データに対する処理は人間が行っても良いし、自動的手段で行っても良い)
by Tomoichi_Sato | 2010-10-07 03:23 | ITって、何? | Comments(0)

「ITって、何?」質問1: どうして、誰もITって何かをちゃんと説明してくれないの?

<専門家と一般人のギャップについて>

--ITって何、か。それが一言で答えられるくらいなら、研修の講義をどうするか悩んだりしないよ。

「じゃあ、何言なら答えられるの。何時間とか、何日もかかるわけ?」

--そりゃあ、もちろん相手のレベルによりけりさ。一をきいて十を知る人なら1時間もあれば本質は洞察できると思うけど、そんな人ばかりじゃないし。本当は、大学の教養課程あたりで、じっくりと1年間かけてみんなに教えるのを必修にすればいいんだけどね。

「でも、その1年の間に進歩して変わっちゃうんでしょう?」

--だから、それは教え方しだいさ。計算機という機械の構造や、表計算ソフトみたいなパッケージ・ソフトの使い方を教えていたら、たしかに1年で古くなってしまう。本当に大事なのは、情報というものとどうつきあうか、その考え方を身につけることだ。そういうスキルは、古びない。

「じゃ、その考え方を教えてよ。」

--もちろん教えて上げたいけれども、どういう順番で全体像を説明すればいいか、まだまとまらないんだ。

「ほんとうは自分でも分かっていないんでしょ。人に教えられないのは自分が分かっていない証拠よ。」

--何を失敬な。君こそ、何がわからなくて何を知りたいんだ。

「何が分からないか自分でも分かんないからこそ、こうやって聞いているんじゃない! ・・なんだかひどくギャップがあるみたいね、わたし達。」

--うーん・・じゃ、こうしよう。『二十の扉』方式でいく。君は自分がITについて疑問に思っていることをぼくに聞く。ぼくはそれに答える。二十問くらいやれば、たぶん全体像に近づけるだろう。

「何でも聞いていいのね?」

--いいよ。ただしそのかわり、一つ条件を付けさせてくれ。

「なあに、条件って。」

--決して、『・・って何?という質問をしないこと。英語で言えばWhat is...?という質問はなし。Whoとか、Howとか、Whyとか、Whereの質問だけにして欲しい。

「どうして?」

--Whatの質問をすると、結局ツールや仕組みの説明になってしまいがちだからさ。今の世間に氾濫しているITの説明書で一番問題なのは、計算機のハードやソフトといったツールの中身の説明ばかりしていることだろう。これはみなWhatにたいする解説にすぎない。

「そうかしら。でもそれでなにが問題なの? ITを理解するって、そういうこととはちがうのかしら。」

--ちがう。ITを理解するというのは、それが何の役に立つのか、それを使うと何ができるのか、それを使いこなすためにはどんな工夫が、なぜ必要なのか、そうしたことを理解することだと思う。
 たとえば、鉄道と機関車しかなかった時代に、自動車なる発明品が現れたときのことを考えてみたらいい。鉄道しか知らない人に、自動車の意義を理解してもらうためには、何が大事か。けっしてエンジンの機械工学的説明をすることじゃないはずだ。では、ハンドルとブレーキの扱い方か? そうでもない。皆がみな、自動車の運転手になるわけじゃないからね。
 では、自動車の意義とは何か。
 これまでは線路のしかれているルート上の、駅という決まった場所に、決められた時刻表にしたがってしか輸送できなかった人や貨物を、多少の道さえあれば自由なルートで好きな時間に運ぶことを可能にする。それが自動車だろ? 人と街のあり方を変えるだけではない。通勤も旅行もずっと便利になる。公共交通や運送業は大きく変貌する。自動車産業という新しいビジネスも生まれる。個人のレジャーも変わるだろう。

「はあ。」

--そのかわり、あちこちに道路を整備しなければならない。都市計画も練り直さなけりゃならない。交通信号や運転免許の制度も必要だ。鉄と石油エネルギーへの依存度が大きくなってしまう。自動車を理解するってのは、そうしたこと全体を洞察できるようになることじゃないだろか。「自動車って、何?」という質問に答えるとは、そういうことなんだ。
 ITも同じさ。ITがあることで、自分の仕事や生活や世の中の仕組みにどんなインパクトがでてくるのか。Whatの質問に仕組み論で答えるだけでは、そうした大事な観点が隠されてしまうと、ぼくは思ってる。

「でも、メカニズムのことだって少しは知っておかないと、理解できないわ。」

--じゃあ君は、自動車のメカニズムについて、何を知っている? 運転免許の講習で聞いたごく簡単な話だけだろう。キャブレターって何か? それを知らなくても運転はできる。TVの原理は知らなくても、TVを見ることはできる。作ったり修理したりする人にはなれないけれど、上手な使い方は理解できる。そうだろ? 
 Whatの話題って、モノの構造の話だ。でも、構造にかんする知識をいくら仕入れても、それがどんな目的のためにどういう機能を発揮できるかを考えるのにはあまり役に立たない。

「ふーん・・じゃ、いいわ。Whatは無しね。それでは、第一問、いきます。
どうして、誰もITって何かをちゃんと私に説明してくれないの?

--おいおい、何だその質問! それじゃ「ITって何?」と聞いているのと同じじゃないか。

「あら、全然ちがうわよ。Whyの質問だからちゃんとルールは守っているもの。それに私は世の中にきちんとした説明がないことの理由をまず知りたいの。これだけITが普及しているのに。おかしいわ」

--うーん。その質問は二段階で考えなけりゃいけないだろうな。まず、ITとは何かを説明できる人が世の中にどれだけいるか、って問題。つぎに、その説明があったとしても、君自身に届かない理由は何か、ってこと。
 第一の問題についていえば、世の中にはITの全貌をすべて知っている人なんていないと思う。

「そうかしら。」

--ITの領域は広大な上に、現在もものすごい速度でひろがりつつある。だから、その全領域に精通している人なんて事実上いない。IT屋さんは専門分化しているからね。各々自分の得意な専門領域から見たITの話だけをするものだから、葦の髄から天井覗く、みたいなことになってしまう。

「よしの髄、だって。・・古いわねえ、そんな喩え。いまどき新人研修じゃぜったい通用しないわよ。ストローを通して外の景色を見る、くらいにしておいたら?」

--じゃ、それでもいいけど、とにかく全部をすべて知っている人はいないのさ。

「でも、全部のことをくまなく知らなくても、概論的な説明は可能だと思うの。たとえば大学の先生なんてそういうの得意そうじゃない?」

--大学の先生たちに適任者がいるかっていうと、疑問だなあ。ITの最新の話題は実業界がもっぱらリードしていて、そうしたものは学会に出てこないことが多い。大学にも情報科学や情報工学という講座があるけれど、こまったことにアカデミックな世界とビジネスの世界はかなり断絶感がある。この国じゃ人材の産
学交流も少ないし。

「じゃ、実業の世界の人はどうなの?」

--こちらはね、あまり概論をしゃべる人がいないのさ。なんといっても専門分化することで競争を生きぬいているわけだから。専門的な話題に関しては、無料の解説や宣伝、有料のセミナーもある。しかしそういうのは、業界に無縁な君のようなごく普通の生活者には届きようがないし、その意味もないでしょ?
 そもそもIT屋さんは「語らない」人が多い。専門家同士になるとやたら冗舌になるくせに、一般人相手となると、はなからコミュニケーションをあきらめているところがある。広い意味では口べたな性格なのかもしれない。
 その一方で、経済評論家みたいにやたらとITに冗舌な人達もいる。本屋にあふれているIT解説書はもっぱらこの種の人たちの書いたものだ。でも、彼らはITの生み出す効能にはすごく関心をもっているけれど、あまり本質はわかっていないみたいだね。表層だけの事象を捉えて、先進企業ではこうだアメリカではああだとおしゃべりしている。結局、口数の多い素人と口べたな専門家ばかりで、ギャップがひろがったままなんだと思う。

「もしかしてIT屋さん達は、みんなを無知蒙昧な状態においておいた方が儲かるって思っているんじゃない? 『わたし作る人・ぼく食べる人』、みたいに役割固定をねらって」

--まさか! それは邪推だよ。実際のところ、『つくる側』としては『使う側』がもっとよく分かってくれたら楽なのに、と感じることの方が多い。なんていうか、ほら、このカーナビみたいなものさ。たいていの人は、使って慣れてみて、はじめてどれほど便利なものか分かる。でも使う前は“そんなもの不要だ”と頑張る人が多くて、説得に苦労する。
 カーナビの前はオートマチック・トランスミッションもそうだった。高いし燃費も応答性も悪い、とか食わずぎらいの反論はいくらでもあった。でも今じゃ市場に出回っている車の9割はAT車じゃないのかな。
 ITだって買う前にその利便性と値段とリスクとのバランスがわかる人が増えてくれた方がずっとありがたい。

「じゃ、なぜわかる説明がないのかしら。」

--たぶん、ITがわからないという人は、さっき君自身が言ったとおり、自分がどこが本当にわからないかを言えないんだろう。つまり適切な質問ができないから説明がすれ違いになるんだね。
 まったく未知の新しい事を説明するんだから、たとえ話をうまく使えるといいのかもな。そう、たとえていうならね、ITというのはデータを媒介とした情報のロジスティックスの仕組みだと思えばいい。それと、ITづくりの世界は建築の世界に良く似ていると思う。この二つの比喩は、これから何回も使わせてもらうかもな。

「ロジスティックスって、兵站とか物流ってこと? なんだかよくわからないわね、あなたの説明も。あと19問でほんとにちゃんと分かるようにしてよ、お願いだから。」

--あー。まかせるあるよ。インディアン嘘つかない。


(つづく)
by Tomoichi_Sato | 2010-09-29 22:41 | ITって、何? | Comments(0)

「ITって、何?」 第0回 疑問のはじまり


「ねえ。すごい渋滞ね。」

--そうだね。

「せっかくのあなたのカーナビも、残念だけどこれじゃほとんど役に立たないわね。あなたの実家まで、あと何時間ぐらいかかるのかしら。」

--うーん、何時間かなあ。スムーズに流れても2時間近くはかかるから。

「カーナビって、そういうことはわからないの? 道順を教えてくれるだけじゃなくて、これからどれくらいかかるか、とか。」

--これは友達のもらいので、3年くらい前の機種だから、そこまではできないんだ。この先の道のりが何キロあるかはわかるけど。最近のやつだと、高速道路の渋滞情報のシステムと通信できるから、どこからどこまで渋滞してるか、もっと速くいける別ルートはないか、とか計算して教えてくれるんだけど。
 でももう高速に乗っちゃったんだから、あとは流れで行くしかないよ。

「3年前のものなのに、もう古いの? すごいわね、カーナビの進歩って。」

--そうだね。まあIT関係のものって日進月歩だから。

「あなたもついていくのが大変ね。コンピュータの仕事なんかしてるばっかりに。3年後くらいにはもう会社からお払い箱になっていたりして。ふふ。」

--よしてくれよ。そうでなくても頭が痛いのに。

「どうしたの。夕べ、ビールでも飲み過ぎた?」

--そうじゃなくて、今度の新人研修のことだよ。IT関係の部分はぼくが講義を受け持つことになっているんだけど、何をどう話すべきか悩んでるんだ。あまりに進歩が早いからね。カーナビじゃないけど、具体的なシステムについての話をしても、すぐに陳腐化しちゃうんだ。そりゃシステム部門配属の人間だけを相手にするんだったら、いいよ。所詮ぼくらシステム屋は毎日最新情報を勉強して追いつくのが仕事の一部なんだから。
 でも、受講生の大半は製造とか営業とかの配属だし、みんな素人だからね。素人相手にそういうツールの細かい話をしてもしかたないんじゃないか、って思うんだ。
 
「ふーん。でも運転中は考え事はやめてね。そうでなくてもあなたはぼんやり屋さんなんだから。」

--こんな渋滞でどこに注意を向けろっていうんだ。

「どうしてそんな人たちまでコンピュータの講義を受けなくちゃならないの?」

--それはさ。今ぼくらの会社では基幹業務はみんな情報システムの上にのっているんだ。みんな端末を使えなければ仕事にならない。いや、それだけじゃなくて、これからの仕事のあり方を変えていくためには、ITへの理解は欠かせないんだ。度胸と根性だけじゃ、これからの競争には勝てない。

「キーボードの使い方とか、教えるわけ?」

--馬鹿言うなよ。集合研修じゃそこまで面倒見てられないし、今時そんなこと知らないやつもいないだろう。そうじゃなくて、もっと根幹の、ITというものへの理解を深めてもらう必要があるんだ。だけど、これが難しくてね。
 ITって今じゃはやり言葉で、みんなIT、ITって言うけれど、本質がわかってる人は少ないね。
 
「あなたの会社のえらい人も、きっとそうなんでしょう?」

--ご明察。でも無関心ではいられない時代だからね。

「わたしのところも、けっこう最近みんなITがどうのこうの、って話が多いわね。うちの翻訳事務所なんてPCでワープロ使うのが関の山だったのに、ソフトウェアの権利関係がどうの、ビジネスモデル特許がどうので、得意先の弁理士や弁護士の先生たち、頭を悩ましているもの。」

--わかる気がする。法律なんて所詮この世界のスピードに追いついていないし。

「わたしだってちゃんと分かりたいわ。分からないまま自分が振り回されるのは嫌だもの。他人のご高説を鵜呑みにするのも、いや。
 どお、まだこの渋滞じゃ時間もたっぷりあるみたいだし、せっかくだから、わたしがあなたの講義の聞き役になってあげる。」

彼女は顔をこちらに向けると、目をじっと見つめて、言った。

「ねえ、ITって、何?」


(この稿つづく)
by Tomoichi_Sato | 2010-09-23 22:12 | ITって、何? | Comments(0)

「ITって、何?」掲載にあたって

これから何回かに分けて掲載する「ITって、何?」という話は、わたしが数年前に書きためて、一部の方に公開した原稿です。IT(情報技術)というものの意味と意義を、使い手の側に分かってもらうことを意図して、この対話編をつくりました。今の時点からみると若干古い部分もあるとは思いますが、技術論が主眼ではないので、まだ多くは通用すると信じます。

当時も今も、ITに関しては、作り手のための技術的情報はあふれていますが、使い手との間の意識のギャップはむしろ広がるばかりという気がします。本屋にいけばIT関連コーナーに本が平積みされていますが、そのほとんどは内部の仕組みを解説した技術論か、有名企業の成功事例を紹介した経済評論ばかり。いわば、園芸の本をあけたら、種と、みのった果実の話だけしかない状態です。ユーザが知りたいのはその中間の話、木の姿かたちと性質、育て方なのに。

また政府の政策やメディアの論調などをみても、IT産業論はいまだに、コンピュータという名前の電子機器や通信ネットワークのインフラを提供する企業の育成支援が主眼で、それにソフトウェア開発業界の強化が付け加わる程度です。つまり、供給者サイドの政策ばかりで、使用者サイドの視点が足りていません。この溝を埋めない限り、本当の意味でITの価値が日本社会に受け入れられることはないでしょう。使用者側の意識と理解が高まらないと、IT業界は苦境から脱せないばかりか、一般企業における真の競争力も高まらないのです。

・・まあ、そこまで大げさなことは言わないにせよ、私たちが日常で接するITという道具について、この小さなストーリーが、読者の方にとって多少なりとも考え直すきっかけとなれれば、幸いです。

週1回のペースで掲載していく予定ですので、よろしければ、どうかおつきあいください。
by Tomoichi_Sato | 2010-09-23 22:02 | ITって、何? | Comments(0)