人気ブログランキング | 話題のタグを見る

お知らせ:MES関連で『ものづくり白書』に登場、ダッソーのセミナーにも登壇します

お知らせです(この頃、お知らせが続いてますが、イベントってなぜか重なる時は重なるんですよね)。

じつは昨年の秋から、自分が幹事を務める(財)エンジニアリング協会「次世代スマート工場のエンジニアリング」研究会で、MESの業務標準機能に関するプロジェクトを始めました。この活動が、幸いにもこの6月に経済産業省から出たばかりの『ものづくり白書』 に紹介されました。また今月開催されるダッソー・システムズ社のプライベート・セミナーでも、お話しする予定です。

この活動を始めたきっかけは、近年MESが注目されると共に、「MESの標準11機能」というリストがネット等でかなり出回るようになった事です。この11機能については、かつて当サイトでも批評したことがありますが、日本の製造業の現場から見て、決してわかりやすいものではありません。

理由は、業務プロセス中心ではなく、ITシステム目線での機能リストになっていること、ディスクリート系とプロセス系が一緒に扱われていること、ISA/IECのS95標準とも合致していないこと、などです。元々、90年代に米国のMESA Internationalが制定したという経緯もあり、上位系にERPが動いており、それと連係するのを前提としている点も、多くの日本企業の実情とは異なっているでしょう。

しかし、自社工場にMES導入を検討したい製造業のエンジニアの中には、この「MESの標準11機能」をベースに、将来構想を考えようとされる方が、しばしば見受けられます。あいにく、わたし達の社会では、MESシステムに詳しいコンサルタントや学者がほとど存在せず、製造業に出入りするIT業界のSIerの多くも、じつは現場にあまり明るくありません。他に頼るべき情報もあまりないため、当事者としてはこの機能リストに頼らざるを得ないのかもしれません。

まあそれだけならまだしも、製造業をクライアントとするコンサルタント業者の中には、MES導入を相談されると、ちょこっとネットで調べて「標準11機能」を見つけ、それをベースにRFPを作成して提出する人たちもいるようです。こういう類いのRPFを受け取ったMESベンダーこそ良い迷惑。皆、頭を抱えて、「この顧客は一体何をしたいんだ!?」と困惑する事態が、しばしば出現するのです。

こうした状況を打開しよう、日本の製造現場の実情に合った、新しい標準的な枠組みを作ろう。そう考えて、わたし達の研究会では昨年秋に、約30名の有志によるプロジェクト・チームを立ち上げました(これは純粋に技術者によるボランタリーな活動で、公的支援も、スポンサー企業も、一切ありません)。

わたし達が目指したのは、製造業の担当者がMES導入の構想を作り、RFPを作成するのに役立つ、標準テンプレートづくりです。そのために、ITシステム視点ではなく、業務プロセスの視点から、工場におけるオペレーションを洗い出し、リストアップする方法をとりました。つまり、日本の工場におけるAs-Is業務のカタログ作りです。

まず工場の業務を、おおきく12種類に分類しました。「製造」「品質管理」を中心として、「生産管理」「設計」「生産技術」「保全」「物流/在庫管理」「環境/HSE」「品質保証」「従業員」、そして「購買/資材」「工場経理」の12です。最後の二つは本社機能とされる(かつERPでカバーされる)場合も多いのですが、製造と密接な関係があるため、あえて加えてあります。

その上で、ものづくりに関わる単位的業務を洗い出したところ、約500種類のオペレーションのリストができました。たとえば、『製造指図書発行』『着手順割り付け(ディスパッチング)』『治工具払出指示』『部材投入』『ピッキング』等々、現場での直接業務も、それを支える各種間接も含みます。

とはいえ、工場業務は業種により多種多様です。わたし達は、日本で一番数が多いと思われる、組立加工系(ディスクリート型)の工場を想定しましたが、他の業種への目配りもしつつ、最大公約数を抽出したつもりです。

こうして洗い出した約500の業務オペレーションを、Excel表形式でカタログ化しました。それぞれの業務の簡単な説明に加え、MES/MOMシステム化の対象とすべきかどうかの判断(我々研究会の推奨を○×△で表示しました)、代替可能なシステム名(ERP/PLM等)と、インテグレーション対象のデータなどを詳述しています。

この表を元に、ユーザ企業が自社の望むTo-Be業務像を整理し、MES/MOMで実現すべき機能のスコープ(星取表)を編集作成して、RFPに添付する活用形態を想定しています。

無論これは一種のカタログですので、すべてを完璧にカバーしていると主張するつもりは、ありません。また、ある業務オペレーションが、製造に分類されるのか、それとも生産管理や生産技術に分類されるのかは、企業によりけりでしょう。大事なのは分類軸ではなく、重要な業務がカバーされていることです。

本資料は(一財)エンジニアリング協会のHPから無償でダウンロード可能とします(案内はこちらのページにリンクがあり、資料配付作業を開始しまs)。

なお、本資料は約8ヶ月間の検討議論を経て作成したものですが、無論ブラッシュアップすべき点も多々ありますので、一種の『パブリック・コメント版』として位置づけています。多くの方にご清覧いただいた上で、コメントを頂戴できれば幸いです。

ありがたいことに、この活動は経済産業省にも注目いただき、5月31日に発刊した本年度の『ものづくり白書』で、コラムとして紹介されました(第1部第5章・P.227)。白書は、経産省の下記HPから無償でダウンロード可能です。わたし自身の名前はありませんが、でも写真にはちゃっかり登場しています(笑)。
加えて、6月21日(金)夕刻に『3DEXPERIENCE Conference Japan 2024』と同日開催されるダッソー・システムズ株式会社DELMIAブランドのユーザー会『DELMIA Community Summit Japan 2024』にて、下記の講演を行います。

演題:「スマートなシステムとしての工場を作る
(日揮ホールディングス株式会社 - 佐藤 知一)

概要:演者は’21年に、ダッソー・システムズと日揮の共同Webセミナーで「システムとしての工場を作る」という講演をした。それから3年、日本のスマート工場作りは大きく先に進んだろうか? 我々が(財)エンジ協会「次世代スマート工場」研究会で行った調査では、確かにMES/MOMの普及は進みつつあるが、構想・要件策定に悩む企業も多い。本講演では製造業における情報・データの流れと神経系のあり方からはじめて、MESの新標準機能定義の試み、MESが可能にする新しい工場ハードの姿などについて論じたい。

場所:ANAインターコンチネンタルホテル東京 RoomF
時間:17:00 - 18:00

申込み方法:本講演は『3DEXPERIENCE Conference Japan 2024』に参加の方が受講いただけます。直接会場(RoomF)までお越しください。ご参加にあたっては『3DEXPERIENCE
Conference Japan 2024』への登録が必要となります。

以上、本活動の成果に、大勢の方が関心を持っていただけることを願っております。
佐藤知一@日揮ホールディングス(株)


<関連エントリ>
「IoT時代のMESをもう一度考え直す 〜 (2) MESの機能と階層を理解する」https://brevis.exblog.jp/26007261/ (2017-08-27)


# by Tomoichi_Sato | 2024-06-06 19:24 | サプライチェーン | Comments(0)

モダンPMへの誘い 〜 計画のSカーブは、実は2本あり得る

モダンPM技法の三本柱の一つである、EVMS(Earned Value Management System)について、しばらく解説してきた。EVMSでは、横軸にプロジェクト開始からの日付、縦軸に金額をとったグラフをよく用いる(理屈の上では、別に金額に限る訳ではなく、成果物の数量を表す単位、たとえば床面積m2とか設計図面数でもいいのだが、現実には金額を使うことが多い)。そしてこのグラフの上に、計画線PV・実績線AC・出来高EVの3本の線を描いていく。

EVMSでは、スケジュール差異SV(=EV-PC)と、コスト差異CV(=EV-AC)を主要なKPIとして見ていく。両方とも、プラスならば良好、マイナスならば問題を表す。つまり、グラフで言えば出来高EVのカーブが、計画線PVや実績線ACのカーブよりも上に来ているかを、まず注目する訳だ。

そして一般に、プロジェクトという活動は、最初はゆっくり立ち上がり、次第に活況に入って、最後にはまたスローダウンして収束していく。だから上記の3本の線はいずれも、ローマ字の大文字Sを左右に引き延ばしたような、「Sカーブ」型のパターンを描く。これが、普通の教科書にある説明だ。

ところで、この説明を読んで、疑問に思った方はおられないだろうか。何を? それは計画線PVの引き方である。実績線ACや出来高EVは、現実を表しているのだから、1本しかありえない。しかし、計画線PVは、はたして1本だけなのだろうか? そうとは限るまい、というのが今日の話である。

図1を見てほしい。システム開発プロジェクトの簡単な事例である(以前、「EVMSとアーンド・スケジュール法の弱点 ~ プロジェクト予測のミクロとマクロ」 という記事で用いたのと同じものだ)。

モダンPMへの誘い 〜 計画のSカーブは、実は2本あり得る_e0058447_00040290.png

図1 システム開発プロジェクトのActivity network

予算はトータル1,500万円。プロジェクトを構成するActivityは全部で6個。それぞれの予算と所要期間は以下に示すとおりだ(期間は稼働日基準なので、5日がカレンダーの1週間に相当する)。コストは内部人件費と外部発注費の両方があるが、金額換算で表示している。

1  基本設計(20日) 予算=100万
2.1 ハード選定(5日) 予算=30万
2.2 ハード納品(25日) 予算=400万
3.1 詳細設計(10日) 予算=120万
3.2 ソフト開発(30日) 予算=600万
4  総合テスト(15日) 予算=250万

基本設計の後、プロジェクトは大きく2つの作業の流れに分かれる。ハードウェア調達に関わる、ハード選定→ハード納品、の流れと、ソフトウェア開発に関わる、詳細設計→ソフト開発、である。両方がそろって初めて、総合テストが実施できる。

さて、このプロジェクトについて、計画線PVを推算してみよう。なお、PV値の計上は、それぞれのActivityが完了した時点で、一括計上することにする。単純化のために、途中での比率計上などはしない。

そうすると、出費予定は表1のようになりそうだ。各Activityの完了タイミングを考えると、基本設計→ハード選定→詳細設計→ハード納品→ソフト開発→総合テスト、になる。PVのSカーブは累積出費を表すから、その値は表1のようになるはずだ。

ところで、ちょっと考えてみてほしい。ハードウェア調達の方は、50日後(10週後)に終わる。ところがソフト開発の方は60日(12週)かかるから、総合テストは遅い方に引っ張られて、開始は60日後だ。つまり、ハード調達後に、10日(2週間)、ムダな空白期間が生じる訳だ。

ハードの金額だってそれなりだから、資金繰りを考えて、経理部門からはぎりぎり待って発注してくれと、依頼がかかるかもしれない。その場合、60日後にハードが納品されれば良い訳だから、選定は35日後(7週後)に終われば良い。選定の着手は30日後(6週後)になる。

モダンPMへの誘い 〜 計画のSカーブは、実は2本あり得る_e0058447_00040232.png
こうしたときのPVのSカーブは、今度は表2のような計算になる。「予定完了日」のカラムで、赤字にした部分が、表1からの変更点だ。そして「累積予定出費」つまりPV値は、この関係で少し変わる。

両者をグラフ化したのが、図2の「2本の予定線PV」だ。なお、本当は斜めの線ではなく、階段状にステップアップしていくのだが、あえて見やすさを考えて、ここでは斜めに描いている。Activity数が増えていくと、実際、もっとカーブっぽくなっていく。

モダンPMへの誘い 〜 計画のSカーブは、実は2本あり得る_e0058447_00040219.png
図2

そして注目してほしいのは、最早ケースと最遅ケースで、計画線が違う点である。なぜ違うのか。それは、ハード調達系のActivity系列に、10日間の余裕日数があったからだ。その分、早く着手することもできるが、10日遅く着手することもできる。このような余裕日数のことを、スケジューリング用語で「Float」と呼ぶ。むろん、10日ではなく、3日、5日遅らせることだってできる。10日分の『自由度』がある訳だ。

ということは、EVMSでは何を意味するのだろう? それは、PV・AC・EVの3本の線とこれまで説明してきたが、実はPVには最も早く着手するケースと、最もぎりぎりまで待って着手するケースの、2本の線がある、ということだ。そしてEVの線が、その2本のPVの線の間に入っているかどうかを、チェックすることになる。

EVの線が、最遅ケースよりも下に来ていたら、それは許容限度以上に遅れていることを示す。逆に最早ケースよりも上に来ていたら、多分よほどうまくやって、当初想定よりも各Activityが短い期間で終わったことを示す。でも、それらはいずれも極端なケースで、普通はその2本の間にあって、どちらに近いかによって、プロジェクトの状況を示すことになる。

<関連エントリ>
「モダンPMへの誘い 〜 EVMSというツールの『使用上の注意』」 https://brevis.exblog.jp/30886364/ (2024-04-07)
「EVMSとアーンド・スケジュール法の弱点 ~ プロジェクト予測のミクロとマクロ」 https://brevis.exblog.jp/28381225/ (2019-06-10)


# by Tomoichi_Sato | 2024-05-25 00:06 | プロジェクト・マネジメント | Comments(0)

お知らせ:生産統制と納期遵守のための1日オンラインセミナーを開催します(6月6日)

オンライン・セミナーのお知らせです。数年前から大阪府工業協会で行っている、主に中堅中小製造業向けの生産統制に関する1日セミナーを、今年も6月6日にオンラインで開催します(有償)。

ところで、『生産統制』とは何でしょうか? わたしはセミナーの際、いつも「皆さんの会社には、『生産統制部』とか『生産統制課』といった名前の組織はありますか」とたずねるのですが、答えはほぼノーです。部や課どころか、生産統制担当者といった役職すらありません。生産計画担当者(係・課)は、大抵の会社にあるのに、です。

「生産管理とは、生産計画と生産統制の二本立てである」、と言った意味のことが、昔から生産管理の教科書には書いてあります。ところが現実には、計画担当者はいるのに、統制担当者はいない。なぜでしょうか? 答えは簡単です。普通は計画を担当する者が、進捗も同時に追いかけるからです。

計画だけ立てて、進捗統制は別の誰かに任せきり、といったケースはまず見かけません。なぜなら計画は、月次・週次(ないし必要に応じて日次)に、立て直します。その際、現場の進捗を次の計画にフィードバックしなかったら、使い物になりません。だから計画と統制は、同じ担当部署・担当者がやる必然性があるのです。

本セミナーではしたがって、計画と統制の両方の話をします。そして、計画を立てる際の柱となる、全体工期や在庫量には、きちんとした理論・理屈がある、ということをご説明します。

『生産統制』という用語は、日本の生産管理論における独特の言葉のようです。英語でこれに相当するのが、Shop Floor Controlなのか、それともManufacturing Operations Managementなのか、今ひとつ分かりません。別に日本独特の言葉や概念があってもいいのですが、それが教科書の中だけに現れて、現実の企業の組織に見当たらないのだとしたら、少しばかり、頭の整理が必要です。

本セミナーはオンライン形式ですが、学んだことをちゃんと身につけるため、グループ演習を取り入れています。そのため、zoomのブレークアウトセッション機能を使います。このとき、グループ内でディスカッションしたり画面を共有したりしますので、申し込まれる方は、できるだけ音声・カメラ付きのPCかスマホで、参加することをおすすめします。

人手不足が深刻な今、そして資材部品の納入が不安定な今、どうしたら自社の納期を守れるのか。皆さんと一緒に、考えていきたいと思います。大勢の方のご来聴をお待ちしております。


<記>

日時: 2024年6月6日(木) 9:45~16:45

テーマ: 生産統制のポイント
     ~ 納期遅れを起こさない! うまくいく生産計画とは? ~

主催: 公益財団法人 大阪府工業協会

会場: Zoomによるオンライン講座

セミナー詳細: 下記をご参照ください


佐藤知一@日揮ホールディングス(株)


<参考エントリ>
「『生産統制』の三つの課題」 https://brevis.exblog.jp/26211397/ (2017-11-23)





# by Tomoichi_Sato | 2024-05-19 23:45 | サプライチェーン | Comments(0)

『それ』は本当に、不要不急なのか

徹底して現世的な人には、現世のことがよくわからないものだ。——わたしの好きな、G・K・チェスタートンの言葉である。

現世という言葉の反対概念は、来世だ。「現世的」とは、つまり来世など一切信じない態度を言う。

現代日本で、来世だとか生まれ変わりとかを真剣に信じている人は、それほど多くないと思う。 そういう意味で、今の日本はとても現世的だと言える。そして100年前のイギリス、チェスタートンが生きていた最盛期の大英帝国も、実はそうだった。英国はキリスト教国ということになっているが、真剣に宗教を信じている人は減りつつあり、特にそれはお金持ちや支配階層において顕著だと、彼は洞察していた。

当時、キリスト教の権威が揺らいでいたのは事実だ。ダーウィンの進化論や近代天文学の発展により、神と地球を中心とした世界像は、次第に相対化されるようになっていった。

しかし、それよりも、急速に拡大する資本主義が、現世主義を加速していた。日曜日になるとブルジョア達は着飾って、教会の上席に連なって説教を聞くが、それは農民や労働者階級に範を垂れるためで、もはや敬虔さのためではない。そんな風に、チェスタートンは傑作中編小説「孔雀の樹」(『裏切りの塔』 収録)で皮肉っている。

勃興するブルジョア階級が何よりも求めたのは、金銭と権力であった。英国にはいまだに貴族制度が残っているが、この時代すでに、爵位は事実上、お金で手に入った。だから地位や名誉は、買うことができる。英国では資本と経営が早くから分離され、金融制度も発達していたから、金融資産を持っている人間は、企業の経営者に命令することができた。つまり人を動かす権力を持っているのだ。

ところで、普通の庶民の生活を考えると、そこには様々な苦労がある。災害もあり、疾病もあり、貧困もあり、そして世の不正もある。愛憎や孤独の苦しみもある。これらはすべて、その本人のせいなのか。もしそうでないなら、神の見えざる大きな力によって、この世の不公正、秤の傾きを正す時が来るのではないか。せめて自分の魂は、善行や友愛の代償として、救いが得られるのではないか。そう考える人たちがいたって、不思議ではない。

現世的とは、金銭と権力が、この世ではすべてだ、と考える傾向である。だって、お金と権力こそ、あの世に持っていけない最大のものだからだ。

ただ、普通に働く人たちの中には、金銭万能の現世的な思考だけでは納得できない者も、数多く存在する。一応、民主制の下で社会が動く英国では、彼らの意見も無視することはできない。だから、徹底して現世的な人には、現世のことがよく理解できない、とチェスタートンは言ったのだ。


コロナウイルス禍による都市封鎖がはじまって以来、もう4年経つ。封鎖の緊急事態は1年前に終わったが、あの3年間は何だったのか。わたし達が得た教訓は、何があったのか。

都市封鎖の初期、『不要不急』な移動や行動は、かたく忌避され、「自粛」を強要された。わたしの息子は2020年の秋に、結婚式を挙げたのだが、それは緊急事態と次の緊急事態の間、ちょうど梅雨のつかの間の晴れのような短い時期に、奇跡的に開催できたのだった。しかしその時期、ほとんどのカップルは自分たちの結婚を祝ってもらう事さえ、ろくにできなかった。婚礼の儀式など、不要不急という訳だ。

息子夫婦に子供が生まれたときも、わたし達はまだ病院に面会に行くことすらできなかった。でも、それはまあ、まだいい方だ。世の中には、最愛の人に先立たれながら、コロナ感染の理由で見送ることさえ許されなかった人たちが、本当に大勢いたのだから。

あの頃、ドイツZDFのニュースを見ていたら、イタリアの都市封鎖の状況をレポーターが紹介して、「イタリア人が大切にする三つのもの、すなわち家族と、宗教と、美味しい食事を、都市封鎖が痛打した」と報じていた。そう。親しい人の交流、集まって祈ること、そして新鮮で豊富な食事を皆で楽しむことが、すべて禁じられたのだった。

ヨーロッパの都市封鎖に比べて、この国の行動制限は多少緩やかだったと言ってもいい。ただ、そこに登場したのが『不要不急』という言葉だった。では、いったい不要不急とは何なのか。

わたし達の社会において、不要不急とは、生存に直接関係のない事だ。わたしのささやかな趣味は、合唱・音楽だが、それは不要不急に類別された。集まって皆で歌を歌うなど、言語道断という訳だ。

他方、食べる事、雨風をしのいで眠る事、衣服をまとう事、つまり衣食住は、一応必要なものとされた。食料生産と輸送、建設工事、衣類リネンの製造は(たとえそれが意味不明なマスクであっても)継続推進された。そしてエネルギー、電力、水などの供給を行うユーティリティ産業も、社会の必要品とされた。

もちろん衣食住と言っても、あまり贅沢な住居や華美な衣服は、不要不急と見なされる。つまりそこには、程度の差があるらしい。最低限のものなら、許される。贅沢はダメ。なんだか江戸時代の倹約令みたいだ。あるいは隣近所にある共産主義国みたいだと言ったら、皮肉に過ぎるだろうか?

別の言い方をしよう。生存の要を満たし、社会の利便性を支え、生産活動に直接寄与するもの。それが要で急なるものだ。そして、美とか遊びとか、あるいは儀式や祈りとか、人間の感情的・感覚的要求を満たすに過ぎないものは、「不要不急」のラベルを貼られる。これが、わたし達の社会の価値観である。

新著『ITって、何?』で、わたしは文明と文化について、次のような意味の定義を紹介した:

  • 文明とは人間に、生存への必要と利便性を与える
  • そして文化とは、人間にアイデンティティ(生きる意味)を与える

『ITって、何?』は、男女の対話形式になっている。男は技術者で、定型的なデータを重視し、女は翻訳家で、非定形な情報を大切にする。そしてITの本質とは、データと情報のサイクルを作ることである。とはいえ実は、わたしはこの本を、文明と文化の対話劇として書いた。文明がなければ生きていくことができない。しかし文化がなければ、人間は生きていく意味を失う。そして情報こそ、人間に意味を与えるものなのだ。

こうしてみると、『不要不急』の範囲が、よく分かる。わたし達の社会で不要不急とされるのは、文化の領域に属する物事、美とか遊びとか交流とか宗教とかだ。これらは人間に個性と意味と、アイデンティティを与える役割を持つ。

それに対して、文明の領域に属する事柄、すなわち食料・エネルギー・基幹素材などの商品の生産や流通とか、それらを支える社会のルールと防衛機構は、いつも優先される。そしてこちらは、生産量とか、利益額とか、効率性とかいったKPIで測り、「管理」することができる。管理社会とは、すなわち文明の論理だけでできている社会である。

さて、現世的とは、お金と権力だけを信じることだと、最初に書いた。お金と権力への欲望とは、言いかえれば所有欲支配欲である。だが、この二つの欲望は、その当人にとって、両刃の剣のように、危険な存在だ。

何かをあまりに強く所有したいと願うと、逆に人はその対象に縛られてしまう。何かを強く支配したいとの願いにとりつかれると、逆にその願いから自由になれなくなる。ずっと以前、G・ワインバーグの、

「もしあなたが何かをそんなにひどく求めているなら、多分それは手に入れない方がいい」

という言葉を、『ロージーの返事を、ときどき思い出す』で紹介したが、人は所有欲に自分自身を所有され、支配欲に自分自身が支配される傾向がある。結果として、自分が自分自身の主人ではなくなってしまう。それが、独裁者の危険なのだ。

そして、その毒を中和できるのは、ふと我に返って、自分の人生の意味を考える瞬間である。文明に中毒した人間を救える唯一のものが、不要不急とされる文化の力なのだ。

20世紀初頭、大英帝国の最盛期において、チェスタートンはこのままでは英国は滅びる、と予見した。徹底して現世的な少数の人々に、資本と権力が集中しすぎ、殆どの人は雇われ人としてしか、生き延びることができない。そして多数の人が孤独という名の病に苦しむ。そのような社会は、長続きしないというのが、彼の思想だった。

英国はしかし、彼の願う道をたどらなかった。二度の大戦を経て、苛烈な支配下に置いていた植民地の殆どを失い、自国内の産業基盤も国外に流出してしまったのだ。今、ロンドンのヒースロー空港の新ターミナルへの通路を歩くと、戦後のイギリスを象徴する写真と年表を見ることができる。彼らが誇りに思っているのは何か。皮肉にも、戦後の英国で唯一最大に輝いていたのは、ビートルズに象徴される、不要不急な音楽文化だったのである。


『それ』は本当に、不要不急なのか_e0058447_13180791.jpg

(現代のロンドン中心部と、ヒースロー空港のターミナル2への長い通路)


<関連エントリ>
「ロージーの返事を、ときどき思い出す」 https://brevis.exblog.jp/22307650/ (2014-08-21)

「クリスマス・メッセージ:あらためて、平和を祈ろう」 https://brevis.exblog.jp/30539585/ (2023-12-21)


# by Tomoichi_Sato | 2024-05-11 13:19 | 考えるヒント | Comments(0)

データを予測に活かすために身につけるべき、二つの原則

  • データとの付き合い方の基本とは

「データは新しい石油だ」とか「データ・ドリブン経営」といった言葉を近年、耳にするようになった。データの重要性を長年力説してきたシステム・アナリストとしては、大変心強いことだ。しかし(いつものことだが)、『データ』という事がらの内実を充分理解しないまま、ムードで語られている感じが、なくは無い。

拙著『ITって、何?』の冒頭の問答でも書いたことだが、多くの人は情報とデータの区別さえ曖昧なまま、両方の言葉をごっちゃに使っている。元の原稿を書いたのは2002年のことだが、それから20年以上経っても、状況はあまり改善していない。

こういう人たちは、コンピュータの中に記憶されている数字だったら、「データ」だと考える。 だから、サーバの中に多数のファイルがごっちゃに保存されているだけなのに、「わが社には、大量の過去データがある」と考える管理職が出現する。それをAIにかけて学習させれば、素晴らしい予測モデルができる、などと夢想する。

データとの正しい付き合い方を理解しておけば、別にAIなど持ち出さなくても、意味のある予測モデルを作る事自体は可能だ。むしろブラックボックスになりにくい分、その方が自社にとって重要な知的資産ともなり得る。ただしそのためには、身につけておかなければならないスタンスないし原則が、いくつかある。わたしの 若い頃の経験をもとに、それをちょっとご紹介しよう。


  • DO瓶の教え

さて、皆さんはDO瓶(溶存酸素瓶) と言うものをご存知だろうか? まぁ、ご存知の方はめったにおられまい。 そこで関谷理化株式会社のサイトから、 写真を引用させていただこう。

データを予測に活かすために身につけるべき、二つの原則_e0058447_23094410.jpeg
https://www.sekiyarika.com/bis/products/detail5578.html より引用

DO瓶とは、容積100ミリリットルほどの、小さなガラス瓶である。海洋環境や、湖沼・河川などの水質調査に用いる。海や川からサンプル水を取水し、この瓶に密封して実験室まで持ち帰る。そして滴定法により、水の中に溶けている酸素濃度を測定するのである。酸素は水に一応溶けるものの、1リットルあたり、せいぜい10mg程度までしか溶存しないので、 重量比で言うと10万分の1程度の微量である。​​

ところで当たり前だが、大気は酸素で満ちている。 だからサンプル水をこの瓶に注ぎ込むときに、うっかり泡立ててはいけない。それどころか、瓶の中にわずかでも気泡が残っていると、測定値がブレてしまう。

そのためにこの瓶には、ちょっとした工夫がこらされている。瓶の蓋の部分と、本体の受け口は、ガラスのすり合わせ面になっている。しかも瓶の蓋の下部、つまり本体に入る根元の面が、写真だとややわかりにくいが、水平でなく斜めに切られている。瓶にサンプル水を静かになみなみと注いだら、真上からこの蓋をすっと落とす。すると余計な水は斜めの面に押され、すり合わせ部分から溢れ出て、蓋がきっちり閉まる。作業全体は静かに、しかし手早く行わなければならない。そうしないと、泡が立ったり気泡が残ったりしがちである。

わたしの修士論文の研究テーマは、湖の生態系のシミュレーションであった。対象は、長野県の諏訪湖である。 ここには信州大学の臨湖実験所があって、 既に何年間もの克明な調査結果と膨大なデータが(当時の事だから、当然ながら単純なテキストデータだったが)蓄積されていた。わたしの研究は、この膨大なデータを分析して、シミュレーション・モデルを作り上げることにあった。

ところが、わたしの指導教授は、現地に行って、自分でデータを取ってこいと命じた。 既に大量のデータが報告されているのに、である。(ただし余計な話だが、生物学者はしばしば、環境調査に大変な労力と情熱を費やすわりに、数値的な分析と予測を軽く見る傾向があったが、それはさておき)たしかに違う角度から、補足的に調査すべき事項はあった。 そこで研究室の先輩に手引きしていただきながら、現地に行き、ボートに乗って、実際に取水して回った。

そしてサンプル水をDO瓶に注ぎ込む段になって、それがいかにスキルを要する危なっかしい作業かを実感することになった。何せ、手先がひどく不器用な人間なのだ。何度も注ぎ直して、ようやく使い物になる1セットが出来上がる、そんな繰り返しだった。


  • データ取得のコストと精度を知る

そして改めて、なぜ先生が自分の手でデータをとってこいと言ったのか、理由がわかった。現場で自分の手でデータを取って初めて、そのデータを取得するためのコストと時間、そしてデータの精度が実感として分かったのである。それは現地から遠く離れた東京の研究室の机の上で、数字だけ眺めていては、決して理解できないことだった。

深さの違う2点間の値の引き算から、深さ方向の微係数を計算できる。理屈ではそうなのだ。だが、どの程度の精度を持ったデータ同士の引き算なのかによって、結果の意味付けは全く異なる。ここの場所の値も欲しいな、と研究室では気楽に言える。だが、ボートの速度と気象条件を考えたら、けっして簡単ではないことが、現地を経験すると初めてわかる。

データは、モデル化することによって、真の価値を発揮する。モデルというのは、何よりも対象系の簡潔明快な記述と、予測のためにある。予測とは普通、将来への推測だが、場合によってはバックワードに原因を推測(判別)することをも含む。

ところで、適切なモデル構築のためには、現場にいき、できれば自分の手でデータを取ってみることが必要だ。これが、最初にたたき込まれた思考習慣だった。そうすることで、データ取得のコストや時間、データの精度が理解できる。精度の吟味のないデータ処理や計算など、無意味(=ガーベッジイン・ガーベッジアウト)だからである。

次に身につけさせられたのは、実際のデータを眺めて、その範囲や比率、平均や分布のパターンを知ることであった。そのためには、平均・分散・最小値・最大値・標準偏差・変動係数といった基礎統計量についての理解が必要だ。加えて、ヒストグラム・散布図・管理図・対数プロットなど、データ分析に向いたグラフ表現のテクニックを知っておくべきだ。

それも、できれば、自分で点をグラフにプロットするのがいい。そうすると、それぞれの測定値の個性やクセも見えてくる。それで、もし可能なら、さらに重回帰や主成分分析など多変量解析法も少しは知っておくことが望ましい。


  • データをよく見ることの重要性

いやいや、そんな理工系研究のシミュレーション・モデルならともかく、通常の業務系システムのデータモデルなら、そんな統計学なんていらないでしょ? という疑問もあろう。実際、多くの業務系SE達は、彼らのITシステムがはじき出すデータの中身について、わりと無頓着に見える。たとえば従業員マスタに性別という項目があるとして、「男性」「女性」(最近なら「その他」)の値の、どれかが登録可能であればいいじゃないの?

果たしてそうだろうか。わたしだったら、そうは考えない。仮に男女2値だとしても、まず、男女の比率を見る。それが6:4なのか、1:9なのか。それとも9.999:0.001なのか。

そして男女の性別で判断が変わる処理は、どれだけあるのか見積もるだろう。現代日本では、女性は結婚・離婚によって姓が変わる確率が高い。女性の多い職場で、履歴データを追跡可能にしておくためには、旧姓も保持しておくべきか。また最後の比率の例では、1万人に1人しか女性がいない訳だ。だったら性別のフィールドなどとらずに、例外処理にした方が良いのではないか? なんと言っても、データはコストなのだから。

ITって、何? 』の「インターチェンジ」の章では、年賀状のための住所録のデータモデル論議を、主人公達にさせた。このとき個人を基本エンティティにするか、それとも夫婦をエンティティするか、二つの設計パターンを対比させたが、それはまさに、自分たちの知人の性別比率がどうなっているかに関わっているのである。

□ できる限り現場に足を運んで、自分の手でデータを取ってみること
□ 集めたデータを眺めて、範囲や比率、平均や分布のパターンを知ること

これらは単純だが、データからモデルを構築するときに、従うべき必須の原則である。

無論、状況によっては、現場に行けない・もはや自分ではデータを取れない、といった場合もあるだろう。得られたデータを一所懸命に眺めても、特段目を引くような点が何も見つからない時もあるだろう。でも、それはそれでいいのだ。これら原則はスタンスないしアプローチの姿勢であって、別に必勝の道具立てだといっている訳ではない。

ただ、「データは新しい原油だ」と言うとき、それはデータが重要な資源だ、というだけでなく、原油と同様に、精製して余分なモノを除去しなければ、エネルギー動力として使えないことをも意味している。データは燃料で、モデルはエンジンである。データにふさわしいエンジンを作るために、わたし達はデータの出自と性質を、よく知っておかなければなるまい。


<関連エントリ>
「システムが崩壊するとき」 https://brevis.exblog.jp/11784084/ (2009-12-15)



# by Tomoichi_Sato | 2024-05-01 23:16 | 思考とモデリング | Comments(0)