QC7Tools
QC7つ道具、新QC7つ道具とDX版QC7つ道具
Ver. 4.6.1で、CSV/TSVファイルやフォルダから、すぐにプロット表示・分析を始められるワンタッチな設定機能「ファイルから登録 」が追加され、Ver. 4.7.0ではワンタッチなインストール機能で簡単にインストールでき、Functionでデータ編集が出来るようになりました。
QC7つ道具、新QC7つ道具とDX版QC7つ道具
QC7つ道具とDX版QC7つ道具であるDN7、新QC7つ道具の機能の一覧をご紹介します。
QC7つ道具は、基本的に現象を数値的・定量的に分析するための技法で、コンピュータが発達していない開発当時の状況でも活用できるように、人の手で計算もしくは描画できるような手法となっています。最近では多くの手法がソフトウェア化され、ある程度自動で扱えるようになってきています。なお、唯一、数値を扱わないのは特性要因図(魚の骨)であり、ブレインストーミング的に作図されます(支援ツールはソフトウェア化されています)。
これに対し、新QC7つ道具は、数値化が難しい問題を解決するために開発されており主に言語系データ的手法のツールで、多くがブレインストーミング的に作図されます。唯一の数値的手法がマトリックスデータ解析法(主成分分析)です。
QC7つ道具や新QC7つ道具は、長年にわたり特に日本の製造業の品質を下支えし、品質管理で大きな成果を上げてきました。一方、近年IT化が進み、IoT技術の普及や世の中のDX化などに伴い大量のデータが工程から取得されるようになってきており、いわゆるBig Data(データの数が多い、という意味のほかに数学的に扱う際に注意が必要な高次元データという意味も含んでいます)活用の時代が到来しています。ところが、QC7つ道具は、人の手でも計算でき・扱える手法であるがゆえに、Big Dataに対しては必ずしも適していないところがあります。分かり易いところでいくと、例えば散布図は打点が10万点以上など、データが多すぎると描画さえ難しくなります。DN7は、そのような観点を補う手法 として開発されました。
DN7は、これらの大量かつ高次元のデータを扱うことを前提に設計されており、また結果を見るまではユーザにブレインストーミング的手法を要求せず、データに基づいて結果を出すデータドリブン的なアプローチを採用しています。データを集め、繋ぎ、可視化するところまではAP+DN7が自動的に処理し、ユーザは可視化された結果を見て「まず見て、考える」といった、工程に対する 新しいDX的視点を提供します。
※ 以下の内容についてですが、QC7つ道具とDN7は、ある程度機能的に対応しています(横に並んでいる機能間に類似性・発展性がある)が、新QC7つ道具はそもそも言語系手法が多いので横隣り同士で対応関係があるわけではありませんのでご留意ください。
管理図は工程が安定状態にあるかどうかを把握するための判断材料です。一定の規則に従ってデータをサンプリング、平均やレンジなどの統計値を算出し、その結果を系列で折れ線グラフにします。中心線 (CL) と管理限界によって、点の配置と分布などから、その管理工程の異常を判断できます。
統計値を用いず、製品の個体データを基本全てプロットしている図です。管理線外の点が即管理図でのNGとは同義でないことに留意してください。
データ点が多い場合は打点同士が塗りつぶされて識別できなくなるため、高速モードに移行してデータ推移が分かるよう省略(サンプリング)表示します。
将来起こりうる未知の問題や、混沌としている問題・課題などの構造を明らかにする手法で、様々な言語データを親和性/関連性に基づき体系化します。
ヒストグラムは、データを一定の区間(Bin)に分け、各範囲に属する数値の度数を高さとしてプロットする図です。データの分布やピーク(モード)、ばらつきなどデータの傾向を把握できます。
一般的には管理限界(LCL/UCL)は正規分布を仮定して算出されており、ビッグデータへの適用は多峰分布などケースによって注意が必要です。
データセットを複数のグループ(多くの場合時系列やID系列)に分け、それぞれの分布曲線を並べて表示することで分布変動を把握しやすくした図で、視覚的に変化点検出することができます。
ヒストグラムではBinの幅によって分布の外形が変わってしまう問題があり、よりユニバーサルな手法としてカーネル密度推定を用いた密度曲線が分布の描画に使用されています。
連関図法では、問題が複雑に絡み合い、解決の糸口が見つけにくい場合に、"原因と結果"や"目的と手段"など、要因の相互関係を論理的に整理・明確化し、因果関係などから主要因とその関係を導き出します。この手法は品質や現場に関わる課題分析に有効であり、製造やシステム開発分野で活用されます。特性要因図に似ていますが、複数の結果や要因同士も含めたより複雑なネットワーク関係を扱うことが異なります。
チェックシートとは、点検・調査・確認などを可視化し見やすくするために、あらかじめ決められた項目に従いチェックを付ける方法です。記録用チェックシートは問題解決の際に必要となるデータ収集が主目的、点検用チェックシートでは点検項目の抜け・漏れなどないようポカヨケなどに利用されます。最近は電子帳票化されているケースも多いですが、人がチェックする、ということが前提であることが多く、人的なミス(未入力・誤入力等)に留意する必要があります。データを正しく解釈するには、データインテグリティに関する配慮が必要です。
縦軸に日毎(0:00~24:00)もしくは週毎(日~土)をとり、横軸は日付としてカレンダ状に、データ数や統計値(平均値やσなど)の大小を色としてプロットしたものです。長期のデータ俯瞰や、人間の活動(昼夜、シフト、週明け/週末など)に付随した工程変動の把握に適しています。基本は自動収集されたビッグデータを扱うことを前提とすることで、人的ミスによるデータへの外乱の影響を避けています。
単発のCSVデータなどを見る際は、データがどこの期間にあるか分からなくなることが多いので、最初にCHMでデータの所在を確かめましょう。
系統図法とは、目的を達成するために最適な手段・方法をツリー状に配置していく手法で、目的達成のための手段を"目的"とし、その"手段"を階層的に何度も検討することで、実行すべき最適な手段を導き出していきます。それぞれの階層では一つ上の階層を目的として捉え、展開していきます。
散布図は、1つの事象に対する2変数の数値データの分布関係を調べるときに用いられ、2つの項目を横軸・縦軸にとり、データを点の集合で表示します。
2変数の間にはどんな相関関係があるのか、あるいは関係がない(無相関)のかを知ることができます。またデータクラスタを認識することもできます。
分布形状は大別して下記3つの傾向があります。
正の相関…右上がりの形状。xの増加でyも増加
負の相関…右下がりの形状。xの増加でyは減少
無相関…xの増減とyの増減に法則性がなく、2つの変数は相関関係にない。
3変数以上の変数間の散布図を表示するために散布図行列を用いています(ただし高次元では組み合わせ爆発が起こるため、DN7では7次元の変数間までのプロットに対応しています)。
データ数が大量な場合は散布図は破綻しますが、DN7においては大規模データの際は濃淡密度プロット(正確には等高線プロット)に移行することで、100万点超のBig Dataにも対応しています。
なお、濃淡プロットでも外れ値は選択的に表示(白い打点)するように設計されており、データの塊や外れ値を捉えやすいプロットを実現しています。
マトリックスデータ解析法は主成分分析による解析法で、主成分を用いて次元圧縮し、低次元化することで多数の変数の管理を一括管理する方法です。多くが言語データを扱う新QC7つ道具の中で、唯一数値データを扱っています。海外ではブルズアイ(牛の目を射抜く意味から命中点の意、射撃やダーツなどの的のこと。標的や"大当たり!"的なニュアンスもあり、転じて使用されている)とも言われています。
DN7には含まれていませんが、分析プラットホームには異常検出機能として実装されています。
(第1主成分PC1と第2主成分PC2の散布図として解釈できなくもないので、こちらに並べました)
グラフは、データを可視化した図。グラフを用いることによって、データの比較や変化などが一目で分かるようになります。
QC7つ道具においてはどのようなグラフ化を行うかが特定はされておらず、主に折れ線グラフ・棒グラフ・円グラフ・帯グラフ・レーダチャートなどをデータや目的に応じて自己判断し、適材適所で使うことになります。
間違えたグラフを選択すると、判断ミスや誤解を招くことになるので気を付けましょう。
複数の変数軸を平行に配列して、多数のデータを各軸を通過する折れ線として描画しており、多次元のデータ分布を把握できます。虹色が見える軸が重要変数です。色が混ざっていたら無相関です。
7つ道具のグラフを踏襲して、ということもいえますが、より高次元での相関分析・クラスタや外れ値の可視化に対応しているところから、散布図機能の拡張と捉える方が自然かもしれません。
変数をカテゴリ値のみに絞ることができ、その場合はデータの構成比率を把握できるパラレルカテゴリプロットに切り替わります。こちらは工程の機差解析などに有効です。
マトリックス図法では、検討する2つの要素を行列状に配置し、関連度合いを交点に表示することで問題解決を進めます。要素間の関係を整理したり、全体を俯瞰視して結論を導き出したりすることができます。また、系統図法で導き出した数多くの方策を実施する際の優先順位や役割分担などの決定にも使われます。概念的には層別に近いです。
DN7ではカテゴリ値によるファセット表示を行える機能がありますが、これはマトリックス図法の発展形とも捉えらることができます。
特性要因図は、問題(特性)の背景にある要因を書き出し、可視化した図となります。主に5M+1E(Man:人, Machine:機械, Method:方法, Material:材料, Measurement:測定, Environment:環境)の観点から問題の背景にある要因を示し、系統的に整理します。問題の原因を整理することで、原因の絞り込みや推定ができます。図の形状が魚の骨に似ていることから、フィッシュボーン、フィッシュボーンチャートと呼ばれることもあります。QC7つ道具の中で唯一言語系の解析といえ、工程知見とブレインストーミング的な手法で作成されます。
デジタル版の魚の骨のイメージで、データの相関関係をLASSOを用いて算出した後に相関関係の強さを線の太さ、符号を色で、サンキーダイアグラムとして描画します。太さがより太い変数が重要変数である可能性を示唆します。
ブレインストーミング的な手法を介さないため、観測データに含まれない事象は説明できません(従って重要変数は測定・データ化してある必要があります)が、自動的に魚の骨と類似した情報を自動算出することができることから、現場で何が起こっているかを恣意性なく客観的に把握することができます。
アローダイヤグラム法は、作業が複雑に絡み合っている場合などに、各作業の関係と日程の繋がりを可視化します。計画を進めるための作業順序を矢印と結合点で結んだ、アローダイアグラム(矢線図・PERT[Program Evaluation and Review Technique]図)と呼ばれるネットワーク図で、スケジュールを管理・検討します。クリティカルパス(最早日程と最遅日程が同じ経路)の発見、各工程の進捗管理やどの程度の遅れなら許容できるか、同時に期間短縮するためのポイントなどを検討する際に役立ちます。
パレート図とは、項目別に分けたデータを値の大きな順に並べた棒グラフと、そこに、各項目のデータの累積数を全データ数で割った数値(累積比率)の折れ線グラフ(累計曲線)を重ねた図です。全体の中で大きな比率を占めるものが何かを明確にし、どの項目が結果に対する影響度(重要度)が高いかを把握できます。真っ先に取り組まなければならない問題や各項目の優先度を容易に把握できます。
共起関係(ある現象と別の現象が同時に出現する頻度に着目した関係)を可視化します。共起関係とは、あるアラームが発生した際に同時に発生するアラーム、ある状態が発生した際に発生するイベントなどの時間を含んだ関係で、5M1Eなどと組み合わせて解析することで工程の改善に役立ちます。
直感的な共起性の把握はできますが、定量的な把握が難しいため、パレート図を併用してあります。
PDPC法とは、プロセス決定計画図や過程決定計画図を意味するPCPD(Process Decision Program Chart)を用いる手法で、目的を達成するまでに考えられる障害を予測して対策を考案し、過程で不測の事態が起こっても代替できる案を明確にしておくことで、目的をより確実に達成するために使用します。過去の類似事例や経験を活かしやすく、スタートから問題解決・ゴールまでの全体像の把握にも役立ちます。
品質管理の世界的スタンダードといえる品質管理手法です。どちらかというと各工程毎に品質を安定化させることに着目しています(層別は除く。魚の骨は工程全体で書けなくもないですが複雑な巨大魚になりがちなので、普通は工程毎に作ります)ので積み上げのボトムアップ的な手法ということもできます。
時間推移的な概念が薄い(管理図は時系列かというと微妙です。日に1回とかnロットで一回的な計量なので、イベントデータに近く、もちろん時間的先行性などから時間要素はありますが、例えば管理図で移動平均曲線を描いたり、リアルタイム測定と言ったりする人はいませんよね)ので、事前/事後両方の図表を並べ比較するなどの工夫を行うこともあります。
ID管理(個体識別)的視点もないです。群として、サンプリング(計算対象の数を絞る)し、その統計値を扱う形になっており、結果的に手計算や手でもグラフを描けるという大きな利点が生まれます。「代表値で、群を知り、系を知る」という感じです。サンプリングするので、外れ値の影響を受け難い(あまり考えなくていい)というメリットも生まれます。
管理図での判定方法は、多くが正規分布が前提のものが主となりますので、Big Data(非正規分布も多い)を扱う場合は注意が必要です。Big Dataとれるようになったからとりあえずサンプリング数だけを増やす、といったことを気軽に行ってはいけません。
IDによってデータをつなぎ、工程間や分野間をつなぐ、というID管理(個体識別・個体管理)を前提とした視点で構成されています。「個を知り、系を知る」という思想です。個別識別するので、大量のデータの場合、手で書くわけにはいきません、デジタル的な手法が前提となります。
時間的な推移の検出機能が半分以上あります。「工程は変わるもの」が前提でそれを見つけに行くという感じです。別の言い方をすれば、前提なきBig Dataに対応させている、ともいえます。製品の加工や測定データが数分の遅れがあるもののすぐに見れますので準リアルタイムデータということができます。
個体識別が前提なので、機械学習につなげやすいというメリットもあります。ここは他の2手法と大きな違いであり、DX世代やIoTにおいては大きなアドバンテージになります。なお、機械学習もそうですが、外れ値の影響を受けやすいので注意が必要です(DN7では外れ値に注目できるような、もしくは外れ値をよしなに処理する機能が盛り込まれています)。
Big Dataを前提にしていますので、データは正規分布ではない、という前提で設計されています。したがって、必ずしも工程管理には向いていないですので、工程管理ができるQC7つ道具と併用する、もしくは強化するという位置づけで考えましょう。
言語的なアプローチが主体で、多くが定性的に問題解決を目指す手法です。ほとんどの手法で多かれ少なかれブレインストーミングが必要で、自動化が難しいものが多いです(現在ではAI的にこのような機能を実現する試みがありますがオントロジー的要素が強いので、人間にはできても…みたいな感じです)。製造工程管理以外の他業種での活用が多いのも特徴です。
うち2つの機能には時間的概念が入ってはいますが、全体的に時間経過は考慮されていないものが多いです。こちらもどちらかというとスタティックな分析といえます。
結果系だけでなくフォアキャスト(Forecast)的手法があるのも他の2手法と大きく異なります(魚の骨は事前に書きなさいと言われるような気もしますが…)。より確実に計画を遂行するために活用するメリットがあります。
マトリックスデータ解析法での管理手法には正規分布が前提の判断手法が含まれる時がありますので、Big Data(非正規分布が前提)を扱う場合は気を付けましょう。
#QC7つ道具とDX版QC7つ道具DN7の機能一覧