Ver. 4.6.1で、CSV/TSVファイルやフォルダから、すぐにプロット表示・分析を始められるワンタッチな設定機能「ファイルから登録 」が追加され、Ver. 4.7.0ではワンタッチなインストール機能で簡単にインストールでき、Functionでデータ編集が出来るようになりました。
AP+DN7の便利な機能を紹介します。
ワンタッチでデータを登録できる機能ができました。めちゃ便利なので使ってみましょう。
[ファイルから登録]を押して、
これから見たいデータが入っているフォルダパスを入力し、[Enter]を押すか、別の場所をクリックすると、
こんな感じでデータが読み込まれます。
よくわからない人はこのまま次へ。たいがい、どうにかなります。
後で設定変更するのは少し面倒なので、内容が分かる方は、この時点で、データ設定を確認・修正しておくことをお勧めします。
あとは、[データ登録]を押すだけ。
なんと、最短、2アクションでデータ登録ができ、少し待つとCHMが自動で表示されます。便利ですね!
動画で解説 →
DN7の真価は複数の分析機能を連携させてデータを読み解くことで発揮されます。これをワンタッチで実現する機能が追加されました。
Jump機能です。これまでは、プロットの設定などは設定コピーを使っていたと思いますが、基本自動的に設定が引き継がれるようになります。
何らかの機能でプロットした後にプロット領域上部にある矢印アイコンを押してみてください。
そうするとJumpダイアログが開いて、おすすめの分析機能(このケースはSkDの後の分析)が表示され、どの変数を受け渡すか、が表示されます。
なお、[All]を選ぶと全ての機能がJump先に選べます。
[OK]を押すと、プロットの設定を引き継いで、次の分析機能にJumpできます。
不良率との連動性を確認できる機能が追加されました。
リッジラインプロットRLPにて、不良率(NG率)を算定したい項目のJudge(日本語の場合”判定”)をチェックします。
チェックするとNG Conditionの項目が表示されますので、例えば温度項目が[≧20]℃とか、判定値が[=NG]とか[=0]などといった指定を行います。
その後プロットを行うと、RLPの最上部にNG Conditionに基づいて計算されたNG率が表示されます。
この後Jump機能でサンキーダイアグラムSkDにJumpすることで、NG率と連動する変数を絞り込むことができます。
この機能で不良率と関係している変数を素早く絞り込めますので、不良の原因の可能性が高い変数を探索することができます。
Tryの冒頭にこんなくだりがありました。
最初にしていただきたいことがあります。多くのDN7の機能では、いつからいつまで表示して、とか、この期間のデータを使って、というものが多いです。
で、カレンダヒートマップCHMをまず見ましょうという流れでしたが…。とはいえ、もう少しサクッとデータのありかを把握したいものです。
そこで、Data Finderの出番です。
多くのページの対象期間の所、右側に[Data Finder]のボタンがあります。 v4.1.1 から搭載されています。
早速押してみたいところですが、実際に触っていただくのがいいかと思いますので、Bookmark☆からデモデータの"1-3 FPP"を開きましょう。
デモデータが開いたら[Data Finder]のボタンを押してみましょう。
ヒートマップが出てきました。このデモデータがどこにあるのかが明暗で一目で分かります。
明るい青の所にデータがたくさんあって、黒いところにはデータがない、みたいな感じです。
[Year]を押してみましょう。
デモデータが2か月分のデータしか含んでいないこともすぐ分かりますね。
試しに、"2022-02"のセルをクリック、その後に"2022-05"のセルをクリックして、[Month]を押してみましょう。
FromToの中身が、最初の"2022-03-01-2022-04-30"から、先ほど選んだ"2022-02-01-2022-05-31"に変わっていますね。
試しで2月から5月に広げたので、実際にデータがあるところに戻したいと思います。
色がついているところにデータがあるので、最初に色がついている"03-01"のセルをクリックし、最後に色がついている"04-25"をクリック、FromToが"2022-03-01-2022-04-25"に変わっていることを確認して、[Week]を押します。
FromToが"2022-03-01 00:00 – 2022-04-25 23:59"になりました。
ここで、データを見たい区切りが朝の7:00で、稼働日のデータを見たいとします。
"2022-03-01 07:00"のセルと、"2022-04-23 07:00"のセルを連続してクリックすると、FromToが"2022-03-01 07:00 – 2022-04-23 07:00"になります。
この状態で[Set]を押すと、
対象期間の入力が更新されました。
見たい範囲に絞り込んだデータ範囲を、直感的に入力できますね。
もちろんこれまでの入力方法(→)も使えますが、便利なのでData Finder活用しましょう。
リッジラインプロットRLPは、工程の変化を可視化するのに適した手法であり、直感的な変化点検出や傾向把握ができます。すばやく工程の変化を把握し、早期に5M1E分析などの改善に持ち込めます。アンドンとして利用することで、異常が発生したことに次の日になって初めて気付くとか、数時間不良を作り続けてしまうといったことを防止でき、この消耗品は交換によって動きが周期性を持つとか、材料ロットによって変動が起きやすいなどの傾向把握にも活用できます。
以下の図では、同じデータをリッジラインプロットRLPと全数プロットFPPでプロットしたものですが、RLPの特徴がお分かりいただけると思います。
このプロットは上部と下部に分かれており、上部はEMD、下部はRLPが表示されています。
上部側のEMDは、Earth Mover‘s Distanceと呼ばれる、2つの確率分布間の距離を測る指標で、分布が上振れ(増加側に動いた)したか、下振れ(減少側に動いた)したかを数値化したものです。またDN7では、EMDやRLPの色をEMDの値によって決めています (正値→増加/赤・0→変化なし:緑/負値→減少:青)。基準は最初の密度分布で、最初の分布のEMDは自分自身との比較になるので必ずEMD=0(緑)になります(Driftモードの場合。一つ前の分布との差を見るDiffモードもあり、この場合は変化点に[変化が大きい場所ほど]色が付きます)。
下部側はリッジラインプロットRLPそのもので、データを分割して区切ったデータ群ごとに、一つ一つの分布曲線を作成(密度曲線:カーネル密度推定)し、並べたものです。並べた密度曲線の推移が山の稜線(リッジライン)のように見えるのでリッジラインプロットと呼ばれています。
古典的にはヒストグラムを利用されていると思いますが、ビッグデータ解析においてはヒストグラムにはいろいろ注意が必要で、よりオールマイティに使える密度曲線を採用することで、時系列の分布の動きが見やすく、変化を捉えやすくなっています。詳細については、こちらを参照ください。
パラレルコーディネートプロットPCPは容易にパラレルカテゴリへ表示を切り替えることができます。
パラレルカテゴリプロットは、連続値の測定値が少なく、カテゴリ記録しか残っていないような製品やラインなどでも効果を上げることができます。各変数の項目毎に構成比率を示す色の帯を描画するプロットで、多次元での層別や間差分析を視覚的に行います。色の比率が異なるところが注目ポイントです。例えばある不良が特定の号機でのみ発生していると、その号機だけにその不良の色の帯が集まり、その他の号機ではその不良の色の帯はない、というように不良を発生させている装置を特定できます。
PCPにて[表示する変数]を[カテゴリ変数のみを表示]にして、右横にある[グラフを表示]を押すだけです。
PCPと同様に軸ラベルで右クリックし、[目的変数に選択]を選ぶと、その軸の変数が色の着色基準になります。
右の例では[旅客クラス]を目的変数にしました。
このプロット、層別や間差解析に非常に役立ちます。ぜひ活用しましょう。
インストラクションで使ったTitanicのデータをパラレルカテゴリで表示したデータです。
パット見て特徴的なところを見てみます。
一番左のカテゴリ(同乗者が何人いたか)のライトグリーン(一番右のカテゴリ=目的変数Targetに設定した旅客クラスで2等旅客)が色の比率が目立って異なります。0人(つまり単身乗船者)が一番多く、1人(夫婦とか親子とか2人で乗船)の人が1/3くらいでしょうか。2人(子供がいる夫婦とか3人で乗船)はさらに1/5くらいでしょうか、少なくなりますね。3人以上の同乗者がいる人はほぼいなそうです。
ここで工程に例えてみます。目的変数Target(一番右)が不良の内訳だったと見なします。不良は1/2/3の3種類あり、不良2は全体の20%ほどを占めていそうです。で、一番左のカテゴリが加工機の号機だとします。不良2(ライトグリーン)は、0号機が一番多く不良が発生していて、次が1号機、2号機と続き3号機以降はほぼ発生していないといえます。ここで少し考えないといけないのが、0号機と1号機の3色合わせた幅が倍くらい異なることです。生産量が0号機は1号機の倍あるということになります。さらに0号機の3色の色の比率をTarget(不良内訳)の3色の比率と比べると近いですね。0号機での不良2(ライトグリーン)の発生確率は20%程度といえます。一方1号機での3色の幅は同じくらいなので、不良2(ライトグリーン)の発生確率は33%程度です。0号機は確かに最も多くの不良を作っているので要注意ですが、1号機での不良2の発生確率は0号機の33%/20%≒1.66倍ということで、0号機よりも1号機の方が深刻だという可能性が分かります。0‐2号機で不良2が発生し、3-6号機では発生していない、ということもいえるので、これらの号機の差(ハードやソフトの違い、摩耗状況や消耗品の交換状況など5M1E情報との対比)を調べていくことで不良2の真因に迫れ、改善につなげられそうです。このように色の比率を見ていくことで、工程での間差判定を行うことができます。
元のデータに戻って、性別(mail=男/femail=女)では、色の比率がTargetの旅客クラスの比率と大して変わりません。従って性別はあまり重要でない(旅客クラス毎に男女構成比は大して変わらなかった)ことが言えます。一方、生存状況(左から3つ目:0=死亡/1=生存)では色の比率が生存1と死亡0でTargetとは異なるため、この変数が層別要因になって着目すべき変数であることが言えます。赤のFirstクラスの人はよりたくさん生存1していることが分かります。あと、救命ボート(左から2番目:1以外=ボート番号/1=ボートに乗れなかった人)に乗れた人が生存1していることも分かります。ただ、時々、救命ボートに乗れたのに死亡0した人や、救命ボートに乗れなかったのに生存1している人がいる(上下でクロスしている細い線)ことも分かりますね。
(これは比率関係からの結言で、実際は因果関係があるので、関係が逆で、旅客クラスが生存率に影響した、すなわち高いクラスの乗客の方がより命拾いした、ですね)
工程ではパラレルカテゴリプロットは、不良の原因工程の特定に使われます。目的変数に不良のカテゴリ比率を用いた際に、例えばライン、加工ステーション、検査ステーション毎などでカテゴリ比率を見た場合、本来、どのステーションでも同じ比率にならないといけませんが、特定の不良を作り込む工程が特定の(例えば機差がある)ステーションに存在した場合、構成比率が目的変数と異なります。もしくは他のステーションとの比率構成がそのステーションだけ異なることもあります。このような場合、そのステーションが他とは割合の異なる不良カテゴリを作り込んでいる可能性(他よりよいケース、もしくは他より悪いケースどちらともあり得ます)があります。よいケースが見つかった場合は、そのステーションに他も合わせれば全体的によくなっていきますね。
偏りや間差がなければ、全てのグループが同じ色の比率となるはずなので、目的変数における色の比率と異なるグループを見つけるのが着目点となります。機種間差・ライン間差・号機間差・ステーション間差など幅広い間差についての洞察を得られます。また、連続値の記録が少ないラインは少なくなく、カテゴリ値しか残っていない工程でも十分活用できます。