Ver. 4.6.1で、CSV/TSVファイルやフォルダから、すぐにプロット表示・分析を始められるワンタッチな設定機能「ファイルから登録 」が追加され、Ver. 4.7.0ではワンタッチなインストール機能で簡単にインストールでき、Functionでデータ編集が出来るようになりました。
デジタルネイティブ時代にふさわしい工程のカイゼン活動を支えるツールとして、また、DXに対応したQC7つ道具「DX版QC7つ道具」としてDN7は考案されました。データが揃っていれば、必ずしも工程の知見がなくても様々な可視化を行うことが可能となり、手作りでグラフを作ることなく、「まず見て、考える」といったカイゼン活動が可能になります。以下にあるように各機能においてBig Dataに対応できるよう工夫されています。
主な特徴
・重要変数の絞り込みができる ⇒ 不良の原因を多数の変数から絞り込み、当たりをつけることができる
・結果に影響する間差を検出できる ⇒ 特定の号機で発生している不良など、機差や材料間差・ロット間差などを検出できる
・多数の変数の相関関係の分析ができる ⇒ 複数工程にまたがった複雑な変数関係を俯瞰して把握でき、工程改善に繋げることができる
・変化点検出や連動性把握が容易 ⇒ いつ変わったか・どこで変わったかが素早く分かり、不良率と連動している変数も見つけられる
・前処理の機能(工程データ特有のノイズ・外れ値処理) ⇒ いろいろ問題になる外れ値除去などを良しなにしてくれる(必要に応じて自動処理を外すこともできる)
・分析画面は製造工程によらない(汎用分析設計) ⇒ 一度使い方を覚えればどんな工程でも使え(教育負荷少・多能工向き)、ガバナンスコントロールも容易
・正規分布状でなくても正しく見れるようになっている ⇒ 非正規分布なデータでもミスリーディングしにくく、データの分解能不足なども分かる
・ビッグデータで破綻しないように設計 ⇒ 従来の統計手法や可視化手法では破綻しがちなビッグデータでもデータをより正確に見れる
Big Data分析において、X-Rプロットの代替(平均値やレンジは算出データ数が多くなりすぎたり、外れ値や欠損値を含むと統計値としての有効性が薄れます。Big Dataがとれるようになったからといってサンプリング数をむやみに増やすようなことは止めましょう)として用いる全数データの時系列もしくはワーク・製品ID系列のプロットです。データのトレンド変化や異常値・外れ値の可視化に使用します。
ラベルプロットという機能(グラフ上部にある青いラベル群)があり、マガジン・ロット・品種といった纏まりの切り替わりタイミングと変数の変動との関係を把握することができます。
AP+DN7は、データベースからデータ取得・紐付け統合したデータのダウンローダとしても使用できます。また、任意のプロットで[右クリック]→[Plot View]を選択すると、そのワークや製品に関連するデータを一覧として参照できる機能もあります。
一般的に全数プロットはデータ量が多いと、打点が多すぎて海苔のようにベタっと潰れてデータの状況が分からなくなったり、多くなりすぎると描画さえできなくなってしますが、AP+DN7では、データ量が多い場合に自動的に、高速にレンジ推定を行うアルゴリズムを用いてデータ推移を俯瞰できる高速モードに切り替わるため、Big Dataにおいても使用することができます。
Big Data分析においては打点が多く過密しがち(多すぎて潰れる)、非正規分布であることが多いため、全数プロットFPPだけでは外れ値などは把握できるものの、分布変動を把握することが難しくなります。いくつかのデータ群毎に密度曲線(Density Plot)を描画し系列に沿って並べることで、工程の変動を視覚的に把握することができます。
DN7では、RLPのサイドに点でプロットされているグラフが付加されています。これは、分布の増加・減少傾向を示しており、分布が下方向(全体として値が小さくなる方向に遷移)に動いているか、上方向に動いているか(値が大きくなる方向に遷移)しているか、が分かります(ワッサースタイン距離を応用したもので分布間の距離を示す数値です)。まっすぐな場合は工程変動があまりないということを意味しています。継続してずれていく場合は特性のドリフトがある、また、急激に変動した場合は何らかの工程の変化点であることを示唆します。
工程での年間変動など長期間のデータや曜日・シフトなどで変動しうるパラメータを可視化します。例えば不良率や生産量の推移などを長期にわたって可視化することができ、週明けが不良率が高いとか、昼休み空けに特定のアラームが発生しやすいといった、特定のパターンの変動などを把握することが可能です。
季節/曜日/時間変動・人の生産活動に依存する変動把握に効果的です。生産量の推移などの傾向は一目で確認できます。
AP+DN7では、Daily(縦軸が24時間)とWeekly(縦軸が曜日)の2種類を選択することができます。日々起こることか、それとも、週次で起こることか、といった基準で使い分けましょう。
複数変数間の相関関係(散布図)を確認できます。相関関係やクラスタ(データの集まり:層別や分離後に分析を行います)を一目で把握できる良さがありますが、残念ながら、BigData分析、特に多数の変数の見守り(大量の変数間相関把握)には向きません。このツールでは7変数までの表示に対応しています。それ以上の変数を扱う場合は、平行座標プロットPCPをご活用ください。
一般的な散布図はデータ量が多くなると描画できなくなります。AP+DN7では、データ量が多い場合、濃淡散布図(正確には等高線図)にし、高速に2次元の密度推定を行うアルゴリズムを採用しており、Big Dataにおいても使用することができます。高次元の場合は、特に重要と思われる変数に絞って活用しましょう。(濃淡散布図で白い点で表示される打点は孤立点[低密度な領域にある点:外れ値も含まれている可能性があります]と推定されたデータです。孤立点は、5%で最大1000個までを表示します)
パラレルコーディネートでは、目的の変数に関して、大量の変数間の相関関係を確認できます。それぞれの軸(各軸が左右方向に平行に配置されています)で色が分かれている軸が注意すべき変数、すなわち何らかの相関がある軸と判断してください(例えば相関係数順に並べた場合は両端に着目すべき色が虹色に分かれた軸が見えます。これらが重要変数です。逆に、色が混ざっている軸は相関が低いといえます)。
バランスよく虹色になっている軸では線形の相関(カラーバーと同じ色配置[正の相関]もしくは反転した色配置[負の相関])が認められます。色が分離しているものの偏った色配置になっている場合は非線形の関係が考えられますので、何らかの関数変換を行なったり、クラスタリングし層別する必要があります(分離している変数と目的変数で散布図で関係を確認することをお勧めします)。
例えば、不良判定変数を目的変数として関係がある変数を把握したり、不良内容(カテゴリ値)に対して機種依存性やステーション依存性を把握することができます。また、各変数の一部の領域通るデータを選択表示して、それら選択されたデータが他の変数でどのような値をとるかを調べることができます。この場合、不良対象製品がどのようなデータ履歴があるかを把握できます。
AP+DN7では、PCPを簡単にパラレルカテゴリ(平行セット/Parallel Sets:カテゴリ値のみを抜粋して表示)にする機能が付いていますので、層別や間差解析に活用できます。
目的変数との関係性が高い変数を抽出し、関係性とその強さを可視化します。魚の骨の重要な部分を抜き出し、重要度 (関係性の強さを太さで表現) を見える化するイメージです。データに基づいて算出 (データドリブンでの算出) しますので、魚の骨の知見がなくても可視化できます。
共起関係(ある現象と別の現象が同時に出現する頻度に着目した関係)を可視化できます。あるアラームが発生した際に同時に発生するアラーム、ある状態が発生した際に発生するイベントなどの関係を可視化できます。
(こちらは通常のCSVデータでは対応できないため、少なくとも現状は指定フォーマットのCSVを作成いただく必要があります)