3. LOWESSとSplineによる標準化（実践編）

さて，前回理論でお話した，LOWESSとSplineによる標準化について，実際どうやるか？を説明したいと思います．色々，簡単にできるRパッケージがないかなーとか，ずっと探していたのですが，しっくりくるものが無かったので，腹をくくって自分でコーディングしてみました．

LOWESSとSplineのコーディングは行っていたのですが，クロスバリデーションのコーディングが面倒だからずっと据え置きにしていたのですが，これを良い機会として書かせていただきました．

ソフトウェア自体はものすごく単純で，以下のフォーマットで記載されているようにデータ行列を作成します．

１列目はサンプル名

２列目はQC（TRUE）かサンプル（FALSE）

３列目は分析順番

４列目以降は各化合物の定量値です．

ポイントは，おそらく，このようなデータ行列はエクセルかなにかで整理すると思うのですが，整理した後は，必ず「タブ区切りテキストファイル」として保存してください．

プログラムおよび，デモ用のデータ行列は以下のサイトからダウンロードできるようになっています．

http://prime.psc.riken.jp/Metabolomics_Software/LOWESS-Normalization/index.html

以下，使い方

１．ダウンロードしたプログラムZipファイルをまず解凍してください．

２．フォルダー内にあるLowessNormalizationSample.exeを開いてください．

３．「Browse」ボタンをクリックし，用意していただいたデータ行列を選択してください．

４．「Load」ボタンをクリックし，指定したファイルのデータを読み込んでください．うまく読み込めていたら，QC numberやMinimum span size等が表示されます．フォーマットが違っていたら，そのエラーメッセージが表示されますので，それに従って修正してください．

５．前回のコラムに書きましたが，LOWESSとSplineによる標準化でのパラメーターは，Spanと呼ばれる0から1の値です．これを客観的に決定するためにQCサンプルのみの情報を使った7 fold cross validationにより，最適パラメーターを決定するようにしました．「Span opt.」ボタンからできます．

６．最後に，「Export」ボタンを押したら，標準化された結果が，元のデータ行列ファイルと同じ階層に出力されます．

皆様のお役に立てればと思うのですが…何か，バグ等がございましたら，管理人までお知らせください．

それでは，本日は短いですが，この辺で！

Google Sites

Report abuse