[回避策]
R 2.9.0に落として、bioconductorをインストールすると、
biocinstall version 2.4.13, Bioconductor version 2.4 がインストールされて、affyでもcel ver.3が読めるようになる
相変わらずconvertCelは落ちる...
[問題]
R 2.12.2, Bioconductor 2.9(のはず)
読みたいアレイ http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1986 のraw data
affyパッケージの、ReadAffyで読み込めない
> ReadAffy("GSM35544.cel.txt")
Error in try(.Call("ReadHeaderDetailed", filename, PACKAGE = "affyio")) :
End of file reached unexpectedly. Perhaps this file is truncated.
以下にエラー read.celfile.header(filenames[i], info = "full") :
Failed to get full header information for GSM35544.cel.txt
CELファイルはversion3はテキストだが、version4はバイナリらしい。
参考 http://www.affymetrix.com/support/developer/powertools/changelog/gcos-agcc/cel.html#V3
[代案1: Affymetrixが出しているファイルコンバーターを使う]
Affymetrix Power Tools (APT) 1.4.4/1.4.3をインストール
1.4.4はlion対応、1.4.3はsnow leopard対応(バイナリ)
使い方
ファイルをコンバートするのは、apt-cel-convert
-f, --format: 元ファイルの形式。引数は text(version4), xda(version 3), agcc
-i: 上書き(defaultは'false')
-o: 出力先ディレクトリ
http://media.affymetrix.com/support/developer/powertools/changelog/apt-cel-convert.html
結果:segfaultになる。version 4のcel fileでも失敗
GSM173080はバージョン4(readAffyでも読める)
apt-1.14.3-i386-apple-snowleopard/bin/apt-cel-convert -f text -o test2 GSM173080.CEL
Converting GSM173080.CEL to test2/GSM173080.CEL
Segmentation fault
[代案2: BioconductorのaffxparserライブラリにあるconvertCelを使う]
version 4へ変換する。他のフォーマットへは変換できないが読み込みは出来るらしい・・・?
結論から言うとRが落ちる。MacOS 10.6上、およびサーバ上にて確認
> library(affxparser)
>convertCel("mouse_tissue/GSM35544.cel.txt","mouse_tissue/GSM35544.cel.v4.txt",version=4,readMap=NULL, writeMap=NULL)
terminate called after throwing an instance of 'affymetrix_calvin_exceptions::FileNotOpenException'
Abort trap
コレもダメだ。
[代案3: AffymetrixのExpression Consoleを使う]
開かないらしい(windowsなので未確認)