Upload
medku
View
4.177
Download
14
Embed Size (px)
DESCRIPTION
Nat Biotechnol. 2013 Jun;31(6):545-52. doi: 10.1038/nbt.2594. Epub 2013 May 19. Nat Biotechnol. 2011 Oct 2;29(10):886-91. doi: 10.1038/nbt.1991.
Citation preview
変態に R を与えた結果がこれだよ… 9 R で SPADE と SNE を使って次元削減と可視化
20140222Tokyo.R#36 @ ニフティ株式会社 新宿フロントタワー 18F
YF@Med_KU
本日の内容
次元削減と可視化SPADECyto Spanning tree Progression of Density normalized Events
t-SNEt-distributed stochastic neighbor embedding
本日の内容
本日の内容
SPADEviSNE
Cyto Spanning tree Progression of Density normalized Events (SPADE)n 次元定量データのパターンから分化系統樹作成
新規
退会
無課金厨課金厨
重課金厨 Nat Biotechnol. 2011 Oct 2;29(10):886-91Science. 2011 May 6;332(6030):687-96http://d.hatena.ne.jp/MikuHatsune/20130922
前回の Tokyo.R#35 で
次元削減法線形K-nearest neighbors algorithm (kNN)principal component analysis (PCA)linear discriminant analysis (LDA)canonical correlation analysis (CCA)feature vectors
非線形Sammon's mappingSelf-organizing mapPrincipal curves and manifoldsAutoencodersGaussian process latent variable modelsCurvilinear component analysisCurvilinear distance analysisDiffeomorphic dimensionality reduction
Kernel principal component analysisIsomapLocally-linear embedding(LLE)Laplacian eigenmapsManifold alignmentDiffusion mapsHessian LLE, Modified LLELocal tangent space alignmentLocal multidimensional scalingMaximum variance unfoldingNonlinear PCAData-driven high-dimensional scalingManifold sculptingRankVisuTopologically constrained isometric embeddingRelational perspective map
分子生物学の多次元データFlow cytometry (FCM)
SPADEdensity-dependent down-sampling
Original Down-sampling
http://d.hatena.ne.jp/ryamada22/20130611
SPADEminimum spanning tree
3D MST 2D MST
{nnclust}http://d.hatena.ne.jp/ryamada22/20130611
SPADEup-sampling
Original Up-sampling
http://d.hatena.ne.jp/ryamada22/20130611
309 人の女の子のデータ
309 人の女の子のデータ
309 人の女の子のデータ
歳をとる 背が伸びる
Stochastic neighbor embedding
N 次元データをに次元削減するとき, がと隣り合う条件付き確率を
がと隣り合う条件付き確率を
とする。
Stochastic neighbor embedding
との最小ミスマッチを, Kullback-Leibler divergenceの和を最小化して求める。
𝜂𝛾𝑡
𝛼 (𝑡 )
のときの解
Learning rate
のときの momentum
Symmetric SNE and t-SNE
symmetric SNE外れ値があるときによろしくないので
t-SNE自由度 1 の t 分布
実際には PCA を挟んで先に次元をいくらか落としてもよい。が大きすぎるとき,計算量が増えるので一様分布でランダムサンプリングする。
viSNE による可視化
小規模クラスターの検出
Minimum residual disease (MRD)