Ich fragte mich, ob ich die Daten für die Durchführung von PCA auf meine Proben in R transponieren muss. Ich verwende die integrierte Funktion prcomp(). Mein Datensatz ist RNA-Seq-Expressionsdaten und die Spalten sind Proben und Zeilen sind Genausdrücke. Es scheint, dass es in beiden Richtungen funktioniert, aber gibt es einen Konsens darüber, was in den Zeilen/Spalten sein sollte? Vielen Dank!PCA mit Prcomp für RNA Seq in R
1
A
Antwort
0
Die meisten Biostatistik-R-Pakete tun dies, indem sie den Datenrahmen transponieren. Ich gebe Ihnen einen Beweis:
Die RUV SVD Faktorisierungsmethode ist in RNA-Seq üblich. Sehen Sie es Quellcode:
https://github.com/drisso/RUVSeq/blob/master/R/RUVg-methods.R
if(isLog) {
Y <- t(x)
} else {
Y <- t(log(x+epsilon))
}
x
ist das Gen-Matrix-Tabelle. Siehst du den Transponiervorgang? Später im Code gibt das Paket die transponierte Matrix (Y) in die svd
-Funktion ein.
svdWa <- svd(...)
Um das Leben und andere einfacher zu machen, möchten Sie möglicherweise Gene in Ihre Spalten und Proben in Ihren Zeilen setzen.
Verwandte Themen
- 1. PCA oder MDS für Gruppen in R
- 2. grep RNA Klammerdarstellung mit R
- 3. R PCA Analyse Fehler
- 4. PCA Skalierung mit ggbiplot
- 5. Mit ggfortify und ggrepel für pca
- 6. Autoplot prcomp mit Prozent
- 7. Wie einen neuen Vektor auf einen PCA-Raum in R
- 8. Wie man PCA in prcomp umwandelt, um ursprüngliche Daten zu erhalten
- 9. r - ggplot gepaart Seq
- 10. R: PCA-Plot mit verschiedenen Farben für Sites
- 11. Dimensionsreduktion für Clustering in R (PCA und anderen Methoden)
- 12. Holen Sie PCA-Datenpunkte in R
- 13. Begrenzung der PCA-Variablen für Plotten
- 14. Kann ich Feature-Auswahlmethoden für PCA-Spalten in R verwenden?
- 15. Wenden Sie eine Seq() in R-Funktion
- 16. Wie berechnet man Zentroide in PCA?
- 17. R: kalibrierte Achsen zum PCA-Biplot hinzufügen in ggplot2
- 18. PCA für die Bildverarbeitung
- 19. Herausfinden der RNA-Basenpaarung in gegebener Struktur
- 20. PCA Für kategoriale Funktionen?
- 21. vienna RNA falten Python Installationsproblem
- 22. Grundlegendes Beispiel für PCA mit Matplotlib
- 23. tun PCA auf sehr großen Datensatz in R
- 24. Berechnung neuer Variablen von Hauptkomponenten - PCA in R
- 25. Reshape opencv Bild für PCA
- 26. Bildkomprimierung mit PCA
- 27. PCA mit NAs produziert Mismatch zwischen Teilmenge und Datensatz
- 28. R-Funktion prcomp schlägt mit NA-Werten fehl, obwohl NA zulässig sind
- 29. R-Code Automatisierung
- 30. Probleme mit Shiny PCA und ggbiplot Färbung
In der Tat wird es "in beide Richtungen", mathematisch gesprochen. Für die meisten Datenanalysen enthalten die Spalten jedoch Variablen von Interesse (Gene in Ihrem Fall), die Zeilen enthalten Beobachtungen dieser Variablen (in Ihrem Fall Beispiele). – neilfws
Danke @neilfws! Nur um zu verdeutlichen, bin ich daran interessiert, die Beziehungen zwischen den Proben zu sehen, indem ich Gene als Vektoren benutze. Also sollten noch die Gene in den Spalten sein? –