2016-09-22 1 views

Antwort

0

Um RPKM zu berechnen, benötigen Sie (gemappt) raw liest wie in BAM/SAM oder sogar CRAM-Dateien enthalten. Wiggle, BED und ihre Ableitungen wie bigWiggle sind komprimierte Versionen von denen, die nur die Abdeckung enthalten (hauptsächlich zum Plotten verwendet), das heißt, sie haben die zum Zählen benötigten Leseinformationen verloren und berechnen daher RPKM (oder FPKM/TPM auf diese Weise).

Der Standardansatz besteht darin, von einer BM-Datei zu starten, die Anzahl der Lesevorgänge für interessierende Bereiche zu ermitteln und RPKM usw. zu berechnen. Es gibt viele Pipelines wie this.

Wenn Bam-Dateien nicht verfügbar sind, enthält GEO normalerweise mindestens die raw fastq-Dateien (oder sra-Dateien, die in fastq konvertiert werden können) als Grundlage für das Mapping, um eine bam-Datei zu erhalten. Sehen Sie sich auch ArrayExpress an, sie könnten die RAW-Dateien für dieses Projekt haben, da es GEO spiegelt.

Vielleicht als ein Wort der Warnung, wenn Sie beabsichtigen, differenzielle Ausdrucksanalyse zu tun, müssen Sie von den rohen Zahlen, nicht die RPKM-Werte gehen.

Verwandte Themen