Ich habe nach Methoden gesucht, dies zu tun, aber die Verwendung von count (unique()) sucht nicht nach anderen Faktoren. Ein Beispieldatensatz ist unten.Suche nach eindeutigen taxonomischen Zählwerten basierend auf der Hierarchie
+------+------+--------------+----------------+-----------+-------+
| Site | Date | TaxonID | Family | Genus | Count |
+------+------+--------------+----------------+-----------+-------+
| X1 | 2006 | Chironomidae | Chironomidae | - | 2 |
| X1 | 2006 | Saetheria | Chironomidae | Saetheria | 1 |
| X1 | 2006 | Chimarra | Philopotamidae | Chimarra | 5 |
+------+------+--------------+----------------+-----------+-------+
Counting TaxonID würde über rechnen, da in diesem Fall die Zeile 1 sollte nicht aufgrund geringerer identifiziert etwas gezählt werden, als dieser taxonomischen Ebene, dh Zeile 2.
In diesem Datensatz, die eindeutigen Werte in Zählen Genus wird funktionieren, aber in einem Beispiel, in dem Zeile 2 nicht vorhanden ist, wird dies nicht funktionieren.
Dies ist eine abgeschnittene Tabelle, in der normalerweise auch Phylum, Klasse und Reihenfolge vorhanden sind, und TaxonID kann etwas in einem dieser Felder sein.
Ich bin mir nicht sicher, ob ich verstehe, was Sie fragen. –
Ich hatte Angst, ich wäre nicht klar genug. Ich suche im Grunde nach der Anzahl der einzigartigen Gruppen. Vielleicht ein anderes Beispiel wäre, roter Tisch, roter Stuhl, roter NA, blauer NA. Hier sind die rote Tabelle, der rote Stuhl und die blaue NA eindeutig, und der höhere Ebenenfaktor, die Farbe, wird ignoriert, wenn ein niedrigerer Ebenenfaktor, ein Objekt, existiert, aber nicht ignoriert wird, wenn es keinen niedrigeren Ebenenfaktoreintrag gibt. Klärt es das besser? –
Und was erwarten Sie als Folge davon? Ich meine in deinem Posted Beispiel. 2 oder 3? –