2
Ich habe eine CSV-Datei, in der es immer zwei erste Spalten, aber mit unterschiedlicher Anzahl von Spalten für verschiedene Dateien. Die csv kann wie folgt aussehen:Laden CSV von verschiedenen Spalten Nummer mit Pandas
Gondi,4012,227,233,157,158,149,158
Gondi,4013,227,231,156,159,145,153
Gondu,4014,228,233,157,158,145,153
Gondu,4015,227,231,156,159,149,158
Vorerst ich mit NumPy
arbeite, und mein Code, um diese Daten zu laden ist:
import numpy as np
def readfile(fname):
with open(fname) as f:
ncols = len(f.readline().split(','))
name = np.loadtxt(fname, delimiter=',', usecols=[0],dtype=str)
ind = np.loadtxt(fname, delimiter=',', usecols=[1],dtype=int)
data = np.loadtxt(fname, delimiter=',', usecols=range(2,ncols),dtype=int)
return data,name,ind
Kann ich das gleiche tun mit pandas
effizienter?
Wie funktioniert es? – jezrael