die Varianz bekommen numpy mit

ich, dass die Varianz jeder Spalte in einer CSV-Datei erhalten möchten habe ich schrieb folgendes:die Varianz bekommen numpy mit

import numpy as np 
import csv 
import collections 
Training  = 'Training.csv' 
inputFile  = open(Training,'r',newline='') 
cols_values  = collections.defaultdict(list) 
numericalValues = [] 
reader = csv.reader(inputFile) 
row = next(reader) 

for row in reader: 
    for col, value in enumerate(row): 
     cols_values[col].append(value) 
     numericalValues.append(cols_values[col]) 

np.var(numericalValues[0], dtype=np.float64)

Ich erhalte eine Fehlermeldung in np.var line:

TypeError: cannot perform reduce with flexible type

keine Ahnung was mir fehlt, die Werte sind definitiv Ziffern!

Quelle

2017-05-02 Engine

sind alle diese doppelte Präzision? –

nein, aber auch ohne Typdefinition bekomme ich den gleichen Fehler – Engine

Natürlich, weil Sie sagen, dass Sie verschiedene Datentypen haben. Egal, was Sie angeben (oder nicht), Sie müssen den gleichen Datentyp für alle Werte haben. Konvertieren Sie daher das Array in einen einzelnen Datentyp, bevor Sie die Varianz berechnen. –

Gibt es einen Grund, keine Pandas dafür zu verwenden?

import numpy as np 
import pandas as pd 
Training = 'Training.csv' 
df = pd.read_csv(Training) 
df.apply(np.var, axis=0)  # can also use `df.var(...)`

Sie wollen sicherstellen, dass alle Ihre Spalten numerische Werte haben. Sie können auch np.nanvar verwenden, um NaN Werte zu ignorieren, wenn Sie wählen.

Quelle

2017-05-02 15:44:00

danke für die antwort es hat funktioniert jetzt habe ich muss verstehen warum! – Engine

die Varianz bekommen numpy mit

Antwort

Verwandte Themen