2017-07-24 5 views
0

Ich möchte einen Datenrahmen lesen (der Tweets enthält) Zeile für Zeile, um den Text zu analysieren.Iterate über Pandas Datenrahmen Zeilen als reiner Text

import csv 
import pandas as pd 

df = pd.read_csv('tweets2.csv') 
df.head() 

for row in df.iterrows(): 
    print (row) 

Dieser Code, den ich schrieb, macht den Job nicht, da die "Zeile" auch den Index enthält. Stattdessen möchte ich den einfachen Text, den ich weiter verarbeiten werde.

Antwort

1

könnten Sie df.values verwenden:

for row in df.values: 
    print(row) 

Beispiel:

df = pd.DataFrame({'Col1': [1, 2, 3, 4, 5], 'Col2' : ['a', 'b', 'c', 'd', 'e']}) 

print(df) 

    Col1 Col2 
0  1 a 
1  2 b 
2  3 c 
3  4 d 
4  5 e 

for row in df.values: 
    print(row) 

[1 'a'] 
[2 'b'] 
[3 'c'] 
[4 'd'] 
[5 'e'] 
+1

Danke, es hat seinen Zweck erfüllt! – Alex

0

iterrows yields (index, Series) pairs

So können Sie sie in der for-Schleife auspacken könnte:

for i, row in df.iterrows(): 
    print(row) 

Wenn Sie die i nicht verwenden, sollten Sie sie in _ ändern.

Mit iterrows ist jeder row ein Series. Wie durch @ cᴏʟᴅsᴘᴇᴇᴅ gezeigt, ist eine alternative values verwendet:

for row in df.values: 
    print(row) 

Mit dieser Methode jedes row ein numpy Array ist (so wird die Kennzeichnung verloren).

Verwandte Themen