Iterate über Pandas Datenrahmen Zeilen als reiner Text

Ich möchte einen Datenrahmen lesen (der Tweets enthält) Zeile für Zeile, um den Text zu analysieren.Iterate über Pandas Datenrahmen Zeilen als reiner Text

import csv 
import pandas as pd 

df = pd.read_csv('tweets2.csv') 
df.head() 

for row in df.iterrows(): 
    print (row)

Dieser Code, den ich schrieb, macht den Job nicht, da die "Zeile" auch den Index enthält. Stattdessen möchte ich den einfachen Text, den ich weiter verarbeiten werde.

Quelle

2017-07-24 Alex

könnten Sie df.values verwenden:

for row in df.values: 
    print(row)

Beispiel:

df = pd.DataFrame({'Col1': [1, 2, 3, 4, 5], 'Col2' : ['a', 'b', 'c', 'd', 'e']}) 

print(df) 

    Col1 Col2 
0  1 a 
1  2 b 
2  3 c 
3  4 d 
4  5 e 

for row in df.values: 
    print(row) 

[1 'a'] 
[2 'b'] 
[3 'c'] 
[4 'd'] 
[5 'e']

Quelle

2017-07-24 08:39:53

Danke, es hat seinen Zweck erfüllt! – Alex

iterrows yields (index, Series) pairs

So können Sie sie in der for-Schleife auspacken könnte:

for i, row in df.iterrows(): 
    print(row)

Wenn Sie die i nicht verwenden, sollten Sie sie in _ ändern.

Mit iterrows ist jeder row ein Series. Wie durch @ cᴏʟᴅsᴘᴇᴇᴅ gezeigt, ist eine alternative values verwendet:

for row in df.values: 
    print(row)

Mit dieser Methode jedes row ein numpy Array ist (so wird die Kennzeichnung verloren).

Quelle

2017-07-24 08:41:49 Marein

Iterate über Pandas Datenrahmen Zeilen als reiner Text

Antwort

Verwandte Themen