Kann nicht speichern die document_id

Ich habe tb_sentence Tabelle:Kann nicht speichern die document_id

========================================================================= 
| id_row | document_id | sentence_id |   sentence_content  | 
========================================================================= 
| 1 |  1  | 0  | Introduction to Data Mining. | 
| 2 |  1  | 1  | Describe how data mining.  | 
| 3 |  2  | 0  | The boss is right.    | 
=========================================================================

I tokenize der sentence_content wollen, so dass die tb_tokens Tabellen enthalten:

========================================================================== 
| tokens_id | tokens_word | tokens_freq | sentence_id | document_id | 
========================================================================== 
|  1  | Introduction |  1 |  0  |  1  | 
|  2  | to   |  1 |  0  |  1  | 
|  3  | Data   |  1 |  0  |  1  | 
|  4  | Mining  |  1 |  0  |  1  | 
|  5  | Describe  |  1 |  1  |  1  | 
etc...

hier ist mein Code:

$sentence_clean = array(); 
$q1 = mysql_query("SELECT document_id FROM tb_sentence ORDER BY document_id ") or die(mysql_error()); 
while ($row1 = mysql_fetch_array($q1)) { 
    $doc_id[] = $row1['document_id']; 
} 
$q2 = mysql_query('SELECT sentence_content, sentence_id, document_id FROM tb_sentence ') or die(mysql_error()); 
while ($row2 = mysql_fetch_array($q2)) { 
    $sentence_clean[$row2['document_id']][] = $row2['sentence_content']; 
} 
foreach ($sentence_clean as $kal) { 
    if (trim($kal) === '') 
     continue; 
    tokenizing($kal); 
}

mit der Funktion der Tokenisierung ist:

function tokenizing($sentence) { 
    foreach ($sentence as $sentence_id => $sentences) { 
     $symbol = array(".", ",", "\\", "-", "\"", "(", ")", "<", ">", "?", ";", ":", "+", "%", "\r", "\t", "\0", "\x0B"); 
     $spasi = array("\n", "/", "\r"); 
     $replace = str_replace($spasi, " ", $sentences); 
     $cleanSymbol = str_replace($symbol, "", $replace); 
     $quote = str_replace("'", "\'", $cleanSymbol); 
     $element = explode(" ", trim($quote)); 
     $elementNCount = array_count_values($element); 

     foreach ($elementNCount as $word => $freq) { 
      if (ereg("([a-z,A-Z])", $word)) { 
       $query = mysql_query(" INSERT INTO tb_tokens VALUES ('','$word','$freq','$sentence_id', '$doc_id')"); 
      } 
     } 
    } 
}

Das Problem ist Die document_id kann nicht gelesen werden und kann nicht in tb + Tokens-Tabelle eingefügt werden. Wie kann man diese document_id anrufen? danke :)

BEARBEITETE FRAGE: jedes Wort (das Ergebnis der Tokenisierung) hat document_id und sentence_id. Mein Problem ist, kann die document_id nicht anrufen. Wie kann man sowohl sentence_id als auch document_id in jedem Wort nennen?

Quelle

2012-08-02 bruine

Gute Arbeit, die Frage zu stellen. EXCEPT ... "das Problem ist Die document_id kann nicht gelesen werden und kann nicht in tb + tokens Tabelle eingefügt werden" - können Sie genauer sein? Was läuft schief? – Smandoli

@Smandoli Entschuldigung, wenn mein Englisch schlecht ist. Jeder 'sentence_content' hat die' document_id'. Ich muss auch die Tokens-Wörter mit der document_id einfügen, aber ich kann die document_id nicht lesen – bruine

Es gibt keine '$ row ['document_id']' weil Sie 'document_id' nicht in die Auswahlliste der zweiten Abfrage aufgenommen haben. –

Ich glaube, Sie nicht diese Code benötigen:

$q1 = mysql_query("SELECT document_id FROM tb_sentence ORDER BY document_id ") or die(mysql_error()); 
while ($row1 = mysql_fetch_array($q1)) { 
    $doc_id[] = $row1['document_id']; 
}

Array von doc_id $ wird nie benutzt worden brauchen

if (trim($kal) === '') 
     continue;

$ kal ist ein Array und nicht

getrimmt werden

$sentence_clean[$row2['document_id']][] = $row2['sentence_content'];

weil Sie gehen zu den sentence_id aufzunehmen, sollte es $ row2 [ 'sentence_id'], nicht []

(natürlich sollte man darauf achten, da in derselben document_id nicht gleichen sentence_id sein wird oder sonst sollten Sie es concat)

dies ist ein paar Korrekturen von mir:

$sentence_clean = array(); 
$q2 = mysql_query('SELECT sentence_content, sentence_id, document_id FROM tb_sentence ') or die(mysql_error()); 
while ($row2 = mysql_fetch_array($q2)) { 
    $sentence_clean[$row2['document_id']][$row2['sentence_id']] = $row2['sentence_content']; 
} 

foreach ($sentence_clean as $doc_id => $kal) { 
    tokenizing($kal, $doc_id); 
} 

function tokenizing($sentence, $doc_id) { 
    foreach ($sentence as $sentence_id => $sentences) { 
     $symbol = array(".", ",", "\\", "-", "\"", "(", ")", "<", ">", "?", ";", ":", "+", "%", "\r", "\t", "\0", "\x0B"); 
     $spasi = array("\n", "/", "\r"); 
     $replace = str_replace($spasi, " ", $sentences); 
     $cleanSymbol = str_replace($symbol, "", $replace); 
     $quote = str_replace("'", "\'", $cleanSymbol); 
     $element = explode(" ", trim($quote)); 
     $elementNCount = array_count_values($element); 

     foreach ($elementNCount as $word => $freq) { 
      if (ereg("([a-z,A-Z])", $word)) { 
       $query = mysql_query(" INSERT INTO tb_tokens VALUES ('','$word','$freq','$sentence_id', '$doc_id')"); 
      } 
     } 
    } 
}

ich analysieren die document_id zu der Funktion

Quelle

2012-08-02 13:58:09 ivantedja

oh, doof mich .. ja, du hast Recht ..! großartig! vielen Dank @ivantedja. Ich lerne viele Dinge von dir :) – bruine

Kann nicht speichern die document_id

Antwort

Verwandte Themen