2017-01-03 5 views
-1

Trainingsdatensatz:Machine Learning Algorithmus für Arzneimittel zu finden, basierend auf Diagnose

-------------------- 
Patient Age:  25 
Patient Weight:  60 
Diagnosis one:  Fever 
Diagnosis two:  Headache 

    > Medicine:   **Crocin** 

--------------------------------- 
Patient Age:  25 
Patient Weight:  60 
Diagnosis one:  Fever 
Diagnosis two:  no headache 

    > Medicine:   Paracetamol 

---------------------------------- 

Daten Geben Probe-Set mit Arzneimittel/medicne zu Patienten verschrieben.

Wie finden Sie welche Medizin basierend auf Patientendaten (Alter/Gewicht) und Diagnose (Fieber/Headeache/etc)?

Antwort

1

Die Aufgabe, die Sie anstreben, ist Klassifizierung, da die Zielwerte eine nominale Skala sind.

Um den richtigen Wortschatz zu erhalten, ist der Rest der Arbeit bereits von anderen Bibliotheken wie Python, die die meisten relevanten Algorithmen und viele Daten enthält, um sie zu testen und die Algorithmen zu lernen.

Es scheint, dass Sie vier Variablen als Eingabe haben:

  1. Alter - metrische Variable
  2. Gewicht - metrische Variable
  3. Diagnose ein - Sollgröße
  4. Diagnose zwei - Sollgröße

Sie müssen Sie nominale Variablen kodieren, wo ich ein Array aller möglichen Diagnosen empfehlen würde, wie z wie:

Fieber, Schmerzen Kopfschmerzen, Magen, x - [0, 0, 0, 0]

Jetzt wird jedes Array-Element auf 1 gesetzt werden, wenn die Diagnose richtig und 0 sonst. Daher haben Sie insgesamt 2 + n Eingabevariablen, während n die Anzahl der möglichen Symptome ist.

Dann können Sie einfach auf die sklearn Bibliothek gehen und starten Sie den einfachsten Klassifikationsalgorithmus verwendet: Nearest Neighbour Classification

Wenn dies nicht gutes Ergebnis hat ergeben (wahrscheinlich werden die Ergebnisse nicht gut sein), können Sie beginnen, anspruchsvollere verwenden Modelle (SVM, RandomForest). Doch zuerst sollten Sie das Vokabular lernen und einfache Modelle verwenden, um die Methoden und die Verarbeitungskette kennenzulernen.

Verwandte Themen