1

Ich trainierte Daten von 500 Geräten, um ihre Leistung vorherzusagen. Dann wandte ich mein trainiertes Modell auf einen Testdatensatz für weitere 500 Geräte an und zeigte ziemlich gute Vorhersageergebnisse. Jetzt wollen meine Führungskräfte, dass dieses Modell auf einer Million Geräten, nicht nur auf 500, gut funktioniert. Offensichtlich haben wir keine Daten für eine Million Geräte. Und wenn das Modell nicht zuverlässig ist, möchte ich, dass ich die erforderliche Menge an Zugdaten entdecke, um eine zuverlässige Vorhersage für eine Million Geräte zu treffen. Wie soll ich mit diesen Führungskräften umgehen, die keinen Hintergrund in der statistischen Analyse und Modellierung haben? Irgendwelche Vorschläge? DankeWie kann man Führungskräften die Zuverlässigkeit eines Vorhersagemodells nachweisen?

+0

Ich vermute, dass es statistische Modelle für diese sein wird, aber ich vermute auch, erfordern sie viel spezifischere Daten. Ich weiß nicht viel über maschinelles Lernen, also könnte es leicht meine Schuld sein, aber Ihre Beschreibung scheint mir sehr vage zu sein. – biziclop

+5

Dies ist kein Problem der Führungskräfte, die nicht über maschinelles Lernen wissen. Ihr Punkt ist gültig. Es ist möglich, dass Ihr Trainings- und Testset nicht repräsentativ für Ihren gesamten Datenraum ist und dass Ihr Modell nur für diese voreingenommene Teilmenge funktioniert, aber nicht für alle Daten verallgemeinert werden kann. Sie müssen ihnen zeigen, dass der kleine Datensatz, den Sie abgetastet haben, unverzerrt ist. Das Problem ist einfach zu verstehen. Betrachten wir z.B. dass das Trainings- und Testset nur männliche Kunden enthält. Selbst wenn das Modell gut funktioniert, kann es bei einem echten Datensatz mit männlichen und weiblichen Kunden schlecht funktionieren. – cel

+0

@cel Vielen Dank für Ihre Antwort. Ihr Punkt ist absolut gültig. Gibt es eine Korrelation zwischen der Größe des Zuges und der Zuverlässigkeit des Modells? Denn im nächsten Schritt muss ich ihnen zeigen, dass der zufällig ausgewählte Zugsatz groß genug ist, um ein zuverlässiges Modell zu bauen. – Mohammad

Antwort

3

Ich habe vorgeschlagen, @cep, um seinen Kommentar als Antwort zu schreiben - einschließlich der Bereitstellung der variance und bias Berechnungen. In jedem Fall könnte es

hinzugefügt werden „nicht schnell sein Execs anzunehmen, im Wesentlichen nicht in der Lage sind, in Bezug auf die technischen oder mathematischen Konzepte“

Zwar gibt es Dilbert Manager sein kann aus .. Irgendwo Ich habe einige von ihnen selbst gesehen. Häufiger kommen Manager durch harte Arbeit zu ihren Positionen. Sie sind wahrscheinlich eingerostet - aber die Fähigkeiten sind wahrscheinlich noch da.

In diesem Fall, ob sie einen "Hintergrund in der statistischen Analyse und Modellierung" haben oder nicht, wenden sie gesunden Menschenverstand an.

Als Erstes können Sie den richtigen Kontext und die richtige Terminologie angeben. für die Bereitstellung von konkreten Werten: @cel hat etwas davon erwähnt

  • Annahmen
    • welche Annahmen Sie über die Daten.
    • welcher Grundlage ist es Extrapolation der begrenzten Daten zu berücksichtigen
    • warum das sollte
    • auf die 99,5% der nicht getesteten Daten anzuwenden
  • Datenverteilung
    • Grund deskriptiven Statistiken extrapoated Ergebnisse trauen
    • Ihre Annahme der Apriori-Verteilung der Daten.Begründen Sie, warum Sie es wählte
  • Modellierung
    • die Modelle/Ansätze in Betracht gezogen wurden und warum
    • das Modell, das Sie tatsächlich wählte und warum
    • wie kamen Sie auf die Hyper
    • , wie Sie trainierte das Modell
  • Ergebnisse
    • statistischen Maßnahmen der Anpassung und Fehlerrate
Verwandte Themen