- Ich versuche, Multi-Layer-NN zu verwenden, um die Wahrscheinlichkeitsfunktion in einem partiell beobachtbaren Markov-Prozess zu implementieren.
- Ich dachte, die Eingaben für das NN wären: aktueller Zustand, ausgewählte Aktion, Ergebniszustand; Die Ausgabe ist eine Wahrscheinlichkeit in [0,1] (Wahrscheinlichkeit, dass die Durchführung der ausgewählten Aktion im aktuellen Zustand zum Ergebniszustand führt)
- Beim Training habe ich das NN mit den zuvor genannten Eingaben gefüttert und ihm für jeden bereits aufgetretenen Fall die Ausgabe=1,0 beigebracht.
Das Problem :
Für fast alle Testfälle liegt die Ausgabewahrscheinlichkeit bei 0,95. Kein Ergebnis lag unter 0,9! Sogar für fast unmögliche Ergebnisse gab es diese hohe Wahrscheinlichkeit.
PS: Ich denke, das liegt daran, dass ich ihm nur geschehene Fälle beigebracht habe, aber keine nicht geschehenen. Aber ich kann ihm nicht bei jedem Schritt in der Episode die Ausgabe=0.0 für jede nicht eingetretene Aktion beibringen!
Gibt es Vorschläge, wie dieses Problem gelöst werden kann? Oder vielleicht eine andere Möglichkeit, NN zu verwenden oder prob Funktion zu implementieren?
感謝