Ich arbeite derzeit mit einem System, das Terminierungsentscheidungen basierend auf einer Reihe von Anfragen und dem Systemzustand trifft.
Ich möchte den Eingangsstrom von echten Inputs nehmen, einige der Komponenten simulieren und Simulationen gegen den Rest durchführen. Die Idee ist, es für die Planung in Bezug auf die Systemkapazität zu verwenden (d. h. wann bestimmte Komponenten zu skalieren sind), bestimmte Ausfallmodi zu ermitteln und die Auswirkungen von Änderungen am Codebasis zu analysieren (d. h. Simulationen mit Version A im Vergleich zu Simulationen mit Version B).
Ich kann alles in Bezug auf das tun, außer einen geeigneten Eingangsstrom zu erzeugen. Die exakte Wiedergabe des Inputs aus der Produktion war nicht sehr hilfreich, da es schwierig ist, einen lang genug Datenstrom zu erhalten, um einige der Verhaltensweisen herauszufinden, die ich zu finden versuche. Mit anderen Worten, wenn die Produktion nach 300 Tagen Input zusammenbricht, habe ich nicht genügend Daten, um es herauszufinden, bis nachdem es zusammengebrochen ist. Das Wiederholen des gleichen Eingabesatzes wurde in Betracht gezogen; aber nach einigen ersten Versuchen sind sich alle Entwickler einig, dass die Simulation anscheinend "mehr Zufall" benötigt.
Zu diesem bestimmten System:
- Der Input besteht aus einer Reihe unregelmäßig verteilter Ereignisse (d. h. ein stochastischer Prozess mit diskreter Zeit und kontinuierlichem Zustandsraum).
- Eigenschaften sind nicht unabhängig voneinander.
- Sogar die unabhängigeren Eigenschaften sind Zusammensetzungen anderer Eigenschaften, die für mich immer, von Natur aus, unsichtbar sein werden (was zu einer multi-modalen Verteilung führt).
- Der Anfrageintervall ist nicht unabhängig von anderen Eigenschaften (d. h. viele Anfragen für kleine Ressourcenmengen kommen gebündelt herein, große Anfragen nicht).
- Es gibt Rückkopplungsschleifen darin.
- Es ist nachweislich chaotisch.
Also:
Angenommen, ein Strom von Eingabereignissen mit einer bestimmten Verteilung verschiedener Eigenschaften (einschließlich Intervall) wird angegeben, wie generiere ich einen unendlichen Strom von Ereignissen mit derselben Verteilung über eine Anzahl nicht unabhängiger Eigenschaften?
Nachdem ich mich umgesehen habe, denke ich, dass ich eine Markov-Chain Monte-Carlo-Simulation machen muss. Mein Problem besteht darin, herauszufinden, wie ich die Markov-Kette aus den vorhandenen Eingabedaten erstelle.