Ich bin mir nicht sicher, ob die Frage korrekt ist, aber mir ist keine Möglichkeit eingefallen, sie zu formulieren. Ich werde versuchen, es anhand eines Beispiels zu erklären.
Betrachten Sie eine Tabelle von einzelnen Krankenhausbesuchen mit Attributen für die VisitID (VID), Patienten-ID (PID) und Krankenhaus-ID (HID).
VID PID HID
1 A x
2 A y
3 A x
4 B z
5 B z
Was ich vorhabe, ist PID-HID-Paare zu identifizieren, bei denen mehr als 50 % der gesamten VIDs für diesen PID in dem angegebenen HID waren. In diesem Fall möchte ich "A & x" zurückgeben, da 2/3 der gesamten VIDs für PID "A" in HID "x" waren und "B & Z", da alle VIDs für "B" in "z" waren.