Maß für gleichmäßige Verteilung/Streuung von Punkten in einem Intervall

Neue Frage »

visiteur Auf diesen Beitrag antworten »
Maß für gleichmäßige Verteilung/Streuung von Punkten in einem Intervall
Meine Frage:
Hallo.

Ich schlage mich seit einiger Zeit mit einem Problem herum, das etwas mit der Verteilung und Streuung von Punkten in einem Intervall zu tun hat. Bin selbst kein Mathematiker, und wollte es jetzt mal hier versuchen, nachdem verschiedene Recherchen zu Gleichverteilung, Diversitäts- und Entropiemaßen usw. noch keine zufriedenstellende Lösung für mich gebracht haben.

Mein Problem ist folgendes: Ich habe eine Menge {x1, x2, x3 ... xn} von n Punkten aus dem Intervall [0, 1]. Ich suche jetzt ein Maß, mit dem ich die Verteilung der Punkte dieser Menge innerhalb des Intervalls beschreiben kann: Dieses Maß sollte seinen minimalen Wert annehmen, wenn alle Punkte identisch sind, und es sollte den maximalen Wert annehmen, wenn die Punkte bei größtmöglicher Streuung möglichst gleichmäßig verteilt sind. Wenn zum Beispiel n=4, dann sollte das Maß den maximalen Wert annehmen, wenn x1=0, x2=0,333..., x3=0,666... und x4=1; der Wert sollte minimal sein, wenn x1=x2=x3=x4; und das Maß sollte größere bzw. kleinere mittlere Werte annehmen je nachdem, wie sehr die Verteilung eher dem ersten bzw. dem zweiten Fall ähnelt.

Meine Frage lautet also, ob mir jemand eine Formel sagen kann, mit der man ein solches Maß berechnen kann. Ich hoffe, das Problem hinreichend präzise formuliert zu haben und bedanke mich schon mal im Voraus.


Meine Ideen:
Ich hatte zuletzt versucht, von den Differenzen zwischen den Punkten auszugehen und in das gesuchte Maß einfließen zu lassen 1. wie gering die Unterschiede zwischen diesen Differenzen sind, und 2. die Summe aller Differenzen.
HAL 9000 Auf diesen Beitrag antworten »

Nehmen wir o.B.d.A. an, ansonsten ordne man sie so an. Die Funktion



dürfte für die von dir geforderte Eigenschaft haben. Für ist es hingegen umgekehrt, d.h.

Maximum für , und Minimum für .
visiteur Auf diesen Beitrag antworten »

Danke. Ein Problem mit dieser Formel ist allerdings folgendes: Wenn bspw. x1=x2=0 und x3=x4=1, dann ergibt die Formel den gleichen Wert, wie wenn x1=x2=x3=0 und x4=1. Wünschenswert wäre dagegen, dass der Wert im ersten Fall höher ist, da die Verteilung dort gleichmäßiger ist als im zweiten.
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von visiteur
Wünschenswert wäre dagegen, dass der Wert im ersten Fall höher ist, da die Verteilung dort gleichmäßiger ist als im zweiten.

Dann trägst du besser erstmal alles wasserdicht zusammen, was "wünschenswert" ist. Ansonsten kommt mit jedem neuen Vorschlag ein anderes Gemecker, was nun wieder nicht passt. Augenzwinkern

Nicht, dass du am Ende noch Vorstellungen hast, die sich gegenseitig widersprechen...
visiteur Auf diesen Beitrag antworten »

Für die meisten meiner "Testfälle" liefert deine Formel durchaus korrekte Ergebnisse. Vielleicht hilft es, wenn ich diese Testfälle mal präsentiere und eine Rangordnung angebe, die durch die gesuchte Funktion abgebildet werden sollte.

Die Werte der Funktion sollten in den folgenden Fällen zunehmend immer kleiner werden:

Fall 1: x1=0, x2=0,333..., x3=0,666..., x4=1
Fall 2: x1=x2=0, x3=0,5, x4=1
Fall 3: x1=x2=0, x3=x4=1
Fall 4: x1=x2=x3=0, x4=1
Fall 5: x1=0,41, x2=0,42, x3=0,43, x4=0,44
Fall 6: x1=x2=x3=x4

Offenbar hatte ich die Problemstellung doch nicht genau genug formuliert, als ich sagte, dass ich ein Maß für die Gleichverteilung einer Punktmenge bei größtmöglicher Streuung suche. Das liegt womöglich daran, dass mir bislang selbst nicht hinreichend klar war, dass Streuung und Gleichmäßigkeit zwei unabhängige Aspekte sind, die evtl. irgendwie gewichtet werden müssen, wenn man sie zu einem einzigen Wert verrechnen will. Beim Vergleich der Fälle 4 und 5 ist es so, dass in 4 die Streuung größer ist (in dem Sinne, dass die Differenz zwischen dem maximalen und dem minimalen Wert größer ist), in 5 dagegen die Punkte gleichmäßiger verteilt sind. Trotzdem habe ich Fall 5 unter Fall 4 eingeordnet, weil die Punkte in 5 ingesamt in einem extrem kleinen Bereich streuen (zwischen 0,41 und 0,44). Wie hoch der Faktor zur Gewichtung zwischen Streuung und Gleichmäßigkeit (falls es einen solchen brauchen sollte) sein soll, kann ich nicht genau vorgeben. Vielleicht lässt sich das so lösen, dass eine Variable in die Formel eingebaut wird, mit der man die Gewichtung vornehmen kann?
HAL 9000 Auf diesen Beitrag antworten »

Mit dem Begriff "Streuung" würde ich aufpassen: Darunter verstehen Statistiker gewöhnlich dasselbe wie die Stichprobenvarianz, und in dem Sinne hat

Fall 3: x1=x2=0, x3=x4=1

die maximale Streuung, auf jeden Fall mehr als dein genannter Maximalfall

Fall 1: x1=0, x2=0,333..., x3=0,666..., x4=1. smile
 
 
visiteur Auf diesen Beitrag antworten »

Ah ok. Ich hatte "Streuung" wohl eher im Sinne von de.wikipedia.org/wiki/Streuung_%28Statistik%29#Spannweite verstanden.
HAL 9000 Auf diesen Beitrag antworten »

Die Spannweite ist in beiden Fällen 1, so wie bei jeder deiner Stichproben mit und . Ein offensichtlich viel zu "grobes" Maß für dein Anliegen. Augenzwinkern
visiteur Auf diesen Beitrag antworten »

Im Kern geht es mir ja um die Gleichmäßigkeit der Verteilung - bei möglichst großer Spannweite. Die Stichprobenvarianz mag ein weniger grobes Streuungsmaß als die Spannweite sein, aber diesen Gleichmäßigkeits-Aspekt kann man mit ihr doch genauso wenig abbilden, oder? Dazu müsste noch irgendein weiteres Maß für die Gleichmäßigkeit hinzugenommen werden. Du weist ja selbst darauf hin, dass allein mit der Stichprobenvarianz die Rangordnung meiner Fälle nicht abgebildet werden kann...
HAL 9000 Auf diesen Beitrag antworten »

Es gibt noch so manche Ideen, wie man sowas konstruieren könnte, etwa basierend auf



oder angelehnt an meine obige erste Idee



mit den "künstlich" eingeführten Randmarken und .


Ich will gar nicht behaupten, ob diese Terme diese oder jene deiner Eigenschaften besitzt, möglicherweise liegen für bestimmte auch wieder "verkehrte" Verhältnisse vor (also Minimum, wo du Maximum haben willst, und umgekehrt) usw. - es ist nur eine Anregung, wie es mit derartigen Differenzstrukturen + Potenzierung möglicherweise gehen könnte. Sei mal selbst ein bisschen kreativ.
visiteur Auf diesen Beitrag antworten »

Die erste Idee ist es, glaub ich. Hab jetzt basierend darauf (aber ohne die Potenzierung) eine Formel gebastelt, die meinem Eindruck nach korrekte Ergebnisse liefert, wobei Werte zwischen 0 (alle Punkte identisch) und 1 (Gleichverteilung bei maximaler Spannbreite) erzeugt werden:



Allerdings funktioniert es nur bei n's größer gleich 3, wegen Division durch Null bei n=2. Ich könnte sagen, dass die Formel eben nur zu verwenden istl bei n größer gleich 3 und bei n=2 eine andere Formel (nämlich schlicht xn-x1) genommen werden soll. Aber eleganter wäre wohl eine Formel zu haben für alle Fälle. Gibt es eventuell eine Möglichkeit, durch irgendwelche Umformungen das Problem der Division durch 0 zu vermeiden?
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »