Perzentile (Quantile)

Neue Frage »

Meisenmann Auf diesen Beitrag antworten »
Perzentile (Quantile)
Hallo,

ich möchte gern einige Perzentile für eine Stichprobe ausrechenen.

Ich habe mir dazu zunächst einmal dieses Beispiel angeschaut und anschließend die Werte einmal selbst berechnet.

Für die Berechnung habe ich die Formel die hier von Arthur Dent gepostet wurde verwendet.

Mein Ergebnis für 33% ist 62,5 und für 66% 135.

In dem o. .g. Beispiel werden aber folgende Werte angegeben:

33% ist 61,4 und 66% ist 135,6

Ich habe das ganz anschließend mit Excel nachgestellt und mir wurden ebenfalls die Werte aus dem Beispiel zurückgegeben.

Wie wird das in diesem Beispiel bzw. in Ecxcel berechnet?

Vielen Dank
Meisenmann
JPL Auf diesen Beitrag antworten »

Hi,

beide Werte sind insofern richtig, als dass die geforderten %-werte unterhalb des Perzentilwertes liegen. Es gibt aber (neben der klassischen und von Arthur geposteten Version) noch eine Reihe anderer Methoden, die nicht immer den Mittelwert zwischen den beiden möglichen Werten nehmen, sondern Gewichtungen. Eine kleine abhandlung findest du hier:
http://support.sas.com/documentation/cdl...ate_sect028.htm (beachte aber, dass andere Programme, z.b. R, wieder andere Definitionen haben)
Abgesehen davon, dass Excel und Statistik eigentlich nichts gemein haben, wird bei Excel interpoliert: http://office.microsoft.com/en-us/excel/HP052092111033.aspx
Grüße,
JPL
 
 
Meisenmann Auf diesen Beitrag antworten »

Hi,

vielen Dank für Deine Antwort JPL! Excel bildet also nicht den Mittelwert, sondern schätzt durch lineare Interpolation einen gewichteten Wert.

Ich habe hier einen passenden Algorithmus gefunden.

Leider komme ich mit dem ersten Schritt nicht ganz klar. Im ersten Schritt wird der Index (Zeilennummer) der Einfallsklasse ermittelt:

RN = 1+((N-1)*P)

Warum 1+((N-1)*P) und nicht N*P das versteh ich nicht ganz?!


Beste Grüße
Meisenmann
JPL Auf diesen Beitrag antworten »

Hi,

bei Wiki.alternative methods (http://en.wikipedia.org/wiki/Percentile) findest du eine Antwort.
Grüße,
JPL
Meisenmann Auf diesen Beitrag antworten »

Hi JPL,

nochmals danke für Deine Antwort, aber ich kapiers auch mit Hilfe von diesem Link nicht.

Da steht die eine modifizierte Version der Formel aus dem Link den ich gepostet habe. Aber wie es zu dem 1+((N-1)*P) kommt steht da auch nicht.


Vielleicht kannst Du ja ein paar Worte dazu sagen?

Grüße
Meisenmann
JPL Auf diesen Beitrag antworten »

Hi,

den link zum ESH hast du aber schon gelesen?
Da steht die eigentliche Definition drin, die Abweichung von EXCEL hat mit früher auch viel Kopfzerbrechen bereitet, bis ich dann auf ein vernünftiges Stats-programm umgestiegen bin Big Laugh
Der Unterscheid soll marginal sein, da ist er natürlich trotzdem. Da es wohl keine echte Begründung gibt, und man die einstellung wohl auch nicht ändern kann, würde ich deswegen von der Verwendung von Excel absehen.
Grüße,
JPL
Meisenmann Auf diesen Beitrag antworten »

Hi JPL,

nochmals danke für Deine Antwort.

Den Link hab ich natürlich übersehen Hammer .

Excel möchte ich garnicht verwenden. Ich programmiere gerade eine Anwendung, ein kleines feature wäre eben die Perzentilberechnung von bestimmten Messwerten.

Diese Berechnung wurde bisher mit Excel ausgeführt, deshalb habe ich mich bisher mit der Quantil-Funktion von Excel beschäftigt.

Es macht den Aschein, als ob Du Dich sehr gut in diesem Bereich auskennst. Wenn Du mir jetzt sagst, dass die Excel-Funktion nicht sonderlich gut ist und mir dann auch noch einen besseren Algorithmus nennst, bin ich nicht abgeneigt diesen zu verwenden Big Laugh (insofern ich ihn auch verstehe...).


Beste Grüße
Meisenmann
JPL Auf diesen Beitrag antworten »

Hi Meisenmann,


Zitat:
Wenn Du mir jetzt sagst, dass die Excel-Funktion nicht sonderlich gut ist und mir dann auch noch einen besseren Algorithmus nennst, bin ich nicht abgeneigt diesen zu verwenden

sehr weise! Freude

Wie gesagt gibt es sehr viele Ansätze Perzentile zu berechnen, wenn diese zwischen den Werten liegen. SAS amcht es so (method 5 ist default), R macht es so, default 7.
Gerade für nicht sehr kompakte samples (z.B. 1,2,3,4,50,60,70,80) können da sehr unterscheidliche ergebnisse herauskommen (in R, median, type=1/3/4: 4, type=2/5/6/7/8/9: 27 oder in R, 45%perzentil, type=1/2/3: 4, , type=4: 3.6, type=5: 8.6, type=6: 6.3, type=7: 10.9, type=8: 7.8333, type=9: 8.025).

viel Spaß beim programmieren!
Grüße,
JPL
Meisenmann Auf diesen Beitrag antworten »

Vielen Dank JPL, Du hast mir sehr weitergeholfen! Gott

Beste Grüße!
Meisenmann
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »