RE: Programmierungsproblem: Statistische Auswertung

#1 von SAH , 17.04.2007 09:11

Liebe Forenteilnehmer,

im Rahmen der Loktests ist es möglich, aus den gemessenen Werten Wirkungsgrad-, Leistungs-, Drehzahldiagramme zu erstellen. Selbstverständlich stehen hier auch weitere Variablen zur Verfügung.
Ein weiterer Meßwert für alle angetriebenen Modelle wäre die Zugmasse ("Zugkraft"). Um jedoch Elektronik und Motoren zu schonen kann man sich der Statistik bedienen und aus dem Leistungsdiagramm die Zugmasse bei der angegebenen Spannung berechnen.
Das von mir vorbereitete Programm liefert mit theoretischen Werten (also z.B. die Ergebnisse aus dem Eisenbahnmagazin) Übereinstimmung mit max. 3% Abweichung. Bei den von mir gemessenen Werten sind ebenfalls in den meisten Fällen sinnvolle Werte erhalten worden. Beispiele: BR 89 (3000) mit Plastikreifen 51g, mit Haftreifen 100g,
BR Da der SJ (3019.2) 86g, BR E94 (3022) 196g oder BR 18.1 (3411) 98g analog AC und 96g Digital FS 7.
In den Fällen, in denen "Ausreißer" in der Auswertung auftreten und diese nicht erkannt oder nicht richtig verwertet werden,
kommen recht lustig Ergebnisse heraus:
BR 03.10 (3489) mit FDCM 7g, 3411 im DC-Betrieb 1694g oder BR V200 (3021) 3465g.
Die Frage hierzu nun: bei der Berechnung von Mittelwerten gibt es u.U. Ausreißer. Welche Kriterien kann ich einem Programm ansetzen, um Ausreißer zu erkennen? (Bislang: Mittelwert +/- 1.99*Sigma, nach Elimination Mittelwert +/- 3 Sigma).
In diesem Zusammenhang: mit php zu programmieren ist das elende Fuzzelarbeit. Geht das evtl. einfacher?

mfG.
SAH


Stephan-Alexander Heyn
www.sheyn.de/Modellbahn/index.php


SAH  
SAH
Tankwart
Beiträge: 12.723
Registriert am: 06.06.2005
Homepage: Link
Spurweite H0, N, Z
Stromart AC, DC, Digital, Analog


RE: Programmierungsproblem: Statistische Auswertung

#2 von Toby ( gelöscht ) , 17.04.2007 11:08

Möglichkeit 1: t-Test, Testgröße ist (Wert-Mittelwert)/Standardabweichung, ein Ausreißer ist gegeben wenn die Testgröße das kritische Quantil überschreitet. Das kritisches Quantil der Student-Verteilung ergibt sich aus der gewünschten Wahrscheinlichkeit und der Anzahl der Freiheitsgrade, ganz gerne wird einfach 3 verwendet. Sprich, die Abweichung vom Mittelwert darf nicht größer als 3 Sigma sein (was du ja auch schon benützt hast), was meistens damit motiviert wird, dass bei Normalverteilung 99,7% der Realisierungen innerhalb der 3 Sigma liegen.

Möglichkeit 2: Verwendung eines robusten Schätzers, das ist das arithmetische Mittel nämlich nicht. Im vorliegenden Fall ist der Median ein geeigneter robuster Schätzer.


Toby

RE: Programmierungsproblem: Statistische Auswertung

#3 von SAH , 03.05.2007 16:15

Hallo Tobias,

herzlichen Dank für Deine Anregungen auch in de.rec.modelle.bahn.
Das naheliegende findet man bekanntlich zuletzt:
Lineare Regression (lediglich eine komplette Tabelle der Zufallshöchstwerte des Regressionskoeffizienten habe ich nicht gefunden).
Dadurch sind die meisten Probleme weg vom Tisch und ich habe in 85% aller Fälle ohne Ausreißer vernünftige Werte.
Der lustigste Wert ist nun das schweizer Krokodil 3056 mit einer Zugmasse von 15644g bei eine Korrelationskoeffizienten von -0,006 (na hurra!!!!!!!!!). Da hilft nur nochmal messen.

mfG.
SAH


Stephan-Alexander Heyn
www.sheyn.de/Modellbahn/index.php


SAH  
SAH
Tankwart
Beiträge: 12.723
Registriert am: 06.06.2005
Homepage: Link
Spurweite H0, N, Z
Stromart AC, DC, Digital, Analog


RE: Programmierungsproblem: Statistische Auswertung

#4 von Toby ( gelöscht ) , 08.05.2007 13:24

Lineare Regression ist doch auch ein Ausgleichungsproblem, bei dem Abweichungen der Zufallsvariable vom Erwartungswert zu Verzerrungen führen?! Insofern ist mir nicht ganz klar wie das Ausreißer kompensieren kann.


Toby

RE: Programmierungsproblem: Statistische Auswertung

#5 von SAH , 08.05.2007 13:52

Hallo Toby,

Zitat von Toby
Lineare Regression ist doch auch ein Ausgleichungsproblem, bei dem Abweichungen der Zufallsvariable vom Erwartungswert zu Verzerrungen führen?! Insofern ist mir nicht ganz klar wie das Ausreißer kompensieren kann.



vielleicht liegt dies an der Vorgehensweise:
Erster Schritt: aus den gemessenen Zeiten (Zugmasse, Streckenlänge usw. sind bekannt) die P2 ausgerechnet. P2 ist eine Parabel, deren Steigung ein Maximum bei P2max/2 hat. Diese Steigung ist nichts anderes als die erste Ableitung nach dem Drehmoment. Dies rechne ich wie folgt aus: ($P2[$i]-$P2[$i-1])/($M[$i]-$M[$i-1])=$y[$i]
Damit kann ich bereits die Lineare Regression durchführen. Ein Ausrechnen "per Hand" sieht analog aus: die zweite Ableitung ist eine Parallele zur Abszisse, also ($y[$i]-$y[$i-1])/($M[$i]-$M[$i-1])=$y2[$i].
Anschließend die beschriebene Prozedur, die doch sehr aufwendig ist.
Offensichtlich gibt es doch große Unterschiede im Ergebnis (siehe oben).
Wäre natürlich schön, ein solches Krokodil zu haben

mfG.
SAH
PS: kennst Du ein Buch oder eine Literaturstelle mit den Tabellierten Werten des Zufallshöchstwertes füpr den Korrelationskoeffizienten in Abhängigkeit vom Vertauensintervall?


Stephan-Alexander Heyn
www.sheyn.de/Modellbahn/index.php


SAH  
SAH
Tankwart
Beiträge: 12.723
Registriert am: 06.06.2005
Homepage: Link
Spurweite H0, N, Z
Stromart AC, DC, Digital, Analog


RE: Programmierungsproblem: Statistische Auswertung

#6 von Christian Lütgens ( gelöscht ) , 08.05.2007 20:37

Hallo.

Zitat von SAH
In den Fällen, in denen "Ausreißer" in der Auswertung auftreten und diese nicht erkannt oder nicht richtig verwertet werden,
kommen recht lustig Ergebnisse heraus:
BR 03.10 (3489) mit FDCM 7g, 3411 im DC-Betrieb 1694g oder BR V200 (3021) 3465g.



Das Ergebnis der 3021 erscheint doch durchaus plausibel.


Bye,
Christian


Christian Lütgens

RE: Programmierungsproblem: Statistische Auswertung

#7 von SAH , 09.05.2007 11:24

Hallo Christian,

Zitat von Christian Lütgens

Zitat von SAH
In den Fällen, in denen "Ausreißer" in der Auswertung auftreten und diese nicht erkannt oder nicht richtig verwertet werden,
kommen recht lustig Ergebnisse heraus:
BR 03.10 (3489) mit FDCM 7g, 3411 im DC-Betrieb 1694g oder BR V200 (3021) 3465g.


Das Ergebnis der 3021 erscheint doch durchaus plausibel.




Richtig!
Da ist dann auch der anderweitig nach "beglaubigten" Aussagen fehlende Faktor 10

Im Ernst: nach der neuen Methode kommt tatsächlich ein Ergebnis in der Nähe von 320g heraus.

mfG.
SAH


Stephan-Alexander Heyn
www.sheyn.de/Modellbahn/index.php


SAH  
SAH
Tankwart
Beiträge: 12.723
Registriert am: 06.06.2005
Homepage: Link
Spurweite H0, N, Z
Stromart AC, DC, Digital, Analog


RE: Programmierungsproblem: Statistische Auswertung

#8 von Toby ( gelöscht ) , 11.05.2007 10:50

Zitat von SAH

PS: kennst Du ein Buch oder eine Literaturstelle mit den Tabellierten Werten des Zufallshöchstwertes füpr den Korrelationskoeffizienten in Abhängigkeit vom Vertauensintervall?


Puuh, du fragst Sachen... Nein, kenne ich nicht, ich weiss ehrlich gesagt auch nicht ganz genau, was du meinst. Einen Wert der angibt, wie hoch der Korrelationskoeffizient maximal sein kann/darf, wenn es sich um eine eigentlich zufallsverteilte Größe handelt? Das wäre dann ja quasi ein Test auf Zufallsverteilung - da müsste ich mal in meinen Statistikunterlagen nachschauen.


Toby

RE: Programmierungsproblem: Statistische Auswertung

#9 von SAH , 11.05.2007 11:22

Hallo Toby,

Zitat von Toby

Zitat von SAH

PS: kennst Du ein Buch oder eine Literaturstelle mit den Tabellierten Werten des Zufallshöchstwertes füpr den Korrelationskoeffizienten in Abhängigkeit vom Vertauensintervall?


Puuh, du fragst Sachen... Nein, kenne ich nicht, ich weiss ehrlich gesagt auch nicht ganz genau, was du meinst. Einen Wert der angibt, wie hoch der Korrelationskoeffizient maximal sein kann/darf, wenn es sich um eine eigentlich zufallsverteilte Größe handelt? Das wäre dann ja quasi ein Test auf Zufallsverteilung - da müsste ich mal in meinen Statistikunterlagen nachschauen.




Ja genau das. Am besten noch mit der Ausrechenformel für die Werte der t-Verteilung

mfG.
SAH


Stephan-Alexander Heyn
www.sheyn.de/Modellbahn/index.php


SAH  
SAH
Tankwart
Beiträge: 12.723
Registriert am: 06.06.2005
Homepage: Link
Spurweite H0, N, Z
Stromart AC, DC, Digital, Analog


RE: Programmierungsproblem: Statistische Auswertung

#10 von acsenf ( gelöscht ) , 11.05.2007 11:37

Hallo!

Sacht mal ihr traibt Sachen...mit Modellbahn hat das nix mehr zu tun!
Also ich freue mich lieber über die tollen Fahreigenschaften und gute Detaillierung.
Solche Messungen sind für mich reine Zeitverschwendung. Berechnungen muss ich beruflich den ganzen Tag durchführen, da muss ich nicht auch noch zu Hause rechnen

Übrigens zu den Formeln: Die findest einmal auf einem alten 10D-Mark Schein . Der einzige legale Spickzettel.
Oder in Schmusch Messtechnik, der in den Statistik-Skripten diverser Hochschulen.

P.s. Mit Matlab kannst das schön bearbeiten und auch Graphen ausgeben


Gruß

Sven


acsenf

RE: Programmierungsproblem: Statistische Auswertung

#11 von SAH , 14.05.2007 08:26

Hallo lieber Sven,

Zitat von acsenf

Sacht mal ihr traibt Sachen...mit Modellbahn hat das nix mehr zu tun!



Bleibe bitte auf dem Teppich. Wenn dies *für Dich* uninteressant ist, brauchst Du es auch nicht zu kommentieren.
Für mich ist die Modellbahn elektromechanisches Lehrspielzeug.

mit freundlichen Grüßen,
Stephan-Alexander Heyn


Stephan-Alexander Heyn
www.sheyn.de/Modellbahn/index.php


SAH  
SAH
Tankwart
Beiträge: 12.723
Registriert am: 06.06.2005
Homepage: Link
Spurweite H0, N, Z
Stromart AC, DC, Digital, Analog


RE: Programmierungsproblem: Statistische Auswertung

#12 von acsenf ( gelöscht ) , 14.05.2007 10:17

Hallo Stephan!

Das war doch nicht böse gemeint. Wollte eher meine Verwunderung kundtun, was man so alles anstellen kann.
Allerdings wären deine Tests sehr viel interessanter, wenn du die Zugkraft über Seilrolle messen würdest und eine Angabe in Newton, oder Gramm machen würdest. Dann hätte man eine gute Bewertungsgrundlage, dafür, ob das Modell für die heimische Anlage taugt, oder nicht.

Viele Grüße

Sven


acsenf

RE: Programmierungsproblem: Statistische Auswertung

#13 von SAH , 15.05.2007 07:41

Lieber Sven,

Zitat von acsenf

Das war doch nicht böse gemeint. Wollte eher meine Verwunderung kundtun, was man so alles anstellen kann.
Allerdings wären deine Tests sehr viel interessanter, wenn du die Zugkraft über Seilrolle messen würdest und eine Angabe in Newton, oder Gramm machen würdest. Dann hätte man eine gute Bewertungsgrundlage, dafür, ob das Modell für die heimische Anlage taugt, oder nicht.



Das bitte ich um Verzeihung.
Die Gründe warum Zugmassen auf diese Weise bestimme sind:
ich habe keine Federwaage und nur ein abendteuerliches Konstrukt als Seilrolle. Das Bild wäre zu abscheulich und würde bei einigen hier im Forum für Glatzen sorgen . Die im AC-Betrieb gemessenen Werte bei der angegebenen Spannung sind anhaltswerte und auch in meinen Tabellen (Leistung, Wirkungsgrad etc.) aufgelistet.
Ein Dynamometer ist mir zu teuer (500 Euro für einen im Bereich 0-2000mN, +/- 3%) und für den Preis zu unpräzise.
Die statistische Methode ist vergleichbar (+/- 5%) und gleichzeitig ein gutes Mittel, um ggf. nachzumessende Modelle zu ermitteln.
Ferner ist die Belastung einer evtl. vorhandenen Elektronik bei weitem nicht so groß, denn ich möchte möglichst keine weiteren Verluste in diesem Fall mitmachen müssen.

HTH
SAH


Stephan-Alexander Heyn
www.sheyn.de/Modellbahn/index.php


SAH  
SAH
Tankwart
Beiträge: 12.723
Registriert am: 06.06.2005
Homepage: Link
Spurweite H0, N, Z
Stromart AC, DC, Digital, Analog


   


  • Ähnliche Themen
    Antworten
    Zugriffe
    Letzter Beitrag
Xobor Einfach ein eigenes Forum erstellen
Datenschutz