Diese Frage ist gespeichert in:

Anzeige

Neueste Antworten

841342
SarahChe
SarahChe (Rang: Mileva Einstein2)

Was geschieht mit dem Fehler eines Wertes, wenn man diesen als Logarithmus darstellt?

Wenn ich eine Funktion an meine experimentellen Daten anpasse (benutze Origin 9.1), dann gibt mir das Programm zusätzlich zum Wert einer Konstante noch den Standardfehler. Da ich viele dieser Werte in einer Tabelle darstelle und mich primär die Grössenordnung interessiert, gebe ich die Werte der Konstante als 10er Logarithmus an. Kann ich dann einfach den Logarithmus des Standardfehlers angeben oder muss ich diesen anders umwandeln?


Ergänzung vom 01.09.2017 11:26:

Um dem ganzen etwas mehr Hintergrund zu geben: Es handelt sich um chemische Experimente mit pH Messung. Daran passe ich eine Funktion an, die mir die Gleichgewichts-Konstanten geben. Die Funktion interessiert nur nebensächlich, wichtig sind die erhaltenen Konstanten unter verschiedenen experimentellen Bedingungen wie etwa Temperatur, weil dies etwas über die Moleküle aussagt.
Da dies aber Werte ergibt zwischen 10^-10 und 10^14 ist es praktischer und häufig gesehen, dass sie als logK angegeben werden, also der Logarithmus der Konstante K.
In einem Fall erhalte ich aber sehr unterschiedliche Standardfehler, und möchte diese diskutieren, da sie etwas über die Qualität der Methode an sich aussagen.
Das gewünschte Endformat wäre dann logK = 7 +- 2.
Wenn ich also als Ergebnis K = 10^-6 und für den Standardfehler 10^-5 erhalte, wie rechne ich das um?

Anzeige

2 Antworten

1076499
gilgamesch4711

gilgamesch4711

Rang: Master (1.305) | statistik (18), fehler (18)

39 Minuten nachdem die Frage gestellt worden ist (31.08.2017 15:49)

1

Die Gesetze der ===> Fehlerfortpflanzung beruhen auf der Differenzialrechnung

d [ ln ( a ) ] = ( 1 / a0 ) da ( 1a )

d [ exp ( a ) ] = exp ( a0 ) da ( 1b )

Die Standardabweichung s für mehrere Variablen berechnest du mittels Pytagoras; in ===> Einsteinnnotation

s ² = da ( i ) da ( i ) ( 2 )


Ergänzung vom 01.09.2017 16:20:

Machen wir ' s doch mit einem Zahlenbeispiel. Angenommen du misst pH = 6 mit dem Fehler da1. Und p(OH) = 7 mit dem Fehler db1 . Wie schlägt der Fehler auf die Konstante K durch durch?

dK1 = da1 exp ( 6 ) ; dk2 = da2 exp ( 7 )

Danach mittelst du über n Messungen:

dk ( ges ) = 1/n sqr ( dk1 ² + dk2 ² + dk3 ² + ... )

Hast du nie ===> Fehlerfortpflanzung bei Formeln gelernt? Schau mal in wiki

8 Kommentare

841342
SarahChe
SarahChe

Ich hab das ganze Zeugs durchaus gelernt, ist aber mittlerweile 10 Jahre her... Da viele Artikel es ebenso behandeln, wie wenn man es einem erklärt, der alles von vorne lernt, macht es das mühsam den Teil zu finden, der für einem selbst relevant ist.
Vielleicht muss ich meine Situation anders beschreiben: Ich messe nicht den pH einer Lösung viermal und nehme den Durchschnitt. Ich messe den pH einmal, gebe etwas hinzu, messe ihn nocheinmal etc. Dann finde ich via non-linearer Regression in einer Software eine Konstante, die das System beschreibt. Entsprechend erhalte ich nicht die Standardabweichung, sondern einen Standardfehler.

Wenn ich also der Fehlerfortpflanzung folge, dann:
Funktion y(x)=lg(x), Fehler fy = dy/dx*fx
Die Ableitung von y(x) ist 1/(x*ln10).
Entsprechend ist fy = 1/(x*ln10)*fx.

habe jetzt f für Fehler genommen, auch wenn delta richtig wäre, aber mit d gibts nur Verwechslungen mit der Ableitung...

Wenn ich also für den Wert 10^7 den Fehler 10^6 habe, dann gibt das nach der Umwandlung 7+-0.043...?

841342
SarahChe
SarahChe

Hab das ganze per Programm nochmals nachrechnen lassen und erhalte das gleiche Ergebnis.
Vielen Dank für deine Hilfe!

1051786
NGTRX
NGTRX

Wenn das das übliche Verfahren ist, habe ich wieder was dazugelernt. Scheint recht pragmatisch zu funktionieren. Allerdings ist da noch ein kleines Verständnisproblem.
10 ^(7+ 1/(10^7*ln10)*10^6) = 11 051 709,...
und nicht 11 000 000.
Ich denke, das ist verschmerzbar. Der Fehler hat sich nur um 5% erhöht. Ich frage mich aber, wie groß kann so eine Abweichung im Extremfall werden und wo ist die Grenze der Vertretbarkeit?
Gibt es dahingehend Einschränkungen der Anwendbarkeit, vor allem bei weiteren Fortpflanzungen oder Folgeanalysen?

841342
SarahChe
SarahChe

Um die Fehlerfortpflanzung wirklich korrekt durchzuführen, müsste man eigentlich die Taylorreihe weiterführen und die zweite, dritte, vierte etc Ableitung ebenfalls dazurechnen (siehe Wiki), nach dem ersten Glied abzubrechen macht es aber natürlich einfacher und führt nur zu einer kleinen zusätzlichen Abweichung. Wenn ich es bis zur dritten Ableitung weiterführe erhalte ich 11011260, was schon etwas näher bei 11000000 liegt. Würde wahrscheinlich umso besser, je weiter man die Taylorreihe führt.
Generell müssten ja wirklich beide Methoden zum gleichen Ergebnis führen. Die Fehlerfortpflanzung hat den Vorteil, dass auch für mehrere miteinander verknüpfte Fehlerquellen und Funktionen wo kleine x zu grossen y führen etc das Vorgehen immer klar definiert ist.

1051786
NGTRX
NGTRX

Du meinst also, die Anwendung der Taylorreihe könnte bei log(10^7+10^6)-7=0,04139... konvergieren?
Sorry, mir fehlt das know-how, um das ohne extremen Aufwand selbst zu prüfen, aber einen innere Stimme sagt mir nein, aber es wird trotzdem immer besser^^

841342
SarahChe
SarahChe

Ja. Bei der Taylorreihe werden die Ableitungen mit dem Fehler und einer Nummer verrechnet und zusammengezählt. Die Form der Ableitungen eines Logarithmus führt aber dazu, dass die Terme abwechslungsweise positiv und negativ werden und immer kleiner werden. Der so berechnete Fehler pendelt also immer enger um 0.04139..., bis er ihn erreicht. Theoretisch geschieht das erst nach unendlich vielen Ableitungen, aber irgendwann erreicht man einfach den Punkt wo man sagt "nahe genug".

1051786
NGTRX
NGTRX

Ich zweifelte deswegen, weil das Problem gar nicht an der Genauigkeit des Fehlers liegt, sondern am verschobenen Mittelwert zwischen den Grenzen der Streuung nach dem Logarithmieren.
Dieser Mittelwert M liegt nun mal bei (log(10^7+10^6)-log(10^7-10^6))/2, da ändert doch keine Taylor-Reihe was.
Folglich muss der exakte Fehler log(10^7+10^6)-M sein.
10^(6,99781760+0,043575088)=11 000 000,0...
10^(6,99781760-0,043575088))=9 000 000,0...
Als allgemeingültige Formel in einem einem Stück ohne Substitution wird das ein Bandwurm, aber normalerweise muss man das doch nur einmal schreiben. Was spricht also dagegen?

841342
SarahChe
SarahChe

Stell dir vor, der Wert x wird nicht nur zu logx, sondern du hättest die Werte x, y und z mit je einem anderen Fehler, und berechnest dann etwas wie SIN(x)/logy+1009*z^4. Je nach dem, wie gross x, y und z sind musst du sie anders verrechnen, um den grösstmöglichen oder den kleinstmöglichen Fehler zu erhalten.
Was genau die Unterschiede zwischen Konfidenzintervall, Standardfehler und Standardabweichungen sind und wie sich solche mathematischen Umwandlungen auf diese Fehler auswirken kann dir aber ein Statistiker besser erklären als ich...

Dein Kommentar zu dieser Antwort

Noch nicht registriert bei COSMiQ?
Melde dich hier an!

Bewertung des Fragestellers:

Top

Gute Antwort meinen:

letzte 10 Meinungen:

[Fenster schließen]
3

Als gute Antwort bewerten

Kommentare zur Antwort:

8

8 Kommentare

Anzeige
1051786
NGTRX

NGTRX

Rang: Max Planck (10.168) | statistik (15), fehler (9)

47 Minuten nachdem die Frage gestellt worden ist (31.08.2017 15:57)

2

Ich hoffe, ich habe Dich da jetzt richtig verstanden.
Der Logarithmus des Standardfehlers der Werte in Bezug auf Deine Funktion ist nicht identisch mit dem Standardfehler des Logarithmus der Werte in Bezug auf den Logarithmus Deiner Funktion und lässt sich auch nicht nachträglich umrechnen, falls Du das meinst.


Ergänzung vom 01.09.2017 12:32:

Ich habe nach der 10.Klasse keinen Matheunterricht mehr gehabt. Also sieh mir nach, wenn ich da etwas vereinfacht denke.
Ich sehe das bei Statistiken manchmal, dass z.B. das Gewicht von Kartoffeln als Glockenkurve dargestellt wird und frage mich, wie es negative Kartoffeln geben kann, die es laut Glockenkurve geben müsste.
Daher würde ich von vornherein die Logarithmen der Kartoffelgewichte nehmen, dann passt das.
Noch ein einfaches Beispiel: Eine Strecke ist einen Kilometer lang und soll geschätzt werden. Einer sagt 2 km, der hat einen Fehler von 1 km.
Ein anderer schätzt 1 mm. Der liegt ja dichter dran.
Nun bilde mal daraus den Standardfehler, und der Quatsch wird immer quätscher.
Jetzt versuche das mal mit dem Logarithmus. Der 2 km sagt, ist plötzlich viel dichter dran als der mit 1 mm. So hat es auch Sinn, den Standardfehler aus den Logarithmen zu bilden.
Und: Plötzlich ist auch das mit dem negativen Bereich geklärt, der zwangsläufig existieren muss.
Deine Werte 10^-10 bis 10^14 sind nicht mal in etwa normalverteilt. Einen Standardfehler anzugeben hätte auch nur dann Sinn.
Also musst Du von vornherein die Logarithmen nehmen, die Basis ist egal.
Gerade bei Fragen des chemischen Gleichgewichtes wirken sich Einflüsse selten proportional aus, sondern fast immer exponentiell. gerade der PH-Wert ist da ein typisches Beispiel, und um den geht es ja hier.
Das ist schließlich ebenso ein Logarithmus einer Konzentration, wie auch das Gleichgewicht in Deiner Lösung.
Also aus dem Bauche heraus würde ich meinen, die absoluten Konzentrationen zu diskutieren ist weniger sinnvoll, als deren Logarithmen, siehe das Beispiel mit der Strecke.


Ergänzung vom 01.09.2017 17:11:

Wenn ich also als Ergebnis K = 10^-6 und für den Standardfehler 10^-5 erhalte, wie rechne ich das um?
Standardfehler größer als das Ergebnis? ich tausche mal um.
K=10^-5 S=10^-6
x = log(K+S) y=log(K-S) z=(x+y)/2
log(K) = z +- (z-x)

x=-4,9586 y=-5,0458 z=-5,0022
log(K)= -5,0022 +- -0,0436
log(K)[min]= 5,0458
log(K) [max]=-4,9585
Meintest Du das so?

6 Kommentare

841342
SarahChe
SarahChe

Ich verstehe das in etwa aus statistischer Sicht. Aber ich muss vielleicht mein Experiment anders erklären.
Ich messe sagen wir 100 Werte und passe daran eine Funktion an. Diese Funktion gibt mir den Wert der Gleichgewichtskonstante K für dieses Molekül und den Standardfehler, der mir aufschluss darüber gibt, wie gut die Funktion die Messwerte beschreibt.
Dann wiederhole ich das Experiment für ein anderes Molekül und erwarte entsprechend einen ganz anderen Wert für K.
Ich erhalte nicht Messwerte zwischen 10^-10 und 10^14, sondern Resultate. Diese vergleiche ich dass aus rein chemischer Sicht, es ist aber einfacher zu schreiben Molekül A = -10 und Molekül B = -14.
Jetzt lassen sich aber nicht alle Moleküle gleich gut mit meiner Funktion beschreiben, was sich in grösseren Standardfehlern niederschlagen kann. Entsprechend muss ich auch den Standardfehler der entsprechenden Werte abgeben.
Da ich die Werte für K nicht von Hand statistisch auswerte, sondern ein Programm mir aus hunderten und tausenden Messwerten einen Wert und einen Fehler geht, muss ich irgendwie mit dem nicht-logarithmischen Fehler arbeiten.

841342
SarahChe
SarahChe

Das erscheint mir eigentlich auch logisch. Aber gleichzeitig sollte sich doch der eigentliche Wert nicht verändern, weil doch a) der Fehler nur eine statistische Schätzung ist und b) nach logarithmischer Umwandlung die Streuung nicht gleich gross zu grösseren Werten wie zu kleineren ist.
Des weiteren scheint auch gilgamesch4711 nicht Unrecht zu haben, eigentlich sollte dies doch der Fehlerfortpflanzung folgen?

1051786
NGTRX
NGTRX

Es ist ein wenig böse, sowas zu machen, wenn man mit den Werten weiterrechnen will, denn die Streuung des Logarithmus nach oben wirkt sich ja stärker aus, wie Du selbst bemerktest. Der korrigierte Wert als arithmetisches Mittel der oberen und unteren Toleranzgrenze ist nicht mehr der Scheitelpunkt in der Dichtefunktion.
Ich hätte da ganz spontan 3 Ideen anzubieten:
1. Die zuvor beschriebene.
2. Du verwendest 2 Fehlerwerte für den Fehler, also log(K) +S1/-S2, was dann absolut korrekt wäre.
3. Du belässt den ursprünglichen Wert, ermittelst den Fehler nur für die untere Grenze und verschiebst die oberen Grenze entsprechend nach außen, erhöhst somit die Fehlertoleranz ein wenig zu Gunsten der besseren Darstellbarkeit.
Ohne dass ich sagen kann, was in der Statistik da üblich ist, denke ich, dass man nur zum Zwecke der einfachen Darstellung Variante 1 verwenden kann, auch wenn der Grund der leicht veränderten Werte schwer jedem erklärbar ist.
Ultrakorrekt, was die Fehlerdichte betrifft, wäre nur Variante 2.
Variante 3 ist wie Variante 1 für spezielle Fehlerbetrachtung und Folgerechnungen untauglich, erspart Dir aber schwierige Erklärungen über die veränderten Werte.
Wenn Dir das alles nicht gefällt, fällt mir nur Variante 4 ein, aber die war nicht gefragt, nämlich alles ohne Logarithmus darzustellen oder von vornherein mit logarithmischen Rohdaten zu arbeiten. Letzteres erscheint mir recht elegant, aber wie gesagt habe ich noch nie mit Statistiken beruflich gearbeitet. Ist also nur mein eigenes Bauchgefühl.

841342
SarahChe
SarahChe

Die Funktion umzuformen auf logarithmische Daten funktioniert leider nicht so einfach, und es ist sowieso schon ein Unding von einer Formel.
Das Programm gibt mir allerdings die Möglichkeit, von den gefitteten Konstanten abgeleitete Werte zu berechen und gibt mir auch gleich den entsprechenden Fehler dazu.
Wie gilgamesch schon richtig vermutet hatte, muss man den Regeln der Fehlerfortpflanzung folgen. Bei kleinen Fehlern ist der Unterschied zwischen der Fehlerfortpflanzung und deinen Vorschlägen relativ gering, bei grossen Fehlern wird er allerdings schnell offensichtlich.
Trotzdem danke für deine Antwort!

410666
BesondersArroganter
BesondersArroganter

Ich erhalte nicht Messwerte zwischen 10^-10 und 10^14, sondern Resultate..... das ist mir ein Rätsel , wo ist der Unterschied ? Daten sind Daten , oder ?


Wie ich es lese machst du du dasselbe wie in der Regressionsanalyse, nur das deine Funktion keine Gerade ist.


Wieso kommt bei deiner argumentation kein konfidenzintervall vor oder der Determinationkoeffzient als Maß für die Vorhersagegüte ?

841342
SarahChe
SarahChe

Nein, denn zwischen Messwerten erwarte ich eine Korrelation, aber zwischen Resultaten für verschiedene Bedingungen nicht.
Stell dir das so vor: Wenn jemand den Kaloriengehalt für Himbeeren bestimmt und verschiedene Mengen Himbeeren misst, wird er mit einer linearen Regression einen Durchschnittswert pro Gramm erhalten plus einen Fehler, der sowohl Messungenauigkeiten als auch natürliche Variationen beinhaltet. Es kann statistisch erwartet werden, dass die Fehler einer gewissen Verteilung um den Durchschnitt folgen, hier wird oft die Standard-Abweichung als Massstab genommen.
Wenn ich nun den Kaloriengehalt von Himbeeren mit dem von Erdbeeren, Eiern und Grashalmen vergleiche, werde ich verschiedene Werte mit verschiedenen Fehlern erhalten. Die Werte können untereinander nicht statistisch ausgewertet werden, ihre Verteilung folgt ganz bestimmt nicht einer Normalverteilung, da sie von weiteren Faktoren abhängig sind.
In meiner Forschung untersuche ich aber genau diese Faktoren und will deswegen Erdbeeren mit Himbeeren vergleichen, muss dies aber argumentativ tun nicht statistisch. Nichts desto trotz schaue ich mir Werte an, die zB 10'475'132'865 und 0.00000000164 sind. Solch grosse Zahlen sind schwierig zu überblicken, weswegen der Zehnerlogarithmus wesentlich praktischer ist.
Des weiteren verwende ich eine non-lineare Regression, keine lineare. Der Fehlerwert ist computergeneriert und weitaus zu komplex um von Hand berechnet zu werden. Die Standard-Abweichung nützt hier relativ wenig, weswegen der Standard-Fehler benutzt wird (Unterschied!), der in meinem Fall auch ein Mass dafür ist, wie gut sich meine Funktion an meine experimentellen Daten anpassen lässt bzw wie gut ich mein Experiment designt habe.
Das Konfidenzinterwall sagt etwas über einzelne Datenpunkte im Vergleich zum Mittel aus, was aber in meinem speziellen Fall wissenschaftlich nicht interessant ist. Der Determinationskoeffizient diskutiere ich separat, da dieser aber über die gesamte Regression definiert ist, während Standardfehler für mehrere unabhängige Konstanten innerhalb der Regression verschieden sind und über Abschnitte meiner Messung weit mehr aussagen. Dies ist unter anderem der Fall, weil gegenseitige Abhängigkeiten zwischen den Konstanten bestehen.
Mein doch eher spezieller Fall ist relativ komplex und es macht wenig Sinn hier zu diskutieren, ob ich überhaupt das richtige betrachte oder nicht. Die eigentliche Frage ist und bleibt dieselbe: Was geschieht mit einem Fehler, wenn man den Wert logarithmiert. Unter der Vorgabe, das der Fehler nicht für die logarithmierten Werte neu berechnet werden kann sondern man lediglich den ursprünglichen Fehler verwenden kann. Mithilfe von gilgamesch und NGTRX haben wir hier bereits erarbeiten, dass man den Gesetzen der Fehlerfortpflanzung folgen muss.

Dein Kommentar zu dieser Antwort

Noch nicht registriert bei COSMiQ?
Melde dich hier an!

Bewertung des Fragestellers:

hilfreich

Gute Antwort meinen:

letzte 10 Meinungen:

[Fenster schließen]
1

Als gute Antwort bewerten

Kommentare zur Antwort:

6

6 Kommentare

Diese Frage ist bereits geschlossen, daher sind keine Antworten mehr möglich. Du kannst jedoch einzelne Antworten kommentieren oder einen Kommentar hinterlassen.

Diese Frage:

  • Kommentare
410666
BesondersArroganter
BesondersArroganter

die konstante erreicht werte über 1000, 10000 ?

1051871
Picus48
Picus48

Irgendwie erscheint es mir nicht sinnvoll die Werte für die zugehörigen Standardfehler ebenfalls zu logarithmieren.

Ich finde es aussagefähiger, wenn der Wert für den Standardfehler nicht-logarithmiert bleibt, unabhängig von der Darstellung der Werte für die Konstanten.

Aber wenn es denn sein soll, sehe ich auch keinen Grund, es nicht zu tun. Man ändert doch lediglich eine Darstellungsweise (Format). Genauso gut könnte man die Zahlen in Hexadezimal umwandeln.

1051786
NGTRX
NGTRX

Wenn ich das richtig verstanden habe, geht es darum, den Standardfehler nicht nur zu logarithmieren, sondern so anzupassen, dass er sich auf den Logarithmus des Wertes und nicht mehr auf den Wert selber bezieht. Und das führt irgendwie zu unschönen Verwerfungen.

 

Das könnte Dich auch interessieren:

  • Warum nimmt ein Zigarettenautomat machmal gültige Münzen nicht an ?

    Antwort: Automaten haben verschiedene Kriterien, wann sie die Münzen annehmen und wann nicht. Wenn eine Münze nun nur leicht von den Kriterien abweicht, sei es durch Abnutzung oder zu schnell bzw. zu langsam eingeworfen, lässt er sie durchfallen. Durch das mehrmalige Einwerfen ist somit eine höhere Chance gegeben, dass der Automat das Geld nun doch irgendwann annimmt. Die Münze am Automaten zu reiben, ... Alle Antworten ansehen

  • Schuld eingestehen?

    Antwort: Ich glaube, dass es vor allem zwei Dinge gibt, die das eingestehen von Schuld schwer machen. 1. Das Biuld vom perfekten Menschen, dass uns in den Medien vorgegaukelt wird. Jugendlich, erfolgreich, schön, sexi ... = Perfekt und somit Fehlerfrei. Das Bild des menschlichen Menschen, mit Fehlern und Schwächen wird kaum gezeigt. 2. Der Hang, dass alles "professionell" sein muss. Wenn einer ... Alle Antworten ansehen

  • Welcher Fehler wird von Menschen am häufigsten begangen?

    Antwort: Menschen die leben machen Fehler, Menschen die intensiv leben, machen viele Fehler aber ich kenne auch Menschen die keine Fehler machen. Allerdings liegen die meisten davon auf dem Friedhof. Manchmal denke ich, wenn ich einen Fehler hätte, ich würde ihn sicher sofort eingestehen. Was heisst denn eigentlich "Fehler"? Das bedeutet, dass mir etwas "fehlt". Dann ist doch der Fehler eine Voraussetzung ... Alle Antworten ansehen

  • Qualitätsmanagement: Fehlerquote=5000 DPMO; Umrechnungsfaktor=0,5 --> Fehlerrate in ppm?

    Antwort: DPMO: Defects Per Million Opportunities = 5000 PPM: Parts per Milliom = 5000ppm Ergibt eine PPM Rate von 5000(das wird teuer;-)) PPM ist eine sehr strenge Auslegung der Qualitätssicherheit eines Lieferanten Doch die neuesten Verträge bei Zulieferen( wie bei mir) laufen über Incidents=Zwischenfälle die durch gelieferte Teile entstehen und jeder incident kostet einen vertraglich festgelegten ... Alle Antworten ansehen

Nicht gefunden wonach Du suchst?

Dann stelle Deine Frage doch schnell und kostenlos!