Anlage 4 VO (EG) 2009/761
Datenanalyse durch nicht-lineare Regression
Allgemeine Bemerkungen
In den Algentests und in sonstigen Tests zur Ermittlung des mikrobiologischen Wachstums — des Wachstums einer Biomasse — stellt die Reaktion naturgemäß eine kontinuierliche oder metrische Variable dar: eine Prozessrate, wenn von einer Wachstumsrate ausgegangen wird, und ein zeitbezogenes Integral, wenn die Biomasse zugrunde gelegt wird. Beide Parameter werden auf die entsprechende mittlere Reaktion von zur Wiederholung verwendeten nicht behandelten Kontrollproben bezogen, die am stärksten auf die jeweils gegebenen Bedingungen reagieren; bei Algentests sind Licht und Temperatur die Hauptfaktoren. Das System kann verteilt oder homogen sein, und die Biomasse kann als kontinuierlicher Parameter betrachtet werden; einzelne Zellen brauchen nicht berücksichtigt zu werden. Die Varianzverteilung des Reaktionstyps dieser Systeme hängt ausschließlich von den Versuchsbedingungen ab (die in der Regel durch logarithmisch-normale oder normale Fehlerverteilungen gekennzeichnet sind). In dieser Hinsicht besteht ein Unterschied gegenüber typischen Reaktionen in Bioassays mit quantitativen Daten, bei denen die Toleranz (typischerweise mit binomischer Verteilung) der einzelnen Organismen häufig als maßgebliche Varianzkomponente betrachtet wird. Die Kontrollreaktionen liegen hier bei Null oder im Bereich des Hintergrundwerts. Im einfachsten Fall nimmt die normalisierte oder relative Reaktion r gleichmäßig von 1 (Hemmung Null) bis 0 (vollständige Hemmung) ab. Sämtliche Reaktionen sind mit einem Fehler verbunden, und offensichtlich negative Hemmungen können rechnerisch ausschließlich das Ergebnis zufälliger Fehler sein.Regressionsanalyse
Modelle
Durch eine Regressionsanalyse soll die Konzentrations-Reaktionskurve als mathematische Regressionsfunktion Y = f (C) bzw. häufiger als F (Z) beschrieben werden; dabei ist Z = log C. Umgekehrt ermöglicht C = f–1 (Y) die Berechnung von ECx-Werten einschließlich EC50, EC10 und EC20 sowie der jeweiligen 95- %-Konfidenzintervalle. Verschiedene einfache mathematische Funktionen haben sich als geeignet zur Beschreibung von Konzentrations-Reaktionsbeziehungen in Tests zur Ermittlung der Hemmung des Algenwachstums erwiesen. Zu diesen Formeln zählen die logistische Gleichung, die nicht symmetrische Weibull-Verteilung und die logarithmische Normalverteilung als Sigma-Kurven, bei denen sich jeweils ein asymptotischer Verlauf gegen eins bei C → 0 bzw. gegen Null bei C → unendlich ergibt. Der Einsatz kontinuierlicher Schwellenwert-Funktionsmodelle (z. B. des Kooijman-Modells der „Hemmung des Populationswachstums” (Kooijman u. a. 1996) wurde kürzlich als Alternative zu asymptotischen Modellen vorgeschlagen. Dieses Modell geht davon aus, dass bei Konzentrationen unter einem bestimmten Schwellenwert EC0+ keine Auswirkungen mehr gegeben sind; dieser Schwellenwert wird mit Hilfe einer einfachen kontinuierlichen Funktion mit undifferenziertem Ausgangspunkt durch Extrapolation der Reaktions-Konzentrationsbeziehung so geschätzt, dass die Konzentrationsachse geschnitten wird. Die Analyse kann in einer einfachen Minimierung der Restquadratsummen (bei Annahme einer konstanten Varianz) oder der gewichteten Quadrate (bei Ausgleich einer Varianzheterogenität) bestehen.Verfahren
Das Verfahren kann wie folgt beschrieben werden: Eine geeignete Funktionsgleichung Y = f (C) wird gewählt und durch nicht-lineare Regression an die Daten angepasst. Vorzugsweise sind die Messungen der einzelnen Kolben und nicht die Mittelwerte der Wiederholungen zu verwenden, um möglichst viele Informationen aus den Daten zu gewinnen. Bei einer hohen Varianz haben praktische Erfahrungen hingegen gezeigt, dass die Mittelwerte der Wiederholungen eine sicherere mathematische Schätzung ermöglichen, die weniger von systematischen Fehlern bei den Daten als von den einzelnen ermittelten Datenpunkten abhängt. Die angepasste Kurve und die gemessenen Daten werden grafisch dargestellt; anschließend ist zu prüfen, ob die Kurve in angemessener Weise angepasst wurde. Eine Analyse der Restwerte könnte für diesen Zweck besonders hilfreich sein. Wenn die gewählte Funktionsbeziehung zur Anpassung der Konzentrations-Reaktionskurve die Kurve nicht vollständig beschreibt oder einen wesentlichen Teil der Kurve wie z. B. die Reaktion bei niedrigen Konzentrationen nicht gut beschreibt, ist eine andere Option zur Kurvenanpassung zu wählen (z. B. eine nicht symmetrische Kurve wie etwa die Weibull-Funktion anstelle einer symmetrischen Kurve). Negative Hemmungen können z. B. in Verbindung mit der logarithmischen Normalverteilung problematisch sein und ebenfalls den Einsatz einer alternativen Regressionsfunktion erfordern. Es wird nicht empfohlen, diesen negativen Werten einen Wert von Null oder einen kleinen positiven Wert zuzuweisen, weil ansonsten die Fehlerverteilung beeinträchtigt werden könnte. Angemessen sind unter Umständen getrennte Kurvenanpassungen für bestimmte Bereiche der Kurve (z. B. für den Bereich mit der niedrigen Hemmung, wenn EClow x-Werte geschätzt werden sollen). Aus der angepassten Formel sind (mit der Umkehrfunktion C = f–1 (Y)) charakteristische Schätzwerte für ECx zu ermitteln und mindestens für EC50 sowie für einen oder zwei Werte von EClow x zu protokollieren. Praktische Erfahrungen haben gezeigt, dass die Genauigkeit der Algentests im Allgemeinen eine angemessen exakte Schätzung der Konzentration bei einer Hemmung von etwa 10 % ermöglicht, wenn hinreichende Datenpunkte verfügbar sind (sofern nicht eine Unregelmäßigkeit in Form einer Stimulation auch bei niedrigen Konzentrationen gegeben ist). Die Genauigkeit einer EC20-Schätzung ist häufig beträchtlich größer als die Genauigkeit geschätzter EC10-Werte, weil die EC20-Werte gewöhnlich im annähernd linearen Bereich der zentralen Konzentrations-Reaktionskurve vorgenommen werden. Gelegentlich ist die Beurteilung von EC10-Werten wegen der Wachstumsstimulation problematisch. Werte für EC10 sind also im Allgemeinen mit hinreichender Genauigkeit zu erhalten; in jedem Fall empfiehlt sich jedoch, auch die EC20-Werte zu erfassen.Gewichtungsfaktoren
Die Versuchsvarianz ist nicht grundsätzlich konstant und beinhaltet typischerweise eine proportionale Komponente; daher wird vorzugsweise regelmäßig auch eine gewichtete Regression vorgenommen. Die Gewichtungsfaktoren für diese Analysen werden im Allgemeinen als umgekehrt proportional zur Varianz angenommen: Wi = 1/Var(ri) Viele Regressionsprogramme beinhalten die Option zur Durchführung gewichteter Regressionsanalysen mit Gewichtungsfaktoren, die aus einer Tabelle ausgewählt werden können. Die Normalisierung der Gewichtungsfaktoren kann auf bequeme Weise erfolgen, indem die Gewichtungsfaktoren so mit n/Σ wi (n = Anzahl der Datenpunkte) multipliziert werden, dass sich die Summe 1 ergibt.Normalisierung der Reaktionen
Die Normalisierung durch die mittlere Kontrollreaktion bringt einige grundsätzliche Probleme mit sich und bedingt eine eher komplizierte Varianzstruktur. Mit der Division der Reaktionen durch die mittlere Kontrollreaktion zur Ermittlung der prozentualen Hemmung wird ein weiterer Fehler eingeführt, der auf den in den Mittelwerten der Kontrollen enthaltenen Fehler zurückzuführen ist. Wenn dieser Fehler nicht vernachlässigbar gering ist, sind Gewichtungsfaktoren in Verbindung mit der Regression und mit den Konfidenzintervallen bezogen auf die Kovarianz der Kontrollen zu korrigieren (17). Eine hohe Genauigkeit der geschätzten Mittelwerte der Kontrollreaktionen ist wichtig, um die Gesamtvarianz der relativen Reaktion zu minimieren. Diese Varianz lässt sich wie folgt beschreiben. (Dabei steht das tiefgestellte i für die Konzentration i und die tiefgestellte 0 für die Kontrollen.) Yi = relative Reaktion = ri/r0 = 1 – I = f (Ci) bei gegebener Varianz: Var (Yi) = Var (ri/r0) ≅ (∂Yi / ∂ ri)2·Var(ri) + (∂ Yi/ ∂ r0)2·Var (r0) entsprechend gilt (∂ Yi/ ∂ ri) = 1/r0 und (∂ Yi / ∂ r0) = ri/r02 bei normal verteilten Daten und mi und m0 Wiederholungen: Var(ri) = σ2/mi für die Gesamtvarianz der relativen Reaktion Yi gilt somit: Var(Yi) = σ2/(r02 mi) + ri2·σ2/r04 m0 Der Fehler im Mittelwert der Kontrollen ist umgekehrt proportional zur Quadratwurzel der Anzahl der durchschnittlichen Kontrollwiederholungen; gelegentlich ist die Einbeziehung historischer Daten gerechtfertigt, um den Fehler auf diese Weise erheblich zu reduzieren. Ein alternatives Verfahren besteht darin, die Daten nicht zu normalisieren und die absoluten Reaktionen einschließlich der Daten der Kontrollreaktionen nicht anzupassen, sondern den Kontroll-Reaktionswert als zusätzlichen Parameter einzuführen, der durch nicht-lineare Regression anzupassen ist. In Verbindung mit einer normalen Regressionsgleichung mit zwei Parametern erfordert diese Methode die Anpassung von drei Parametern; daher sind mehr Datenpunkte erforderlich als bei der nicht-linearen Regression von Daten, die mit einer vordefinierten Kontrollreaktion normalisiert werden.Umkehrung der Konfidenzintervalle
Die Berechnung nicht-linearer Konfidenzintervalle durch Schätzung mit der Umkehrfunktion gestaltet sich eher komplex und ist in den üblichen statistischen Computer-Programmen als reguläre Option nicht enthalten. Ungefähre Konfidenzintervalle können mit Standardprogrammen zur Berechnung nicht-linearer Regressionen durch Neu-Parametrisierung ermittelt werden (Bruce und Versteeg, 1992); dabei wird die mathematische Formel mit den angestrebten Punktschätzungen (z. B. EC10 und EC50) als zu schätzenden Parametern neu entwickelt. Vorausgesetzt wird I = f (α, β, Konzentration. Die Definitionsbeziehungen f (α, β, EC10) = 0,1 und f (α, β, EC50) = 0,5 werden verwendet, um f (α, β, Konzentration) durch eine äquivalente Funktion g (EC10, EC50, Konzentration) zu ersetzen. Für eine direktere Berechnung (Andersen u. a. 1998) kann die ursprüngliche Formel verwendet und eine Taylor-Expansion um die Mittelwerte für ri und r0 angenommen werden. In letzter Zeit werden zunehmend auch Methoden mit Bootstrapping-Algorithmen verwendet. Diese Methoden beruhen auf Schätzungen einer empirischen Varianzverteilung ausgehend von den gemessenen Daten und von häufigen Stichproben unter Einsatz eines Zufalls-Nummerngenerators.Literatur
Kooijman, S.A.L.M.; Hanstveit, A.O.; Nyholm, N. (1996): No-effect concentrations in algal growth inhibition tests. Water Research 30, S. 1625-1632. Bruce, R.D. and Versteeg, D.J.(1992) A Statistical Procedure for Modelling Continuous Ecotoxicity Data. Env. Toxicol. Chem. 11, S. 1485-1494. Andersen, J.S., Holst, H., Spliid, H., Andersen, H., Baun, A. & Nyholm, N. (1998): Continuous ecotoxicological data evaluated relative to a control response. Journal of Agricultural, Biological and Environmental Statistics 3, S. 405-420.© Europäische Union 1998-2021
Tipp: Verwenden Sie die Pfeiltasten der Tastatur zur Navigation zwischen Normen.