Wasserlinsen sollen Wirkung von homöopathischen Mitteln zeigen

(Überarbeitet am 14.2.2014)

——————————————————————————————————
EDIT 23.02.2015 WICHTIG!
Bitte beachten: Auf der Tagung ‚Science meets Homeopathy‘ in Berlin vom 12. bis zum 14. Februar 2015 hatte ich Gelegenheit, meine Vorbehalte mit Herrn Baumgartner zu besprechen (Link). Mein Kritikpunkt zur Auflösung der Messeinrichtung konnte ausgeräumt werden. Einige Fragen sind allerdings noch offen, nach deren Klärung wird der Arikel überarbeitet. ——————————————————————————————————-

Homöopathische Medikamente enthalten bekanntlich ab einer gewissen Potenz kein einziges Atom oder Molekül der Urtinktur mehr. Wenn aber die Eigenschaften des fertigen Medikaments doch von der Urtinktur geprägt sein sollen, dann müsste es einen Übertragungsweg für diese Eigenschaften geben, für den nur das beim Potenzieren benutzte Wasser in Frage kommt. Folglich muss das Wasser irgendeine auf die Urtinktur zurückgehende Änderung erfahren haben. Wenn eine solche Veränderung nachweisbar wäre, wäre eines der vielen Rätsel um die Homöopathie gelöst.

Eine Schweizer Forschergruppe hat daher untersucht, ob Wasserlinsen ein geeignetes Mittel sein können, solche Unterschiede nachzuweisen. Hierüber wurde in verschiedenen Arbeiten berichtet [1], [2], [3]. Die Grundidee besteht darin, Wasserlinsen (Lemna Gibba L.) mit Arsen deutlich zu schädigen und dann zu beobachten, wie sie sich wieder erholen. Maßstab für das Ausmaß der Vergiftung war ein reduziertes Wachstum. Wenn man diese geschädigten Pflanzen in frisches Wasser setzt, das mit einer wirksamen homöopathischen Arznei versetzt ist, dann sollte sich die Pflanze schneller erholen als in der Kontrollprobe, die keine Arznei enthielt. Dies konnte anhand der Zunahme der Oberfläche der Blätter und der Anzahl der Pflanzen gemessen werden.

In einem Vorversuch [1] hat man drei verschiedene Substanzen als möglicherweise wirksame Mittel erkannt, die in den in [2] dargestellten Versuchen repliziert werden sollten. Von diesen Mitteln erwies sich letztendlich Arsenicum Album als das wirksamste, daher werden wir hier nur die Ergebnisse zu diesem Stoff betrachten. [3] scheint als ein zusammenfassender Abschlussbericht konzipiert zu sein.

Der Bayerische Rundfunk hat in seiner Fernsehsendung vom 22. 4. 2013 ebenfalls über die Arbeit der Forschergruppe berichtet [4], die selbst ein erhebliches Echo hervorgerufen hat. Sowohl die Autoren der Berichte als auch der BR zogen eine positive Bilanz der Untersuchungen.

Allgemein

In allen drei Studien wird in geradezu vorbildlicher Ausführlichkeit der Ablauf der Untersuchungen dargestellt und welchen Aufwand man betrieben hat, die Versuchsbedingungen für die einzelnen Experimente konstant und vergleichbar zu halten. Eine Diskussion hierüber erübrigt sich, da wir nicht in der Lage sind zu überprüfen, ob vielleicht doch etwas übersehen wurde. Unsere Kritik an dieser Studie richtet sich nicht auf diesen Teil der Forscherarbeit.

In den Berichten finden sich eine Menge Zahlen, die auf der Grundlage der Versuche ermittelt worden sind. Zumeist sind dies aber statistische Kennwerte zur Signifikanz der Ergebnisse. Einen tatsächlichen aussagekräftigen Vergleich der Wachstumsraten zwischen homöopathischem Präparat und Wasser findet man indes nur in [2], weswegen wir uns in der Analyse auf diese Arbeit konzentrieren.

Studiendesign 

Der generelle Studienablauf wurde oben bereits beschrieben und ist sicher nachvollziehbar dargestellt. Was allerdings etwas stutzig macht, sind gewisse Details in der Durchführung, worauf schon Marko Kovic von den Skeptikern Schweiz hier  hingewiesen hat: Er verweist auf die Auswahl nicht gebräuchlicher Potenzierungen und auch darauf, dass möglicherweise mehr Einzelergebnisse erzeugt wurden als berichtet wird. Die dann tatsächlich in das Studienergebnis eingeflossenen Ergebnisse wären dann möglicherweise eine Auswahl der positiven Resultate, also eine bewusste Verfälschung des Ergebnisses. Kovic bezieht sich in seiner Analyse zwar auf [3], aber wir können die Ansatzpunkte auch in [2] finden:

Nach den Angaben des Berichts wollten die Forscher nach einem Verfahren suchen, mit dem man einen Unterschied zwischen einem potenzierten homöopathischen Mittel und einfachem Wasser feststellen kann. Dann wäre es doch naheliegend, dass man mit den zu prüfenden Substanzen den gesamten Bereich der handelsüblichen Potenzen abdecken will. Arsenicum Album als flüssige Lösung wird beispielsweise von der DHU in den Potenzen D6, D8, D10, D12, D15, D20, D30 D60 und D200 listenmäßig angeboten. Weleda liefert D6 D12 und D30. Die Forscher benutzen aber stattdessen D17, D18, D21, D22, D23, D24, D28, D30, D33. Nicht nur, dass damit völlig unübliche Potenzen eingesetzt werden, die man allenfalls als Spezialanfertigung beziehen kann und die daher wohl kaum in der täglichen Praxis anzutreffen sind. Der Einsatzbereich von Arsenicum Album wird auch nur zu einem recht kleinen Anteil abgedeckt. Für diesen merkwürdigen Sachverhalt findet man in keinem der Berichte eine Erklärung.

Ebenso ohne Erklärung bleibt die seltsam anmutende Zusammenstellung der Proben. Wenn wir hier die Experimente aus den Vorversuchen einbeziehen, dann ergibt sich das folgende Bild:

Ein Versuchslauf bestand aus 100 Glasbechern, die als Versuchsgefäße dienten. Die 100 Gefäße wurden zu 5 Versuchsgruppen zu je 20 Bechern aufgeteilt. Jede dieser Gruppen enthielt nach Angaben der Forscher

  • einen Becher mit ungeschädigten Wassserlinsen in Wasser als Kontrolle
  • einen Becher mit Wasserlinsen in Arsenlösung, ebenfalls als Kontrolle
  • neun Becher mit Wirkstoff in den neun verschiedenen Potenzen, diese werden wir im Folgenden als Verumgruppe bezeichnen
  • neun Becher mit ungeschütteltem (4 Stück) und geschütteltem Wasser (5 Stück), diese werden wir als Placebogruppe bezeichnen, obwohl natürlich kein Placebo verwendet wurde

Die ersten beiden Proben sind nicht in die Auswertung eingeflossen und dienten wohl der Überprüfung der Qualität der Pflanzen. Fasst man alles zusammen, dann enthält jeder Versuchslauf:

  • 10 Proben als Kontrolle mit ungeschädigten Wasserlinsen in Arsen und klarem Wasser
  • 45 Proben mit Wasserlinsen in geschütteltem und ungeschütteltem Wasser
  • 45 Proben mit zusammen 5 Verumgruppen zu je neun Potenzen

Insgesamt wurden drei verschiedene homöopathische Wirksubstanzen in jeweils neun verschiedenen Potenzen untersucht. Dazu wurde noch quasi als vierte Wirksubstanz ungeschütteltes Wasser untersucht als ’systematische Negativkontrolle‘. Die jeweils neun Becher enthielten Wasserlinsen in ungeschütteltem Wasser. Alle 4 Substanzen zu je 20 Bechern wurden in Summe 25 Mal erprobt, was in Summe 2000 einzelne Proben ergeben hat und 20 Versuchsläufe erforderte. Wenn wir zusammenzählen, was wie oft gemessen wurde, dann ergibt sich folgendes Bild:

  • 100 Mal ungeschädigte Wasserlinsen in klarem Wasser
  • 100 Mal ungeschädigte Wasserlinsen in Arsenlösung
  • 500 Mal geschädigte Wassserlinsen in geschütteltem klaren Wasser
  • 625 Mal geschädigte Wasserlinsen in ungeschütteltem klaren Wasser
  • 675 Versuche mit den drei untersuchten Substanzen jeweils in 9 Potenzen, mithin jeweils 25 Versuche an identischen Verum-Proben.

Wer kann sich denn einen solchen Versuchsplan ausgedacht haben und wer hat ihn freigegeben? Ungeschütteltes Wasser wird fast so oft erprobt wie alle Wirkstoffe in jeweils allen Potenzen zusammen. Insgesamt stehen 1325 Kontroll- und Vergleichsproben nur 675 Proben mit Verum gegenüber.

Man hätte ohne Weiteres die doppelte Anzahl an Verum-Versuchen durchführen können und immer noch Platz für 650 Kontroll- und Vergleichsproben gehabt, was immer noch recht üppig gewesen wäre. Beispielsweise reicht doch pro Versuchslauf eine Reihe Vergleichsproben mit Wasser aus, die dann als Vergleich für alle Verum-Gruppen in diesem Versuchslauf hätte dienen können. Es ist auch nicht so richtig einleuchtend, welchen Erkenntnisgewinn man erzielen wollte, indem man ungeschüttelte Wasserproben als Quasi-Verum mit geschütteltem und ungeschütteltem Wasser als Placebogruppe verglichen hat. Man hätte also

  • bei gleichem Messaufwand (2000 Becher) für Verum ohne Weiteres die doppelte Anzahl Datenpunkte erreichen können, jeder Wirkstoff und jede Potenz 50 statt 25 Mal messen können, was der statistischen Stärke zugute gekommen wäre
  • bei gleichem Aufwand doppelt so viele Potenzen oder gar Wirkstoffe messen können, womit man den Anwendungsbereich der einzelnen Substanz hätte besser abdecken können
  • die Messergebnisse der Studien in der halben Zeit mit dem halben Aufwand – und daher auch mit erheblich geringeren Kosten – erreichen können.

Oder hat man gar nicht so viele Leerproben gefahren, sondern etwas anderes gemessen, über das aus welchen Gründen auch immer hier nicht berichtet wird? Dies ist natürlich nicht beweisbar und klingt sehr nach Verschwörungstheorie, ist daher eigentlich nicht besonders glaubwürdig. Aber, dass irgendjemand bei klarem Verstand das Budget für diesen Versuchsplan genehmigt haben soll, ist auch nur sehr schwer vorstellbar.

Quintessenz: Irgendwie wirkt die ganze Versuchsdurchführung etwas irreal.

Ergebnisse: Vergleich Wasser – Arsen

Die wesentlichen Ergebnisse sind für uns natürlich die Unterschiede in den Wachstumsraten der Wasserlinsen unter den homöopathischen Medikamenten im Vergleich zu normalem Wasser. Erstaunlicherweise halten sich die Forscher mit konkreten Zahlen recht bedeckt, nur in [2] findet man ein Bild, in dem direkt der Vergleich zwischen Verum und Placebo zahlenmäßig dargestellt ist. Man findet viele Tabellen mit jeder Menge Kennzahlen zur Signifikanz – aber wie groß die Unterschiede nun tatsächlich sind, wird alleine in einem einzigen Diagramm dargestellt. Arsenicum Album hat demnach den größten Heilungseffekt bei den Wasserlinsen ausgelöst, weshalb wir uns hier auf diese Wirksubstanz beschränken wollen. Die Ergebnisse für die anderen Stoffe sind hier weggelassen.

Arsenicum_Growth rate

Bild 1

Dies ist ein Ausschnitt aus Fig. 4 aus [2]. Hier sind die Wachstumsraten pro Tag für die fünf Experimente mit Arsenicum Album (obere Punkte) mit der Kontrollgruppe aus klarem Wasser verglichen. Der Vergleich bezieht sich auf die Zunahme der Oberfläche der Blätter im Zeitraum von Tag 2 bis Tag 6 des Versuchs. Die ersten beiden Tage haben, so die Forscher, keine Unterschiede in den Wachstumsraten erbracht. Die Verbindungslinien zwischen den Punkten haben keine Bedeutung und dienen nur der besseren Erkennbarkeit. Die senkrechten Linien in den Punkten stellen den Standardfehler dar, anhand dessen man die Streuung der Daten ermitteln kann. Zu jedem Datenpunkt sind die Ergebnisse der neun verschiedenen Potenzen zusammengefasst worden. Warum man das so gemacht hat, ist nicht erklärt. Jeder einzelne Punkt im Diagramm repräsentiert das Ergebnis für 45 Proben.

Mit diesem Bild werden wir uns jetzt eine Weile beschäftigen.

Zunächst fällt die relativ große Schwankungsbreite der Daten auf. Nach ihrem Bericht haben die Forscher einen rechten Aufwand betrieben, die Bedingungen von Versuch zu Versuch konstant zu halten. Dennoch treten recht große Schwankungen auf: Die Ergebnisse für Arsen und Kontrollgruppe schwanken je für sich von Versuchsreihe zu Versuchsreihe maximal um rund 7 %. Damit beträgt die Schwankungsbreite mehr als das 5,5-fache des Abstandes zwischen den beiden Kurven. Ein deutliches Ergebnis sieht anders aus.

Nach den Angaben der Forscher gehören zu jedem Experiment fünf Einzelversuche, deren neun Potenzen zusammengefasst worden sind. Mithin repräsentiert jeder einzelne Datenpunkt im Bild, wie oben gesagt, 45 Messergebnisse. Die Forscher haben in jedem einzelnen Punkt im Bild die Streuung durch einen senkrechten Strich dargestellt. Die Streuung wurde als Standardfehler dargestellt, was den Vorteil hat, relativ kleine Zahlenwerte zu liefern, allerdings auch den Nachteil, nicht direkt etwas über die Streuung der Messergebnisse auszusagen.

Viel aussagekräftiger ist die Standardabweichung, die man allerdings aus dem Stadardfehler berechnen kann. Sie ist insofern aussagekräftig, weil sich innerhalb einer Schwankungsbreite von der Größe der Standardabweichung nach oben und der gleichen Größe nach unten rund zwei Drittel der Versuchsergebnisse befinden. 95 % der Versuchsergebnisse liegen in einem Streubereich, der doppelt so groß ist.

So schön einsichtig das auch ist, der Nachteil ist, die Standardabweichung ist unangenehm groß und eignet sich von daher nicht zur Darstellung, wenn man ein deutliches Ergebnis präsentieren will. Es wird in der Arbeit beschrieben, dass die Versuchsergebnisse einer Normalverteilung entsprechen, daher müsste die folgende Betrachtung recht genau zutreffen. Ich habe die Daten aus Bild 1 vermessen, was allerdings wegen der begrenzten Auflösung am Bildschirm nicht allzu genau ist. Daraus habe ich die Standardabweichung errechnet und als rote und blaue Linien eingezeichnet. Das Ergebnis zeigt Bild 2:

 My_Arsenicum_Growth rate

Bild 2

Wie man deutlich erkennen kann, liegen die Mittelwerte der Arsenicum-Reihe durchweg im Bereich der Standardabweichung der Kontrollreihe und umgekehrt. Das spricht überhaupt nicht für ein Ergebnis, das statistisch signifikant ist. Zur Signifikanz verweise ich auf mein Buch, wo die Bedeutung ausführlich behandelt worden ist.

Die Forscher haben die Signifikanz für ihr Ergebnis ermittelt, in Tabelle 2 in [2] wird angegeben, die Signifikanz der Wachstumsrate bei Arsenicun album läge bei p < 0,001, was eigentlich ein sehr signifikantes Ergebnis wäre. Nur, mit Blick auf Bild 2 fällt es sehr schwer, das zu glauben. Man hat als Signifikanztest eine Varianzanalyse als multifaktoriellen F-Test durchgeführt. Ich muss offen gestehen, mit diesem Testverfahren nicht hinreichend vertraut zu sein, um beurteilen zu können, welcher Sachverhalt bei den vorliegenden Daten zu einer solch ausgeprägten Signifikanz geführt haben könnte. In einer späteren Veröffentlichung [3] wird der Varianztest nicht mehr erwähnt, sondern stattdessen ein Student-t-Test beschrieben. Daher fühle ich mich hier durchaus berechtigt, mich nicht tiefer in das Wesen des Varianztests einzuarbeiten, sondern die  Signifikanz ebenfalls mit Hilfe von T-Tests zu überprüfen.

In Bild 1 kann man erkennen, dass die Daten aus den einzelnen Experimenten paarweise zusammenzuhängen, möglicherweise wurden die Schwankungen der Mittelwerte der Experimente durch kleine Änderungen in den Versuchsbedingungen hervorgerufen, die technisch nicht zu vermeiden waren: Das Maximum der Arsenicum-Gruppe tritt im gleichen Experiment auf wie bei der Kontrollgruppe, gleiches gilt für die Minimalwerte. Daher erscheint es gerechtfertigt, für jeweils ein Experiment die Signifikanz aus dem Vergleich der Daten für Arsenicum Album und Placebo zu berechnen.

Es ergeben sich für die fünf Datenpunkte (‚experiments‘):

  • Experiment 1: p = 006
  • Experiment 2: p = 0,01
  • Experiment 3: p = 0,19
  • Experiment 4: p = 0,35
  • Experiment 5: p = 0,02

Ich selbst verfüge nicht über die notwendigen tiefgehenden Kenntnisse in Statistik, um beurteilen zu können, wie sich die Ergebnisse dieser Tests auf einen Varianztest übertragen würden. Da aber nicht ein Ergebnis des T-Tests die von den Forschern angegebene Wahrscheinlichkeit von p = 0,001 errecht, erscheint deren Bewertung durchaus fragwürdig, wenn auch nicht nach Maß und Zahl zu belegen.

Wenden wir uns einem anderen Aspekt zu:

War die Messtechnik geeignet, die hier dargestellten Unterschiede überhaupt zu messen?

Sofern sie keinem anderen Einfluss unterliegen, wachsen Wasserlinsen in einer Weise, dass sie sich von Tag zu Tag immer mit dem gleichen Faktor vervielfachen. Begrenzende Einflüsse könnten beispielsweise sein, dass die Nährstoffe, die zum Wachstum benötigt werden, weniger werden oder nicht genügend Platz vorhanden ist. Beides haben die Forscher ausgeschlossen. Der Wachstumsfaktor lässt sich aus den Wachstumsraten, so wie sie angegeben sind, errechnen. Ich will jetzt niemanden verschrecken, wenn ich über Logarithmen rede, aber in der Arbeit wurde die Wachstumsrate definiert zu

r = (ln (x2) – ln (x1)) / (t2 – t1)

mit x2 als Fläche am Ende x1 als Fläche am Anfang und t2-t1 als dazwischenliegende Zeit in Tagen. Wer mit Logarithmen firm ist, weiss wie es geht, den Rest würde ich nur unnötig erschrecken.

Der Mittelwert der Ergebnisse der Arsenicum-Proben beläuft sich auf 0,4396, der für die Wasserproben auf 0,4344, wie aus dem Original von Bild 1 – durchaus mit begrenzter Genauigkeit – herausgemessen wurde. Der Unterschied beträgt nur ca. 1 %. Solch kleine Werte erfordern eine recht hohe Genauigkeit der zugrunde liegenden einzelnen Messwerte, was wir im Folgenden untersuchen werden.

Im Mittel der fünf verschiedenen Daten liegt der Wachstumsfaktor für Arsenicum album bei 1,552, für Wasser bei 1,544. Das sieht auch nach der Umrechnung nicht nach einem sehr großen Unterschied aus. Wie konnte man den messen? Nach den Angaben ist dies der tägliche Wachstumsfaktor für die Fläche für die Tage 2 bis 6, also die letzten vier Tage des Versuchs.

Die Forscher haben in jeden Becher mehrere Wasserlinsen eingebracht, wir werden die erforderlichen Genauigkeiten anhand der Entwicklung einer solchen Pflanze abschätzen. Gehen wir einfach mal von einer Wasserlinse aus, die einen Durchmesser von 5 mm hat, die Fläche beträgt dann rund 20 mm². Wir haben zwar keine Angaben, was in den ersten Tagen passiert – man ist mit solchen Angaben recht zurückhaltend – aber für den Zweck der Diskussion hier sei angenommen, dass die Wachstumsrate genauso groß war wie in den letzten 4 Tagen. Aus den 20 mm² ist dann im Wasser nach zwei Tagen durch Sprossung und Blattwachstum der neuen Pflanzen eine Fläche entstanden von

20 x 1,544 x 1,544 = 47,7 mm²

Nach weiteren vier Tagen ist die Fläche auf 271 mm² angewachsen . Unter Arsen ist die Fläche von 20mm² nach zwei Tagen auf 48,2mm² (0,5mm² mehr als im Wasser), nach sechs Tagen auf 279,5 mm² (8,5 mm² mehr als in Wasser) gewachsen.

Ich behaupte, diesen Unterschied sehen Sie mit dem bloßen Auge nicht, wie durch folgende Überlegung klar wird:

Da es sich jetzt wahrscheinlich um ein Gemisch von verschieden großen Pflanzen handelt, gehen wir von einem mittleren Durchmesser von etwa 4 mm aus, was einer Fläche von 12,6mm² entspricht. 271 mm² oder 279,5 mm² erfordern dann 22 Blätter. Für die Blätter im Arsenicum album ergäbe sich im Durchschnitt ein Durchmesser von 4,05 mm, für Wasser einer von 3,96 mm, also nur rund einen Zehntel Millimeter kleiner. Alternativ könnte auch ein einziges Blättchen von rund 3,3 mm mehr entstanden sein. Wie gesagt, auf den ersten Blick sieht man das sicher nicht.

Für die Betrachtung mit einem einzelnen Blatt als Ausgangspunkt kommen wir vielleicht noch auf handhabbare Werte, insbesondere, wenn die Zahl der Blätter bei Arsenicum album höher gewesen wäre. Aber wie sieht es anders herum aus: Wie genau muss die Ausgangsbasis, der Durchmesser des ersten Blattes, ermittelt worden sein, um einen solch kleinen Unterschied in den Wachstumsraten zweifelsfrei festzustellen? Gehen wir hierzu quasi als Gegenbetrachtung von einer Fläche im Endzustand von 280 mm² aus und schauen, welcher Größenunterschied bei den Blätter vier Tage zuvor vorgelegen haben müsste. Zu diesem Zeitpunkt waren die Ausgangsdaten für die Ergebnisse gemessen worden, die wir hier präsentiert bekommen.

Ausgehend von 280 mm² nach sechs Tagen hätte für Wasser nach zwei Tagen eine Fläche von 49,3 mm² vorgelegen haben müssen, für Arsen von 48,3 mm² . Gehen wir von einer gleichen Anzahl Blätter jeweils gleichen Durchmessers aus, dann ergeben sich bei drei Blättern für Arsenicum album durchschnittlich 4,53 mm Durchmesser, bei Wasser 4,57 mm, ein Unterschied von nur 0,04 mm. Das heißt, wenn die Messtechnik es nicht schafft, Durchmesserunterschiede im Bereich von 0,04 mm exakt zu bestimmen, sind die aus den Größen ermittelten Wachstumsraten nicht unterscheidbar, die Ergebnisse wären Lotterie.

Was bedeutet das? In der Prüftechnik gilt als Faustformel, dass ein Messsystem eine Auflösung von höchstens einem Zehntel der verlangten Genauigkeit des Ergebnisses haben muss. Das heisst hier, das Messsystem müsste eine Auflösung von nur 0,004 mm gehabt haben. Da wir mit einem Durchschnittswert gerechnet haben, also auch noch kleinere Unterschiede in den Wachstumsraten auftreten, gehen wir von etwa der Hälfte aus, also 0,0025 mm – dies ergibt einfach zu handhabende Zahlen. Der Flüssigkeitsspiegel im Becher müsste also mit rund 10.000 dpi abgetastet worden sein, was bei der Wasseroberfläche im Becher rund 400 Megapixel ergibt.  Die Kamera, die benutzt wurde, um die Pflanzen zu fotografieren, müsste also über einen entsprechenden Sensor verfügt haben. Bei dem üblichen Aufnahmeformat 4 : 3 wären wir also so bei ca. 550 Megapixeln. Zum Vergleich: die Kamera mit der besten Auflösung, die derzeit bei Amazon angeboten wird, hat 46 Megapixel, also weniger als ein Zehntel des hier erforderlichen Wertes – und rangiert weit jenseits der € 2000,-. Das ist nur die Kamera. Auch der Rest der Auswertestrecke muss in der Lage sein, entsprechende Bildgrößen zu verarbeiten, in 8 bit Graustufen sind das immerhin auch 550 Megabyte. Auf eine CD-ROM passt mithin nur ein Bild.

Wir haben jetzt nur die Kamera betrachtet. Es gibt aber noch viel mehr Einflüsse, die die Messgenauigkeit beeinflussen. Sind alle Blätter voll entfaltet, keines durch benachbarte Blätter am gleichen Stengel behindert oder verdeckt? Schwimmen sie alle in der idealen Lage auf dem Wasser oder schwimmen welche schräg? Welchen Streich kann einem die Oberflächenspannung des Wassers spielen, wenn die Blätter in der Nähe vom Glasrand sind? Wer weiss, was es noch für Einflüsse gibt, die das Messergebnis verfälschen könnten.

Indes: Nach meinen Vorstellungen sind solche Kameras und Auswerteverfahren zwar allenfalls im Bereich militärischer Spionagesatelliten zu finden. Aber ich kann mich täuschen. Daher habe ich den Hersteller des angegebenen Messsystems angeschrieben, mit der Bitte, mir Angaben zur Messunsicherheit zukommen zu lassen. Wenn diese Daten vorliegen, werde ich sie hier ergänzen.

Ergebnisse: Vergleich der Potenzierungen

Diese Darstellung können wir recht kurz halten, denn hier passiert eigentlich für den naturwissenschaftlich orientierten Leser nichts wirklich Neues, s. Bild 3:

 My_ArsenicumPotenzen_Growth rate

Auch hier sind die Wachstumsraten aufgetragen, diesmal allerdings als Prozentsatz zur Wachstumsrate in den Wasserproben (c0 und c1), die zu 100 % gesetzt wurden (normierte Darstellung). Die restlichen Datenpunkte stellen für die einzelnen Potenzen (17X = D17 usw.) die Mittelwerte der gemessenen 25 Werte dar. Die senkrechten Linien in den Messpunkten stellen wieder den Standardfehler dar, die Standardabweichung ist um den Faktor 5 größer. Dies ist beispielhaft für den niedrigsten und den höchsten Punkt als blaue Linien eingetragen (die für den oberen Punkt stößt allerdings an den Bildrand und sieht daher schief aus). Die rote Linie repräsentiert die Standardabweichung der Kontrollgruppe aus normalem Wasser. (Die Standardabweichung ist in Relation hier viel größer, da in diesem Punkt mehr Messpunkte zusammengefasst sind als in den Verumgruppen, 100 anstelle nur 25!)

Wie man sieht, liegen alle Mittelwerte gemessen an den Standardabweichungen recht eng beieinander. Ohne jetzt nochmals eine entsprechende Rechnung zu zelebrieren, sei dies als Anzeichen dafür gewertet, dass diese Ergebnisse überhaupt nicht signifikant sind. Wenn man allerdings darauf bestehen will, dass das Ergebnis irgendetwas aussagt, dann doch wohl das, dass das Potenzieren überhaupt nichts bringt. Wenn es die von den Verfechtern der Homöopathie vertretene Wirkung gäbe, dass die Potenzierung von Schritt zu Schritt die Wirksamkeit der Arznei vergrößerte, dann müsste die Verbindungslinie der Mittelwerte der Potenzen nach rechts ansteigen. Diese Tendenz ist beim besten Willen nicht zu erkennen, auch ohne eine Regressionsanalyse durchzuführen.

Diskussion

All die Betrachtungen, die ich hier angestellt habe, führen zu dem Ergebnis, dass die Forscher mit viel Aufwand Zufallsergebnisse produziert haben. Dennoch bleibt etwas Unbehagen: Wenn es sich tatsächlich um Zufallsergebnisse handeln sollte, warum liegen dann in Bild 1 die Ergebnisse für Arsen durchweg oberhalb der Wassergruppe? Man müsste doch eigentlich erwarten, dass das Lotterieergebnis bei einzelnen Datenpunkten auch einmal andersherum hätte ausfallen müssen.

In der Tat ist diese Tatsache nicht wegzudiskutieren: Den Wasserlinsen ging es mit Arsenicum Album immer besser als mit klarem Wasser, zwar nur sehr wenig, aber immerhin. Woher kann das kommen?

Man kann zunächst sicher mit der Wahrscheinlichkeit argumentieren: bei dem vergleichbaren fünfmaligen Werfen einer Münze ist die Wahrscheinlichkeit, dass immer die Zahl zu sehen ist, 1 : 32. Dies ist etwa die Wahrscheinlichkeit, dass man beim Würfeln zweimal hintereinander eine Sechs würfelt (1 : 36), was ja durchaus vorkommt.

Eine andere mögliche Erklärung setzt auf dem oben ausgiebig diskutierten sehr merkwürdigen Versuchsplan auf. Die Forscher geben an, dass die Studie von Weleda finanziert wurde, einem deutschen Hersteller für homöopathische Medikamente. Wenn ein Unternehmen ein Forschungsprojekt bezahlt, dann möchte es auch, dass über einen bestimmten Sachverhalt geforscht wird. (Das ist nichts Verwerfliches! Industrieforschung gewährleistet auch, dass sich die Universitäten mit den realen Dingen beschäftigen, die für die Welt von Interesse sind, und nicht ausschließlich über irgendwelche merkwürdigen Erscheinungen im Außenbereich weit entfernter Galaxien forschen). Wenn man sich den Versuchsplan ansieht, dann scheint Weleda an der Frage interessiert gewesen zu sein, ob denn der ganze Potenzierritus einen Sinn macht – wie wir sehen, tut er das nicht. Für Weleda ist dies interessant, denn mit dieser Erkenntnis kann man Geld sparen. (Das ist auch nichts Verwerfliches: wenn nicht viele Ingenieure und Naturwissenschaftler dieses seit Jahrzehnten betreiben würden, könnten Sie sich vermutlich von rund 40 Wochenstunden Arbeit bei 6 Wochen Urlaub weder ein eigenes Auto oder gar ein Haus leisten.)

Üblicherweise muss ein Forschungsassistent ein solches Projekt betreuen, das heißt planen, die Durchführung überwachen, wenn nicht gar selber in hohem Maße handwerklich mitarbeiten, schließlich die Daten auswerten und präsentieren. Der Assistent möchte sich wissenschaftlich qualifizieren – sonst wäre er nicht dort, wo er ist – was immer eine Veröffentlichung wissenschaftlicher Erkenntnisse beinhaltet. Natürlich ist der Auftraggeber nicht so sehr daran interessiert, dass die Ergebnisse, für die er viel Geld bezahlt, über eine Veröffentlichung der Konkurrenz kostenlos zur Verfügung gestellt werden. Er erlaubt daher dem Assistenten, dass er die Daten verwenden darf, um über eine eigene Themenstellung zu veröffentlichen. Dabei darf er aber nur so wenig wie möglich Originaldaten zeigen. Das sehen wir hier deutlich.

Das bisher beschriebene Vorgehen ist völlig normal und bietet keinen Anlass zur Kritik. Könnte es aber sein, dass vielleicht viel mehr Daten gemessen wurden als die Autoren in die Studie aufgenommen haben? Dies macht die Freigabe des Versuchsplans plausibler. Dann wäre es immerhin möglich, dass zur Darstellung nur die fünf besten Datensätze verwendet wurden.  Dieses Szenario würde alle Ungereimtheiten erklären, die uns aufgefallen sind, würde aber eine Unsauberkeit in der Berichterstattung bedeuten. Da dieser Sachverhalt durchaus Sprengkraft entfalten könnte, habe ich alle Autoren der Studie [2] per Email über diesen Artikel informiert und um eine Stellungnahme gebeten.

Man wird sehen, was dabei herauskommt. Ich habe mich auf jeden Fall verpflichtet, über eine Stellungnahme hier in meinem Blog zu berichten.

Ergänzung (19. 7. 2013):

Es gibt inzwischen einen Nachtrag zu diesem Artikel, der noch die Versuchszeit als einen weiteren Aspekt und zusätzliche Fehlerquelle betrachtet und die gesamten Ergebnisse der Betrachtungen zusammenfasst.

Zusammenfassung

Die Autoren der drei Studien kommen zu dem Schluss, dass es gelungen sei, ein Verfahren zu finden, Unterschiede in Wasser nachzuweisen, die nach der Art und Weise, wie die Untersuchungen durchgeführt wurden, nur vom homöopathischen Mittel herrühren können. Die von den Forschern reklamierte hohe Signifikanz des Ergebnisses, ist anhand der vorgelegten Daten mit einfachen Mitteln nicht nachvollziehbar. Mithin erscheinen die Daten eher als Zufallsprodukte.

Zweifel bestehen, ob die verwendete Messtechnik die Genauigkeit bieten kann, die für eine zuverlässige Bestimmung der geringen gemessenen Unterschiede notwendig wäre. Dies könnte eine Ursache für die starke Streuung zwischen den Versuchen sein und würde in der Konsequenz zu der beobachteten niedrigen Signifikanz führen.

Warum dann allerdings für das betrachtete Mittel nur Ergebnisse angefallen sind, bei denen dieses eine bessere Erholung der Pflanzen zeigte als Wasser, erfordert eine Stellungnahme der Autoren der Untersuchung.

Danksagung:

Ich danke Frau Ute Parsch für die Anregung zu dieser Analyse und ihre Diskussionsbeiträge.

Quellen:

[1] Scherr C, Simon M, Spranger J, Baumgartner S: ‚Effects of potentised substances on growth rate of the water plant Lemna gibba L.‘, in: Complementary Therapies in Medicine (2009) 17, 63-70, (Link zum Volltext nicht mehr verfügbar) Link zum Abstract

[2] Jäger T, Scherr C, Simon M, Heusser P, Baumgartner S: ‚Effects of Homeopathic Arsenicum Album, Nosode and Gibberellic Acid Preparations on the Growth Rate of Arsenic-Impaired Duckweed (Lemna gibba L.)‘, in: The Scientific World Journal: TSW Holistic Health and Medicine (2010) 10, pp 2112 – 2129, Link zum Volltext
Lizenz zur Reproduktion von Inhalten: http://www.hindawi.com/journals/tswj/apc/

[3] Jäger T, Scherr  C, Simon M, Heusser P, Baumgartner S: ‚Development of a Test System for Homeopathic Preparations Using Impaired Duckweed (Lemna gibba L.)‘ in: The Journal of Alternative and Complementary Medicine (2011) 17, 4; pp 315-323, Link zum Volltext

 [4] Sendung des Bayerischen Rundfunks vom 22.4.2013 zum Thema Homöopathie
(Link zum BR entfallen)
Alternativ auf YouTube:
http://www.youtube.com/watch?v=LjhFjqjiT2w

Dieser Beitrag wurde unter Blog, Grundlagenforschung veröffentlicht. Setze ein Lesezeichen auf den Permalink.

9 Kommentare zu Wasserlinsen sollen Wirkung von homöopathischen Mitteln zeigen

  1. Ute Parsch sagt:

    Hallo!

    Ich habe gerade gemerkt, dass bei Quellen [1] und [3] geändert wurden und die Links jetzt auf kostenpflichtige Versionen der Artikel zeigen, bzw. ins Leere laufen.

    Hier ist [1] weiterhin kostenfrei zu sehen:

    http://www.researchgate.net/publication/23967001_Effects_of_potentised_substances_on_growth_rate_of_the_water_plant_Lemna_gibba_L/file/79e4151384f00ced1a.pdf

    Und hier ist [3] weiterhin kostenfrei zu sehen:

    http://www.researchgate.net/publication/51035889_Development_of_a_test_system_for_homeopathic_preparations_using_impaired_duckweed_(Lemna_gibba_L.)/file/9fcfd51384bde00836.pdf

    Grüße

    • Norbert Aust Norbert Aust sagt:

      Hallo Ute,
      Danke für den Hinweis.
      Ich habe allerdings gerade alle Links ausprobiert und (bei mir) funktionieren [1] und [2] und führen direkt auf die jeweiligen PDFs.

      Dein Link [3] ist allerdings besser als meiner, da er zum Volltext führt und nicht nur zum Abstract, den habe ich jetzt in mein Literaturverzeichnis übernommen.

      Viele Grüße

  2. Pingback: “Homöopathie – Heilung oder Humbug?” Humbug, liebe Redaktionen … @ gwup | die skeptiker

  3. Dr. E. Berndt sagt:

    Ich habe eine Aufzeichnung einer Sendung im WDR Naturheilkunde und Homöopathie gesehen. War einfach grauenhaft. Ein Arzt und „Naturheiler“ ist durch die Sendung gehuscht und hat mit freundlichen nichtssagenden Floskeln die diversesten Naturheilverfahren über den grünen Klee gelobt.
    Bei der Homöopathie wurde die Wasserlinsenstudie als Beweis zitiert.
    Gibt es Neuigkeiten zu dieser Studie?

    • Ute Parsch sagt:

      Die neueste Studie von Baumgartner zum Thema (zur Abwechslung wie seiner älteren Arbeiten wieder mit Gibberellinsäure) gesteht durchaus die Nichtreproduzierbarkeit der Ergebnisse ein:

      http://www.homeopathyjournal.net/article/S1475-4916%2813%2900163-X/abstract

      „Reproducibility of basic research investigations in homeopathy is challenging. This study investigated if formerly observed effects of homeopathically potentised gibberellic acid (GA3) on growth of duckweed (Lemna gibba L.) were reproducible. (…) Only in the third series with gibbous L. gibba L. we observed a significant effect (p = 0.009, F-test) of the homeopathic treatment. However, growth rate increased in contrast to the former study, and most biologically active potency levels differed.”

      Grüße

  4. Pingback: Allein unter Globulisten: Kritiker Norbert Aust bei „Science meets Homeopathy“ in Berlin @ gwup | die skeptiker

  5. manfred sandvoss sagt:

    Dass die ergebnisse bescheiden sind, liegt daran, dass hier im grunde ein versuch in sachen isopathie gemacht wurde, also gleiches mit gleichem heilen statt ähnliches mit ähnlichem. daher untauglich, um für oder gegen die homöopathie zu sprechen.

  6. Pingback: Wenn Homöopathen ein Homöopathie-kritisches Buch rezensieren, wird’s lustig @ gwup | die skeptiker

  7. Pingback: Homöopathen-Lobby: Mit Kaulquappen und der GOÄ nach Multiplikatoren fischen @ gwup | die skeptiker

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.