@Worrel: Du versuchst gerade ganz simple kausale 1:1 Zusammenhänge zu konstruieren, dass funktioniert nicht.
Das ist dein Problem.
.gif)
Denn du hast geschrieben:
"Bestehende empirische(!) Ergebnisse sind zum Beispiel, dass sich anhand des Kommunikations-, Einkaufs- und Bewegungsprofils eines ansonsten völlig anonymen Menschen ablesen lässt, ob dieser an Depressionen leidet oder demnächst leiden wird."
Sprich: Du behauptest, aus den Daten über
eine Person könnte man feststellen, ob diese depressiv ist. Nein, kann man nicht. Man kann feststellen, wie viele Personen von Hundert
wahrscheinlich depressiv sind, aber über eine einzelne Personen kann man
keine definitive Aussage treffen.
Am Beispiel der oft genannten Depression: Wenn das Bewegungsmuster... von einem Ausgangsmaß (100
.gif)
innerhalb eines, vorher definierten, kurzen Zeitraums um z.B. 60% abnimmt, besteht eine 86%ige Wahrscheinlichkeit, dass die betreffende Person eine Depression bzw. mittelgradige depressive Episode entwickelt hat.
Und die restlichen 14% teilen sich Möglichkeiten wie:
- neues Computerspiel
- zu schlechtes oder gutes Wetter (als es letztens 34° war, war mir das viel zu heiss, um rauszugehen)
- Gesundheitsprobleme (Verstauchungen, Migräne, Durchfall, Erkältung, Periode, Sonnenbrand, Zahnschmerzen, ...) bei einem selber oder einem Haushaltsmitglied
- Exessives Lernen oder Vorbereiten (Prüfung etc), Renovieren, Hausputz, Gartenpflege, ...
- keinen Bock aufs Handy und das Ding einfach mal zu Hause gelassen (oder vergessen)
- Urlaub des besten Kumpels, mit dem man sonst um die Häuser zieht
- Events wie LAN Party Wochenende oder HdR Filme Marathon
- auf Abruf bereit stehen, weil
jemand anders depressiv ist und deine Hilfe brauchen könnte
- kreative Phase
- Abneigung gegen Stadtkirmes, bzw. deren Produkten (Betrunkene)
- Smartphone kaputt
...
Ich finde eine Zahl wie 86% sehr hoch gegriffen, wenn man sich alleine die von mir aufgezählten Möglichkeiten anschaut, die mir innerhalb von ein paar Minuten eingefallen sind. Bei einer solchen Studie würde ich mir erstmal genauere Infos über die Erhebung besorgen, bevor ich deren Ergebnisse verwende.
zB: Wie wurden denn die Versuchspersonen ausgewählt? Man muß bei dieser Fragestellung ja sichergehen, daß auch depressive Leute dabei sind.
oder: Was ist denn genau "ein kurzer Zeitraum"? Fallen dann halbstündige Depressionsphasen durchs Raster (die gibt's doch bestimmt auch?)? Ist eine Woche noch "kurz"?
oder: Was für eine Zielstellung hatten denn die Versuchsorganisatoren? Bekanntlicherweise gibt es ja diverse Möglichkeiten, bewußt und unbewußt das Meßergebnis zu beeinflussen oder gar Daten falsch zu verbinden oder zu deuten.
siehe bspweise:
https://www.sein.de/absurde-statistiken-zufall-oder-zusammenhang/ - unter anderem gibt es da einen Graphen, der eine verblüffende Übereinstimmung zeigt zwischen
- der Anzahl der Menschen, die starben, weil sie sich in ihrem Bettlaken verhedderten
und
- Einnahmen aus Ski-Gebieten
Wenn das mit anderen einfachen Daten kombiniert wird (=Metadatenanalyse), kann diese 'Ferndiagnose' weiter verfeinert und mit größer Sicherheit (>86
.gif)
gemacht werden. Das Depressionsbeispiel ist vielleicht auch nicht das Beste, da es natürlich dazu verleitet zu sagen: "Naja, das trifft ja nicht auf mich zu!".
Es geht nicht darum, ob es auf
mich zutrifft, sondern, ob es
eindeutig zutrifft. Das zweifele ich gerade in höchstem Maße an. Was nützt mir ein Riesenhaufen Statistik, wenn derjenige nur gerade Kopfschmerzen und deswegen sein Handy zuhause gelassen hatte und für einen Freund CDs und Filme bestellt hat, die laut Datenbank depressive Inhalte haben? Und die Statistik trotzdem behauptet, er wäre depressiv?