• Aktualisierte Forenregeln

    Eine kleine Änderung hat es im Bereich Forenregeln unter Abschnitt 2 gegeben, wo wir nun explizit darauf verweisen, dass Forenkommentare in unserer Heftrubrik Leserbriefe landen können.

    Forenregeln


    Vielen Dank

[excel, nochmal]größten zweimal vorhandenen wert finden?

  • Ersteller Ersteller ruyven_macaran
  • Erstellt am Erstellt am
R

ruyven_macaran

Gast
[excel, nochmal]größten zweimal vorhandenen wert finden?

ich mal wieder.
nachdem ich meinen datensatz jetzt in der richtigen form hab, folgt gleich das nächste problem:
ich hab immer wieder ausreißer drin, d.h. meine messwerte sind für eine sekunden deutlich anders, als das gesamte umfeld.
vom versuchsaufbau her sind so schnelle änderungen eigentlich nicht möglich, erst recht nicht mit sofortiger rückkehr zum ausgangswert.
dummerweise sind die dinger nicht sooo selten, wie man sich das wünschen würde.
stört an sich auch nicht, würde ich zur auswertung nicht die min/max werte über den gesamten zeitraum benötigen - und da finde ich sehr viele derartige fehler...
lösch ich einen davon, find ich den nächsten mit minimal kleinerem wert.
den ganzen unrealistischen schrott von hand rausschmeißen kann ewig dauern, außerdem komm ich irgendwann in den grenzbereich, bei dem ich anfange, subjektiv zu entscheiden, was richtig und was falsch ist.
inakzeptabl.

habe mir als objektive und automatische lösung überlegt, einfach als absolutes max/min den größten/kleinsten wert zu nehmen, der mindestens 2-3-4mal vorkommt. (den absolut höchsten peak einer kurve abzusäbeln kann ich mir leisten)
problem:
sag mir mal einer eine funktion für excel, die genau den raussucht.
(am besten heute, morgen bräuchte ich n paar erste ergebnisse :ugly: )

plz help *dackelblick*
 
AW: [excel, nochmal]größten zweimal vorhandenen wert finden?

Mhhh...

ich weiß ja nicht wie deine Mersswerte jetzt aussehen, aber hast du dir mal überlegt ob es nicht sinnvoll wär über den Anstieg der Werte die Ausreißer zu eliminieren?

So quasi indem du immer einen Wert x mit x-1 und x+1 vergleichst und sollte die Differenz groß genug sein kannst du x entfernen.

Programmiertechnisch sollte es in Visual Basic nicht eine allzugroße Hürde sein.
Falls doch würd ich mich mal an einschlägige Excel Foren wenden. Da sitzten Typen die denken nur in Zeilen und Spalten *g*
 
AW: [excel, nochmal]größten zweimal vorhandenen wert finden?

Warum nicht einfach nach der Spalte mit den Messergebnissen sortieren und einfach die obersten paar weglöschen und dann wieder nach zB dem Datum sortieren? :B
 
AW: [excel, nochmal]größten zweimal vorhandenen wert finden?

skicu am 11.01.2008 15:42 schrieb:
Warum nicht einfach nach der Spalte mit den Messergebnissen sortieren und einfach die obersten paar weglöschen und dann wieder nach zB dem Datum sortieren? :B


das würd funktionieren, wenn die messwerte über die dauer des test ungefähr konstant bleiben. wenn es aber ne ansteigende kurve oder gerade wäre, dann geht das nicht. das wär ja dann so, dass zB der 5. wert ein ausreißer ist, aber troztdem um ein vielfaches kleiner als einer der korrekten späteren meßwerte zB der 200. - dann würdest du den ausreißer nicht erwischen, sondern einfach nur alle der oberen meßwerte und ein paar der zeitnahen vorigen ausreißer löschen, aber die ganzen frühen und mittleren ausreißer nicht.



wie wäre es, wenn du eine neue spalte machst, und dann schreibst du da rein, und zwar mal angenommen in A1, A2, A3... stehen die meßwerte:

Zeile1: WENN(A1>A2;"";A1)

d.h. wenn der meßwert in dieser zeile, A1, größer ist als der nächste, A2, was nicht sein kann, dann kommt da nix hin, sonst steht da A1


bzw. wenn er nicht kleiner sein kann, dann halt umgekehrtes vorzeichen. oder du definierst, dass mehr als 50% größer nicht sein kann, also WENN(0,5*A1>A2;"";A1) => wenn sogar die hälfte von A1 größer als A2 ist, dann stimmt was nicht...
 
AW: [excel, nochmal]größten zweimal vorhandenen wert finden?

maki83 am 11.01.2008 15:36 schrieb:
ich weiß ja nicht wie deine Mersswerte jetzt aussehen,
(siehe verlinkten thread im startposting)
aber hast du dir mal überlegt ob es nicht sinnvoll wär über den Anstieg der Werte die Ausreißer zu eliminieren?

hab ich mir überlegt, werde ich auch so machen, wenn sich nichts besseres findet.
aber gestern war erstmal was kurzfristigeres gefragt und so fit bin ich in vb nicht ;)
außerdem hab ich das problem, dass ich 8 parrallele reihen habe, jede davon aber hinsichtlich ne individuelle grenze bezüglich des anstiegs hat.
d.h. ich müsste für jede einzelne einen eigenen grenzwert festlegen - und das irgendwie "objektiv" und für alle in vergleichbarem maße. (und am jeweils möglichen spektrum kann ich mich da erst orientieren, wenn ich die ausreißer raus hab %-) )

skicu am 11.01.2008 15:42 schrieb:
Warum nicht einfach nach der Spalte mit den Messergebnissen sortieren und einfach die obersten paar weglöschen und dann wieder nach zB dem Datum sortieren? :B

das datum ist in nem nicht-excel kompatiblen format, kann ich nicht nach sortieren :rolleyes:
außerdem kann meine auswertungssoftware (graphen dieser größe machen in excel probleme) nicht mit fehlenden werten umgehen, ich muss also an stelle des ausreißers z.b. den durchschnitt von davor und danach liegendem wert einsetzen - was nur geht, wenn ich das ganze nach datum sortiert habe.
(also jedes mal hin/her sortieren, ändern,... - das würde viele, viele, viele stunden dauern. außerdem hab ich panische angst davor, bei manipulationen am eigentlichen datensatz irgend nen fehler zu machen, den ich nicht bemerke und der mir dann alles verhaut)

hab die methode gestern aber trotzdem kurz angewendet - alle werte in nen extra sheet, sortieren (auch nicht so einfach, wenn die werte nicht alle untereinander passen :ugly: ) und ich hatte zumindest ne referenz, anhand derer ich das ganze dann optisch auswerten konnte. (ausreißer seh ich und solange die anderen werte richtig in % umgerechnet wurden sind sie mir egal)
aber für die finale statistik muss ich das auch automatisch/per formel können :(
und wie herbboy schon anmerkte: ausreißer weit innerhalb der min/max finde ich so gar nicht. (mit der gestern gesuchten lösung aber auch nicht ;) )

Herbboy am 11.01.2008 15:58 schrieb:
das würd funktionieren, wenn die messwerte über die dauer des test ungefähr konstant bleiben. wenn es aber ne ansteigende kurve oder gerade wäre, dann geht das nicht. das wär ja dann so, dass zB der 5. wert ein ausreißer ist, aber troztdem um ein vielfaches kleiner als einer der korrekten späteren meßwerte zB der 200. - dann würdest du den ausreißer nicht erwischen, sondern einfach nur alle der oberen meßwerte und ein paar der zeitnahen vorigen ausreißer löschen, aber die ganzen frühen und mittleren ausreißer nicht.



wie wäre es, wenn du eine neue spalte machst, und dann schreibst du da rein, und zwar mal angenommen in A1, A2, A3... stehen die meßwerte:

Zeile1: WENN(A1>A2;"";A1)

d.h. wenn der meßwert in dieser zeile, A1, größer ist als der nächste, A2, was nicht sein kann, dann kommt da nix hin, sonst steht da A1


bzw. wenn er nicht kleiner sein kann, dann halt umgekehrtes vorzeichen. oder du definierst, dass mehr als 50% größer nicht sein kann, also WENN(0,5*A1>A2;"";A1) => wenn sogar die hälfte von A1 größer als A2 ist, dann stimmt was nicht...


die messwerte bewegen sich für jede der 8 parralleln jeweils in einem festgelegten rahmen, in dem sie (mehr oder minder) frei schwanken.
mit </> kann man also nichts machen, dann eher mit steigungen.

mein gestriges (und andauerndes) problem bestand vor allem darin, dass ich diese 8 parralleln vergleichen können muss - d.h. ich brauch die werte als % angaben des jeweils möglichen bereichs, definiert durch min./max.
und zwar das reale min/max, nicht etwaige ausreißer.
die führen sonst dazu, dass ich z.b. bis auf einen einzelnen punkt (den ausreißer) nie über 70% komme, was a) falsch ist und b) die auswertung der restlichen abschnitte erschwert. (letztlich geht es um die schwankungen - und natürlich sind die deutlicher, wenn 0% und 100% wirklich im möglichen bereich liegen und nicht ausreißern vorbehalten sind, die alles andere auf 10%-50% zusammenquetschen)

im weiteren verlauf werd ich aber auch versuchen, die schwankungshäufigkeiten&stärken über den gesamten datensatz auszuwerten, da stören mich dann auch ausreißer, die nur ein lokales max darstellen.
ne lösung dafür dürfte obiges problem mit abdecken :)
bislang hatte ich vor, da einfach das gleiche prinzip anzuwenden, dass ich als max. steigung die höchste 2mal vorhandene nehme und die dann entstehenden >100% werte wie 100% behandle. im prinzip ist das aber nur ein umständlicherer weg zu dem, was maki83 vorgeschlagen hat. (mit dem kleinen aber feinen vorteil, dass "2mal vorhanden" ein objektiv auf alle andwendbare kriterium ist, "zu stark" nicht)
 
AW: [excel, nochmal]größten zweimal vorhandenen wert finden?

Okay, klingt schon ganz gut was du vor hast.

ABER: Warum speicherst du die Daten nicht zusätzlich woanders ... SICHERUNGSKOPIE?
Dann brauchst du auch keine angst haben irgendwas zu verbocken.

Ich arbeite gerade an meiner Diplomarbeit und da geht es viel um Bildanalyse.
Irgendwie seh ich da parallelen. Wenn ich ein Bild 'entrauschen' will jage ich einen Tiefpassfilter darüber.
D.h. einen Filter der mir alle hohen Frequenzen (einzelne Peaks, ausreißer) wegfiltert.
Ist reine Mathematik.. Das muss doch auch bei einer Tabelle mit Zahlen gehen.

Bemüh google doch nochmal.

Als Software die für solche aufgaben nen bissel besser geeignet ist als excel kann ich dir Origin empfehlen.

Ist ein Programm zur Auswertung, Analyse und Darstellung von Meßdaten.

LINK: http://www.additive-net.de/software/origin/index.shtml
 
AW: [excel, nochmal]größten zweimal vorhandenen wert finden?

maki83 am 14.01.2008 11:58 schrieb:
Okay, klingt schon ganz gut was du vor hast.

ABER: Warum speicherst du die Daten nicht zusätzlich woanders ... SICHERUNGSKOPIE?
Dann brauchst du auch keine angst haben irgendwas zu verbocken.

ich hab mitlerweile fast n gigabyte backups von verschiedenen manipulationsschritten ;)

das problem ist, dass ich -im gegensatz zu jemanden, der mit bildern arbeitet ;) - den datensatz nicht annähernd überblicken kann.
selbst mit weiterer software kann ich sinnvoll&erkennbar nicht viel mehr als 4000-5000 zeilen darstellen, da merke ich es schlicht nicht, wenn sich irgendwo unter 150000 zeilen n systematischer fehler einschleicht - und wenn der fehler nur tendenzen ändert und vielleicht sogar zu meinen erwartungen passt, komme ich auch nie auf die idee, danach zu suchen.

Als Software die für solche aufgaben nen bissel besser geeignet ist als excel kann ich dir Origin empfehlen.

Ist ein Programm zur Auswertung, Analyse und Darstellung von Meßdaten.

LINK: http://www.additive-net.de/software/origin/index.shtml


hmmm - 50€ wollte ich jetzt eigentlich nicht in ne semesterarbeit investieren.
(und über abteilung ist da sicherlich nichts zu machen - graph pad prism 4 ist das höchste der gefühle, nicht mal sigmaplot für graphen für ne ordentliche graphische darstellung ist zu haben :( )
 
Zurück