Hallo zusammen,
ich suche im Rahmen meiner Bacheloarbeit nach einer Möglichkeit verschiedene Datensätze zu analysieren und zu kategorisieren. Konkret:
Ich habe zahlreiche ArrayLists, gefüllt mit Messwerten. Die Reihenfolge der Einträge ist wichtig, da zunächst die Differenz zwischen zwei Einträgen berechnet werden soll. Hier mal exemplarisch der Inhalt einer Liste.
0, 23, 15666, 20, 67, 20, 15580, 29, 36, 21, 15614, 21, 14016, 20, 23, 43, 15615, 19, 47, 39, 15582, 30, 56, 21, 15581, 20, 66, 23, 15594, 17, 4917, 15611, 21, 43, 15645, 20, 23, 64, 15601, 21, 43, 24, 19, 44, 15601, 20, 23, 21, 22, 21, 15591 (die Liste ist jedoch bedeutend größer)
Wie ihr sehen könnt, gibt es intervallähnliche Muster. Es gibt immer ein paar kleine Werte, gefolgt von einem großen Wert. Bei anderen Listen ist dies ähnlich, aber die Werte müssen nicht im gleichen Wertebereich liegen.
Meine Frage an euch ist nun:
1. Habt ihr eine Idee, wie man eine einzelne Liste auf Gemeinsamkeiten untersuchen kann? Naiver Ansatz war bisher eine Durchschnittsberechnung für alle kleinen und großen Werte. Aber es ist wichtig, dass ich quasi ein Intervallschema pro Liste erhalte, denn
2. Ich möchte die Listen untereinander anschließend auf das Intervallschema vergleichen, um dort eventuelle Gemeinsamkeiten feststellen zu können, sodass ich mit einer prozentuellen Wahrscheinlichkeit sagen kann, dass die beiden Listen von dem selben Messobjekt stammen.
Wahrscheinlich liegt das Problem selbst nicht an der Implementierbarkeit sondern an meinen fehlenden Mathematikkenntnissen, aber vielleicht sind ja ein paar schlaue Köpfe unter euch, die mir eventuell helfen können
Vielen Dank schon mal im Voraus!
Pocoporco
ich suche im Rahmen meiner Bacheloarbeit nach einer Möglichkeit verschiedene Datensätze zu analysieren und zu kategorisieren. Konkret:
Ich habe zahlreiche ArrayLists, gefüllt mit Messwerten. Die Reihenfolge der Einträge ist wichtig, da zunächst die Differenz zwischen zwei Einträgen berechnet werden soll. Hier mal exemplarisch der Inhalt einer Liste.
0, 23, 15666, 20, 67, 20, 15580, 29, 36, 21, 15614, 21, 14016, 20, 23, 43, 15615, 19, 47, 39, 15582, 30, 56, 21, 15581, 20, 66, 23, 15594, 17, 4917, 15611, 21, 43, 15645, 20, 23, 64, 15601, 21, 43, 24, 19, 44, 15601, 20, 23, 21, 22, 21, 15591 (die Liste ist jedoch bedeutend größer)
Wie ihr sehen könnt, gibt es intervallähnliche Muster. Es gibt immer ein paar kleine Werte, gefolgt von einem großen Wert. Bei anderen Listen ist dies ähnlich, aber die Werte müssen nicht im gleichen Wertebereich liegen.
Meine Frage an euch ist nun:
1. Habt ihr eine Idee, wie man eine einzelne Liste auf Gemeinsamkeiten untersuchen kann? Naiver Ansatz war bisher eine Durchschnittsberechnung für alle kleinen und großen Werte. Aber es ist wichtig, dass ich quasi ein Intervallschema pro Liste erhalte, denn
2. Ich möchte die Listen untereinander anschließend auf das Intervallschema vergleichen, um dort eventuelle Gemeinsamkeiten feststellen zu können, sodass ich mit einer prozentuellen Wahrscheinlichkeit sagen kann, dass die beiden Listen von dem selben Messobjekt stammen.
Wahrscheinlich liegt das Problem selbst nicht an der Implementierbarkeit sondern an meinen fehlenden Mathematikkenntnissen, aber vielleicht sind ja ein paar schlaue Köpfe unter euch, die mir eventuell helfen können
Vielen Dank schon mal im Voraus!
Pocoporco