Ich habe eine vorgegebene Collection<token> durch ein Framework (dürften String-Objekte sein) und muss diese mit zwei Wortlisten abgleichen - diese haben ~6000 Zeilen.
Wortlisten werden aktuell mittels File.readnextLine(Wortliste.txt) in List<String> und dann in ein String[]-Array umgewandelt.
Erster Ansatz: über die Collection<token> iterieren und dann einfach Collection mit String[]-Array abgleichen.
Dauert aber Ewigkeiten auf dem Unirechner (über 7 Minuten).
Zweiter Ansatz: Collection<token>.toArray = Token[]-Array und dann String[]-Array mit String[]-Array abgleichen.
Dauert aber auch noch ~2 Minuten.
Dritter Ansatz: List<String> in Hashset umwandeln und dann mit Collection<token> oder Token[]-Array vergleichen (da hab ich aber noch absolut 0 Ahnung, war eine Idee meines Dozenten) :rtfm:.
Hashset kümmert sich ja nicht um Sortierung und ich muss ja nur schauen ob der Token-String in der Wortliste vorhanden ist, nicht wo genau er ist.
Hat jemand noch andere Ideen? Code kann ich aktuell leider nicht posten da das SVN mich nicht commiten lässt und die Daten alle auf dem Uni-Rechner liegen. Kann ich morgen nachreichen.
Wortlisten werden aktuell mittels File.readnextLine(Wortliste.txt) in List<String> und dann in ein String[]-Array umgewandelt.
Erster Ansatz: über die Collection<token> iterieren und dann einfach Collection mit String[]-Array abgleichen.
Dauert aber Ewigkeiten auf dem Unirechner (über 7 Minuten).
Zweiter Ansatz: Collection<token>.toArray = Token[]-Array und dann String[]-Array mit String[]-Array abgleichen.
Dauert aber auch noch ~2 Minuten.
Dritter Ansatz: List<String> in Hashset umwandeln und dann mit Collection<token> oder Token[]-Array vergleichen (da hab ich aber noch absolut 0 Ahnung, war eine Idee meines Dozenten) :rtfm:.
Hashset kümmert sich ja nicht um Sortierung und ich muss ja nur schauen ob der Token-String in der Wortliste vorhanden ist, nicht wo genau er ist.
Hat jemand noch andere Ideen? Code kann ich aktuell leider nicht posten da das SVN mich nicht commiten lässt und die Daten alle auf dem Uni-Rechner liegen. Kann ich morgen nachreichen.
Zuletzt bearbeitet: