L
latoureiffel
Gast
hi!
ich habe 2 grosse textdateien (eine 1 gb gross, die andere 2 gb) und will beide durchsuchen und zwar nach folgenden muster:
datei 1 bezeichnet einen zahlenbereich (hier 1 bis 5 und nächste zeile 3 bis 9) zb.
A text text 1 5 text text
B text 3 9 text text
Q text text 27 873 text
datei 2 sieht so aus
C text text text 38 text
A text 3 text text
A text text 8 text text
usw. ("text" steht für worte, einzelne buchstaben etc. ist momentan nicht von belang).
ich will jetzt wissen, ob die angegebene zahl in datei 2 in den rahmen von 1 passt, aber nur wenn der erste buchstabe übereinstimmt.
also müsste ich bei meinem beispil eine übereinstimmung finden (weil zeile 2 aus datei 2 (zahl = 3) im bereich von 1-5 liegt und beide zeilen mit A beginnen.
meine fragen sind:
1. mit welchem befehl kann ich so grosse textedateien am besten durchlaufen? schnelligkeit ist nicht wichtig, aber mit zeilenweisem lesen schmiert mein PC ab
2. ist es ok sich die 1. zeile aus datei 1 rauszupicken, dann die ganze datei 2 nach übereinstimmungen abzusuchen und dann mit der nächsten zeile aus datei 1 fortzufahren und wieder datei 2 komplett zu durchlaufenb? das hört sich für mich sehr umständlich an, gibt es da bessere ansätze?
da die dateien ungeordnet sind, kann ich nicht zeile 1 aus datei 1 mit zeile 1 aus datei 2 vergleichen, da würde ich nicht alles finden...
danke!
ich habe 2 grosse textdateien (eine 1 gb gross, die andere 2 gb) und will beide durchsuchen und zwar nach folgenden muster:
datei 1 bezeichnet einen zahlenbereich (hier 1 bis 5 und nächste zeile 3 bis 9) zb.
A text text 1 5 text text
B text 3 9 text text
Q text text 27 873 text
datei 2 sieht so aus
C text text text 38 text
A text 3 text text
A text text 8 text text
usw. ("text" steht für worte, einzelne buchstaben etc. ist momentan nicht von belang).
ich will jetzt wissen, ob die angegebene zahl in datei 2 in den rahmen von 1 passt, aber nur wenn der erste buchstabe übereinstimmt.
also müsste ich bei meinem beispil eine übereinstimmung finden (weil zeile 2 aus datei 2 (zahl = 3) im bereich von 1-5 liegt und beide zeilen mit A beginnen.
meine fragen sind:
1. mit welchem befehl kann ich so grosse textedateien am besten durchlaufen? schnelligkeit ist nicht wichtig, aber mit zeilenweisem lesen schmiert mein PC ab
2. ist es ok sich die 1. zeile aus datei 1 rauszupicken, dann die ganze datei 2 nach übereinstimmungen abzusuchen und dann mit der nächsten zeile aus datei 1 fortzufahren und wieder datei 2 komplett zu durchlaufenb? das hört sich für mich sehr umständlich an, gibt es da bessere ansätze?
da die dateien ungeordnet sind, kann ich nicht zeile 1 aus datei 1 mit zeile 1 aus datei 2 vergleichen, da würde ich nicht alles finden...
danke!