Frage zu nicht funkionierendem RegEx .*

Status
Nicht offen für weitere Antworten.

Don83

Bekanntes Mitglied
Hallo,
ich habe gerade ein Problem. In meiner Freizeit organisiere ich gerade für ein kleines Browserspielchen ein kleines Tunier. Machen an die 500 Leute mit. Ich möchte deshalb die Ergebnisse der Kampfberichte parsen um ein paar Statistiken zu erstellen.

Jetzt will aber aus mir nicht ersichtlichen Gründen das pattern nicht matchen.
Sogar wenn ich .* angebe, was ja quasi sowas wie eine wildcard ist, bekomme ich beim matching ein "false" zurück. Ich kann mir das wirklich nicht erklären.

Weis da jemand vielleicht rat?
Hier meine Klasse und im Anhang die zu parsende File:
[HIGHLIGHT="Java"]import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.Scanner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Kampfberichtauswerter {

public static void calcNKAttack(String kb){
Pattern p1 = Pattern.compile(".*");
Matcher m1 = p1.matcher(kb);
System.out.println(m1.matches());

}

public static void main(String[] args) throws IOException {
File datei = new File("kampfbericht.txt");
FileReader leser = new FileReader(datei);

// erzeugen einer Dauerschleife:
StringBuilder input= new StringBuilder();
for (;;) {
int gelesenInt = leser.read();

// Wenn kein Zeichen mehr zurückgegeben wird (= -1),
// dann ist das Dateienende ereicht,
// daher aufhören
if (gelesenInt == -1) {
break;
}

// ein char wird als integer eingelesen!
// Daher als char umwandeln
char gelesenChar = (char) gelesenInt;

// Jedes Zeichen ausgeben
//System.out.print(gelesenChar);
input.append(gelesenChar);
}
String kampfbericht = input.toString();
System.out.println(kampfbericht);
calcNKAttack(kampfbericht);
}
}[/HIGHLIGHT]
 

Anhänge

  • kampfbericht.txt
    83,6 KB · Aufrufe: 7
Zuletzt bearbeitet von einem Moderator:

Don83

Bekanntes Mitglied
Danke :),
ich weis jetzt allerdings noch nicht, wie ich dieses DOTALL aktiviere. :oops: Allerdings lässt es sich auch mit ([\S\s]*) ganz gut umgehen.
 

Don83

Bekanntes Mitglied
Ok alles klar danke. Jetzt hätte ich aber noch zwei Fragen :oops:.
Und zwar.
Angenommen ich habe solch einen text gegeben:
"(sdfdsfölk("
Hier würde jetzt bemängelt werden, dass die capturing groups nicht geschlossen sind. Aber was wenn die Klammerung teil des zu matchenden Patterns ist?

Und die zweite Frage:
Wenn ich zum Beispiel einen ausdruck habe:
"<a>alkjlklklknlknasdknlk<\a>" Wie kann ich zum Beispiel den inhalt der Tags lesen?
von der logik her irgendwie so: <a>\\S*<\a>
Allerdings will ich ja den Inhalt der tags also schonmal capturing groups, also:
<a>(\\S*)<\a>
Und nachdem ich ja wirklich NUR den inhalt der tags haben will, aber das \\S* eigentlich das hintere tag schlucken würde bräuchte man wohl noch eine kleine modifikation. Ich glaub in perl gab es folgendes Konstrukt: \\S*?
Das wäre die minimale Anzahl an nicht whitespace zeichen bis eben der nächste passende Regex <\a> auftritt. Soetwas bräuchte ich, weis aber leider nicht wies in Java funktioniert. ???:L
 
S

SlaterB

Gast
\\(

und das mit dem ? dürfte funktionieren, siehe 'Reluctant quantifiers' in der Pattern-Beschreibung
 

Don83

Bekanntes Mitglied
Ok, also es klappt jetzt so halb. Allerdings habe ich einen Fehler den ich nicht wirklich verstehe :/.
Also hier ist nun mein code:
Code:
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.Scanner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Kampfberichtauswerter {

	public static void calcFKAttack(String kb) {
		// System.out.println(kb);

		// Pattern p1 = Pattern.compile
		Pattern p1 = Pattern
				.compile(
						".+?<td><a\\shref=\"http://cartegon\\.world-of-dungeons\\.de/wod/spiel/hero/profile\\.php\\?id=\\d+?\"\\s+?onClick=\"return\\s+?jump\\('\\S+?',\\d+?\\)\"\\sclass=\"rep_monster\"\\sx=\"\\d+?\">(.+?)</a>\\s+?greift\\sper\\sFernkampf\\san\\s+?\\(<a\\shref=\"http://world-of-dungeons\\.de/skill/\\S+?\"\\sonClick=\"return\\swo\\('/wod/spiel/hero/skill\\S+?'\\)\">\\w+?</a>\\s+?/(\\d+).+?",
						Pattern.DOTALL);
		Matcher m1 = p1.matcher(kb);
		if(m1.matches()){
			//System.out.println("hullu");
			System.out.println(m1.group(1));
			System.out.println(m1.group(2));
		}
		

	}

	public static void main(String[] args) throws IOException {
		File datei = new File("kampfbericht.txt");
		FileReader leser = new FileReader(datei);

		// erzeugen einer Dauerschleife:
		StringBuilder input = new StringBuilder();
		for (;;) {
			int gelesenInt = leser.read();

			// Wenn kein Zeichen mehr zurückgegeben wird (= -1),
			// dann ist das Dateienende ereicht,
			// daher aufhören
			if (gelesenInt == -1) {
				break;
			}

			// ein char wird als integer eingelesen!
			// Daher als char umwandeln
			char gelesenChar = (char) gelesenInt;

			// Jedes Zeichen ausgeben
			// System.out.print(gelesenChar);
			input.append(gelesenChar);
		}
		String kampfbericht = input.toString();
		// System.out.println(kampfbericht);
		calcFKAttack(kampfbericht);
	}
}

Der Bereich den ich parsen und finden will ist dieser hier:

Code:
<td><a href="http://cartegon.world-of-dungeons.de/wod/spiel/hero/profile.php?id=217845" onClick="return jump('h',217845)" class="rep_monster" x="217845">Kyria van Rensing</a>
 greift per Fernkampf an  (<a href="http://world-of-dungeons.de/skill/Doppelschuss&amp;IS_POPUP=1&amp;world=WC" onClick="return wo('/wod/spiel/hero/skill.php?name=Doppelschuss&amp;IS_POPUP=1&amp;world=WC')">Doppelschuss</a>
/201

Dort will ich konkret den Namen, in diesem Fall "Kyria van Rensing" und unten den Wert, also die 201.

Das pattern das ich angegeben habe wird gefunden. Die zweite capturing group funktioniert, also es werden 201 ausgegeben.
Aber bei der ersten capturing group kommt irgendwie noch Salat raus.

Die Ausgabe sieht in etwa wie folgend aus:
Code:
Kyria van Rensing</a>
</td>
<td align="center">33</td>
<td>Rechte Seite</td>
massig Text blabla....
blablablablabla
blablabla
 (<span class="rep_mana_cost">6 MP</span>): Initiative 248</td></tr><tr><td colspan="3"><hr /></td></tr>
<tr><td class="rep_initiative">Initiative 305<br /><span class="rep_action">Aktion 1 von 5</span></td>
<td><a href="http://cartegon.world-of-dungeons.de/wod/spiel/hero/profile.php?id=217845" onClick="return jump('h',217845)" class="rep_monster" x="217845">Kyria van Rensing
Also irgendwie wird das Kyria van Rensing schon erkannt, aber ich bekomme noch so viel Müll mit in die Capturing group und weiß nicht wieso.
Die capturing group in der Regex sieht so aus:
Code:
blabla+?\">(.+?)</a>blabla
also = (.+?)... gefolgt von </a>.
Ich hatte eine Idee, also zum Beispiel die capturing group wie folgend abzuändern:
([[.]&&[^<>]]+?) aber wenn ich dies ändere wird überhaupt kein pattern mehr gefunden.
Allerding weiß ich nicht ob ich das mit den optional Klammern richtig mache, denn es funktioniert noch nicht einmal ([.]+?)
 
S

SlaterB

Gast
ein . in eckigen Klammern ist wirklich nur ein Punkt, viele Sonderzeichen verlieren da ihre Bedeutung,
schreibe
[^<>]+?

warum es ohne nicht geht, kann ich aus dem Kopf nicht sagen,
allgemeiner Tipp: test möglich eng, mit wenig Text,
wenn du auf ein schwer lösbares Problem triffst, beende erstmal komplett dein komisches Programm, vergiss Datei-Einlesen, komischen Methoden wie calcFKAttack() usw

erstelle eine neue Klasse, darin genau eine main-Methode, genau einen Teststring, z.B.
"<a\">Kyria van Rensing</a>"
genau ein Pattern und dann die Auswertung,

wenn das nicht so klappt, wie du es dir vorstellst,
dann kannst du das komplette 20 Zeilen-Programm hier posten und jeder kann es ausprobieren,
wenn es doch klappt, dann langsam erweitern, immer mehr von der Originaldatei kopieren, auch Zeilenumbrüche usw
 

Don83

Bekanntes Mitglied
Ah, alles klar! Vielen dank. :toll:
Das der Punkt in eckigen Klammern seine Bedeutung verliert erklärt dann so einiges :).
Ansonsten werd ich mir deinen Tip mal zu Herzen nehmen und wirklich nur den kurzen abschnitt testen.
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
M Spring oder nicht, das ist hier die Frage Allgemeine Java-Themen 3
MiMa Grundsätzliche Frage zur Verwendung von Java Versionen?? Allgemeine Java-Themen 3
KonradN Mal eine Frage zu Binary Serialization Allgemeine Java-Themen 15
8u3631984 Frage zu Java Streams min / max Allgemeine Java-Themen 17
8u3631984 Frage Performance bei Linked List und Array List Allgemeine Java-Themen 5
H Frage regex greater than less than Allgemeine Java-Themen 7
berserkerdq2 Frage zu IntelliJ und JavaFX Allgemeine Java-Themen 1
W Timer Konzept-Frage Allgemeine Java-Themen 16
T Eine Frage des Designs Allgemeine Java-Themen 2
C Frage zu eigenem TableCellRenderer Allgemeine Java-Themen 11
C Programmvorstellung & Frage zum Thema Geschäftsform Allgemeine Java-Themen 51
J Frage zu System.getproperties. Allgemeine Java-Themen 60
molat100 wie kann man die Frage beantworten Allgemeine Java-Themen 1
pkm Frage zur Präzision von Calendar.WEEK_OF_YEAR Allgemeine Java-Themen 12
J Eine Frage zu den Threads und Task Allgemeine Java-Themen 1
pkm Frage nach eventuellem syntaktischen Zucker bei der Konkatenation von ArrayLists Allgemeine Java-Themen 4
M Frage-Antwortspiel wie Wer wird Millionär Allgemeine Java-Themen 1
F Frage zu System.in Allgemeine Java-Themen 3
marcooooo Frage zum Beispiel im Anhang Allgemeine Java-Themen 16
T Meine Frage lautet wie ich 2 CSV Dateien miteinander in Java verbinde und Spalten die zueinander gehören durch den gleichen Key zusammen ausgebe? Allgemeine Java-Themen 5
S Noch eine Design-Frage zu Setter Allgemeine Java-Themen 6
B For-Loop Frage Allgemeine Java-Themen 21
L Java frage Allgemeine Java-Themen 3
bueseb84 Frage zu Mock und UpperBound Allgemeine Java-Themen 2
M Frage zum Konstruktor Allgemeine Java-Themen 2
W Best Practice Frage zur Umsetzung MVC Allgemeine Java-Themen 9
P String-Verschlüsselung - Frage zur Sicherheit Allgemeine Java-Themen 21
B Frage zu Unit-Tests Allgemeine Java-Themen 6
T Allgemeine Frage: GUI für 3D-Visualisierung Allgemeine Java-Themen 5
R Allgemeine Frage zu RMI bei MVC Allgemeine Java-Themen 2
O Frage zum Runtimeverhalten von Java ... Allgemeine Java-Themen 2
H Rundreise frage (Algorithmus) Allgemeine Java-Themen 18
B Generelle Frage bei einer Webanwendung / Reduzierung von DB Abfragen Allgemeine Java-Themen 1
D Frage zu Vererbung Allgemeine Java-Themen 5
J Frage zu regulärem Ausdruck Allgemeine Java-Themen 2
M Allgemeine Frage: Wie lernt man Java / Programmieren von Grund auf? Allgemeine Java-Themen 7
rentasad Design-Frage - Interfaces, Klassen, statische Methoden Allgemeine Java-Themen 3
S Frage zur JLS Allgemeine Java-Themen 0
J Verständnis Frage zur Instanz, Objekte, Instanzierung, Referenz Allgemeine Java-Themen 14
A Methoden Allgemeine Java Frage Allgemeine Java-Themen 3
E String Frage Allgemeine Java-Themen 9
I bin neu bei GitHub, Frage zur Sicherheit Allgemeine Java-Themen 14
C J2V8 NodeJs Java Bride Problem und Frage!?!? Allgemeine Java-Themen 1
C KeyListener Frage Allgemeine Java-Themen 3
T Frage zu UML in Java programmieren Allgemeine Java-Themen 1
R Konstanten initialisieren - FRAGE Allgemeine Java-Themen 3
MTJ004 FTP Frage zu FTP Speicherung Java-Android-FTP Allgemeine Java-Themen 5
J Frage zum Entwurf / json-Datenmodell Allgemeine Java-Themen 8
A Frage zu meinem Code Allgemeine Java-Themen 2
RalleYTN Classpath Nur ne kleine Frage zur MANIFEST.MF Allgemeine Java-Themen 4
T Frage zu Access Modifiers Allgemeine Java-Themen 6
W Input/Output Frage zu pdfbox und FileUtils Allgemeine Java-Themen 2
O Frage zur Implementierungsweise Allgemeine Java-Themen 4
B Frage zu Bitshift Allgemeine Java-Themen 3
J Java Zufallsgenerator (6 aus 49) Frage Allgemeine Java-Themen 7
L Frage zu RIA und GWT Allgemeine Java-Themen 0
P Concurrency Frage Allgemeine Java-Themen 8
M Frage zu Enumerations Allgemeine Java-Themen 2
F Unlimited Strength Policy. Frage Verbreitung der Anwendung Allgemeine Java-Themen 1
F Frage zur Library JTS Allgemeine Java-Themen 5
S Java Design Frage Allgemeine Java-Themen 10
E Reflection? Frage Allgemeine Java-Themen 4
C FileInputStream frage Allgemeine Java-Themen 6
G Polymorphie Programmdesign Frage Allgemeine Java-Themen 20
Uzi21 Frage zu NetBeans ( Console) Allgemeine Java-Themen 11
D Classpath Frage zum Java Resource Loading Allgemeine Java-Themen 2
G Frage zu JPA Allgemeine Java-Themen 1
S Methoden Frage Allgemeine Java-Themen 2
P MVC - Frage zu Model Allgemeine Java-Themen 4
K Frage zu Locks Allgemeine Java-Themen 1
S Frage zu abstract Allgemeine Java-Themen 5
M ArrayList<String> Frage Allgemeine Java-Themen 7
M OOP Design Frage Allgemeine Java-Themen 2
N Frage zur while-Schleife Allgemeine Java-Themen 18
T Best Practice Auslesen von Zeichenketten (Frage, Antworten, usw) Allgemeine Java-Themen 4
C Eine Frage zur Bearbeitungszeit Allgemeine Java-Themen 8
H Frage wegen Heap-Speicher Allgemeine Java-Themen 2
T Garbage Collection Frage Allgemeine Java-Themen 15
P Kurze Frage: aus einer File die Zeilenanzahl auslesen Allgemeine Java-Themen 9
D Frage zu Java und Umlauten / charsets Allgemeine Java-Themen 2
B Frage zu Java und OpenGL? Allgemeine Java-Themen 3
Q Kapselung Allgemeine Design- Frage Allgemeine Java-Themen 8
A eine test thread.join() frage Allgemeine Java-Themen 2
DStrohma LayoutManager Frage zum GridBagLayout Allgemeine Java-Themen 4
F Frage zu Regex möglich Allgemeine Java-Themen 4
H XML-File mit Java erzeugt Frage Allgemeine Java-Themen 10
D Frage und Antwort Programm, Problem bei Methodenaufruf Allgemeine Java-Themen 3
J NetBeans Frage bezüglich der Scanner-Klasse Allgemeine Java-Themen 6
H Java Vector Frage Allgemeine Java-Themen 9
W Frage... Allgemeine Java-Themen 29
R Frage zur topologischen Sortierung Allgemeine Java-Themen 2
H Frage zu weka.core.Instance Allgemeine Java-Themen 3
Y Kleine Frage zu String.split Allgemeine Java-Themen 3
T Frage zu Klassendesing Allgemeine Java-Themen 3
W Frage zu Refactoring statischer Methoden Allgemeine Java-Themen 4
C Eclipse Wichtige frage Allgemeine Java-Themen 5
H Frage zu java.weka.core.Instances Allgemeine Java-Themen 3
S Frage zu Format Modifiers in Log4j Allgemeine Java-Themen 11
H Frage zu clone() Allgemeine Java-Themen 5
4 Simple(?) Frage zu Threads Allgemeine Java-Themen 14

Ähnliche Java Themen

Neue Themen


Oben