String analysieren / zuordnen

brillliant

Mitglied
Hallo zusammen,

habe bspw. folgenden zusammenhängenden String (ohne Zeilenumbrüche):

Code:
1 Manchester United (M)  *28 * 21 4 3 * 68:27 41 * 67 * 2 Manchester City (P) * 28 * 21 3 4 * 69:20 49 * 66 * 3 Tottenham Hotspur * 28 * 16 5 7 * 52:34 18 * 53 * 4 FC Arsenal * 28 * 16 4 8 * 57:39 18 * 52
(und ohne die Sterne, die haben sich grad selber eingefügt)


Mein Konstruktor-Kopf für eine Klasse Manschaft sieht wie folgt aus:

Java:
     public Manschaft(String name, int spiele, int siege, int unentschieden, int niederlagen,
            int toreGeschossen, int toreBekommen)

Hätte jemand eine Idee, wie ich es schaffen könnte, gezielt die Informationen für eine Manschaft für den Konstruktor herauszufiltern?

Bspw. dann:

Java:
new Manschaft("Mancheseter United","28","21","4","3","68","27");
 
Zuletzt bearbeitet:
B

bygones

Gast
gibt es keine moeglichkeit dass der String den du bekommst besser formatiert ist... allein Zeilenumbrueche wurden das ganze um massig vereinfachen.

gehen wuerde es auch so, aber schoen ist es nicht.
 

brillliant

Mitglied
Nein leider nicht, habe schon ewig dafür gebraucht, dass er so aussieht!

Eine nicht "schöne" Lösung wäre für's erste auch nicht schlecht, da ich im Moment daran hängen bleibe und gern weiter machen würde.
 
N

nillehammer

Gast
Du hast es umso leichter, je strukturierter der Input ist. Strukturiert wäre bspw. jeder Datensatz in neuer Zeile und jedes Feld durch ein spezielles Trennzeichen getrennt (das wäre dan csv).

Nun ist es bei Dir leider nicht so einfach. Trennzeichen für Felder ist hier das SPACE, welches auch als Trennzeichen für Datensätze und leider auch als Datenbestandteil (im Namen) verwendet wird. Außerdem kommt es manchmal sogar mehrfach vor. Die einzige Struktur, die es gibt, ist der Datentyp der einzelnen Felder (bzw. auf String-Ebene die erlaubten Zeichen).

Wenn ich die Datensätze richtig deute, kommt ungefähr folgende Struktur heraus:
LaufendeNr: Ziffern, mindestens eine bis beliebig viele
Name: Beliebige druckbare Zeichen plus SPACE, mindestens 1 bis beliebig viele
SpieleAnzahl: Ziffern, mindestens eine bis beliebig viele
SiegeAnzahl: Ziffern, mindestens eine bis beliebig viele
UnentschiedenAnzahl: Ziffern, mindestens eine bis beliebig viele
NiederlagenAnzahl: Ziffern, mindestens eine bis beliebig viele
GeschosseneTore: Ziffern, mindestens eine bis beliebig viele
Konstanter Doppelpunkt
GefangeneTore: Ziffern, mindestens eine bis beliebig viele
Dann kommen noch zwei Zahlenblöcke, die nicht eindeutig definiert sind (der erste scheint wohl die Tordifferenz zu sein, der zweite die Punkte?)

Diese Strukturinformationen kann man mittels Regular Expressions maschinenverstehbar beschreiben, die Expression anwenden, sich die Treffer rauspulen dann über die Treffer iterieren, um die Informationen herauszuholen. In Code sieht das dann etwa so aus:

Java:
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public final class RegexTest {

	private static final String TEST_INPUT = "1 Manchester United (M)  28  21 4 3  68:27 41  67  2 Manchester City (P)  28  21 3 4  69:20 49  66  3 Tottenham Hotspur  28  16 5 7  52:34 18  53  4 FC Arsenal  28  16 4 8  57:39 18  52";

		private static final Pattern DATASET_PATTERN = Pattern
			.compile("(\\d+\\s+[\\p{Print}\\s]+?\\s+\\d+\\s+\\d+\\s+\\d+\\s+\\d+\\s+\\d+:\\d+\\s+\\d+\\s+\\d+\\s*)");

	/**
	 * @param args
	 */
	public static void main(String[] args) {

		final Matcher matcher = DATASET_PATTERN.matcher(TEST_INPUT);

		while(matcher.find()) {
			System.out.println(matcher.group(1));
		}
	}
}
Du siehst, bis hier her ist schon einiges an Aufwand nötig, nur um die um die relativ unstrukturierten Datensätze auseinander zu pulen. Vielleicht lohnt es, hier abzubrechen und etwas mehr Arbeit auf die Erzeugung des Inputs zu verwenden.

Falls nicht, sag Bescheid, dann machen wir weiter... die Felder aus den Datensätzen zu pulen (Stichwort String.split()) schaffst Du ja vielleicht auch selbst.

[EDIT]
1.)
Ich seh grad, die letzte Mannschaft wird nicht mit ausgegeben. Irgendwo ist im Code oder im Pattern also noch ein Fehler. Aber die Idee sollte klar sein.
[/EDIT]
[EDIT]
2.)
Hab den Fehler in der Expression gefunden und korrigiert (das letzte + muss ein * sein)
[/EDIT]
 
Zuletzt bearbeitet von einem Moderator:

brillliant

Mitglied
Wow.. Erst einmal vielen vielen Dank für diese ausführliche Antwort!

Es ist mir leider nicht möglich den Datensatz in einer strukturierteren Form zu bekommen, da ich ihn über einen Htmlparser beziehe und das, schon das Maximum an Form war, was ich heraus holen konnte!

Zu deiner Lösung: Leider habe ich mich noch nie Pattern etc. befasst und grad nur ein bisschen herein gelesen, um im Ansatz zu verstehen, was du da machst. Ich finde die Lösung sehr sehr gut!

Hab's auch gleich mal getest, jedoch sind mir zwei Fehler aufgefallen:

1.Wenn die Tor-Differenz (wie du oben richtig erkannt hast) negativ ist, wird der darauf folgenden Manschaft keine neue "Gruppe"(?) zu geordnet, sondern an die aktuelle angehängt.

2. Habe grad die vollständige Tabelle (siehe unten) eingefügt und komischerweise ist nach der 10. Schluss.

Java:
 1 Manchester United (M)  28  21 4 3  68:27 41  67  2 Manchester City (P)  28  21 3 4  69:20 49  66  3 Tottenham Hotspur  28  16 5 7  52:34 18  53  4 FC Arsenal  28  16 4 8  57:39 18  52  5 FC Chelsea  28  14 7 7  48:32 16  49  6 Newcastle United  28  12 8 8  40:41 -1  44  7 FC Liverpool  28  11 9 8  33:26 7  42  8 AFC Sunderland  28  10 7 11  36:31 5  37  9 FC Everton  28  10 7 11  28:31 -3  37  10 FC Fulham  28  9 9 10  37:37 0  36  11 Swansea City (N)  28  9 9 10  31:34 -3  36  12 Norwich City (N)  28  9 9 10  39:45 -6  36  13 Stoke City  28  10 6 12  27:39 -12  36  14 West Bromwich Albion  28  10 5 13  34:37 -3  35  15 Aston Villa  28  7 12 9  31:35 -4  33  16 Blackburn Rovers  28  6 7 15  40:60 -20  25  17 Bolton Wanderers  28  7 2 19  31:57 -26  23  18 Queens Park Rangers (N)  28  5 7 16  29:48 -19  22  19 Wolverhampton Wanderers  28  5 7 16  30:58 -28  22  20 Wigan Athletic  28  4 9 15  24:53 -29  21

Erkenne jedoch nicht den Grund dafür.
 

Marco13

Top Contributor
Das ist doch ein Krampf. Abgesehen davon, dass so eine Regex fehleranfällig und schwer wartbar ist: Die wird es spätestens dann raushauen, wenn ein Verein "Hannover 96" oder "1860 München" heißt.

Mein erster Gedanke war, erstmal eine Liste von Tokens zu erstellen (also den String mit
string.split(" ")
zu zerlegen und alle leeren Tokens wegzuwerfen), und die Liste dann rückwärts durchzugehen und sich die Infos jeweils zusammenzusuchen. Aber auch das funktioniert nicht, wenn der Name wirklich beliebig sein kann. Das einzige, was mir einfallen würde, wäre, die laufende Nummer auszunutzen, aber auch da kann man sich leicht Gegenbeispiele überlegen.

Wo bekommst du die Daten denn her? Wenn du die z.B. von irgendeiner Webseite runterlutschst bekommt man garantiert auch einen besseren String.
 
N

nillehammer

Gast
brillliant hat gesagt.:
1.Wenn die Tor-Differenz (wie du oben richtig erkannt hast) negativ ist, wird der darauf folgenden Manschaft keine neue "Gruppe"(?) zu geordnet,
Das liegt daran, dass ich nur Ziffern (\\d) zugelassen habe. Eine negative Zahl beginnt ja mit dem Minus-Zeichen. An der entspr. Stelle müsstest Du die Regex also noch anpassen und zwar auf "-?\\d+"
brililant hat gesagt.:
2. Habe grad die vollständige Tabelle (siehe unten) eingefügt und komischerweise ist nach der 10. Schluss.
Auf die Schnelle komm ich auch nicht drauf. Such nach Zeichen(-folgen), die von der Regex nicht berücksichtigt sind und passe das Pattern ensprechend an.

Das bringt mich dann zu Marco's Bemerkungen, die ich in jedem Punkt voll unterstütze. Sone Regex ist keine leichte Kost und, wenn es irgendwie anders geht, sollte man es anders machen.

Marco13 hat gesagt.:
Die wird es spätestens dann raushauen, wenn ein Verein "Hannover 96" oder "1860 München" heißt.
Das hab ich getestet, deswegen das "+[\\p{Print}\\s]+?" (Alle druckbaren Zeichen, aber relunctant qualifier). Aber mit dem Rest Deines Posts hast du voll Recht.
 

static

Mitglied
Hmm, auch wenns schon erledigt ist, eins versteh ich nicht.

Warum überhaupt so kompliziert ? Also ich meine wenn die Daten schon so "hässlich" vorhanden sind, kann man doch einfach mit nem StringBuffer.substring() arbeiten ?
könnte man alles recht übersichtlich machen, ungf. so:

Java:
String data = " deine Daten ";
int maxStellenMannschaft = 20;
int maxStellennaechsterString = 30;

StringBuffer sb = new StringBuffer();
sb.append(data);

String mannschaft = sb.substring(0, maxStellenMannschaft).toString().trim(); // mit trim einfach unnötige Leerzeichen wegkürzen
String naechsterString = sb.substring(maxStellenMannschaft, maxStellennaechsterString).toString().trim();

// usw.

Hierbei muss eben auch "statisch" die genaue Länge des String definiert werden, aber wenn dann erst mal die Werte schön sauber in Variablen gespeichert sind, wäre es doch auch viel schöner damit zu Arbeiten ?
Ist mir jetzt grad so in den Kopf gekommen, bin zwar selber noch Anfänger, aber was würde dagegen sprechen ? (rein aus Interesse)

mfg static
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
S String analysieren, zerlegen und überarbeiten Allgemeine Java-Themen 4
C EML Email Text in String wandeln Allgemeine Java-Themen 11
OnDemand Java String in Hashmap als Key NULL Allgemeine Java-Themen 27
JAnruVA Datentypen Berechneten String-Wert in Double umwandeln um weiter zu rechnen Allgemeine Java-Themen 7
M String Allgemeine Java-Themen 10
M Suche nach String mit unbekannten characters Allgemeine Java-Themen 53
kodela String kann nicht zu Pfad konvertiert werden Allgemeine Java-Themen 16
melaniemueller Einzelne Zeile aus einer txt Datei in einem String speichern Allgemeine Java-Themen 12
E Objekte in einen String packen und wieder laden Allgemeine Java-Themen 5
M Map<String,String>funktioniert nicht richtig Allgemeine Java-Themen 4
O String in Long Hexerdezimal umwandel Allgemeine Java-Themen 14
N String vergleichen. Allgemeine Java-Themen 27
P String.replace() funktioniert nicht? Allgemeine Java-Themen 3
SaschaMeyer Arbeitet String.split falsch? Allgemeine Java-Themen 4
M Switches ohne String Allgemeine Java-Themen 18
AmsananKING String Iteration Allgemeine Java-Themen 5
S Shuffle String aus if-clause Allgemeine Java-Themen 11
Besset Variablen Ist String = "" + int inordnung? Allgemeine Java-Themen 6
M Map <Long, String> zu Map<String, Long> Allgemeine Java-Themen 9
S String Encoding Verständnisproblem Allgemeine Java-Themen 22
N Prüfen, ob ein String 2x das selbe Zeichen hat Allgemeine Java-Themen 10
SaftigMelo Bug Fixen von String-spliten Allgemeine Java-Themen 8
Monokuma String List nach Zahlen und Worten sortieren Allgemeine Java-Themen 9
Kingamadeus2000 Alle mehrfach vorkommenden Buchstaben rekursiv aus einem String entfernen. Allgemeine Java-Themen 6
YohnsonM String - Aufteilung und Nutzung einzelner Chars Allgemeine Java-Themen 7
O Formatierte String ausgabe bei vier Variablen in einer Zeile Allgemeine Java-Themen 1
S String umbenennen: wie? Allgemeine Java-Themen 4
x46 String Format Fehler Allgemeine Java-Themen 2
S ISO 8601 -> getter / setter String Allgemeine Java-Themen 3
L String zu repräsentativen Wert Allgemeine Java-Themen 0
H Array mit dem Datentype String[] initializieren Allgemeine Java-Themen 7
L ArrayList mit String Arrays in ein Array umwandeln Allgemeine Java-Themen 1
L regex ganzer string? Allgemeine Java-Themen 2
L Ist ein string ein erlaubter variabel name? Allgemeine Java-Themen 2
Z JNA Cpp-DLL String Verwendung Allgemeine Java-Themen 2
A String auf Zahlen überprüfen Allgemeine Java-Themen 5
N String Array Eingabe Allgemeine Java-Themen 6
MiMa Datum von String zu LocalDateTime Allgemeine Java-Themen 8
W String -> byte[] -> String - Sieht jemand was ich nicht sehe? Allgemeine Java-Themen 10
R char aus String entfernen Allgemeine Java-Themen 10
LimDul Mittels Streams aus Strings A B C den String A, B und C machen Allgemeine Java-Themen 12
M Programm erkennt String aus .txt Datei nicht Allgemeine Java-Themen 3
P einen public <Optinal String> in einer anderen Klasse mit einem Int vergleichen Allgemeine Java-Themen 2
S Ini Text aus String parsen Allgemeine Java-Themen 1
T String-Manipulation beim Ablauf in Eclipse und als JAR-File Allgemeine Java-Themen 8
M String lässt sich nicht Zusammenfügen Allgemeine Java-Themen 10
Drachenbauer Wie kann ich das Wort "concrete" in einem String durch ein anderes Wort ersetzen lassen? Allgemeine Java-Themen 5
R Schlüsselworte "Throw new exception" gibt nicht den String als Fehlermeldung aus Allgemeine Java-Themen 2
R Variablen String mit split-Funktion aufteilen Allgemeine Java-Themen 7
F Datei in String-Array einlesen Allgemeine Java-Themen 8
S Marker aus String ermitteln Allgemeine Java-Themen 5
T Objekt mit String und Int aus TxT Datei erstellen Allgemeine Java-Themen 23
M Bei String.format ein Komma statt einem Punkt ausgeben lassen Allgemeine Java-Themen 1
S MSSQL Exception & Connection String Allgemeine Java-Themen 19
B Bei Email: FW / AW... - Hilfe bei String suche Allgemeine Java-Themen 21
J String - Vergleiche Allgemeine Java-Themen 7
K Aus String zwei Jahreszahlen auslesen Allgemeine Java-Themen 18
Drachenbauer Wie kann eine vorgegebene Farbe über einen String erkannt werden? Allgemeine Java-Themen 11
G CSV in String Allgemeine Java-Themen 7
P String-Verschlüsselung - Frage zur Sicherheit Allgemeine Java-Themen 21
K Methodenaufruf mit String / String zu Objekt konvertieren Allgemeine Java-Themen 8
D Erste Schritte Fehler mit negativen und 0 Zahlen im String Allgemeine Java-Themen 6
Xge Replace x Zeichen aus String Allgemeine Java-Themen 2
coolian warum bekomme ich ein string index out of bounds exception Allgemeine Java-Themen 17
F In String 2 Buchstaben vertauschen Allgemeine Java-Themen 2
J Class Decompile als String (Procyon) Allgemeine Java-Themen 2
I Datentypen String in class sicher verwahren Allgemeine Java-Themen 17
J Falls der String ein "X" beinhaltet Allgemeine Java-Themen 2
T String mehrere Worte Allgemeine Java-Themen 2
D String Groß-/Kleinschreibung Allgemeine Java-Themen 2
D String und Klassenvariable Allgemeine Java-Themen 6
Aruetiise Funktion(y = mx+n) in String speichern und berechnen Allgemeine Java-Themen 9
C String in Objektnamen umwandeln Allgemeine Java-Themen 3
E Variablen Aus .txt ausgelesener string mit if() überprüfen? Allgemeine Java-Themen 2
L String-Schema-Aufspaltung Allgemeine Java-Themen 2
E String in Zahl umwandeln, ohne Befehl Integer.parseInt Allgemeine Java-Themen 3
L String splitten und multiplizeren Allgemeine Java-Themen 10
G String mit umbekannter länge splitten. Allgemeine Java-Themen 2
S Einzigartigen String in Datenbank finden und löschen Allgemeine Java-Themen 23
A Byte zu String Allgemeine Java-Themen 4
B Von String zu <Objekt> ||Speichern/Laden Allgemeine Java-Themen 17
T Komplexitätsoptimierung String vergleich Allgemeine Java-Themen 4
heinz ketchup String im JLabel ausgeben und erneuern Allgemeine Java-Themen 6
S Input/Output Beste Möglichkeit einen String in einen Datei zu Schreiben Allgemeine Java-Themen 2
V Eingegeben String Splitten und in Integer umwandeln Allgemeine Java-Themen 2
L Decrypt String Allgemeine Java-Themen 1
X Variablen AtmicLong größer als String ? Allgemeine Java-Themen 4
S String literal und Referenzvariablen Allgemeine Java-Themen 6
J Datentypen Absätze mit String im Word Dokument Allgemeine Java-Themen 3
D "Paste" String doppelt Allgemeine Java-Themen 14
E String Frage Allgemeine Java-Themen 9
T String aus While Schleife für ganze Klasse sichtbar machen Allgemeine Java-Themen 5
D JSON to String Allgemeine Java-Themen 31
M String automatisch in nächste Zeile umbrechen (Graphics) Allgemeine Java-Themen 6
U Methoden Algorithmus MergeSort String [ ] array sortieren programmieren Allgemeine Java-Themen 17
T Swing Font String Pixellänge Allgemeine Java-Themen 1
G Substrings in einen String zusammenfassen Allgemeine Java-Themen 5
Tommy Nightmare String.replaceAll(...) fehlerhaft? Allgemeine Java-Themen 3
L String auf zahlenwert prüfen Allgemeine Java-Themen 13
U OOP Warum kann ich aus meiner Methode keinen String auslesen Allgemeine Java-Themen 4

Ähnliche Java Themen

Neue Themen


Oben