(PHP) regex: alles auslesen zwischen <li> und </li>

Ich versuche mich grade an regex und sobald es mal etwas komplizierter wird brauche ich immer hilfe, weil ich es einfach nicht kapiere...

Mein Hauptproblem sind mehrzeilige Quelltexte und HTML-Quelltexte sind meistens mehrzeilig :-)

So ein Pseudo-Regex-Code ist schnell geschrieben:

die sternchen stehen für: hier kann alles vorkommen und das (.+?) heisst wie auch in echt: Das will ich haben ;-)

Eigentlich ganz einfach, aber wie muss meine Expression aussehen?

Danke!

Regular Expressions sind sehr nützlich wenn man es drauf hat 83%

Regular Expressions sind viel zu kompliziert 17%

Ich brauche keine Regular Expressions 0%

6 Stimmen

4 Antworten

Vom Beitragsersteller als hilfreich ausgezeichnet

ak56Lk

Nutzer, der sehr aktiv auf gutefrage ist

im Thema PHP

18.03.2010, 12:33

Regular Expressions sind sehr nützlich wenn man es drauf hat

preg_match_all("#<li(.*)>(.*)<\/li>#", $dein_string, $output_as_array);

print_r($output_as_array);

user638335

18.03.2010, 14:21

> "#<li(.)>(.)<\/li>#"

Normalerweise sind reguläre Ausdrücke gierig, (greedy) bei diesem Ausdruck würde ich annehmen, daß der Ausdruck alles nach <li bis zum Zeilenende "frißt".

Sinnvolle Modifier: U: Ungreedy: möglichst wenig - irgendwelche Zeichen - suchen

s: . matcht auch auf Zeilenende. Ein Zeilende könnte ja in dem <li> Tag vorkommen.

Besser also: "#<li(.)>(.)<\/li>#Us"

Ich würde allerdings eine Negation bevorzugen: '~<li>([^<]+)</li>~'

Also 1 oder mehr Zeichen, die nicht in den eckigen Klammern vorkommen. Zirkumflex vorangestellt, negiert den Inhalt der Klammern.

Hoffe, es wird richtig angezeigt :D Viel Spaß!

wolle54

18.03.2010, 12:41

Regular Expressions sind sehr nützlich wenn man es drauf hat

Bei dem Tag

wirst Du eher preg_match_all (http://php.net/manual/de/function.preg-match-all.php) benötigen, da preg_match bei der ersten Übereinstimmung die Suche beendet und es sicher mehrere gibt.

yerooke

Nutzer, der sehr aktiv auf gutefrage ist

im Thema PHP

17.03.2010, 18:45

Regular Expressions sind sehr nützlich wenn man es drauf hat

Hier ein kleiner Code der den TITLE einer Seite ausliest - leite es einfach ab! Ersetze <title></title> mit <li></li>

$content = @file_get_contents("http://www.test.de");

$preg_one = preg_match("!<title>(.*?)</title>!", $content, $ergebnis);

echo $ergebnis[1];

comod

Beitragsersteller

17.03.2010, 18:48

ja der title steht meistens in einer zeile. was ist wenn der content so aussieht:

<p><title>Hallo\n Das Ist\n Völliger Schwachsinn</title></p>

Also Ich komme jetzt mit $regex = '/<li(.+?)>(.+?)<\/li>/is'; ganz gut aus!

yerooke

17.03.2010, 20:18

@comod

Egal, der Code Filtert nur das Heraus was zwischen der ersten Kombinatio steht und der zweiten, vollkommen unabhängig was davor oder danach steht!

Ähnliche Beiträge

Mittels PHP Umsätze auslesen (hbci, fints, etc...)

Hallo liebe Community, Ich möchte gerne ein PHP-Script erstellen, dass automatisiert eine art Kontoauszug erstellt und dann evtl. auf einer Webseite darstellt. Ich habe bis jetzt von der HBCI-Schnittstelle gelesen, auch eventuelle Lösungsansätze nachverfolgt, die mir allerdings nicht immer sehr aufschlussreich erschienen. Einige der Lösungsvorschläge waren:

openhbci bzw. aqbanking
jameica und hibiscus + xml-rpc
mittels einer html-php klasse einen Browser zu emulieren und die Auszüge dann mittels regex damit aus dem regulären Online-Banking zu extrahieren.

Eine weitere Idee war die benutzung von FinTS (schlägt meine Bank auch vor), allerdings werde ich daraus gar nicht schlau...

Hat vielleicht hier jemand schon Erfahrung gemacht mit der hbci schnittstelle o.ä. und eventuelle Tipps/Tutorials für mich?

Viele Grüße llxp

...zum Beitrag

Regulärer Ausdruck, der Umlaute und nicht Umlaute erfasst?

Blöde Fragestellung aber ich weiß nicht wie ich es genau benennen soll.

Für eine Suchfunktion auf einer Webseite möchte ich die gefundenen Begriffe in der Vorschau der Suchergebnisse farblich markieren. Da die Webseite mehrsprachig ist, kommen auch viele Sonderzeichen wie Umlaute oder Akzentzeichen vor.

Nun möchte ich, dass der Nutzer sowohl Wörter mit Sonderzeichen, als auch ohne eingeben kann und immer das selbe findet. Er kann kann also bspw. nach „passe compose“ oder „passé composé“ suchen und findet immer die gleichen Seiten, auf denen „passé composé“ vorkommt.

In MySQL ist das bei der Suche kein Problem, da kann man mit COLLATE utf8_general_ci genau das erreichen. Schwierig wird es für mich, dass im Ergebnis zu markieren. Hier mal ein Beispielcode in PHP:

if (preg_match_all('/foo/ui', 'foo föö bar bär', $matches)) {
	print_r($matches);
}

Das findet nur „foo“ und nicht „föö“. Umgedreht wird nur „föö“ gefunden. Die einzige Lösung die mir einfällt wäre so ein Ausdruck, der aber nicht sonderlich elegant ist und auch noch länger werden müsste:

'/f(?:o|ö)(?:o|ö)/ui'

Also zur Frage: Kennt jemand einen Modifikator oder irgendeine elegante Lösung, wie ich das besser und einfacher erreichen kann?

...zum Beitrag

Regex mit beliebig vielen Zeichen?

Ich will eine Regex mit der Pattern: Wort, das mit S beginnt und mit D aufhört. Dazwischen darf alles stehen.
Bisher habe ich ^SD$. Was kommt dazwischen, um beliebige Zeichen zu erlauben?

...zum Beitrag

Regex-Pattern mit Punkt oder Komma?

Hallo,

ich bin gerade dabei, ein wenig zu programmieren. In meinem HTML-Code gibt es ein Input-Element, in das Preise eingegeben werden sollen, die ich später mit PHP verwerte. Ich habe bisher diese Regex-Pattern genutzt. ^\d*(\.\d{0,2})?$
Die funktionierte auch wunderbar, aber lässt eben nur Punkte als Dezimaltrennzeichen zu. Nun will ich aber auch Kommas zulassen und habe daher das hier geschrieben ^\d*((\.|,)\d{0,2})?$.
Diese Pattern will aber nicht funktionieren und lässt jetzt gar nichts mehr zu. Woran liegt das?

Vielen Dank im Voraus

...zum Beitrag

Potenzen mit ^ durch Math.Pow() in Gleichungen ersetzten?

Hallo,

ich hab eine relativ lange Gleichung in der Potenzen mit ^ geschrieben werden. Nun möchte ich diese Potenzen gerne durch Math.Pow(double wert, double potenz) ersetzen damit ich sie in einem Programm verwenden kann. Da ich faul bin und das nicht alles per Hand machen will (außerdem mach ich dann sicher Fehler) würde ich das gern automatisch machen. Ich hab dabei erst an Regex gedacht, aber meine Kenntnisse davon sind nicht gut genug um sowas umzusetzen, erst recht weiß ich gar nicht ob Regex für umformungen überhaupt geeignet ist. Hat evtl. wer ne Idee?

Danke für alle Antworten.

...zum Beitrag

Verständnisproblem zum Thema reguläre Ausdrücke/Sprache?

Hallo, ich hätte ein paar Fragen zum Thema reguläre Ausdrücke/Sprachen, denn es fällt mir im Moment sehr schwer dies zu verstehen, bzw manches davon.
Kurz zu mir, ich bin noch Schülerstudent im 2 Semester, ich beschäftige mich zwar sehr mit dem Stoff, aber manchmal bleibt an der ein oder anderen Stelle nicht so viel hängen und deswegen, erhoffe ich mir, dass ihr mir hier helfen könnt.

Am besten erklärt es sich an zwei Beispielen, wozu auch Musterlösungen vorliegen:

Meine Fragen:

Warum schreibt man {ab, b} was bedeutet dies? Ich meine in z.B e_1 ist ab und b durch ein + getrennt, das + bedeutet ja "oder" ?
Wie kommt man auf die Lösung von 3.e?
Habt ihr irgendwelche Tipps, wie man an solche Aufgaben rangehen soll, komme damit nicht so richtig klar, für mich ist dies irgendwie willkürlich.

Vielen Dank im Voraus.

Liebe Grüße

Marc

...zum Beitrag

Wie kann ich per RegEx ein bestimmtes Wort ausschließen?

Z.B. möchte ich aus folgendem String das Wort Name ausschließen:

Name: Schmitz

...zum Beitrag

Regex Pattern erstellen in dem die Zahlen nur von 0 - 255 gehen?

Hallo,

ich will in Java ein Regex Pattern erstellen mit Zahlen die nur von 0-255 gehen dürfen.

Leider weiß ich nicht wie ich diese Einschränkung in mein Pattern einfüge.

class MyRegex{
     String pattern = "\d{1,3}[.]\d{1,3}[.]\d{1,3}[.]\d{1,3}";
}

Die ersten ein bis drei Zahlen zusammen gerechnet, also \d{1,3}, dürfen nicht größer sein als 255 und nicht kleiner als 0. Wie definiere ich das?

...zum Beitrag

Suchen und ersetzen mit regex via Notepad++. Aber nur ein mal pro Seite?

Hallo,

ich muss ein paar tausend Dateien bereinigen, die einen Schadcode enthalten (joomla-Installation).

Alle Seiten sind folgendermaßen aufgebaut:

<?php SCHADCODE ?><?php Originalcode

Manchmal sind die php-Seiten aber auch Teil eines Programmcodes. Dann sehen sie so aus:

<?php SCHADCODE ?> Originalcode

Meine Herangehensweise bisher war, mit

.<\?php(.?)?>*. den Schadcode zu finden und zu ersetzen. Leider findet dieser Suchstring aber auch das zweite, öffnende php-Tag, das ja - wenn vorhanden - bleiben soll. Daher habe ich den Versuch unternommen, mit obigen Suchstring zu suchen, aber nicht durch nichts, sondern durch ein öffnendes php-tag zu ersetzen.

Nur geschieht dies dann auch in jenen Dateien, die kein öffnendes php-Tag haben sollen.

Kurzum: Wie sage ich dem Suchstring, dass er nur bis zum ersten schließenden php-Tag suchen soll und dann stoppen? Mit anbderen Worten: Er soll das erste öffnende (<?php) und erste schließende php-Tag (?>) und diese beiden Tags nebst allem dazwischen löschen.

...zum Beitrag

Excel: Operator aus anderen Zelle auslesen?

Hallo Leute,

ich schildere mein Probelm: Ich hab vorerst eine Tesliste erstellt, welche ungefähr so aussieht:

| A | 4 | | B | 5 | | C | 7 |

...

Jetzt möchte ich woanders eine Formel eingeben, welche die Zelle rechts daneben automatisch einliest und ausrechnet. Die Zelle kann die Formel schon einlesen. Das schaut ungefähr so aus:

=SVERWEIS(TEIL(D1;1;1);$A$1:$B$11;2;FALSCH)&TEIL(D1;2;1)&SVERWEIS(TEIL(D1;3;1);$A$1:$B$11;2;FALSCH)

Die Liste befindet sich in den Spalten A und B und die Formel und ausgerechnete Formel in den Spalten D und E. Das Grüne ist die Auslese für die Variablen und das Rote die für den Operator. Allerdings wird der Operator nicht als dieser angesehen, sondern als String, wodurch nicht die ausgerechnete Formel dasteht sondern die Zahlen für die einzelnen Variablen.

Ein Beispiel:

| AxB | 4x5 |

Eigentlich sollte dastehen:
| AxB | 20 |

Jetzt hab ich eine etwas sehr komplizierten Code für 2 Variablen zusammengeschustert:

=WENN(TEIL(D1;2;1)="x";SVERWEIS(TEIL(D1;1;1);$A$1:$B$11;2;FALSCH)xSVERWEIS(TEIL(D1;3;1);$A$1:$B$11;2;FALSCH);WENN(TEIL(D1;2;1)="+";SVERWEIS(TEIL(D1;1;1);$A$1:$B$11;2;FALSCH)+SVERWEIS(TEIL(D1;3;1);$A$1:$B$11;2;FALSCH);WENN(TEIL(D1;2;1)="-";SVERWEIS(TEIL(D1;1;1);$A$1:$B$11;2;FALSCH)-SVERWEIS(TEIL(D1;3;1);$A$1:$B$11;2;FALSCH);WENN(TEIL(D1;2;1)="/"; SVERWEIS(TEIL(D1;1;1);$A$1:$B$11;2;FALSCH)/SVERWEIS(TEIL(D1;3;1);$A$1:$B$11;2;FALSCH);"unzlässiger Multiplikator"))))

Ein bisschen vereinfacht: =WENN(TEIL(D1;2;1)="x";SVERWEIS(TEIL(D1;1;1);$A$1:$B$11;2;FALSCH)xSVERWEIS(TEIL(D1;3;1);$A$1:$B$11;2;FALSCH); <<Hier kommen dann die anderen abfragen für Division, Addition und Subtraktion)

Ich werde ich aber bis zu 10 Variablen brauchen und dann wird es komplett unübersichtlich.

Multiplizieren ohne die Auslese vom Operator funktioniert bestens. Also: =SVERWEIS(TEIL(D1;1;1);$A$1:$B$11;2;FALSCH)xSVERWEIS(TEIL(D1;3;1);$A$1:$B$11;2;FALSCH)

Jetzt meine Frage: Wie kann ich den Operator als Operator verwenden, anstatt als String?

Sorry für die kack-Formatierung, aber gutefrage.net lässt einen kaum spielraum für Design, deshalb sind die Sternchen die man ja eigentlich zu multiplizieren gedacht sind durch "x" ersetzt worden

lg Wipeout

...zum Beitrag

Regex wie prüfe ich, ob zwei zahlen nicht nebeneinadner sind z. B. String "94883" und ich will prüfen, dass 9 und 8 nie nebeneinander sind im String?

...zum Beitrag

REGEX - Zeilenende bei bestimmtem Wort ermitteln?

Hallo zusammen,

ich möchte via REGEX das Zeilenende markieren, wenn ein bestimmtes Wort vorkommt.

Beispiel:
Im nachfolgenden Text soll nur das Zeilenende (also $) markiert werden, wenn "Germany" im Text steht. Das ist nur ein Beispiel, in der Praxis habe ich hier tausende Zeilen.
Letztendlich möchte ich an die entsprechenden Zeilen noch etwas anhängen, also das Zeilenende ersetzen.

Ich möchte nicht die ganze Zeile auswählen, das kann ich schon. :-) Nur das letzte Zeichen.

Hier wurde die ganze Zeile markiert und würde beim Ersetzen komplett überschrieben werden.

Ich möchte stattdessen nur das Zeilenende markiert haben. So:

Das Beispiel hier ist mit Notepad++ dargestellt. Ich nutze aber eigentlich ein sehr spezielles Tool zum Bearbeiten von EDI-Mappings, was aber niemandem bekannt sein dürfte. Daher der Bezug zu Notepad++.

Nein, ich kann keine anderen Tools zum Suchen nutzen.

Würde mich über Hilfe freuen.

Liebe Grüße

...zum Beitrag

xml PowerShell Element Attribut-Namen ändern?

Hallo, ich würde mir gern ein Powershell-Script erstellen um Attributnamen zu ändern.Ich habe viel gefunden um bei einer XML-Datei die Value-Werte zu Ändern oder neue Attribute einzufügen. Aber nichts zu diesem Problem.

Ausschnitt aus meiner XML:
<TimeLine startutc="2023-07-15 06:00">
<Activity duration="33899" type="Rest" />
</TimeLine>

Hier sollen nicht die Werte verändert werden, sondern einmal aus "Activity" soll "ActivityName" und aus "type" -> "ActivityType" werden.

$quelle = "C:\Users\AAA"
$allXmlDateien = Get-ChildItem $quelle "*.xml" -Recurse    
foreach ($datei in $allXmlDateien) {
$text = Get-Content $datei.FullName
$text = $text.Replace("type", "ActivityType")
Set-Content $datei.FullName $text
}

Das funktioniert zwar, aber das Problem ist, dass es mir alle "type" umbenennt, auch die aus anderen Knoten, die nicht verändert werden sollen!

Kann mir jemand helfen?

...zum Beitrag

Mehrzeilige Textbox Visual Basic.net

Hallo leute,

bins noch mal habe dies mal folgende Frage, ich habe mir eine Textbox ins Formular eingefügt. Diese habe ich multiline true gesetzt wie bekomme ich es jetzt hin das, dass programm mehrere Zeilen in der Textbox schreibt ?

Hier mein momentaner Quelltext:

Select Case TextBox2.Text()

case sagwas

Textbox1.text = "Hallo Welt"

Textbox1.text= "Guten Tag"

Textbox1.text= "Hallo Hallo !"

case else

End Select

und so weiter kann mir da jemand helfen also die Einträge sollen untereinander stehen und dann auch in textbox stehen bleiben

Danke für Schnelle Antworten Glück auf !

...zum Beitrag

Was möchtest Du wissen?

Deine Frage stellen