Daten mit Regex extrahieren Python?
Moin,
ich habe in meinen Latex Literaturverzeichnis einen kleinen Fehler gemacht und
möchte jetzt mit Regex und Python die Daten aus dem String extrahieren und neu formatieren: Das ist mein String:
\bibitem {i7} Kempken, Frank: „Mit Grüner Gentechnik gegen den Hunger?“ [online]. 27.01.2009. https://www.bpb.de/shop/zeitschriften/apuz/32210/mit-gruener-gentechnik-gegen-den-hunger/. 07.02.2023
Und hier mit Code, der nicht das richtige zurück gibt.
import re
s = "\\bibitem {i7} Kempken, Frank: „Mit Grüner Gentechnik gegen den Hunger?“ [online]. 27.01.2009. https://www.bpb.de/shop/zeitschriften/apuz/32210/mit-gruener-gentechnik-gegen-den-hunger/. 07.02.2023"
match = re.search(r'\{(.+?)\} (.+?): „(.+?)“ \[online\]. (.+?). (.+?). (.+?)', s)
result = {
"author": match.group(2),
"title": match.group(3),
"date": match.group(4),
"url": match.group(5),
"last_viewed": match.group(6)
}
print(result)
Danke im Voraus!
Programmiersprache,
Python,
Regulärer Ausdruck