Parsing ist der Prozess des Analysierens und Interpretierens einer Zeichenkette oder eines Datenstroms, um dessen Struktur zu verstehen und in eine für weitere Verarbeitung geeignete Form zu bringen. Dieser Prozess wird häufig in der Informatik, der Computerprogrammierung und/oder der Softwareentwicklung verwendet, um Texte, Daten, Programmiersprachen oder Dokumente in eine Struktur umzuwandeln, die von Computern leicht verarbeitet werden kann.
Dabei wird zwischen syntaktischem Parsing und semantischem Parsing unterschieden: Ersteres rekonstruiert eine präzise Struktur eines Codes, während Letzeres die Bedeutung des Datenstroms ("Intent") extrahiert.
Beim Übersetzen von Quellcode in Maschinensprache analysiert ein Compiler den Quellcode mittels Parsing, um die syntaktische Struktur zu verstehen. Der Compiler überprüft die Syntax und erstellt eine abstrakte Syntaxstruktur (AST), die dann weiterverarbeitet wird, um ausführbaren Code zu generieren.
Webbrowser und andere Anwendungen verwenden Parsing, um HTML- oder XML-Dokumente zu analysieren und zu interpretieren. Dies ermöglicht die Darstellung von Webseiten und das Extrahieren von Daten aus strukturierten Dokumenten.
Beim Einlesen von JSON- oder CSV-Daten in ein Programm wird Parsing verwendet, um die Daten zu interpretieren und in eine interne Datenstruktur zu überführen, die das Programm verwenden kann. Dies erleichtert die Arbeit mit komplexen Datenstrukturen. Mittlerweile werden auch YAML, TOML, Protobuf, Avro und Parquet sowie API-Formate wie JSON, XML geparst. Dafür werden moderne Parsing-Werkzeuge wie Tree-sitter, ANTLR 4 oder Lark verwendet.
In der natürlichen Sprachverarbeitung (NLP) wird Parsing eingesetzt, um die grammatikalische Struktur von Sätzen zu analysieren. Dies hilft, die Bedeutung von Texten zu entschlüsseln und maschinelles Verstehen, Interpretieren und Übersetzen zu ermöglichen. Das KI-gestützte Parsing wie Dokumentenextraktion und semantisches Parsing gewinnt seit einiger Zeit an Bedeutung.
Parsing wird verwendet, um Log-Dateien und auch DevOps und Cloud-Infrastrukturen zu analysieren und wichtige Informationen herauszufiltern. Dies hilft vor allem Administratoren dabei, Fehler zu diagnostizieren, die Leistung zu überwachen und sicherheitsrelevante Ereignisse zu identifizieren. Auch in Streaming- und Big-Data-Anwendungen (z. B. Kafka, Spark Streaming) kommt Parsing zum Einsatz.
Parsing ist ein wesentlicher Prozess in der Informatik, der dazu dient, Zeichenfolgen oder Datenströme zu analysieren und zu interpretieren. Durch Parsing werden Daten in eine Struktur überführt, die für weitere Verarbeitung und Analyse geeignet ist. Beispiele wie Compiler, HTML-, JSON- und XML-Parsing, Datenformate, Spracherkennung und Log-Dateien verdeutlichen die breite Anwendung und Bedeutung von Parsing in verschiedenen (Teil-)Bereichen der IT.
Unsere Softwareentwicklungsexpert:innen kennen sich mit allen relevanten Themen aus und unterstützen Sie gekonnt bei jedem Ihrer Projekte. Kontaktieren Sie uns für ein unverbindliches Erstgespräch.