Dies ist ein als lesenswert ausgezeichneter Artikel.

Perl (Programmiersprache)

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Perl
Paradigmen: prozedural, modular, objektorientiert (seit Perl 5)
Erscheinungsjahr: 1987
Designer: Larry Wall
Entwickler: Larry Wall, Perl Porter
Aktuelle Version 5.40.0[1] (9. Juni 2024)
Typisierung: schwach, dynamisch, implizit
Beeinflusst von: awk, BASIC-PLUS[2], C/C++, Lisp, Pascal, Python,[3]Raku,[4] sed, Smalltalk, Unix-Shell
Beeinflusste: PHP, Ruby, Python, JavaScript, Windows PowerShell
Betriebssystem: plattformunabhängig
Lizenz: GPL und Artistic License
www.perl.org

Perl [pɝːl] ist eine freie, plattformunabhängige und interpretierte Programmiersprache, die mehrere Paradigmen unterstützt.

Der Linguist Larry Wall entwarf sie 1987 als Synthese aus C, awk, den Unix-Befehlen und anderen Einflüssen. Ursprünglich als Werkzeug zur Verarbeitung und Manipulation von Textdateien insbesondere bei der System- und Netzwerkadministration vorgesehen (zum Beispiel für die Auswertung von Logdateien), hat Perl auch bei der Entwicklung von Webanwendungen und in der Bioinformatik weite Verbreitung gefunden. Traditionell vertreten ist Perl auch in der Finanzwelt, vor allem bei der Verarbeitung von Datenströmen verschiedenartiger Nachrichtenquellen. Hauptziele sind eine schnelle Problemlösung und größtmögliche Freiheit für Programmierer. Die Bearbeitung von Texten mit Hilfe regulärer Ausdrücke und ein großer Gestaltungsspielraum sind Stärken der Sprache. Perl zählt zu den Allzweck-Programmiersprachen.

Larry Wall entwarf Perl.

Larry Wall war als Administrator und Programmierer bei dem Unternehmen Unisys angestellt, wo er seit März 1987 daran beteiligt war, unter dem Namen blacker ein sicheres Netzwerk für die NSA zu entwickeln. Er erhielt mehrere Aufträge, Werkzeuge zur Überwachung und Fernwartung der entstehenden Software zu schaffen. Eine Hauptaufgabe war dabei, übersichtliche Berichte aus verstreuten Logdateien zu erzeugen. Da ihm die vorhandenen Sprachen und Werkzeuge dafür zu umständlich erschienen, entwickelte er mit Hilfe seines damaligen Teamkollegen Daniel Faigin und seines Schwagers Mark Biggar schrittweise eine eigene Sprache, um seine Aufgaben zu lösen.

Dabei griff er auch auf sein Wissen und seine Erfahrung als Linguist zurück und entwarf Perl nahe an den menschlichen Sprachgewohnheiten. Dies drückt sich in minimalen Voraussetzungen für Einsteiger, einer starken Kombinierbarkeit der Sprachelemente und einem reichen Wortschatz aus, der auch Befehle zulässt, deren Bedeutungen sich überschneiden. Wall sieht darin die Bedürfnisse eines Praktikers nach Freiheit und intuitivem Ausdruck verwirklicht.

Gemäß diesem praktischen Ansatz borgte sich Perl seinen Wortschatz und seine logischen Strukturen von den in den 1980er Jahren unter Unix verbreiteten Sprachen und Werkzeugen, was das Erlernen vereinfachte, aber auch die Unix-Philosophie umkehrte. Unix und seine Systembefehle waren kompiliert und meist in C geschrieben. Diese Befehle waren logische Einheiten und sollten genau eine Aufgabe beherrschen: „Do one thing and do it well“ („Mach genau eine Sache und mach sie gut“). Interpretierte Shell-Skripte kombinierten schnell und einfach die Befehle, die untereinander ihre Ergebnisse durch Pipes weiterreichen konnten. Perl verletzt diese Philosophie, indem es diese Befehle zum Bestandteil der Programmiersprache macht, also C und Shell vereint und die vorhandenen Befehle und Werkzeuge übergeht.

Dies wurde notwendig, weil Shell-Skripte für komplexe Aufgaben ungeeignet waren. Ihr Ablauf ist sehr einfach, sie können Daten nur eingeschränkt zwischenspeichern und die Pipes sind Flaschenhälse beim Datenaustausch. Andererseits erlauben sie einen wesentlich kompakteren Programmierstil, da die Benutzung eines UNIX-Werkzeugs viele Zeilen C-Quelltext ersetzen kann.

Um die Vorteile beider Programmierarten nutzen zu können, schuf Wall eine Kombination aus C und Werkzeugen wie sed, awk, grep und sort. Er fügte Eigenschaften der Bourne Shell, in geringem Maße auch Elemente aus Pascal und BASIC, sowie eigene Ideen dazu.[5] Diese Fusion ermöglichte kurze, mächtige Programme, die man schnell schreiben und jederzeit auch testen konnte, ohne sie kompilieren zu müssen, was die Entwicklung ebenfalls beschleunigte. Später wurden weitere Fähigkeiten von Sprachen wie Lisp, Smalltalk, Python oder Ruby „importiert“.

Der Name Perl bezieht sich auf ein Zitat aus dem Matthäus-Evangelium (Mt 13,46 EU),[6] in dem Jesus das Himmelreich mit dem Bild eines Händlers beschreibt, der seinen gesamten Besitz verkaufen will, um eine kostbare Perle zu erwerben. Noch vor der Veröffentlichung wurde der Name von „Pearl“ in „Perl“ geändert, da es bereits eine Programmiersprache namens PEARL gab. Allgemein verbreitet und von Larry Wall akzeptiert sind auch die Backronyme Practical Extraction and Report Language (zweckmäßige Extraktions- und Berichtssprache) und Pathologically Eclectic Rubbish Lister (krankhaft stilmischender Blödsinnsauflister). Die Schreibweise „Perl“ bezeichnet die Sprache, „perl“ dagegen das Programm, das diese Sprache interpretiert. Ferner legt die Perl-Gemeinde Wert darauf, dass nicht die Schreibweise „PERL“ verwendet wird, da es sich nun mal nicht um ein Akronym handelt.[7]

Larry Wall war zu dieser Zeit Angestellter des Jet Propulsion Laboratory (JPL).

Am 18. Dezember 1987[8] publizierte Larry Wall sein Programm im Usenet als Perl 1.0, das damals noch eine mächtigere Shell war, die gut mit Texten und Dateien umgehen, andere Programme steuern und gut lesbare Berichte ausgeben konnte. Bereits am 5. Juni im Jahr darauf erschien die Version 2.0 mit grunderneuerter und erweiterter Regex-Engine und einigen weiteren Verbesserungen. Am 18. Oktober 1989 folgte Perl 3, das mit binären Daten umgehen konnte und auch Netzwerkprogrammierung ermöglichte. Als neue Lizenz wurde die GPL gewählt.

Fast unverändert war es ab dem 21. März 1991 als Perl 4 erhältlich, jedoch nun wahlweise unter der GPL oder der von Larry Wall entwickelten Artistic License. Der eigentliche Grund für die neue Version war aber das gleichzeitig erschienene Kamelbuch, das als Referenz für den aktuellen, als Version 4 markierten Stand veröffentlicht wurde. Bis dahin waren die seit Perl 1 verfügbaren UNIX-man-pages die einzige verfügbare Dokumentation. Diese bieten zu jedem Thema eine fundierte und umfangreiche Abhandlung, aber keinen einfachen Einstieg für Perl-Anfänger.

Diese Lücke sollte das von Randal L. Schwartz, Larry Wall und Tom Christiansen verfasste Buch schließen. Es erschien im O’Reilly Verlag, der mit diesem und weiteren Titeln als renommierter Fachverlag für Programmierer bekannt wurde. Perl-Bücher von O’Reilly wurden die maßgeblichen Publikationen, was sich erst im neuen Jahrtausend etwas relativierte. Der Verlag betrieb auch unter der Internetadresse perl.com das meistbesuchte Online-Magazin für Perl-Programmierung und veranstaltet mit der TPC (The Perl Conference – heute OSCON) die größte Perl-Konferenz. O’Reilly profitierte von Perls wachsender Popularität, und im Gegenzug bezahlte Tim O’Reilly seinem Freund Larry Wall in den folgenden Jahren ein festes Gehalt, der sich so, ohne weitere Pflichten oder Vorgaben, der Weiterentwicklung der Sprache widmen konnte.

1993, als Perl die Version 4.036 erreichte, brach Larry Wall die Weiterentwicklung ab und entwickelte Perl 5 vollständig neu.

CPAN: Eines der größten Archive freier Software

Perl 5.0 wurde am 18. Oktober 1994 veröffentlicht und war der bis dahin größte Fortschritt für die Sprache. Mit Plain Old Documentation konnte man nun formatierte Dokumentation in den Quelltext einfügen. Auch ließ sich die Sprache ab jetzt durch separate Module erweitern, was im folgenden Jahr zur Entstehung des CPAN führte. Dieses große Archiv frei erhältlicher Module wurde schließlich selbst ein wichtiger Grund, Perl einzusetzen. Eine weitere, wichtige Neuerung war die Einführung von Referenzen, die erstmals eine einfache Erstellung zusammengesetzter Datenstrukturen erlaubte.

Mit Version 5 wurde es auch möglich, objektorientiert in Perl zu programmieren. Dabei wählte Larry Wall einen ungewöhnlichen Weg und leitete die dafür verwendete Syntax fast ausschließlich aus vorhandenen Sprachelementen ab (Packages, Package-Funktionen und Package-Variablen sowie den neuen Referenzen). Lediglich die Funktion bless() zum Anlegen eines Objektes und der Pfeil-Operator (->) zum Aufruf von Methoden kamen hinzu (der Pfeil-Operator ist eigentlich der Dereferenzierungsoperator, der aus einem Objekt, das aus einer Referenz auf die Klasse besteht, eine bestimmte Methode dereferenziert). Es entstand auch XS, eine Schnittstellenbeschreibungssprache, die es ermöglicht, Perl-Programme mit anderen Sprachen zu erweitern oder mit Perl-Programmen beliebige Software oder Hardware anzusprechen.

Seit der Veröffentlichung von Perl 5 beteiligte sich Larry Wall kaum noch an der Entwicklung der Sprache. Dies übernahmen freiwillig Perl-begeisterte Programmierer, die sogenannten Perl 5 Porters, die über die im Mai 1994 gegründete p5p-Mailingliste kommunizieren, aber auch zunehmend über einen eigenen Bug- und Request-Tracker (RT) über Fehlerbehebungen und neue Funktionen der Sprache entscheiden. Dabei übernimmt je Version ein sogenannter Pumpking die Leitung. Der Begriff Perl Porter entstammt der ursprünglichen Aufgabe der p5p-Liste, die Portierung von Perl auf andere Betriebssysteme zu koordinieren.

In den Jahren nach Version 5.0 wurde nicht nur Perl auf Macintosh und Windows portiert, sondern es verschob sich auch die Nummerierung der Versionen. Da sich an der Syntax nichts Wesentliches änderte, beließ man die 5 und erhöhte bei größeren Meilensteinen die erste Nachkommastelle, verwendete aber zusätzliche Nummern, um die Zwischenschritte zu zählen. Da Perl erst ab 5.6 mit Versionsnummern, die mehrere Kommata enthalten, umgehen konnte, wurden sie bis dahin z. B. Perl 5.001 oder Perl 5.001012 geschrieben. Ab 5.6 wurde auch das damals von Linux verwendete Versionsschema übernommen, bei dem gerade Nummern auf Fehlerfreiheit gepflegte Benutzerversionen hindeuten und ungerade auf Entwicklerversionen, in die neue Funktionen einfließen. Serien von Benutzerversionen (z. B. 5.8.x) werden untereinander binär kompatibel gehalten, was bedeutet, dass ein für Perl 5.8.7 kompiliertes Binärmodul auch mit 5.8.8, nicht jedoch zwingend mit 5.10 oder 5.6.1 funktioniert.

Perl 5.6

Diese Version brachte am 22. März 2000 einige neue experimentelle Fähigkeiten, die erst später ausreiften, wie Unicode und UTF-8, Threads und cloning. Auch 64-Bit-Prozessoren konnten nun genutzt werden. Sprachlich fügte diese von Gurusamy Sarathy geleitete Reihe vor allem lexikalisch globale Variablen (mit our) und eine Vektorschreibweise, die den Vergleich mehrstelliger Versionsnummern erlaubt, sowie die Spezialvariablen @- und @+, ein.

Perl 5.8

Mit der am 18. Juli 2002 von Nicholas Clark betreuten Reihe 5.8.x wurden vor allem die Probleme mit Unicode und den Threads behoben, aber auch die Ein-/Ausgabe (IO), Signale und die numerische Genauigkeit wurden entscheidend verbessert.

Neben verringertem Speicherverbrauch und einer erneuerten und nun auch austauschbaren Regex-Maschine brachte diese Version am 18. Dezember 2007 unter der Führung von Rafaël Garcia-Suarez vor allem Neuerungen, die dem Entwurf von Perl 6 entstammen und deren Gebrauch entweder einzeln oder kollektiv mit use feature ':5.10'; angemeldet werden muss oder kürzer use v5.10;. Dies gilt ab dieser Version für alle Funktionen, welche die Kompatibilität brechen könnten. Hierzu zählen say, given und when (analog zur switch-Anweisung in C), der smartmatch-Operator (~~), der defined or-Operator (//) und state-Variablen, welche die Erzeugung von Closures vereinfachen. Weitere nennenswerte Neuheiten umfassen den verlagerbaren Installationspfad, stapelbare Dateitestoperatoren, definierbare lexikalische Pragmas, optionale C3-Serialisierung der Objektvererbung und field hashes (für „inside out“-Objekte). Die Regex-Engine arbeitet nun iterativ statt rekursiv, was rekursive Ausdrücke ermöglicht. Komplexe Suchanfragen können nun auch verständlicher und weniger fehleranfällig durch named captures formuliert werden. Die Spezialvariablen $# und $* sowie die Interpreterschnittstellen perlcc und JPL wurden entfernt.

Im folgenden Jahr wurden die Quelle von Perforce auf Git umgestellt, was die Entwicklung und Herausgabe neuer Versionen wesentlich vereinfachte.

Perl 5.12

Diese von Jesse Vincent geleitete Version vom 12. April 2010 beinhaltet weit weniger große und sichtbare Veränderungen als 5.10. use v5.12; impliziert use strict; und use feature 'unicode_strings';, wodurch alle Befehle Strings als Unicode behandeln. Unter den technischen Verbesserungen sind besonders der aktualisierte Unicode (5.2), DTrace-Unterstützung und Sicherheit von Datumsangaben jenseits von 2038 hervorzuheben, suidperl wurde entfernt. Aus Perl 6 wurden der Ellipsen-Operator (yada-yada) und die Regex-Escape-Sequence \N übernommen, Modulversionen können jetzt von package und use verwaltet werden. Ebenfalls neu ist die Möglichkeit, eigene Schlüsselwörter durch Perlroutinen zu definieren. Dies ist allerdings als experimentell markiert und kann sich ändern. Für bessere Planbarkeit und Zusammenarbeit mit Distributionen erscheint ab 5. Dezember 2000 am 20. jedes Monats eine Entwicklerversion, alle 3 Monate eine kleine Benutzerversion und jedes Jahr eine große.

Perl 5.14

Ab 14. Mai 2011 erleichtern neue Modifikatoren und Steuerzeichen den Umgang mit Unicode, der auf den Stand 6.0 gebracht wurde. Built-ins für Listen und Hashes dereferenzieren automatisch (autoderef) und weite Teile der Dokumentation wurden überarbeitet oder neu geschrieben. Auch die Unterstützung von IPv6 wurde verbessert, sowie das Anbinden von Multithread-Bibliotheken erleichtert.

Perl 5.16

Die am 20. Mai 2012 herausgegebene Version beinhaltet zahlreiche syntaktische Glättungen, in Teilen erneuerte Dokumentation und den Wechsel zu Unicode 6.1. Die Leitung hatte Jesse Vincent und ab November 2011 Ricardo Signes. Durch einen neu eröffneten Spendentopf der Perl Foundation konnten zudem zwei langjährige Entwickler dazu verpflichtet werden, undankbare Aufgaben zum Abschluss zu führen und den Build-Prozess zu vereinfachen. Einzige grundlegend neue Funktionalität ist das mit use feature 'current_sub'; oder use v5.16; zuschaltbare Token __SUB__, eine Referenz auf die aktuelle Routine.

Perl 5.18

Die am 18. Mai 2013 erschienenen Funktionalitäten lexikalische Subroutinen (lexical_subs) und mit Mengenfunktionen erzeugte Zeichenklassen innerhalb regulärer Ausdrücke sind beide experimentell. Solche Funktionen, zu denen auch lexikalische Kontextvariablen (lexical_topic) und der Smartmatch-Operator gehören, erzeugen jetzt Warnhinweise, die mit no warnings 'experimental::funktionsname'; oder no warnings 'experimental'; abgeschaltet werden können. Die Hashes wurden konsequent randomisiert, um Programme besser gegen DoS-Attacken zu schützen.

Perl 5.20

Ebenfalls unter der Führung von Ricardo Signes kamen am 27. Mai 2014 die experimentellen Funktionalitäten der Subroutinen-Signaturen (signatures) und (postderef) eine alternative Postfix-Syntax zum Dereferenzieren. Das mit 5.14 aufgenommene autoderef wurde als experimentell herabgestuft. Unicode 6.3 wird unterstützt und mit drand48 hat Perl nun einen eigenen, plattformunabhängig guten Zufallszahlengenerator. String- und Arraygrößen sind jetzt 64-Bit Werte.

Perl 5.22

Mit dem 1. Juni 2015 kamen der Doppeldiamantoperator (<<>>), bitweise Stringoperatoren (&. |. ^. ~.), ein 'strict'-Modus für reguläre Ausdrücke use re 'strict'; (re_strict), Unicode 7.0, Aliasing von Referenzen (refaliasing) und konstante Routinen (const_attr), die stets den mit der ersten Kompilierung ermittelten konstanten Wert liefern. Alle benannten Funktionalitäten (Name in Klammern) sind vorerst experimentell.

Perl 5.24

brachte am 9. Mai 2016 Beschleunigungen für Blöcke und numerische Operationen, sowie Unicode 8.0. Die Features postderef und postderef_qq wurden angenommen – autoderef und lexical_topic entfernt.

Perl 5.26

Unter Leitung von SawyerX wurde am 30. Mai 2017 die Regex-Option xx, einrückbare Here-Dokumente und Unicode 9.0 eingeführt. Das Feature lexical_subs wurde angenommen und '.' (das aktuelle Verzeichnis) wurde aus Sicherheitsgründen standardmäßig aus @INC (der Liste von Suchpfaden für Module) entfernt.

Perl 5.28

Erschien am 22. Juni 2018. Nebst Unicode 10.0 erhielt Perl alpha assertions in Lang- und Kurzfassungen. Das sind Aliase für besondere Regex-Gruppen mit sprechenden Namen: zum Beispiel anstatt (?=...), nun auch (*positive_lookahead:...) oder (*pla:...). (*script_run: …) oder (*sr: …) wurde eingeführt, um einheitlich kodierten Text zu erkennen, was hilft Angriffen durch manipulierte Eingaben auszuweichen. Drei kritische Sicherheitslücken wurden geschlossen, mehrfache Dereferenzierungen und Zusammenführungen von Zeichenketten beschleunigt, sowie die Operatoren (&. |. ^. ~.) sind nicht mehr experimentell. Außerdem wurde beschlossen, im Dokument perldeprecation darüber Buch zu führen, wann welche Funktion (mit 2 Versionen Vorwarnzeit) entfernt wird.

Perl 5.30

Aktualisierte am 22. Mai 2019 auf Unicode 12.1, führte die Unicode Wildcard Properties ein und erlaubte einen lookbehind in der Länge zu begrenzen. Entfernt wurden $[, $*, $# und File::Glob::glob, sowie Variablendeklarationen in nachgestellten, bedingten Ausdrücken.

Perl 5.32

Führte am 20. Juni 2020 verkettete Vergleichsoperatoren ($d < $e <= $f), den isa-Operator (prüft Klassenzugehörigkeit) und Unicode 13 ein. \p{name=...} erlaubt es innerhalb einer Regex Ausdrücke zu Unicode-Namen zu interpolieren.

Perl 5.34

Am 20. Mai 2021 wurde eine Ausnahmebehandlung a la Try::Tiny (feature try) in den Kern übernommen und die alternative Schreibweise für Oktaldarstellung von Literalen 0oddddd. Die neue Dokumentationsseite perlgov schreibt den einen neuen Prozess fest, nachdem sich die Perlgemeinschaft zukünftig selbsttätig, ohne den Einfluss von Larry Wall regiert.

Perl 5.36

Ricardo Signes verkündete am 28. Mai 2022 Ausnahmen mit finally-Blöcken, defer-Blöcke, for-Schleifen mit mehreren Laufvariablen, Unicode 14, sowie eine neue Klasse an Hilfsfunktionen, welche über das Pragma builtin importiert werden. Signaturen und Mengenoperationen auf Zeichenklassen wurden stabil markiert und use v5.36; aktiviert das Pragma 'warnings' sowie deaktiviert indirekte Methodenaufrufe ($x = new Class;), sowie die aus Perl 4 belassenen simulierten verschachtelten Hashes.

Perl 5.38

Mit 2. Juli 2023 kam eine Objektorientierung die mit den Schlüsselworten class, method und field arbeitet und die bisherige nicht ersetzt. Eingeführt wurden auch die Spezialvariablen $ENV{PERL_RAND_SEED}, ${^LAST_SUCCESSFUL_PATTERN} und %{^HOOK}, sowie die buitins indexed, is_tainted und export_lexically.

Perl 5.40

Am 9. Juni 2024 wurden das Attribut :reader für field Variablen, das Token __CLASS__ und der Operator ^^ eingeführt. Es kamen auch die builtins inf, nan und load_module und das feature try erreicht den Status stabil.

Aktuelle Versionen

[Bearbeiten | Quelltext bearbeiten]

Auch wenn die neueste Benutzerversion 5.40.0 lautet, wird derzeit die Versionsreihe 5.38.x weiterhin gepflegt (aktuell ist 5.38.2). Die Versionen 5.36.3, 5.34.3, 5.32.1, 5.30.3, 5.28.3, 5.26.3, 5.24.4, 5.22.4, 5.20.3, 5.18.2, 5.16.3, 5.14.4, 5.12.5, 5.10.1 und 5.8.9 sind Schlusspunkte ihrer Reihe, sicherheitsrelevante Verbesserungen werden noch bis zu 3 Jahre nach Veröffentlichung einer Version nachgereicht. Bei Kernmodulen wird meist auf eine Kompatibilität bis zu 5.6 geachtet, bei wichtigen CPAN-Modulen meist 5.8.3. Änderungen finden im Entwicklerzweig mit ungerader Versionsnummer statt (aktuell 5.35.x), der nicht für allgemeine Benutzung bestimmt ist. Da sich Perl 6 zu einer eigenständigen Sprache entwickelt hat, wird die nächste große Version Perl 7 heißen.

Perl 6, das 2020 zu Raku umbenannt wurde, ist eine Schwestersprache, deren Interpreter und die umgebende Infrastruktur vollständig neu entworfen wurden.

Perl wurde für den praktischen Einsatz entwickelt und konzentriert sich daher auf schnelle und einfache Programmierbarkeit, Vollständigkeit und Anpassbarkeit. Diese Philosophie drückt sich in den folgenden Schlagworten oder Phrasen aus, die meist von Larry Wall stammen.

Das bekannteste und grundlegendste Perl-Motto ist „There is more than one way to do it“ (deutsch: „Es gibt mehr als einen Weg, etwas zu tun“), was meist zu TIMTOWTDI (selten TMTOWTDI) oder (mit englischer Kontraktion) „Tim To[a]dy“ verkürzt wird.[9] Perl macht im Gegensatz zu Sprachen wie Python weniger Vorgaben und bietet absichtlich für jedes Problem mehrere Formulierungs- und Lösungsmöglichkeiten (Syntaktischer Zucker). Zum Beispiel kann man logische Operatoren als || und && (wie in C) oder (mit Bedeutungsnuancen) als or und and (wie in Pascal) schreiben; aber auch zahlreiche Befehle mit einem sich überschneidenden Funktionsumfang wie map und for erlauben verschiedene Formulierungen für den gleichen Sachverhalt. Einige Befehle wie der Diamant-Operator (<>) bieten verkürzte Schreibweisen für bereits vorhandene Funktionalität (hier wäre, mit leichten Unterschieden, <STDIN> äquivalent, was jedoch viel länger zu schreiben wäre). Diese Vielfalt wird auch im CPAN sichtbar, wo oft mehrere Module einen sehr ähnlichen Zweck erfüllen oder einen, der ebenso (wenn auch umständlicher) ad hoc implementiert werden könnte (Beispiel Getopt::Long[10]).

Ein weiteres Schlagwort, das man auch als Erweiterung von TIMTOWTDI sehen kann, bezeichnet Perl als die erste postmoderne Programmiersprache. Damit ist gemeint, dass Perl verschiedene Paradigmen vereint und es dem Benutzer freisteht, strukturierte, objektorientierte, funktionale und imperative Sprachmerkmale zu kombinieren.

Einfach und möglich

[Bearbeiten | Quelltext bearbeiten]

Der andere wichtige Merksatz ist Perl makes easy jobs easy and hard jobs possible, was zu deutsch bedeutet „Perl hält die einfachen Aufgaben einfach und macht (die Lösung) schwierige(r) Aufgaben möglich“. Dies beinhaltet zum ersten das Ziel, gängige Aufgaben möglichst mit kurzen „fertigen Lösungen“ zu vereinfachen. Zum Beispiel prüft -e dateiname die Existenz einer Datei. Einfache Aufgaben einfach zu belassen bedeutet für Perl aber auch, möglichst keine vorbereitenden Programmieranweisungen zu verlangen, wie das Anmelden von Variablen oder das Schreiben einer Klasse. Zweitens versucht Perl vollständig zu sein und für jedes Problem mindestens die Grundlagen bereitzustellen, die eine Lösung möglich machen. Das dritte Ziel, die ersten beiden Ziele nicht kollidieren zu lassen, gewinnt mit dem wachsenden Sprachumfang von Perl 6 immer mehr an Bedeutung, wo in Anlehnung an den Huffman-Code die Schreibweisen der am häufigsten verwendeten Befehle möglichst kurz gehalten sind, ohne mit der Logik der Schreibweise ähnlicher Befehle zu brechen.

Kontextsensitiv

[Bearbeiten | Quelltext bearbeiten]

In Perl gibt es Befehle, die verschiedene Bedeutungen haben, je nachdem in welchem Zusammenhang sie benutzt werden. Derart kontextsensitiv sind Datenstrukturen wie das Array. Wird es einem anderen Array zugewiesen, wird dessen Inhalt übergeben; ist der Empfänger ein einzelner Wert (Skalar), erhält dieser die Länge des Arrays.

Technische Merkmale

[Bearbeiten | Quelltext bearbeiten]

Der Perl-Interpreter selbst ist ein in C geschriebenes Programm, das auf annähernd jedem Betriebssystem kompilierbar ist. Vorkompilierte Versionen auf selten verwendeten Systemen wie zum Beispiel BeOS oder OS/2 sind jedoch nicht immer auf dem neuesten Stand. Der Quellcode umfasst circa 50 MB und enthält auch Perl-Skripte, die die Funktion von Makefiles und der Test-Suite übernehmen. Typischerweise ist das kompilierte Programm circa 850 KB groß, was aber je nach Betriebssystem, verwendetem Compiler und Bibliotheken variieren kann.

Perl-Skripte werden in Textdateien mit beliebigem Zeilentrennzeichen gespeichert. Beim Start eines Skripts wird es vom Perl-Interpreter eingelesen, in einen Parse Tree umgewandelt, dieser zu Bytecode, welcher dann ausgeführt wird. Der im Interpreter integrierte Parser ist eine angepasste Version von GNU Bison.

Strenggenommen ist Perl daher keine interpretierte Sprache, da ein Perl-Programm vor jeder Ausführung kompiliert wird. Das führt etwa dazu, dass – anders als bei rein interpretierten Sprachen – ein Programm mit Syntaxfehlern oder fehlenden Abhängigkeiten nicht startet.

Zu Beginn war Perl ein UNIX-Werkzeug, das besonders auf die Verarbeitung von Textdateien, Steuerung anderer Programme sowie zur Ausgabe von Berichten ausgelegt war. Dafür wird es bis heute, nicht nur von Systemadministratoren, auf allen verbreiteten Betriebssystemen eingesetzt. Dabei bekam Perl auch den Ruf einer glue language („Klebstoff-Sprache“), weil mit Hilfe von relativ schnell geschriebenen Perl-Skripten inkompatible Software verbunden werden kann. Bis heute gehört Perl auf allen POSIX-kompatiblen und Unix-ähnlichen Systemen zur Grundausstattung.

Mit der Verbreitung des World Wide Web wurde Perl zunehmend benutzt, um Webserver, Datenbanken und weitere Programme und Daten zu verbinden und die Ergebnisse in Form von HTML-Seiten auszugeben. Der Perl-Interpreter wird dabei über CGI oder FastCGI vom Webserver angesprochen oder ist direkt im Server eingebettet. (mod_perl im Apache, ActiveState PerlEx im Microsoft IIS). Auch wenn für diese serverseitige Skript-Programmierung PHP mittlerweile populärer wurde, wird Perl weiterhin von vielen großen und kleinen Seiten und Internetdiensten wie Amazon.com, IMDb.com, slashdot.org, Movable Type, LiveJournal und Xing verwendet. Da Perl-Skripte oft kaum erkennbar an vielen wichtigen Stellen arbeiten, wurde Perl auch scherzhaft als das Klebeband bezeichnet, welches das Internet zusammenhält. In Perl entstanden auch Frameworks wie Mason, Catalyst, Jifty, Mojolicious und Dancer, die eine sehr schnelle Entwicklung komplexer und leicht veränderbarer Webseiten erlauben. Auch Wiki-Software ist häufig in Perl geschrieben wie z. B. Socialtext, welches auf Mason basiert, Kwiki, TWiki, Foswiki, ProWiki oder UseMod. Auch verbreitete Ticket-Systeme mit Webschnittstelle wie Bugzilla oder RT sind in Perl geschrieben.

Jedoch sind WWW-Anwendungen weiterhin nur eines der vielen Einsatzgebiete von Perl. Wichtige Perl-Programme im E-Mail-Bereich sind SpamAssassin (Spam-Filter), PopFile und open webmail. Zur Systemverwaltung wird Perl zum Beispiel in debconf, einem Teil der Paketverwaltung des Betriebssystems Debian, benutzt.

Weitere Hauptanwendungsfelder sind das Data-Munging und die Bioinformatik, wo Perl seit etwa 1995 die am häufigsten verwendete Sprache war und immer noch bedeutend ist. Gründe hierfür sind wieder die Fähigkeit, Informationen in Textform zu verarbeiten, und die Flexibilität und Offenheit der Sprache, die es der internationalen Forschergemeinde erlauben, trotz unterschiedlicher Standards der Institute zusammenzuarbeiten. BioPerl ist hier die wichtigste Sammlung frei erhältlicher Werkzeuge, die sich vor allem auf das Gebiet der Genomsequenzenanalyse konzentriert. Beim Human Genome Project spielte Perl eine wichtige Rolle.

Auch Desktop-Anwendungen und Spiele wie Frozen Bubble können in Perl geschrieben werden. Die heutigen Computer sind schnell genug, diese Programme flüssig auszuführen.

Bereiche, in denen Skriptsprachen wie Perl nicht sinnvoll eingesetzt werden können, sind zum einen Anwendungen mit hohen Anforderungen an Hardware-Nähe oder Geschwindigkeit wie zum Beispiel Treiber oder Codecs. Zum anderen sollten sie nicht in stark sicherheitskritischen Bereichen (z. B. Flugzeugsteuerung) Verwendung finden, da aufgrund der laxen Syntaxprüfung (z. B. fehlendes/sehr schwaches Typsystem) viele Fehler erst zur Laufzeit auftreten und eine Verifizierung im Allgemeinen nicht möglich ist.

Perl-Portierungen existierten für über 100 Betriebssysteme.[11]

Perl und andere Programmiersprachen

[Bearbeiten | Quelltext bearbeiten]

Für Aufgaben, die mit Perl nur schwierig oder langsam lösbar sind, bietet Perl mit dem Modul Inline[12] eine Schnittstelle an, über die Programmteile in anderen Sprachen in ein Perl-Programm eingebunden werden können. Unterstützte Sprachen sind u. a. C, C++, Assembler, Java, Python, Ruby, Fortran und Octave.[13]

Anwendungsgebiete sind z. B.:

  • rechenintensive Formeln (C, Assembler),
  • Lösung komplexer Probleme mit existierenden Systemen (Octave, Fortran-Bibliotheken) und
  • zusammenführen von Anwendungen in unterschiedlichen Sprachen („Glue-Funktion“ von Perl).

Die Anwendung von Inline ist relativ einfach und gut dokumentiert. Bei kompilierten Programmteilen führt Inline mittels MD5-Kennung Buch über den Versionsstand, wodurch Mehrfachkompilierung des gleichen Codes vermieden wird.

Bei Inline erfordert die Übergabe der Parameter und Rückgabe der Ergebnisse einigen Aufwand. Bei kurzen Berechnungen überwiegt dieser Aufwand den Gewinn an Geschwindigkeit. Wird zum Beispiel die Mandelbrot-Menge berechnet, indem die Formel über Inline als C-Funktion berechnet, die Iteration aber in Perl belassen, verlangsamt sich die Programmausführung gegenüber einer reinen Perl-Implementierung. Wird hingegen auch die Iterationsschleife in C ausgelagert, steigert sich die Performance signifikant.

Tim O’Reilly zählte viele Jahre zu Perls wichtigsten Unterstützern. Sein Verlag hält die Rechte am vielleicht wichtigsten Perl-Logo: dem Kamel.

Als Maskottchen von Perl dient ein Dromedar. Es zierte erstmals den Umschlag des auch als Kamelbuch bekannten Referenzwerkes Programming Perl. Sein Verleger (Tim O’Reilly) sagte in einem Interview scherzhaft als Begründung: Perl ist hässlich und kommt über lange Strecken ohne Wasser aus. Das Dromedar ist auf dem Programming Republic of Perl Emblem zu sehen, das oft als offizielles Perl-Logo angesehen wird und dessen nichtkommerziellen Gebrauch O’Reilly gestattet. Andere im Zusammenhang mit Perl benutzte Logos sind neben Perlen die aufgeschnittene Zwiebel (Erkennungszeichen der Perl Foundation) und der Komodowaran, der die weit verbreitete Perl-Distribution ActivePerl von ActiveState schmückt.

Perl erlaubt bedingt formatfreien Quellcode. Das bedeutet, dass Einrückungen und zusätzliche Leerzeichen syntaktisch unerheblich sind und auch Zeilenumbrüche nach Belieben eingefügt werden können. Dafür müssen Befehle eines Blocks mit Semikolon getrennt werden. Einige Sprachelemente wie Formate, heredocs und gewöhnliche reguläre Ausdrücke sind nicht formatfrei.

Charakteristisch für Perl ist, dass Variablen durch ein Präfix (auch Sigil genannt) gekennzeichnet werden, das ihren Datentyp anzeigt. Hier einige Beispiele:

  • $ für Skalare: $scalar
  • @ für Arrays: @array
  • % für Hashes (assoziative Arrays): %hash
  • & für Funktionen (oft optional): &function
  • * für Typeglobs: *all

Datei-Handles, Verzeichnis-Handles und Formate besitzen kein Präfix, sind aber ebenfalls eigenständige Datentypen. Jeder Datentyp hat in Perl seinen eigenen Namensraum.

Basisdatentypen in Perl sind skalare Variablen, Arrays und Hashes (assoziative Arrays).

  • Skalare sind typlose Variablen für einzelne Werte; es können Strings, Zahlen (Ganz/Gleitkomma) oder Referenzen auf andere Daten oder Funktionen in ihnen gespeichert sein. Strings und Zahlen werden bei Bedarf automatisch und transparent ineinander umgewandelt, eine große Besonderheit von Perl.
  • Arrays fassen mehrere Skalare unter einem Variablennamen zusammen. Arrayeinträge haben einen Index. Die Zählung beginnt bei 0, wenn nichts anderes definiert wurde.
  • Hashes fassen ebenfalls Skalare zusammen, allerdings werden hier Einzelwerte (Values) nicht über numerische Indizes, sondern mit Hilfe zugehöriger Keys (Schlüssel) eindeutig identifiziert und angesprochen. Als Schlüssel kann man eine beliebige Zeichenkette benutzen, oder auch alles, was sich in eine Zeichenkette umwandeln lässt.

Hashes und Arrays lassen sich einander zuweisen, wobei Hashes als Listen von Key/Value-Paaren betrachtet werden. Daten verschiedenen Typs lassen sich mittels Referenzen beliebig zu neuen Datenstrukturen kombinieren, beispielsweise sind Hashes denkbar, die neben (Referenzen auf) Arrays auch einzelne Skalare enthalten.

Package-Variablen werden automatisch erstellt, sobald sie das erste Mal verwendet werden. Weitaus häufiger im modernen Sprachgebrauch kommen gültigkeitsbeschränkte Variablen zum Einsatz. Diese müssen mittels my deklariert werden. our macht eine Variable im gesamten Programm verfügbar. undef variable gibt die angegebene Variable wieder frei.

Kontrollstrukturen

[Bearbeiten | Quelltext bearbeiten]

Die grundlegenden Kontrollstrukturen unterscheiden sich kaum von denen in C, Java und JavaScript.

Bedingte Ausführung

[Bearbeiten | Quelltext bearbeiten]

if funktioniert wie aus C bekannt; unless (<Bedingung>), eine Besonderheit von Perl, ist eine Schreibweise für if (!(<Bedingung>)). Eine Case- oder Switch-Anweisung (given when) gibt es erst ab Perl 5.10, vorher musste man diese Struktur mit if … elsif … else nachbilden. Jedoch setzt given die Kontextvariable ($_) wie for und when wendet smartmatch (~~) darauf an, was dieses Konstrukt ungleich vielfältiger einsetzbar macht als traditionelle Case-Befehle. Das optionale default entspricht hier einem else. Die optimierten logischen Operatoren erlauben auch eine bedingte Ausführung. Bei or (bzw. ||) wird der zweite Ausdruck ausgeführt, wenn das Ergebnis des ersten kein wahrer Wert ist, and (bzw. &&) funktioniert analog.

  if   (<Bedingung>) {<Anweisungen>}
 [elsif (<Bedingung>) {<Anweisungen>}]
 [else         {<Anweisungen>}]

  unless (<Bedingung>) {<Anweisungen>}
 [else         {<Anweisungen>}]

  given (<variable>) {
      [when (<Wert>) {<Anweisungen>}]
      [default    {<Anweisungen>}]
  }

 <Bedingung> ? <Anweisung1> : <Anweisung2>;

 <Ausdruck1> || <Ausdruck2>;
 <Ausdruck1> && <Ausdruck2>;

Wie in C iterieren while und for (in der an C angelehnten Variante), solange die Bedingung wahr ist, until, bis sie wahr ist, und foreach iteriert über eine Liste. In Perl 5 sind for und foreach austauschbar.

 [label:] while (<Bedingung>)
              {<Anweisungen>} [continue {<Anweisungen>}]

 [label:] until (<Bedingung>)
              {<Anweisungen>} [continue {<Anweisungen>}]

 [label:] for ([<Startanweisung>]; [<Bedingung>]; [<Updateanweisung>])
              {<Anweisungen>} [continue {<Anweisungen>}]

 [label:] for[each] [[my] $element] (<Liste>)
              {<Anweisungen>} [continue {<Anweisungen>}]

last verlässt sofort die Schleife, redo wiederholt die derzeitige Iteration, und next springt zum continue-Block, bevor es dann mit der nächsten Iteration fortfährt. Diese Befehle können von einem Label-Bezeichner gefolgt sein, der bei geschachtelten Strukturen bestimmt, auf welche Schleife sich der Befehl bezieht.

 do {<Anweisungen>} while <Bedingung>; # Spezialfall: in dieser Form
 do {<Anweisungen>} until <Bedingung>; # mindestens eine Ausführung

Nachgestellte Kontrollstrukturen

[Bearbeiten | Quelltext bearbeiten]

Die oberhalb aufgezählten Kontrollstrukturen beziehen sich auf einen Block mit mehreren Anweisungen. Bei einzelnen Anweisungen kann man auch die verkürzte, nachgestellte Schreibweise wählen, die auch den (englischsprachigen) Lesern das Verständnis durch natürlichsprachige Formulierung erleichtert.

 <Anweisung> if   <Bedingung>;
 <Anweisung> unless <Bedingung>;

 <Anweisung> for   <Liste>;
 <Anweisung> while  <Bedingung>;
 <Anweisung> until  <Bedingung>;

Reguläre Ausdrücke

[Bearbeiten | Quelltext bearbeiten]

Seit seinen Anfängen waren reguläre Ausdrücke (Regex) ein besonderes Merkmal von Perl, da ähnliche Fähigkeiten bis dahin meist nur spezialisierte Sprachen wie Snobol und awk hatten. Durch die große Verbreitung setzte Perl einen inoffiziellen Standard, der durch die von Perl unabhängige und auch teilweise abweichende Bibliothek PCRE aufgegriffen wurde, die heute von mehreren bedeutenden Sprachen und Projekten verwendet wird.

Ab Version 5.0 hat Perl seine Regex-Fähigkeiten um viele Funktionen, wie z. B. Rückwärtsreferenzen, erweitert. Auch lassen sich reguläre Ausdrücke in Perl wesentlich direkter – als z. B. in Java – mit dem =~-Operator verwenden, da sie Kernbestandteil der Sprache sind und nicht eine zuschaltbare Bibliothek. Der eigentliche reguläre Ausdruck wird mit Schrägstrichen als Begrenzungszeichen notiert. Weil Schrägstriche häufig auch innerhalb regulärer Ausdrücke vorkommen können, dürfen auch viele andere Zeichen zur Begrenzung verwendet werden. Das verbessert die Lesbarkeit, weil man so Zeichen wählen kann, die sich vom Inhalt des regulären Ausdrucks abheben.

Perl kennt zwei Befehle für reguläre Ausdrücke, deren Verhalten mit vielen nachgestellten Optionen verändert werden kann.

  • Der m-Befehl steht für match, was Übereinstimmung bedeutet. Das m kann weggelassen werden, wenn man die Standardbegrenzungszeichen für reguläre Ausdrücke, nämlich Schrägstriche, verwendet. Der folgende Ausdruck durchsucht den Inhalt der Variable $var und liefert einen Array von Zeichenketten, auf die der Suchausdruck passt. Mit aktivierter g-Option liefert die Suche im Listenkontext alle Funde, deaktiviert alle erkannten Subausdrücke. Im Skalarkontext liefert der Ausdruck einen positiven Wert, wenn der Suchausdruck gefunden wurde, mit c-Option die Anzahl der Funde. i lässt Groß- und Kleinschreibung ignorieren, o Variablen nur einmal interpolieren, m den String als mehrzeilig und s als einzeilig betrachten. Die x-Option ermöglicht es, den Suchausdruck der besseren Lesbarkeit wegen über mehrere Zeilen zu verteilen und ihn mit Kommentaren zu versehen.
 $var =~ [m]/<Suchausdruck>/[g[c]][i][m][o][s][x];
  • Der s-Befehl steht für substitute, was ersetzen bedeutet. Er ersetzt den Teil des gegebenen Textes, auf den der Suchausdruck passt mit dem Ersatzausdruck.
 $var =~ s/<Suchausdruck>/<Ersatzausdruck>/[e][g][i][m][o][s][x];

Nach erfolgreicher Verwendung eines regulären Ausdruckes stehen folgende Sondervariablen zur Verfügung:

  • $& – der erkannte String
  • $` – String vor dem erkannten String
  • $' – String nach dem erkannten String
  • $1..$n – Ergebnisse der geklammerten Subausdrücke
  • $+ – der letzte erkannte Subausdruck
  • @- – Start-Offsets der Treffer und Subtreffer
  • @+ – dazugehörige End-Offsets

Der oft in einem Atemzug mit m// und s/// beschriebene Operator tr/// hat mit ihnen nur die Schreibweise gemein. Er lehnt sich an den UNIX-Befehl tr an, der dem Ersetzen einzelner Zeichen dient. Synonym kann statt tr auch y geschrieben werden.

 $var =~ tr/<Suchzeichen>/<Ersatzzeichen>/[c][d][s];

Neben diesen beiden kann auch der Befehl split erwähnt werden, der eine Zeichenfolge aufteilt anhand eines Trennzeichens, das auch ein regulärer Ausdruck sein darf.

Quoting und Interpolation

[Bearbeiten | Quelltext bearbeiten]

Quoting-Operatoren:

  • q – quote nicht interpretierter String (alias zu ' ')
  • qq – quote interpretierter String (alias zu " ")
  • qw – quote words, eine Liste von mit Whitespace (Leerraum) getrennten Strings
  • qr – quote oder kompiliere regex
  • qx – quote auszuführende externe Anwendung (basierend auf Perls readpipe)

Alternatives Quoting und Variableninterpolation führen zu besonders gut lesbarem Code. Ein Beispiel zur Verdeutlichung:

  • Stringverkettung und Quotingzeichen im Text machen den Code schlecht lesbar.
  $text = 'He\'s my friend ' . $name . ' from ' . $town . '.'
        . ' ' . $name . ' has worked in company "' . $company . '" for ' . $years . ' years.';
  • Interpolation von Variablen im String machen das Ergebnis jetzt erkennbar. Escapes \ stören noch den Textfluss.
 $text = "He's my friend $name from $town. $name has worked in company \"$company\" for $years years.";
  • Austausch des Quotingzeichens macht Escapes überflüssig. Der Code ist nun optimal. qq leitet das Quoting von Variablen im String ein. Das beliebige Zeichen danach ist das Quotingzeichen für diesen String.
 $text = qq{He's my friend $name from $town. $name has worked in company "$company" for $years years.};

Häufigster Kritikpunkt an Perl ist, dass darin geschriebene Programme schlecht lesbar seien. Zudem bietet Perl überdurchschnittlich viele Freiheiten, die zu unleserlichem Code führen können (siehe Disziplinen). Andererseits ermöglicht die gleiche Freiheit es auch, nahe an der logischen Struktur des Problems oder dem menschlichen Verständnis zu programmieren. Die von Perl-Programmierern geschätzte Freiheit, persönlichen Vorlieben nachzugehen, muss bei Projekten, die von mehreren Programmierern oder über längere Zeiträume entwickelt werden, durch selbst auferlegte Regeln eingeschränkt werden, um spätere Probleme zu vermeiden. Dies erfordert zusätzlichen Kommunikationsaufwand oder die Verwendung von statischen Code-Analyse-Tools wie Perl::Critic.

Einige Teile der Syntax, wie der Ausdruck der Objektorientierung und Signaturen, sind zwar einfach und sehr mächtig, werden aber häufig gegenüber vergleichbaren Sprachen wie Python oder Ruby als veraltet wahrgenommen und fordern bei standardisierten Herangehensweisen besonders von Perl-Anfängern zusätzliche Tipp- und Denkarbeit. Mit zusätzlichen Modulen lassen sich viele der Schwierigkeiten minimieren. So gibt es mit English ein Core-Modul, das den Spezialvariablen aussagekräftigere Namen gibt und mit Moose ein sehr modernes und umfangreiches Objektsystem, das sich stark an das von Raku anlehnt. Es gilt heute als De-facto-Standard für objektorientierte Programmierung mit Perl.[14] Signaturen wurden mit 5.20 eingeführt, sind aber immer noch als experimentell eingestuft.

Weiterhin wurde Perl vorgeworfen, es verletze die UNIX-Philosophie. Siehe dazu den Abschnitt Entstehung.

Kritik wurde auch gegen Raku erhoben, das zu hoch gesteckte Ziele habe und nach vielen Jahren keine sichtbaren Ergebnisse bringe, stattdessen die Zukunft von Perl lähme. Raku war von Anfang an als Langzeitprojekt ausgerufen, das ausschließlich auf nicht immer planbarer Freiwilligenarbeit und kaum finanzieller Unterstützung beruht. Seine konkreten Ziele zeichneten sich erst im Verlauf der Entwicklung ab, und es gab eindeutige Probleme bei der Kommunikation und der Außendarstellung. Allerdings stammen seit Perl 5.10 wesentliche Neuerungen aus der Schwestersprache.

Perl-Kultur und Spaß

[Bearbeiten | Quelltext bearbeiten]
Logo der Perl Foundation

Wie auch bei anderen Projekten freier Software gibt es zwischen vielen Entwicklern und Benutzern der Sprache besondere soziale Bindungen, und es bildete sich eine eigene Kultur daraus. Die Perl-Kultur ist von Offenheit, Gastlichkeit und Hilfsbereitschaft, aber auch von Individualismus, Spieltrieb und Humor geprägt. Anfangs war sicher Larry Wall hierfür ein Vorbild, da er durch andere Projekte wie rn oder patch bereits bei der Veröffentlichung von Perl eine prominente Position in UNIX-Entwicklerkreisen hatte, doch mittlerweile zählen auch Randal L. Schwartz, Damian Conway, Audrey Tang, Brian Ingerson und Adam Kennedy zu den Leitfiguren, die durch ihre Arbeiten innerhalb der „Szene“ große Beachtung finden. Im Gegensatz zu kommerziellen Programmiersprachen lassen sich fast alle Aktivitäten auf persönliche Motivationen zurückführen. Dementsprechend ist die Perl Foundation eine reine Freiwilligen-Organisation, die sich als Angelpunkt einer sich selbst verwaltenden Gemeinschaft versteht und die gespendeten Gelder für einflussreiche Projekte und Personen, Organisation von Entwicklerkonferenzen und den Betrieb der wichtigsten Perl betreffenden Webseiten verwendet.

Treffen, Workshops und Konferenzen

[Bearbeiten | Quelltext bearbeiten]

Lokale Benutzergruppen, die meist ein- oder zweimal im Monat zu zwanglosen Treffen einladen, bei denen auch Vorträge gehalten werden können, nennen sich Perl Mongers und sind in über 200 größeren Städten auf der ganzen Welt zu finden. Größer, wesentlich straffer organisiert und meist landesbezogen sind die jährlichen Workshops, von denen der gut etablierte Deutsche Perl-Workshop[15] der erste war. Workshops wollen ambitionierte Entwickler in einem möglichst erschwinglichen Rahmen lokal zusammenführen. Ein ähnliches Ziel haben die größeren Yet Another Perl Conferences (YAPC), die für die Regionen Nordamerika, Brasilien, Europa, Asien, Russland und Israel abgehalten werden. Am größten, allerdings auch am teuersten ist die von O’Reilly in den USA ausgerichtete The Perl Conference (TPC), die mittlerweile Teil der OSCON ist.

Seit etwa 2005 werden für engagierte Beitragende auch Hackathons abgehalten.

Viele Spracheigenschaften von Perl laden dazu ein, Programmcode kreativ zu gestalten. Dies hat zu verschiedenen intellektuellen, teils humorvollen, teils skurrilen Wettbewerben und Traditionen um die Programmiersprache Perl geführt.

Golf
Golf ist eine Sportart für Programmierer, bei der das kürzeste Programm (in ASCII-Zeichen), das eine gestellte Aufgabe vollständig erfüllt, gewinnt. Da Perl viele, teils trickreiche Kürzel und Abkürzungen gängiger Techniken kennt, ist dies eine besonders populäre Disziplin unter Perl-Programmierern.
Poesie
Da Perl viele Elemente der englischen Sprache beinhaltet, gibt es regelrechte Wettbewerbe, in welchen die besten Beispiele für Perl-Poesie prämiert werden. Neben der freien Form, die lediglich Perl zum Inhalt hat, wird hier versucht, Gedichte zu schreiben, die vom Interpreter ohne Warnungen und Fehlermeldungen ausgeführt werden.[16] Daneben gibt es auch noch einen Perl-Haiku-Wettbewerb, der dieser japanischen Gedichtform gewidmet ist.
Obfuscation
Sehr berühmt und berüchtigt ist auch die Disziplin obfuscation (Verschleierung), für die es auch einen jährlichen Wettbewerb (den „Obfuscated Perl Contest“) gibt, der am ehesten mit dem International Obfuscated C Code Contest vergleichbar ist, den Larry Wall selbst zweimal gewann. Hier wird danach gestrebt, auf ungewöhnliche und kreative Art und Weise die Funktion eines Programms zu verschleiern. Dies ist in Perl besonders leicht, da es für fast alles Kürzel gibt, die Sprache selbst sehr dynamisch ist und viele Dinge abhängig vom Kontext automatisch geschehen, was auch oft als „Perl-Magie“ bezeichnet wird. Ein Beispiel von Mark Jason Dominus, das 2000 beim 5. Annual Obfuscated Perl Contest den zweiten Preis gewann (dieses Programm gibt den Text „Just another Perl / Unix hacker“ aus):
@P=split//,".URRUU\c8R";@d=split//,"\nrekcah xinU / lreP rehtona tsuJ";sub p{
@p{"r$p","u$p"}=(P,P);pipe"r$p","u$p";++$p;($q*=2)+=$f=!fork;map{$P=$P[$f^ord
($p{$_})&6];$p{$_}=/ ^$P/ix?$P:close$_}keys%p}p;p;p;p;p;map{$p{$_}=~/^[P.]/&&
close$_}%p;wait until$?;map{/^r/&&<$_>}%p;$_=$d[$q];sleep rand(2)if/\S/;print
Randal L. Schwartz
JAPH
Eine Art Unterkategorie von obfuscation ist die von Randal L. Schwartz öffentlich begonnene Disziplin JAPH. Das sind Signaturen, die kleine Perl-Programme enthalten, welche meist nur den Namen des Autors oder eine Botschaft auf eine möglichst nicht nachvollziehbare Art ausgeben. Die Buchstaben JAPH sind die Anfangsbuchstaben von Schwartz’ Signatur Just Another Perl Hacker.
Perligata
Das Perl-Modul Lingua::Romana::Perligata von Damian Conway ist wohl eines der skurrilsten Module schlechthin: Es ermöglicht dem Benutzer, Perl komplett in Latein zu schreiben. Wie in der lateinischen Sprache ist die Satzstellung (weitgehend) irrelevant für die Bedeutung eines Ausdrucks, stattdessen werden die Bezüge zwischen einzelnen Wörtern durch ihre Flexion hergestellt. Von Variablen bis Referenzen und mehrdimensionalen Arrays ist alles in dieser neuen Sprachdefinition vorhanden. Nahezu alle Sonderzeichen wurden aus der Sprache entfernt, Variablen gleichen Namens, aber unterschiedlicher Struktur (beispielsweise $next und @next) werden dekliniert, um die entsprechende Variable zu adressieren. Etwas Beispielcode:
insertum stringo unum tum duo excerpemento da.
   # Entspricht: substr($string,1,2) = $insert;
clavis hashus nominamentum da.
   # Entspricht: @keys = keys %hash;
Aus ähnlichem Antrieb entstanden „Sprach-Module“ für Klingonisch, Borg oder Leetspeak. Solche Module sind ein gutes Beispiel für den Zeitaufwand, den viele Leute Perl widmen; Perl kann man in diesem Sinne durchaus als Hobby bezeichnen.
Acme
Brian Ingerson legte mit seinem bekannten Modul namens Acme, das unmittelbar nichts weiter tut, als dem Benutzer zu bescheinigen, sein Programm habe den Höchstgrad an Perfektion erreicht, einen Grundstein für eine CPAN-Kategorie von Modulen, die keinen produktiven Nutzen haben, sogar oft bewusst kontraproduktiv sind oder eine Funktion vorgeben, die unmöglich so erreicht werden kann und eher als Witz zu verstehen ist. Dieses Spiel mit skurrilen Ideen umfasst beeindruckende ASCII-Art, Module, die den Quellcode unsichtbar machen (Acme::Bleach) oder sonstig humorvoll manipulieren, indem sie ihn zum Beispiel mit typischen Sprachfehlern des Präsidenten Bush versehen oder Methoden zufällig löschen, was die Anwesenheit einer diebischen Elster simulieren soll.

Mottos und Zitate

[Bearbeiten | Quelltext bearbeiten]
Perl-Programmierer sehen Kamele jeder Art als Maskottchen. Die London Perl Mongers haben sogar eines aus dem Londoner Zoo adoptiert.

Es gibt viele bekannte Mottos und Zitate, die sich mit Perl selbst oder den Möglichkeiten der Sprache beschäftigen; hier einige Kostproben:

  • Perl: the Swiss Army Chainsaw of Programming Languages.
    (Perl: Die Schweizer Armee-Kettensäge der Programmiersprachen. Anspielung auf die Vielseitigkeit von Schweizer Taschenmessern.)
  • Perl is the only language that looks the same before and after RSA encryption.” (Keith Bostic)
    (Perl ist die einzige Sprache, die vor und nach einer RSA-Verschlüsselung gleich aussieht.)
  • Only perl can parse Perl.” (Larry Wall)
    (Nur perl kann Perl parsen.)
  • … we often joke that a camel is a horse designed by a committee, but if you think about it, the camel is pretty well adapted for life in the desert. The camel has evolved to be relatively self-sufficient. On the other hand, the camel has not evolved to smell good. Neither has Perl.” (Larry Wall: über das Kamel als Perl-Maskottchen)
    (… wir witzeln oft, dass ein Kamel ein Pferd ist, das von einem Komitee entworfen wurde. Aber wenn man darüber nachdenkt, ist das Kamel ziemlich gut an das Leben in der Wüste angepasst. Das Kamel hat sich dahin entwickelt, autark zu sein. Andererseits hat es sich nicht dazu entwickelt, gut zu riechen. Perl auch nicht.)
  • The very fact that it’s possible to write messy programs in Perl is also what makes it possible to write programs that are cleaner in Perl than they could ever be in a language that attempts to enforce cleanliness” (Larry Wall: Linux World, 1999)
    (Genau die Tatsache, dass es möglich ist, unsaubere Programme in Perl zu schreiben, ermöglicht es, Programme zu schreiben, die sauberer sind, als in Sprachen, die versuchen, Sauberkeit zu erzwingen.)
  • Perl: Write once – never understand again
    (Perl: Einmal schreiben – nie wieder verstehen. Eine Anspielung auf das Mantra Write once – run everywhere von Java)

Wettbewerbe

Wikibooks: Perl-Programmierung – Lern- und Lehrmaterialien
Commons: Perl (Programmiersprache) – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Graham Knop: perl v5.40.0 is now available. 9. Juni 2024 (abgerufen am 10. Juni 2024).
  2. Larry Wall: Programming is Hard, Let’s Go Scripting … auf perl.com vom 6. Dezember 2007; abgerufen am 1. Juni 2019.
  3. Larry Wall: Perl, the first postmodern computer language, abgerufen am 31. Dezember 2018.
  4. What is Raku (Perl 6)? im Perlfaq
  5. manpage von Perl 1.0 in der Perl-Timeline. auf perl.org (englisch)
  6. Kate Johanns: Tech Time Warp: Why Perl — the “duct tape of the internet” — was such a gem SmarterMSP, 20. Dezember 2019, abgerufen am 15. November 2020.
  7. Der erste Teil der offiziellen Perl-FAQ (englisch)
  8. Tabelle aller Erscheinungsdaten von Perl (POD-Dokument; englisch) in der offiziellen CPAN-Distribution
  9. TMTOWTDI im englischsprachigen Wiktionary
  10. Getopt::Long auf CPAN
  11. Liste der bekannten Ports auf CPAN
  12. Modul Inline auf CPAN
  13. GNU Octave auf gnu.org
  14. Why Modern Perl Teaches OO with Moose. chromatic
  15. 22nd German Perl/Raku Workshop 2020 in Erlangen.
  16. zum Beispiel Perl-Poetry-Kategorie perlmonks.org (englisch)