Editorial und das %09 in den URLs

In letzter Zeit tauchte in meinem Workflow zum Erstellen von Postings (Text in Editorial erstellen und konvertieren, Veröffentlichung über die WordPress App oder das WordPress-Back-End), immer wieder kaputter HTML-Code mit URLs à la <a href="%09http://… auf. Zunächst schob ich diese kaputten URLs dem Problemfeld zu, das sich als Problem mit Apples „intelligenter Interpunktion“ entpuppt hat.

Nachdem ich dieses Problem ausgeschaltet hatte, trat das Problem mit dem %09 in den URLs hartnäckig weiter auf und ich bekam das ungute Gefühl, dass es an Editional und Ulysses‘ (Un)Art Markdown-Dateien in den Referenz-Stil umzuschreiben, liegen könnte.

Diagnose

Ich baute den folgenden „gemischten“ Testparcour auf…

Das ist ein Absatz mit einem [Link](https://thoschworks.de/blog/ "ThoSch:Blog | Das Weblog von Thomas Schewe – Eines unter Millionen") im Inline-Stil.

Das ist ein Absatz mit einem [Link][1] im Referenz-Stil

[1]:    https://thoschworks.de/blog/ "ThoSch:Blog | Das Weblog von Thomas Schewe – Eines unter Millionen" 

…und Editorial spuckte ein entsprechend „gemischt“ korrektes (oder fehlerhaftes) Ergebnis aus:

<p>Das ist ein Absatz mit einem <a href="https://thoschworks.de/blog/" title="ThoSch:Blog | Das Weblog von Thomas Schewe – Eines unter Millionen">Link</a> im im Inline-Stil.</p>

<p>Das ist ein Absatz mit einem <a href="%09https://thoschworks.de/blog/" title="ThoSch:Blog | Das Weblog von Thomas Schewe – Eines unter Millionen">Link</a> im Referenz-Stil</p>

Der zweite Link, der im Referenz-Stil erstellt ist, hat ein führendes %09 in der URL.

Ole Zorn, der Entwickler von Editorial, machte mich darauf aufmerksam, dass das %09 für einen Tabulator steht und die von ihm verwendete Library zum Konvertieren von Markdown hier fehlerhaft reagiert. Er wies auch darauf hin, dass der MultiMarkdown-Konverter dieses Problem nicht habe.

Tatsächlich verwendet Ulysses einen Tabulator um die Referenz und die URL zu trennen. Nach der Markdown-Syntax-Defintion von John Gruber darf hier anstatt eines oder mehrerer Leerzeichen auch alternativ ein oder mehrere Tabulatoren verwendet werden. Somit ist das Verhalten von Ulysses nicht fehlerhaft.

Lösung

Nun gibt es aus meiner Sicht – außer der Nutzung eines anderen Programms zur Konvertierung – drei grundsätzliche Lösungsmöglichkeiten:

  1. Anpassung der Library
    Da es sich um eine Fremdbibliothek handelt, ist das ein eher unsicherer und langwieriger Weg
  2. Nutzung des MultiMarksdown-Konverters. Sicherlich ein Weg, wobei ich nicht weiß, welche möglichen Probleme ich mir wiederum mit diesem Umstieg ins Haus hole.
  3. Workaround
    Die Konvertierung erfolgt bei mir üblicherweise durch einen Workflow in Editional. Hinter den Aufruf des Konvertierers könnte eine Find / Replace-Anweisung ="%09http durch ="http ersetzen und damit den Fehler ausbügeln.

Ich habe mich für 3. entscheiden. Das sollte in den meisten Fällen1 funktionieren.

  1. Beim vorliegenden Posting würde dieser Workaround jedoch dazu führen, dass der Fehler auch in der Beschreibung und den Beispielen verschwindet.
    Wo gehobelt wird, …

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Kommentare abonnieren

Es erfolgt keine Weitergabe von Daten an externe Dienste wie WordPress.com.

eMail-Benachrichtigung bei weiteren Kommentaren.
Auch möglich: Abo ohne Kommentar.