TIM gegen Goliath oder der Kampf gegen den Wildwuchs in der Content-Erstellung

Hat Ihr Kollege mal wieder Kopfhörer geschrieben statt Headset? Die neue Kollegin hat die Handlungsanweisung, die schon immer verwendet wurde, neu erfunden? Und wie war noch mal die Formulierung, um auf externe Dokumente zu verweisen?

Diese und ähnliche Szenen spielen sich tagtäglich in den Redaktionsabteilungen von Unternehmen ab. Selbst mit Terminologielisten und Redaktionsleitfäden ist dem Wildwuchs in der Content-Erstellung oft nicht beizukommen. Zu groß ist der Zeitdruck, zu umfangreich das Regelwerk, um jedes Wort nachzuschlagen und auf Konsistenz zu prüfen.

Gerade Konsistenz ist aber die Grundvoraussetzung, um die Kosten für die Übersetzung im Griff zu behalten. Schlussendlich bestimmt sie auch, wie schnell der Leser den Text begreifen und wie bestimmungsgemäß er handeln kann. Das führt wiederum zu nachhaltig zufriedenen Kunden und so wird aus dem Mauerblümchen Technische Dokumentation plötzlich ein Wettbewerbsvorteil für Ihr Unternehmen.

Im Interview: Alexander Becker, Congree Language Technologies GmbH

Wie also kommen Sie zu sprachlich, inhaltlich und stilistisch konsistenten Inhalten? Inhalte werden in unserem Redaktionssystem TIM topic-orientiert in Modulen organisiert. Integriert in den Texteditor ist die TIM Autorenunterstützung, die den Redakteur bei der Erstellung qualitativ hochwertiger Texte unterstützt. Die TIM Autorenunterstützung basiert auf dem Congree Authoring Server.

Als Softwarehersteller im Bereich Content-Optimierung liefert die Congree Language Technologies GmbH die führenden Technologien zur Formulierung konsistenter Texte, unter Berücksichtigung definierter Stilregeln und einheitlicher Terminologie. Im Fokus der Entwicklung steht immer der Anwender und damit die ganz konkrete Arbeitsweise Technischer Redakteure und anderer Autoren im Unternehmen. Congree-Produkte unterstützen branchenübergreifend die Kommunikation in Unternehmen und Fachabteilungen jeder Größe. Autoren können durch den Einsatz von Congree schneller und kostengünstiger qualitativ hochwertige, regelkonforme und leicht übersetzbare Texte erstellen.

Alexander Becker, Head of Sales bei Congree Language Technologies GmbH, über Umfang und Nutzen der TIM Autorenunterstützung:

Sabine Richter: Die TIM Autorenunterstützung ist in TIM ab der Version 4.31 ohne Aufpreis enthalten. Sie bildet eine Teilmenge des Congree Authoring Servers ab. Würden Sie kurz den Funktionsumfang der TIM Autorenunterstützung beschreiben?

Alexander Becker: Die TIM Autorenunterstützung umfasst eine Rechtschreib- und Grammatikprüfung, eine Terminologieprüfung mit linguistischer Termvariantenerkennung und eine Satzwiederverwendung. Die Komponenten heißen Sprachprüfung (Rechtschreibung, Grammatik, Terminologie) und Authoring Memory.

Authoring Memory bietet Sätze zur Wiederverwendung an, die in bereits frei gegebenen TIM-Modulen enthalten sind. Die Funktion wird speziell im CMS-Markt auch gerne mal Autorenunterstützung genannt. Bei der TIM Autorenunterstützung und auch beim Congree Authoring Server ist damit die Gesamtheit der Funktionen gemeint.

Leistungsumfang der TIM Autorenunterstützung

Warum ist es gerade bei der modularen, topic-orientierten Arbeitsweise eines Redaktionssystems so wichtig, eine Autorenunterstützung einzubinden?

Im CMS werden Inhalte über die Zeit verteilt und i. d. R. von verschiedenen Menschen erstellt. Man schreibt kein Dokument en bloc runter.

Die einzelnen Bausteine werden später zu größeren Einheiten wie Betriebsanleitungen oder anderen Publikationen kombiniert. Da schaut selten noch jemand drüber und prüft, ob die Textteile zusammenpassen, oder ob sprachlich noch was verbessert werden müsste, damit der Gesamtinhalt verständlich wird. Gerade bei vielen Produktvarianten, Ausprägungen oder Einzelstückfertigungen ist das in der Praxis auch nicht mehr zu leisten.

Deshalb ist es so wichtig, schon bei der Erstellung der einzelnen Module im CMS auf Konsistenz und Verständlichkeit zu achten. Das beginnt bei sprachlicher Korrektheit durch korrekte Rechtschreibung und Grammatik. Darauf aufbauend hilft die konsistente Benennung der beschriebenen Produkte. Wenn Produkte immer gleich benannt sind, kommt beim Leser keine Verwirrung auf. Und natürlich ist es hilfreich, zu sehen, welche ähnlichen Sätze in der Vergangenheit schon erstellt wurden.

Das war jetzt eine eher kurze Beschreibung, bei der auch ein paar Aspekte fehlen. Kosteneinsparung in Folgeprozessen zum Beispiel. Wir haben zu genau dieser Frage auch ein White Paper erstellt: „Topic-orientierte Dokumentation, oder wie ich lernte den Baustein zu lieben“ – zu finden in der Congree-Wissensbasis.

Jeder Satz, den ich 1:1 wiederverwenden kann, braucht nicht nochmal übersetzt zu werden

Durch das Wiederverwenden von Modulen im Redaktionssystem sinken die Kosten für Erstellung, Lektorat und Übersetzung deutlich. Wie kann ein Unternehmen durch den Einsatz einer Autorenunterstützung noch zusätzlich profitieren?

Kleines Achtung: Eine Software, die Ihnen etwas zurückmeldet, bedeutet auch erst einmal Aufwände. Autoren interagieren mit der Software, lernen damit umzugehen. Das System wird administriert. Dennoch stellen sich über die Zeit Einspareffekte ein.

Der größte Brocken fällt bei Übersetzungsprozessen an. Jeder Satz, den ich 1:1 wiederverwenden kann, braucht nicht nochmal übersetzt zu werden. Oder er ist signifikant günstiger, falls 100%-Treffer bezahlt werden. Durch die Sprachprüfung alleine werden auch schon Varianten reduziert, weil Fehler vermieden und Terminologie konsistent verwendet wird. Das verbessert die Fuzzy-Matches, die üblicherweise günstiger werden, je höher die Ähnlichkeit zu bestehendem Material wird.

Warum reicht es nicht, die integrierten Hilfen der Editoren zu nutzen? Z. B. die Rechtschreibprüfung in Adobe FrameMaker oder in Microsoft Word?

Die integrierten Hilfen der Editoren sind auf jeden Fall mal nicht verkehrt. Irgendeine Hilfe ist denke ich oft besser, als keine Hilfe. Man erreicht einfach nur nicht so viel damit. Oft sind die integrierten Hilfen eher eine Art Spellchecker, zum Beispiel auf Basis von Hunspell. Über die korrekte Schreibweise einzelner Wörter hinaus gibt es da nichts.

Microsoft Word hingegen bietet auch eine Grammatikprüfung an, die sich in den letzten Jahren wirklich positiv entwickelt hat. In der neusten Version wird auch eine Art Stilprüfung angepriesen. Die kann man allerdings nicht konfigurieren. Es gibt nur ein oder aus und die Stilprüfung ist sehr weit weg von elektronischen Style Guides wie etwa Schreiben nach tekom Leitlinie.

Terminologieprüfung gibt es bei Standard-Editoren wie Word nicht, aber manche CMS liefern etwas mit. Das reicht bei Ausschreibungen für den Haken in der Comparison-Chart. Und wie eingangs schon erwähnt: irgendwas zu haben, ist besser, als nichts zu haben.

Wenn man was Richtiges braucht, also eine Rechtschreib- und Grammatikprüfung nach Duden, eine linguistische Termvariantenerkennung, die Flexionsformen und sprachliche Varianten erkennt, mehrbenutzerfähig und performant, mit guter Usability, der braucht Congree. Wir haben auch für diese Frage das Fact Sheet „Was eine gute Sprachprüfung ausmacht“ erstellt. Sie merken schon, wir werden das öfter gefragt.

Für welche Sprachen steht die Sprachprüfung zur Verfügung?

Die Sprachprüfung ist für Deutsch, Englisch und Französisch verfügbar. Weil Französisch die neuste linguistische Sprachprüfung ist, braucht es dafür noch ein Projekt. Wir prüfen dabei massenhaft Kunden-Bestandsdaten durch, um Spezifika von dessen Sprachgebrauch in der Software abzubilden.

In Arbeit sind die Prüfsprachen Spanisch, Italienisch und Japanisch. Wenn eine Sprache vermisst wird, kann man gerne einfach fragen.

Durch die Kombination aus Sprachprüfung und Authoring Memory wird eine kontinuierliche Bereinigung des Datenbestandes bewirkt

Viele unserer TIM-Nutzer haben schon sehnsüchtig auf das Authoring Memory gewartet. Können Sie die Arbeitsweise kurz beschreiben?

Wird ein TIM-Modul bearbeitet, also in XMAX oder in FrameMaker geöffnet, dann erscheint neben der Sprachprüfung auch das Fenster für Authoring Memory. Wie die Sprachprüfung auch, liefert es bei der Interaktion mit dem Dokument (klick, Content ändern, neuen Content schreiben, Dokumentprüfung) sofort Ergebnisse in Echtzeit. Es zeigt an, ob es schon ähnliche Sätze gibt.

Das Authoring Memory kann auch für eine Schlagwortsuche verwendet werden. Der Autor gibt einfach ein paar Wörter ein, und das Authoring Memory zeigt Sätze an, die zu diesen Wörtern ähnlich sind (Ähnlichkeitssuche), oder die diese Wörter beinhalten (Wortsuche). Das ist praktisch bei Standardsätzen, oder wenn man weiß, dass man einen ähnlichen Satz schon mal geschrieben hat.

Datenbasis sind die frei gegeben TIM-Module. Die Module werden automatisch an das Authoring Memory übermittelt, in Sätze segmentiert und stehen dann zur Wiederverwendung bereit. Durch die Kombination aus Sprachprüfung und Authoring Memory wird eine kontinuierliche Bereinigung des Datenbestandes bewirkt. Immer, wenn Sie einen Inhalt anfassen, zeigt Ihnen die Sprachprüfung an, ob Verbesserungspotenzial besteht. Wird dann das verbesserte Modul frei gegeben, landen die neuen und besseren Sätze wieder im Authoring Memory.

Kommen wir von der Wiederverwendung auf Satzebene zur Wiederverwendung auf Wortebene. Was ist das Besondere an der Terminologiekomponente der TIM Autorenunterstützung?

Wiederverwendung auf Wortebene ist eine schöne Analogie zum Authoring Memory, wenngleich auch etwas unüblich. Im Gegensatz zur klassischen Wiederverwendung ist bei Terminologie eher bekannt, dass der Datenbestand lebt. Benennungen ändern sich, neue kommen hinzu, werden erweitert oder abgelegt.

Das Besondere an der Terminologiekomponente der TIM Autorenunterstützung ist die linguistische Termvariantenerkennung. Flexionsformen und linguistische Varianten wie Wortumstellungen werden automatisch erkannt, ohne dass diese in der Terminologie erfasst werden müssten.

Wir haben die üblichen Verfahren wie Stemming, unscharfe Suche und die linguistische Prüfung mit ihren Stärken und Schwächen gegenübergestellt. Im Vergleich wurden bestimmte Phänomene wie Flexion, Bindestrichvarianten, Ableitungsvarianten und Synonyme aufgelistet. Die Gegenüberstellung findet sich in unserem White Paper „Verfahren zur Terminologieprüfung im Vergleich“.

Das kann die Terminologieprüfung der TIM Autorenunterstützung

Zusätzlich gibt es auch ein Benutzerwörterbuch. Können Sie dazu kurz etwas sagen?

Über das Benutzerwörterbuch werden der Sprachprüfung zentral firmenspezifische Wörter bekanntgemacht. Das ist dann relevant, wenn Wörter nicht Bestandteil der normalen Sprache sind, also nicht über das Morphemwörterbuch der Sprache abgedeckt werden. Üblicherweise geht es dabei um Markennamen, Produktnamen und unkonventionelle Schreibweisen wie CamelCase.

Das Benutzerwörterbuch wird auch verwendet, um abweichende Schreibweisen von Substantiven bekanntzumachen. Zum Beispiel den Firmennamen immer in VERSALIEN. Oder für spezifische Textbestandteile, die die Sprachprüfung einfach nicht kennt und nicht weiß, dass es korrekt ist. Beispielsweise „Ex e IIC T4 Gb“, eine Kennzeichnung aus der Explosionsschutzrichtlinie.

Diese Sachen sind von Kunde zu Kunde unterschiedlich. Es handelt sich um kundenspezifisches Vokabular, das über das Benutzerwörterbuch an zentraler Stelle für alle Autoren bereitgestellt werden kann.

Was ist, wenn TIM-Kunden bereits eine bestehende Terminologiedatenbank oder eine Excel-Wörterliste im Einsatz haben?

Eine Stärke, die wir der TIM Autorenunterstützung auch noch mitgegeben haben, ist die Anbindungsmöglichkeit an Drittsysteme. Die ausgewachsenen Terminologieverwaltungssysteme Across crossTerm und SDL MultiTerm können per heißer Integration eingebunden werden. Alle anderen Systeme über eine lose Kopplung. Lose Kopplung meint, dass Congree eine TBX-Datei (TermBase eXchange) bereitgestellt wird, die dann in die Sprachprüfung importiert wird. Das erfolgt üblicherweise automatisiert, da drückt keiner mehr ein Knöpfchen.

Excel verhält sich genauso. Die Excel-Datei wird nur über einen Zwischenschritt in eine TBX-Datei konvertiert. Damit das ohne größere Aufwände klappt, empfiehlt es sich, in der Excel-Datei einer gewissen Struktur zu folgen. Eine Beispiel-Excel-Datei kann ja bei Ihnen direkt angefragt werden.

Sehr schnell signifikant weniger Aufwand

Wie viel Aufwand muss man denn für die Pflege von Terminologie und Benutzerwörterbuch einplanen?

Für die TIM Autorenunterstützung ist es etwas schwierig zu beantworten, hier haben wir noch keine Erfahrungswerte. Das Paket ist so gestrickt, dass es möglichst wenig Aufwände verursacht. Zu Beginn muss man üblicherweise mehr eintragen, weil das System die ganzen firmenspezifischen Wörter noch nicht kennt. Das wird aber sehr schnell signifikant weniger Aufwand.

Wann macht ein Umstieg auf den kompletten Funktionsumfang des Congree Authoring Servers Sinn?

Wenn man mehr braucht. Einige populäre Fälle wären beispielsweise, wenn:

  • Der Redaktionsleitfaden oder Schreibvorgaben maschinell geprüft werden sollen
  • Mehrere Prüfkonfigurationen benötigt werden
  • In anderen Systemen gearbeitet wird, also auch Terminologie im Marketing in InDesign geprüft wird oder Training Sätze in PowerPoint wiederverwenden möchte.
  • Inhalte aus Translation Memorys oder dem Satzvorschlagswesen von Congree als Datenbasis für das Authoring Memory verwendet werden

Generell sind Features aus dem Congree Authoring Server, wie beispielsweise die Termkandidatenermittlung oder Schnittstellen nur über die Congree-Produktlinie erhältlich.

Vielen Dank für das Interview, Herr Becker.

Sehr gern.

Die TIM Autorenunterstützung im Einsatz

Raus aus der Nische – Ein Ausblick

Was nutzt die konsistenteste Doku, wenn das Marketing Werbung mit ganz eigenen Kunstworten macht? Wenn die Position in der Bestellung nicht mit dem Produktnamen auf der Betriebsanleitung übereinstimmt?

Stellen Sie TIM und die TIM Autorenunterstützung auch in anderen Abteilungen vor. Sie sind die Experten, die den Satzspeicher und die Terminologiedatenbank mit qualitätsgesicherten Texten füllen. Unternehmensweit kann mit den gleichen Satzbausteinen und der gleichen Terminologie gearbeitet werden, egal welcher Texteditor in welcher Abteilung verwendet wird!

Die Einführungskosten für die unternehmensweite Einführung sind marginal, während sich die Vorteile komplett skalieren lassen. Endlich wird die öffentliche Wahrnehmung von Unternehmen, Marke und Produkt einheitlich. Die Trefferquote von Suchmaschinen steigt, da mehr Suchbegriffe mit der einheitlich verwendeten Terminologie matchen. Bots und KI-Anwendungen sind leistungsfähiger, da sie abteilungsübergreifend Informationen abholen können.

Nutzen Sie die TIM Autorenunterstützung für hochwertige Texte und organisieren und verteilen Sie diese vollständig digital und nachvollziehbar mit dem Redaktionssystem TIM.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Ich akzeptiere

Das könnte Dir auch gefallen