Das E-Mail-Archiv des FED
Aus FED-Wiki
Inhaltsverzeichnis |
Allgemeines
Das E-Mail-Archiv des FED beinhaltet derzeit alle Nachrichten, die über die Mailingliste FED-Forum des FED versendet wurden (Stand 01.09.2009: 12192 Nachrichten seit dem 06.12.1996).
Internetadresse des E-Mail-Archivs (URL)
Die Internetadresse des E-Mail-Archivs lautet
http://www.fed.de/e-mail-archiv
Aktualisierung
Das E-Mail-Archiv wird monatlich aktualisiert. Dieser automatisierte Vorgang, wird jeweils zum 1. eines Monats durchgeführt.
Hinweise zur Nutzung
... under construction ...
Einlesen, Analyse und Bereitstellung der Nachrichten
Alle in das Archiv übernommenen Nachrichten wurden beim Einlesen einer automatisierten Analyse unterzogen (engl.: parsing). Dazu folgende Anmerkungen und Hinweise:
Volltextindexierung
Alle in das Archiv übernommenen Nachrichten sind ‚volltextindexiert’ und somit über sämtlich enthaltene Wörter ‚suchbar’.
Diskussionen, Diskussionsfaden (engl.: thread)
Bei der Analyse jeder einzelnen Nachricht wurde versucht, sie einer entsprechenden Diskussion zuzuordnen, um themenbezogene Recherchen möglichst einfach und übersichtlich zu gestalten.
Problem
Theoretisch gibt es zwar eindeutig spezifizierte Regeln, aus denen hervorgeht, wie Nachrichten für den Mailverkehr in Mailinglisten aufgebaut und formatiert werden sollten - in der Praxis halten sich aber schon häufig die eingesetzten E-Mail-Programme in ihrer Standardkonfiguration nicht an diese Regeln, noch wissen die Anwender überhaupt um ihre Existenz.
Beispiel
Wird auf eine Nachricht geantwortet, so sollte der Nachricht vom Mailprogramm automatisch eine Kopfzeile ‚In-Reply-To’ hinzugefügt werden, die dann als Wert den Verweis (Message-ID) auf die ursprünglichen Nachricht enthält - nur so kann ein eindeutiger Bezug zwischen diesen Nachrichten hergestellt werden.
Lösung
Mit Rücksicht auf die geschilderte Problematik versucht die Archiv-Software bei der Analyse der Nachrichten zusätzliche Kriterien (Inhalt des Betreffs, zeitlich Nähe etc) bei der Zuordnung zu einer Diskussion mit einzubeziehen.
Da diese Lösung ihrer Natur nach einer Unschärfe unterliegt (siehe auch engl.: fuzzy logic), muss man bei der Recherche im Archiv im Einzelnen auch mit ‚nicht zugeordneten Nachrichten’ bzw. ‚unvollständigen Diskussionen’ rechnen.
Hinweis
Nur Nachrichten, die das System eindeutig miteinander in Zusammenhang bringen kann (siehe oben ‚In-Reply-To’), werden in der Diskussionsansicht (engl.: thread view) grafisch mit Pfeilen verknüpft, alle weiteren werden ohne Pfeile dargestellt.
E-Mail-Adressen
Alle E-Mail-Adressen werden beim Einlesen in das Archiv insofern verändert (maskiert), dass sie, insbesondere von automatisierten Adresssammlern (engl.: harvester), nicht mehr sinnvoll ausgewertet werden können.
Beispiel
Vorher : Name@domain.tld Nachher : Name@???
Vorteil
- Das E-Mail-Archiv kann nicht missbraucht werden, um E-Mail-Adressen zu sammeln. Für den einzelnen Abonnenten von Mailinglisten des FED bedeutet dies konkret eine erweiterte Spam-Prophylaxe.
Nachteile
- Interessante E-Mail-Adressen (insbesondere der Absender einer Nachricht, aber auch z.B. Angaben von Herstellern) sind nicht mehr direkt ersichtlich. Im Einzelfall muss hier dann also zusätzlich in einschlägigen Suchmaschinen recherchiert werden.
- Formatierte Textpassagen (z.B. Signaturen) werden nicht mehr wie geplant dargestellt und so ggf. ‚verunstaltet’.
Formatierung und Darstellung
Die Darstellung einzelner Nachrichten wurde für ‚regelkonform’ formatierte Nachrichten optimiert und führt im Einzelfall (also bei nicht regelkonform formatierten Nachrichten) zu Problemen.
So werden Nachrichten also insbesondere nicht ‚nachformatiert’, was z.B. Zeilenumbrüche angeht (siehe weiter unten: Zeilenlänge).
Auch erfolgt die Darstellung einer Nachricht bewusst über einen ‚dicktengleichen Schriftschnitt’ (Courier New, Courier, Monaco, monospace), um die wenigen Möglichkeiten, die im Rahmen von korrekt durchgeführten Klartext-Formatierungen (engl.: plaintext) zur Verfügung stehen, zu erhalten.
Problem
Theoretisch gibt es zwar eindeutig spezifizierte Regeln, aus denen hervorgeht, wie Nachrichten für den Mailverkehr in Mailinglisten aufgebaut und formatiert werden sollten, in der Praxis halten sich aber schon häufig die eingesetzten E-Mail-Programme in ihrer Standardkonfiguration nicht an diese Regeln, noch wissen die Anwender überhaupt um ihre Existenz.
Beispiel - Zeilenlänge
Die Zeilenlängen innerhalb von Nachrichten, gerade wenn sie an Mailinglisten gerichtet sind, sollten 72-76 Zeichen nicht überschreiten und explizit umgebrochen sein. Nachrichten, die nicht umgebrochen versendet wurden, werden in der Nachrichtenansicht ‚unschön’ bis ‚unleserlich’ dargestellt und laufen bisweilen weit über den vorgesehenen Fensterrahmen hinaus. Anmerkung: Ein automatisierter Zeilenumbruch wird aus verschiedenen Gründen nicht durchgeführt, u.a. deshalb, weil anderenfalls z.B. mitversandte Link-Adressen, die häufig länger als 72-76 Zeichen lang sind, ‚verstümmelt’ würden.
Beispiel – Zitate
Antworten auf Nachrichten sollten, gerade wenn sie an Mailinglisten gerichtet sind, die Nachricht, auf die sie sich beziehen, korrekt zitieren (siehe auch Artikel ‚korrektes Zitieren im Mailverkehr’). Um nun die Lesbarkeit im Archiv zu erhöhen, werden Nachrichtenteile, die vom System eindeutig als Zitat erkannt wurden, grau dargestellt. Bei ‚wohlformatierten’ Nachrichten funktioniert dies gut, im anderen Fall (z.B. Kammquotings) kann dies aber zu ‚unschönen’ bis ‚irritierenden’ Darstellungen führen (es entstehen schwarze Textstellen in grauen Textpassagen).
Bekannte Probleme und Fehler (engl.: software bug)
- Bei einigen Nachrichten funktioniert die Schaltfläche 'Nachricht beantworten' nicht.
TO DO
- Teilbegriffe ‚suchbar’ machen
Dank
Dank sei an dieser Stelle insbesondere gegenüber dem AK-Online des FED ausgesprochen. In der Mailingliste des AK-Online wurde in den vergangenen Jahren immer wieder über die Realisierung eines neuen E-Mail-Archivs diskutiert und so wurden wertvolle Beiträge gesammelt, die letztendlich zu konkreten Richtlinien für eine Umsetzung führten.
Außerdem wird Dank an die Beta-Tester gerichtet, deren Testberichte zu einigen ‚finalen Begradigungen’ beitrugen.
