guatemala.de > Guatemalagruppe Nürnberg e. V. > Fijate
Fijáte
 

Die Technik hinter dem Fijáte-Archiv

Die Navigation

Manche sind bei der Navigation zwischen den Artikeln verwirrt, weil es verschiedenfarbige Pfeile gibt. Nun: Die blauen Pfeile Blauer Pfeil führen zu von der Redaktion freigegebenen Fijátes, die roten Roter Pfeil zu noch nicht freigegebenen, also in den internen Bereich für AbonnentInnen. Das Passwort für diesen Bereich könnt ihr beim Redaktionsteam erfragen.

Die Indizes

Es gibt mehrere Indizes, über die auf die Fijáte-Artikel zugegriffen werden kann:

  • Personen des öffentlichen Lebens wie PolitikerInnen, MenschenrechtsverteidigerInnen, GewerkschaftlerInnen, Militärs, internationale Persönlichkeiten
  • Organisationen wie Menschenrechtsgruppierungen, Gewerkschaften, Parteien, staatliche Stellen, internationale Organisationen
  • Sonstige Begriffe. Ein weites Feld, das von Achí über Femizid und Gold bis zu Zucker reicht.
  • Länderverzeichnis: Internationale Beziehungen Guatemalas können so leichter gefunden werden.
  • Eine Liste aller Abkürzungen – oder wüsstet ihr auf Anhieb, wofür GRUFEPROMEFAM steht?

Die Technik dahinter

Vielleicht stellt sich doch mal jemand die Frage, wie diese Indizes und Verlinkungen entstehen.

Nun, der Prozess läuft teilweise maschinell, teilweise ist es redaktionelle Knochenarbeit:

  1. Die Texte werden aus den PDFs bzw. aus der redaktionellen Vorstufe herausgeholt. Ersteres ist recht fehleranfällig, da der PDF2Text-Konverter gewisse Schwächen aufweist. Deswegen werden die Texte in den letzten Monaten nach und nach manuell kopiert und mit ein paar Steuerinformationen angereichert.
  2. Die Liste mit den Suchbegriffen, deren Synonymen etc. ist eine weitere Steuerdatei, die manuell erweitert wird und in der versucht wird, zu einem Begriff möglichst umfassend Synonyme zu erfassen. Beispiel: "Deutschland, Deutschland*, deutsch*". Der '*' bedeutet, dass später in den Fijáte-Texten literal nach Deutschland gesucht wird, aber auch nach allen Begriffen, die mit Deutschland beginnen, ebenso nach allen Begriffen, die mit "deutsch" beginnen. Also auch "deutsche" Bundeskanzlerin, "Deutschlands" etc.
  3. Die Personen werden möglichst umfassen mit ihren Vor- und Nachnamen erfasst. Das später aufgerufene Programm erstellt daraus dann die verschiedenen Namenskombinationen automatisch.
  4. Ein selbstgeschriebenes Programm liest nun diese Liste und der Reihe nach alle Fijáte-Texte ein und scannt diese durch. Dann erstellt es die Linklisten und schreibt die einzelnen Fijáte-Artikel auf jeweils eine HTML-Seite, wobei es die ganzen Links einfügt etc.
  5. Ein weiteres Programm erstellt aus den Fijáte-Texten die Jahresübersichten mit dem jeweiligen "Anreißer" bestehend aus den ersten Absätzen des ersten Artikels der einzelnen Fijátes.
  6. Diese ganzen HTML-Seiten müssen dann wieder per FTP auf den Webserver herüberkopiert werden.
  7. Bei einem erneuten Lauf mit erweiterten und korrigierten Suchbegriffen, sowie neuen Nummern sollten dann nur noch die Änderungen übertragen werden müssen. Das soll in Zukunft so ca. alle drei Nummern, also alle sechs Wochen geschehen, damit das Archiv auch in Zukunft aktuell bleibt.
  8. Und ganz aktuell ist die Umstellung auf XML-Files - wie ihr vielleicht indirekt durch das neue Layout bemerkt habt.

Grundsätzlich gilt: Wenn Fehler entdeckt werden, bitte melden. Wenn ihr Anregungen habt, bitte melden. Wenn euch Suchbegriffe fehlen, bitte melden.