4 Datenbanksysteme

Das Prinzip einer einfachen Datenbank wurde bereits in Informationen II erläutert. Datenbanksysteme bestehen aus der eigentlichen Datenbank, der Software für die Verwaltung, Bearbeitung und das Durchsuchen der Datenbank nach verschiedenen Kriterien sowie dem Formular mit den verschiedenen Eingabefeldern, Menüs und Schaltern für den Zugriff auf diese Datenbank. Während das Web- oder Suchformular im Computer des Benutzers geladen wird, befinden sich normalerweise die für die Suchanfrage wesentliche Software und die Datenbank auf dem entfernten Rechner des Anbieters der Datenbank.

Im Unterschied dazu befindet sich das im folgenden dargestellte System mit allen Teilen ausschliesslich im Computer des Benutzers. Nur die integrierten Hyperlinkverbindungen führen zu entfernten Rechnern. In einer lokal installierten Version ist zusätzlich die gesamte integrierte Datenbankverwaltung funktionsfähig, dies allerdings auf den Internet Explorer beschränkt unter Verwendung der ActiveX-Technologie. Ansonsten läuft das System sowohl mit Firefox als auch mit dem IE.

4.1 Contents-Linking

Contents-Linking ist das Beispiel eines komplexen Datenbanksystems  

Es vereinigt 2 verschiedene Systeme miteinander:
Der Datenbankinhalt dieses Systems kann aus den Suchergebnissen einer ganzen Reihe von Datenbanken zusammengestellt und in einer lokal installierten Version beliebig verändert oder erweitert werden. Probeweise wurden etwa 40000 Zitate erfasst. Technische Voraussetzungen dafür sind ein genügend großer Arbeitsspeicher und für die Erweiterung der Datenbank die Verwendung des Internet Explorers von Microsoft und der ActiveX-Technologie.

Abb. 1 Contents-Linking I mit Schlagwortauswahlmenüs

Abb. 2 Contents-Linking II mit Eingabeformular

In Abb. 1 und 2 sind unten links 12 sehr kleine Frames zu erkennen. Jeder dieser Frames stellt eine eigene Webseite mit einem mehrzeiligen Eingabefeld dar. In jeder der ersten 9 Dateien ist ein Teil der Bestandsliste enthalten, zusammen ca.60000 Titel mit ISSN, Verlagsangaben und Bestandsnachweisen von Bibliotheken. Diese Bestandsliste wurde durch Zeitschriftenlisten aus der EZB und aus anderen Quellen zusammengestellt.

Im 10. Frame befindet sich die Datenbank dieses Systems, die aus ca. 40000 Zitaten aus Suchergebnissen verschiedener Datenbanken besteht. Die Einspeicherung von Datenbanken in Formularfeldern wurde bereits in Kap. II.3? demonstriert. Man kann dazu versteckte und nichtversteckte Felder verwenden. Ein nichtverstecktes Feld ist das dort beschriebene Eingabefeld textarea. Ein verstecktes Textfeld wird mit <input type=hidden name=.... value="..........."> definiert. Hinter value wird in Anführungs-zeichen der gesamte Datenbankinhalt eingefügt, der auch sehr umfangreich sein kann. Dabei ist darauf zu achten, dass der Inhalt der Datenbank keine Anführungszeichen enthält. Diese müssen evtl. durch ' ersetzt werden.

Um diese Datenbank zusammenzustellen, werden die Literaturzitate durch Copy und Paste von den originalen Webseiten der Datenbanken übernommen und in ein Eingabeformular, in Abb. 2 links zu erkennen, eingefügt. Die Zitate werden durch ein entsprechendes Programm in ein einheitliches Format übersetzt. Dieses hat folgende Struktur:

>z=Journal of colloid and interface science*Instability of the
interface between thin fluid films subjected to electric fields*Year :
2004 , Volume : 274 , Issue : 1 , p. : 294 - 308
>z=Clinical chemistry : (Baltimore, Md.)*Development of an
immunofluorometric assay and quantification of Human kallikrein 7 in
tissue extracts and biological fluids*Year : 2004 , Volume : 50 , Issue :
4 , p. : 709 - 716
>z=Chemistry : (Weinheim)*Enthalpy of solution of 1,4-naphthoquinone
in CO2 + n-pentane in the critical region of the binary mixture:
Mechanism of solubility enhancement*Year : 2004 , Volume : 10 , Issue : 2
, p. : 371 - 376
>z=EUROPEAN J OF NEUROSCIENCE*Miyazaki Taisuke 1; Yamasaki
Miwako 1; Uchigashima Motokazu 1; Matsushima Ayano 2; Watanabe Masahiko 1
*Cellular expression and subcellular localization of secretogranin II
in the mouse hippocampus and cerebellum. *e. 33(1):82-94 January
2011.>z=SEMINARS IN RESPIRATORY AND CRITICAL CARE MEDICINE*Fullerton
James N. M.A. (Oxon) M.B.Ch.B. M.R.C.P. (Lond) 1; Singer Mervyn M.D.
F.R.C.P. (Lond) F.R.C.P. (Edin) 2 *Organ Failure in the ICU Cellular
Alterations. *e. Organ Failure in the Intensive Care Unit. 32(5):581-586
October 2011

Sie erkennen darin das Zeichen > zum Abgrenzen der einzelnen Treffer und die Sternchen zum Trennen der einzelnen Teile eines Treffers. Jedes Zitat wird mit dem Zeitschriftentitel hinter z= eingeleitet. Dahinter folgen in den ersten beiden Zitaten Sachtitel und Erscheinungsvermerk. In den anderen beiden Beispielen folgt hinter dem Zeitschriftentitel der Verfasser, der in den ersten Beispielen fehlt.

V.2.1 Anzeigefunktionen

Abb. 3 Kurzanzeige der Zitate


Der Inhalt der Datenbank kann in beliebig kleineren oder grösseren Abschnitten bis zu mehreren Tausend Zitaten angezeigt werden, ebenso können auch einzelne Zitate zur Anzeige kommen. Die Zitate werden mit der laufenden Nummer der Datenbank in verkürzter Form angezeigt  (Abb. 3).

Erst wenn man auf die als Hyperlink gekennzeichnete laufende Nummer, z.B. 1, klickt, erscheint das mit Hyperlinks ergänzte Zitat:
Abb. 4.
 Einzelnes Zitat mit Hyperlinks
Die in der Datenbank enthaltenen Zitate sind, wie oben erkennbar, ohne Hyperlinks enthalten. Diese werden erst dynamisch durch einen Suchvorgang hergestellt. Dieser Suchvorgang wird gestartet, wenn man auf die als Hyperlink angezeigte Nummer klickt, wie oben gezeigt.

Suche in der Datenbank

Die Suche in dieser Datenbank können Sie mit ein bis drei Suchbegriffen bzw. Zeichenfolgen starten. Die folgende Abbildung zeigt einen Ausschnitt aus dem Ergebnis einer solchen Suche. Die Nummern in Klammern geben die Indexnummer der Zitate innerhalb der Datenbank an: Abb. 4

Während des Suchvorgangs werden in einem ersten Suchabschnitt die Zitate gefunden, die den eingegebenen Zeichenfolgen entsprechen. Um zu diesen Zitaten die zugehörigen Verknüpfungen, d.h. Hyperlinks hinzuzufügen, werden einige Daten benötigt, die in den gefundenen Literaturzitaten fehlen: die ISSN, die Verlagsangabe und die Besitznachweise von Bibliotheken. Alle diese Angaben müssen der Bestandsliste entnommen werden, die in den o.g. 9 Frames untergebracht sind. Der 2. Suchabschnitt führt demnach eine Suche in dieser Bestandsliste durch. Dabei muß der dem Zitat entnommene Zeitschriftentitel der in der Bestandsliste verwendeten Schreibweise angeglichen werden, die zum überwiegenden Teil identisch, teilweise aber nicht identisch ist. Durch eine entsprechende Codierung bzw. eine summarische Änderung der Schreibweise der Bestandslistentitel kann man erreichen, daß etwas über 90% der von Contents-Linking erfassten Zeitschriften in der Bestandsliste gefunden werden. Gefundene Titel sind, wie in Abb. 4 erkennbar, mit einem Pluszeichen gekennzeichnet. 

Durch die Suche in dieser Bestandsliste werden die für Verknüpfungen erforderlichen Daten wie ISSN, Verlagsangaben und Bibliotheksnachweise ermittelt. Die Verknüpfungen mit EZB, ZDB und Google Scholar kommen einfach dadurch zustande, daß in deren Suchadressen bzw. Open-URLs die erforderlichen Angaben wie ISSN oder Zeitschriftentitel eingefügt werden, wobei die ISSN der Bestandsliste und der Zeitschriftentitel dem Zitat entnommen werden. Zeitschriften, die in der Bestandsliste nicht gefunden wurden, können auch immer mit dem vorliegenden Zeitschriftentitel verknüpft werden.

Als Ergebnis werden die Zitate mit den Hyperlinks zur EZB (über den Zeitschriftentitel), zur ZDB und zu Google Scholar, ausgeschrieben, gefundene Zeitschriften mit, nichtgefundene Zeitschriften ohne Pluszeichen. Über den Hyperlinkeintrag Bibliotheksnachweise werden die Kennzeichen aller Bibliotheken angezeigt, für die eine Zugangslizenz besteht.

Alphabetische Zeitschriftenanzeige

Als weitere Funktion können, wie Abb. 5 zeigt, auf der rechten Seite alle in der Datenbank befindlichen Zeitschriften alphabetisch aufgelistet werden, nachdem der Schalter Zeitschriften alphabetisch betätigt wurde. Jede Zeitschrift wird nur einmal aufgeführt. Klickt man auf einen der Titel, werden alle vorhandenen Zitate dieser Zeitschrift angezeigt. Das geschieht ebenfalls durch eine zweigeteilte Suchaktion: zunächst durch eine Suche in der Datenbank, durch die alle Zitate gesucht werden, die diesen Titel enthalten, und danach durch eine Suche in der Bestandsliste, aus der die nötigen Angaben für die Hyperlinkverknüpfung entnommen werden.

Weitere Zitate der Datenbank hinzufügen

Eine wesentliche Funktion dieses Systems ist die Möglichkeit, die Suchergebnisse von Datenbanken zu übernehmen und dem System hinzuzufügen. Abb. 2 zeigt rechts das Eingabeformular für eine bereits integrierte Datenbank. Nach dem Einfügen einer Suchergebnisliste in das Eingabefeld kann diese automatisch der Datenbank hinzugefügt werden. Dieses funktioniert nur in einer lokal installierten Version, bei der die Anwendung des Active-X-Objektes und der direkte Zugriff auf eine lokale Datei möglich ist. Dadurch wird der im unteren 10. Frame sich befindende Datenbankinhalt durch die eingefügte Liste erweitert, nicht bloß temporär, sondern dauernd. Für ein noch nicht integriertes Format wird über den unteren Hyperlinkeintrag Eingabeformular für neue Datenformate dieses Formular und anschliessend das Schema für die Datenübernahme geöffnet. Die Vorgehensweise wird dort erläutert.

Schlagwortsuche

Die Auswahlmenüs der Schlagwörter befinden sich im rechten Teil von Contents-Linking I : Abb. 1 .

Aus dem Auswahlmenü nach Fachgebieten werden jeweils die zugehörigen Schlagwörter angezeigt: Abb. 6 (Themen zum Fachgebiet Linguistik). Die in der Aufsatdatenbank nachgewiesenen Themen sind fett ausgeschrieben.

Nach Anklicken eines der aufgelisteten Schlagwörter werden die diesem entsprechenden Zeitschriftentitel angezeigt. Die fettgeschriebenen Titel sind in der Aufsatzdatenbank enthalten, die übrigen nur in der Bestandsliste nachgewiesen: Abb. 7 (Zeitschriften zum Thema Neurolinguistik). Die in Contents enthaltenen Titel sind mit den betreffenden Zitaten, die in der Bestandsliste enthaltenen Titel mit der EZB verknüpft.

Der Zugang zum Volltext

Der Zugang zum Volltext kann erfolgen:

 Abb. 4  zeigt das Suchergebnis zu random road. 2 Zitate werden gefunden. Klickt man auf den Google Scholar-Hyperlink des 1. Zitats, zeigt Google Scholar dieses Zitat als ersten Treffer: Abb. 8


4.2 Bauanleitung für das Datenbanksystem Contents-Linking

  1. Zitate einer Datenbank erfassen und speichern
  2. Zeitschriftentitel, Bestände und Schlagwörter erfassen und speichern
  3. Anzeigefunktion, Suchfunktion,
  4. Zeitschriftenanzeige
  5. Schlagwortanzeige

1. Zitate einer Datenbank erfassen und speichern

Kopieren Sie die folgenden von RefDoc angezeigten 3 Zitate in das untere Eingabefeld:

Effect of land management and soil texture on seasonal variations in soil microbial biomass in dry tropical agroecosystems in Tanzania
Auteur(s) : SUGIHARA ; FUNAKAWA ; KILASARA ; ...
Applied soil ecology (Print) 2010, 44, 80 - 88 Résumé Tarifs

Primary chondrosarcoma of the diaphragm
Auteur(s) : Ujiki ; Method ; Putong ; ...
The American journal of surgery 1971, 122, 132 - 134 Tarifs

Physiologic observations upon a partial pancreatic fistula following gastrectomy
Auteur(s) : Anderson ; Mehn ; Method
The American journal of surgery 1959, 97, 260 - 269 Tarifs

Klicken Sie anschliessend auf den Schalter Zeige 1. Es werden alle Zeilen des eingegebenen Strings* durch Sternchen ersetzt. Über den Schalter Zeige 2 wird der String in die einzelnen Zitate zerlegt und diese aufgeschlüsselt nach Sachtitel, Verfasser und Zeitschrift.

Code anzeigen

In diesem Fall werden die Zitate durch 2 Sternchen voneinander getrennt, beim IE mit einem Leerzeichen \*\s\*/ dazwischen. Entsprechend lautet der Code für die Splitmethode Taa=Ta.split(/\*\s\*|\*\*/) . In Contents-Linking wird die Trennung durch das Wort Tarifs erreicht, das am Ende jeden Zitats erscheint. Weil die Browser die Zeilen der Zitate in verschiedener Weise aufführen, ist dieses Trennungsmerkmal zu bevorzugen.

* die in das Eingabefeld eingegebenen Zitate werden zu einer einzigen Zeichenkette, einem Stringobjekt, das mit einfachen JavaScript-Methoden bearbeitet werden kann.

Einheitliche Datenübernahme aus unterschiedlichen Formaten

Stellen Sie sich ein Webformular vor, in das Sie die Suchergebnisse verschiedener Datenbanken hineinkopieren und das diese ganz unterschiedlichen Zitate in einem einheitlichen Standardformat ausschreiben soll. Nehmen Sie ausserdem an, dass Sie die von der betreffenden Datenbank auf einer Webseite angezeigten Zitate nicht säuberlich von dem übrigen Kontext der Webseite trennen, sondern die gesamte Webseite vollständig kopieren und in das Webformular einfügen. Das kann nicht funktionieren, werden Sie vielleicht mit Recht sagen, vor allem wenn Sie gewohnt sind, nur mit weitgehend strukturierten - möglichst noch mit Metadaten ergänzten - Daten umzugehen. Es war auch für mich verblüffend, dass es möglich sein kann, die verwirrend unterschiedlich angezeigten Suchergebnisse jeweils in dasselbe einheitliche Format zu übertragen.

Der Vorgang in schematischer Darstellung:

webf

Das Ausgabeformular für die einheitliche Datenübernahme

Starten Sie das Formular

die Erläuterung

Suchergebnisse folgender Datenbanken können eingearbeitet werden:

Für jede Datenbank wird eine schematisierte Codezeile ta verwendet. Bei einigen Datenbanken wird zwischen IE und Firefox unterschieden, z.B. bei JADE ist diese Zeile für den IE:

ta="pv=1>ps=2>pz=3>pe=4>v1=^>s1=\\.|-\\s-|^>z1=\\*In:>e1=\\s\\d+>e2=";

Dazu kommt der Code tr für die Trennung der Zitate:

tr="\\*\\d+";

Je nach ausgewählter Datenbank wird der entsprechende Code in einem einheitlichen Programmteil bearbeitet, auf die eingegebenen Suchergebnisse + Kontext angewandt, und die Zitate schliesslich in den verschiedenen Ausgabeformaten ausgeschrieben. Hier interssiert vor allem das Contents-Link-Format, das besonders vereinfacht ausgeschrieben wird:

>ze=.......(Zeitschrift) *........(Verfasser) *.....(Sachtitel).*......(Erscheinungsvermerk)

.>z=ECOTOXICOLOGY*Oehlmann Jorg 1; Di Benedetto Patrizia 1; Tillmann Michaela 2; Duft Martina 1; Oetken Matthias 1; Schulte-Oehlmann Ulrike 1 *Endocrine disruption in prosobranch molluscs Evidence and ecological relevance.*. 16(1):29-43 February 2007

Die so ausgeschriebenen Zitate sind für Contents-Linking unmittelbar zu verwenden. Sie werden automatisch der Datenbank hinzugefügt.

Die o.g. Codezeilen wurden durch das

Allgemeine Datenübernahmeformular ermitelt.

Dieses sehr wichtige Formular dient dazu, aus den unterschiedlichen Formaten von Datenbanken die relevanten Daten zu entnehmen - unabhängig von Metadaten und Standardformaten. Mit einer anschliessenden Bearbeitung lässt sich die Ausgabe der Daten in einem standardisierten Format oder die Übergabe der Daten an ein Such- und Verknüpfungssystem, an ein Linksystem oder eine Literaturverwaltung realisieren. Es handelt es sich also hier um eine wesentliche Basisfunktion sowohl für die Literaturverwaltung im allgemeinen als auch für Linkresolver oder Linksysteme.

Das Formular für die Datenübernahme enthält ein Schema mit einer Anzahl von Feldern. Mit diesem Schema wird ein vorliegendes Format analysiert.

Auf der Startseite des Multiplen Linksystems geben Sie in das Eingabefeld ein einzelnes, durch mehrere Zeilen strukturiertes Zitat durch Copy und Paste ein. Durch die Wahl von Neue Datenbank im Auswahlmenü öffnen Sie das Datenübernahmeformular. Siehe dazu die Erläuterung

2. Zeitschriftentitel, Bestände und Schlagwörter erfassen und speichern

siehe dazu

siehe dazu

3. Such- und Anzeigefunktion von Contents-Linking

In der Funktion such() werden zunächst die eingegebenen Zeichenfolgen erfasst und diese in allen Zitaten der Datenbank gesucht. Aus den gefundenen Zitaten werden die Zeitschriftentitel entnommen und diese wiederum in der Zeitschriftenbestandsliste gesucht. Falls darin gefunden, werden die Hyperlinks mit den ermittelten Bestandsnachweisen, ggf. mit der ISSN gebildet, ansonsten nur mit dem Zeitschriftentitel. Nichtgefundene Zeitschriften werden gesondert gespeichert und können angezeigt werden.

In der Funktion anz() wird die Datenbank in Teilen von je 1000 Zitaten angezeigt. Jedes Zitat erscheint mit der Indexnummer der Datenbank. Über diese Nummer kann das Zitat einzeln aufgerufen werden. Dies geschieht über einen Hyperlink, der folgenden Javascript-Code enthält:

L="javascript:top.links.oben.document.forma2.starte.value='"+Tx1+"';top.links.oben.document.forma2.starte.click()";

Wird dieser Hyperlink aktiviert, wird zunächst der Code top.links.oben.document.forma2.starte.value='"+Tx1+"'; ausgeführt. Dadurch wird in dem Suchformular auf der linken Seite oben das Feld forma2.starte mit dem Zitattext Tx1 ausgefüllt. Tx1 muss dabei durch '" und "' eingeschlossen sein, weil dieser Wert aus dem Script entnommen wird. Mit dem folgenden Code top.links.oben.document.forma2.starte.click() wird im selben Formular das Formularfeld starte aktiviert. Dies ist ein verstecktes Feld, geschrieben <input type=hidden>, das beim Anklicken onclick= die Suchfunktion start_b() startet. Dabei wird aus dem Feld starte der Text des Zitats ausgelesen und daraus der Zeitschriftentitel extrahiert und dieser in der Bestandsliste gesucht. Das weitere wie oben. Ausgeschrieben wird das betreffende Zitat mit den ergänzten Hyperlinks.

4. Zeitschriftenanzeige

In der Funktion zeit() werden aus allen Zitaten die Zeitschriftentitel extrahiert und in den versteckten Formularfeldern z1, z2 und z3 zwischengelagert. Danach werden die Felder ausgelesen. Die Titel werden addiert A=A1+A2+A3, daraus wird ein Array gebildet AA=A.split(">") und dieses alphabetisch sortiert AB=AA.sort() . In einer For-Schleife werden die Titel ausgeschrieben, wobei sie mit dem Hyperlink

L="javascript:top.links.oben.document.forma2.area3.value='"+Z+"';top.links.oben.document.forma2.starte2.click()"

verbunden sind. *

Ausgeschrieben werden alle in der Datenbank enthaltenen Zeitschriftentitel mit diesem Hyperlink. Bei dessen Anklicken wird der Zeitschriftentitel Z im Formularfeld area3 auf der linken Seite deponiert und danach der Schalter starte2 aktiviert. Dadurch wird die Funktion such() gestartet, wobei aus dem Formularfeld forma2.area3 der Zeitschriftentitel gelesen und dieser im weiteren Verlauf in allen Zitaten gesucht wird. Alles andere wie bei der oben erläuterten Suchfunktion.

* Alle versteckten Formularfelder befinden sich im Quellcode der Datei ArticeSa.htm ganz unten.

5. Schlagwortsuche

Die alphabetisch oder nach Fachgebieten angezeigten Schlagwörter sind mit folgendem Hyperlink verbunden:

Ls="javascript:ssa='"+ssa+"';parent.frames.links.oben.document.forma.T1.value=ssa;parent.frames.links.oben.document.forma2.starte3.click();"

Die Schlagwortkennung ssa wird in das Eingabefeld des Suchformulars links oben eingegeben, danach der Schalter starte3. aktiviert, der die Funktion such2() auslöst. In dieser wird derden die Zeitschriften aus der Bestandsliste auslesen. In jedem Titel wird die Schlagwortkennung s (=ssa) gesucht, falls gefunden, wird der Titel in der Datenbank der Zitate gesucht. Je nachdem, ob darin gefunden, entweder fett ausgeschrieben oder normal. Falls der Titel in Bestandsliste und in Datenbank enthalten, wird er wieder mit folgendem Hyperlink ausgeschrieben:

L="javascript:top.links.oben.document.forma2.area3.value='"+Za+"';top.links.oben.document.forma2.starte2.click();"

Zeutschriftentitel Za im Feld forma2.area3. Automatischer Start über starte2, was eine Suchfunktion auslöst.


Dateien in Contents-Linking und Download

Verbunden mit den Dateien zum Einfügen neuer Zitate

Download aller Dateien

Entpacken Sie das Ziparchiv in einen neuangelegten Ordner Ihres Computers. Starten Sie mit der Datei ArticleS00a.htm.


ASEZA-Datenbank

Dieses Datenbank- und Informationssystem ist ein wesentlicher Teil des Multisuchsystems E-Connect. Es kann in der gleichen Weise wie z.B. die EZB verwendet werden, d.h. für die Suche und Anzeige von elektronischen Zeitschriften.

Worin unterscheidet sich dieses System von der EZB? Während die EZB im wesentlichen ein Anzeigesystem ist, die dem Titel nach bekannte elektronische Zeitschriften oder die die Titel eines ganzen ausgewählten Fachgebietes anzeigt, ist dieses System auch ein wirkliches Suchsystem für die Suche nach Zeitschriften, die nicht dem Titel nach bekannt sind. Zu diesem Zweck ist in das System eine Fachwörter- und Themensuche integriert und zusätzlich sind die auswählbaren Fachwörter und Themen jeweils in einem Index anzeigbar.

Alle über eine Titelsuche angezeigten Titel werden ausserdem mit dem Hinweis auf die zu diesen Titeln ermittelten Themen verknüpft. Das Suchsystem ist damit gleichsam ein mehrdimensionales System.

Das Suchsystem enthält im wesentlichen denselben Inhalt wie die EZB. Ca. 70000 Titel wurden bisher integriert. Diese Titel sind grösstenteils der EZB entnommen. Sie sind vielfach mit thematischen Angaben ergänzt, die teils der EZB, teils aber auch aus anderen Quellen entnommen wurden. Im Prinzip können die Titel der Datenbank des Suchsystems ebenso wie die thematischen Ergänzungen aus allen möglichen verfügbaren Quellen übernommen werden, etwa aus Bibliotheks-, Verlags- und Institutionslisten, müssen aber in der Schreibweise an die von Google Scholar bevorzugt erfasste Schreibart angepasst werden. Die Übernahme geschieht über ein automatisch arbeitendes Einarbeitungssystem sowohl für die reinen Titel-, Standort- als auch Themenhinweise. Ausser den Titeln und den thematischen Angaben wurde die ISSN hinzugefügt, wenn diese mit dem Einarbeitungssystem ermittelt werden konnte. Die ISSN kann für die interne Verwaltung der Datenbank von Nutzen sein, um z.B. Doppeleintragungen in unterschiedlicher Schreibweise zu vermeiden, für die Verknüpfungen sind sie aber ohne Bedeutung, weil diese ausschliesslich über den Titel erfolgen.

Die in den beiden Systemen ASEZA und ASLA enthaltenen Standortangaben können zusammen mit der allgemeinen oder zeitlich beschränkten freien Verfügbarkeit angezeigt werden. Bei Bedarf kann jeder lizenzierte Bibliotheksbestand äusserst schnell und leicht hinzugefügt werden. Zu beachten ist hierbei, dass viele Artikel von Zeitschriften über Google Scholar frei verfügbar sind, auch wenn sie an sich einer Lizenz unterliegen.

Die Titel dieses Systems sind daher durchweg mit Google Scholar verknüpft, wodurch der direkteste und schnellste Weg zu Volltexten gewählt wird. Ausserdem bestehen auch Verknüpfungen mit Google, der EZB und der ZDB. Die in ASLA vorhandenen weiteren Verküpfungen (SFX, EZB-Link, Springer und Scirus) könnten auch in ASEZA sehr leicht hinzugefügt werden.

Die ASEZA-Datenbank ist ein Open Source Projekt. Der Quellcode in Javascript kann in jeder Weise verändert und erweitert werden. Das System kann für die private und öffentliche, nicht aber für die kommerzielle Benutzung angewandt werden.


In das Suchsystem ist das Einarbeitungssystem und das Aktualisierungssystem WriteDat integriert, mit denen die zugrunde liegenden Datenbanken automatisch erweitert und bearbeitet werden können.

Download

Alle Dateien des Such- einschliesslich Einarbeitungssystems können Sie hier herunterladen.


Aufbau und Arbeitsweise

Das Suchformular enthält das Formular forma1 für die Titelsuche, die Themen und Termini-Suche, die Themen- und Termini-Anzeige und erfasst immer auch die Eingabe der Bibliothekskennung im untersten Abschnitt des Formulars.

forma1 ist mit action=such0.htm ergänzt. Über die beiden Startschalter wird zunächst diese Datei gestartet, je nach den übermittelten Werten entweder die Datei such1.htm für die Titelsuche oder TH5.htm für die Fachwörter- und Themensuche. Dabei entsteht z.B. die Adressenzeile such1.htm?TI=eng+phys&t=&D3=false&bib=&l=de ,wenn nach Titeln gesucht wird, die eng und phys enthalten oder TH5.htm?TI=&t=glas&D3=false&bib=&l=de , wenn nach glas gesucht wird.

Mit TI= ist das Eingabefeld für Titel bezeichnet, mit t= das Eingabefeld für Themen und Termini. Diese Bezeichnungen mit folgenden Suchbegriffen (hier eng und phys) erscheinen automatisch beim Abschicken des Formulars in der Adressenzeile. Ausserdem wird immer &bib= und &l= angehängt. Wird in das Formularfeld eine Kennung für eine Bibliothek eingegeben, so wird bib= mit dieser Kennung ergänzt. Hinter &l= wird die Sprache angegeben. Bei D3= wird das Fachgebiet angegeben, hier aber bei der Titel- bzw. Themensuche nicht berücksichtigt.

1. Titelsuche

Hierbei wird die Datei such1.htm geöffnet, die die gesamte Datenbank von ASEZA von über 45000 Titeln enthält. Beim Laden dieser Datei wird gleichzeitig der zugehörige Javascript-Code in der Datei suche1.js gestartet. In dessen Function starte() werden aus der Adresse mit der Methode location.search die zu suchenden Titelwörter und die Bibliothekskennung herausgelesen. Die Titelwörter werden in allen Einträgen der Datenbank nacheinander gesucht, ebenso die Bibliothekskennung, falls diese eingegeben wurde. Bei den gefundenen Titeln werden 4 Verknüpfungen hergestellt: Der Zeitschriftentitel wird mit Google Scholar verknüpft, gefolgt von einer weiteren Verknüpfung mit Google. Die 3. Verknüpfung über EZB führt zur Elektronischen Zeitschriftenbibliothek. Die 4. Verknüpfung wird über den Themen-Hyperlink gebildet. Bei dessen Anklicken wird die Datei TH4.htm mit den ermittelten Themenwerten gestartet. Die Adressenzeile kann hier z.B. folgendermassen lauten: TH4.htm?t=biol=,cell=,neur=&bib=G. Hier sind für eine Zeitschrift die Themen biol (Biologie), cell (Zellforschung) und neur (Neurologie) ermittelt und werden jeweils, mit einem nachfolgenden = ergänzt, hinter dem t= durch Komma getrennt, aufgeführt. Zusätzlich ist auch das Bibliothekskennzeichen G hinter & bib= hinzugefügt.

Die Datei TH4.htm enthält die gesamte Themenliste und den Javascript-Code für die automatisch startende Funktion. In dieser werden die Themenwerte aus der Adressenzeile ausgelesen und dann in der Liste gesucht. Die ermittelten Themen werden ausgeschrieben. Von diesen wiederum kann eine Suche nach Zeitschriften gestartet werden, die diesen Themen entsprechen. Dies geschieht wieder über die Datei such1.htm. Von den hier gefundenen Titeln kann nochmals auch auf die zugehörigen Themen über den Themen-Hyperlink zugegriffen werden, wie oben beschrieben. Damit ist bei der Suche nach Titeln immer auch eine thematische Verknüpfung vorhanden.

Falls eine Bibliothek ausgewählt wurde, kann über den Hyperlink xx Treffer für Bibliothek anzeigen am Ende der angezeigten Treffer das Suchergebnis auf diese eingeschränkt werden. Am Ende der Adressenzeile erscheint hierbei ein Ausrufungszeichen.

2. Themen- und Fachwörtersuche über das untere Eingabefeld

Die Startdatei such0.htm startet mit der Adressenzeile such0.htm?TI=&t=milit&bib=&l=de, wenn z.B. in das untere 2. Eingabefeld milit eingegeben wurde. Danach öffnet die Datei TH5.htm mit der Adresse TH5.htm?TI=&t=milit&bib=&l=de. Diese Datei enthält die Themen- und die gesamte Fachwörterliste sowie den automatisch startenden Anzeigecode. Die eingegebene Zeichenfolge in Kleinbuchstaben wird sowohl als Thema als auch als Fachwort interpretiert, d.h. hier kann t= in der Adressenzeile beides bedeuten. Um als Fachwort gesucht zu werden, wird die Eingabe in Grossbuchstaben geändert. Gesucht wird nacheinader in der Themen- und der Fachwörter-Datenbank. Von den gefundenen aufgelisteten Themen und Fachwörtern aus kann jeweils eine entsprechende Suche über die Datei such1.htm eingeleitet werden.

3. Themenverknüpfung

Besonders interessant ist die zusätzliche Verknüpfung der aufgelisteten Themen (Subjects) mit weiteren Themen über den Hyperlink verknüpft mit folgenden Themen, wodurch die Datei such2.htm gestartet wird. Dabei werden alle Zeitschriften gesucht, die sowohl das zunächst angezeigte primäre Thema, als auch ein weiteres von der Zeitschrift behandeltes sekundäres Thema behandeln, indem die dem Titel hinzugefügten Themencodes entsprechend ausgewertet werden. Die hierbei aufgelisteten Themen wiederum können zur Anzeige derjenigen Zeitschriften führen, die das primäre und das sekundäre Thema behandeln, ausserdem können aber auch über den Hyperlink All alle Zeitschriften anzeigt werden, die das sekundäre Thema enthalten. Diese Verknüpfung ist sowohl bei der Themen- und Fachwörtersuche über das untere Eingabefeld als auch über die Anzeige der zu einem Themen gefundenen Treffer möglich.

4. Themenliste anzeigen

Über die Menüauswahl der Fachgebiete wird die Datei Themen3.htm gestartet. Diese enthält eine Auflistung aller Fachgebiete, die thematisch aufgegliedert und entsprechend auswählbar sind. Bei Auswahl eines bestimmten Fachgebietes entsteht die entsprechende Suchadresse, z.B. Themen3.htm?Fa=agr&bib=, wenn Agrarwissenschaften gewählt wurde. Entsprechend wird die Datei Themen3.htm mit dieser Adresse geladen und gleichzeitig der in der Datei enthaltene Code automatisch gestartet. Durch diesen Code werden die zum Fachgebiet gehörenden Themen ermittelt und angezeigt.Von den angezeigten Themen aus erfolgt die Suche nach den entsprechenden Titeln und deren Anzeige wieder über such1.htm.

5. Fachwörterliste anzeigen

Am Ende der aufgelistesten Themen der Themenliste befindet sich der Hyperlink Wörterliste zum Fachgebiet. Über diesen wird die Datei such2.htm mit der Scriptdatei such2.js gestartet. such2.htm enthält wie such1.htm ebenfalls die gesamte Bestandsliste des Systems, die gesamte Themenliste und ausserdem eine Wörterliste der auszulassenden nichtrelevanten Wörter. Der in suche2.js enthaltene Code ermittelt aus allen zu einem Thema gehörenden Titel die enthaltenen Wörter, entfernt daraus die auszulassenden Wörter durch vergleichende Suche in der Liste auszulassender Wörter und zeigt die restlichen als Fachwörter alphabetisch geordnet an. Die auf diese Weise dynamisch gewonnenen Fachwörter können der bereits bestehenden statischen Fachwörterliste hinzufügt werden, und zwar über die Bearbeitungsdatei WriteDat.htm.

Hinter den zu einem Fachgebiet aufgelisteten Themen befindet sich jeweils der Hyperlink Fachwörter. Bei dessen Anklicken wird die Datei such2.htm z.B. mit der Adresse such2.htm?fw=elek&.. gestartet, wenn die Fachwörter zur Elektrotechnik angezeigt werden sollen. Über die angezeigten einzelnen Fachwörter kann wiederum über die Datei such1.htm nach entsprechenden Titeln gesucht und die gefundenen angezeigt werden. Die angezeigten Wörter sind nicht immer Fachwörter im eigentlichen Sinn. Durch Erweitern der nichtrelevanten Wörterliste kann einerseits die Anzeige stärker auf relevante Wörter eingeschränkt werden. Andererseits kann die Fachwörterliste aus der o.g. angezeigten Wörterliste zum Fachgebiet ergänzt werden über die o.g. Datei WriteDat.htm.

Die Fachwörtersuche (s. 2) über das untere Eingabefeld startet die Datei TH5.htm und durchsucht die gesamte Fachwörterliste. Diese Liste kann aus den einzelnen Fachwörterlisten der Themen (s.o.) zusammengestellt werden. Die Liste auszulassender Wörter (s.o.) ist hierbei entscheidend. Sie muss sukzessiv um weitere Wörter ergänzt werden, u.a. sind viele Abkürzungen und asiatische Wörter hinzuzügen.


Das Suchsystem besteht aus folgenden Dateien: aseza.html, such0.htm, such1.htm, such2.htm, Themen3.htm, TH4.htm, TH5.htm und die Scriptdateien suche.js and suche2.js.

Das Einarbeitungssystem besteht aus folgenden Dateien: einarb2.htm, such1a.htm, such1.txt, such1a.txt.

Das Aktualisierungssystem WriteDat.htm verwendet ausserdem noch folgende Dateien: fachgebiet.htm, WL.txt, WL2.txt, Th5n.txt, TH4n.txt, suchN2.txt, suchN.txt.


Inhalt der Dateien

Bestandsliste

Die Basisdatei ist G-File.txt. Die Zeitschriften werden darin folgendermassen aufgelistet:

Zeitschriftentitel, Thema bzw. Themen, wenn vorhanden, ISSN, falls vorhanden, Verlag, falls angegeben, Standorte, falls vorhanden, evtl. Zeitbeschränkung

Alle diese Daten können automatisch mittels eines Einarbeitungssystems aus der EZB oder auch aus anderen Quellen entnommen werden. Als Grundlage für die Bestandsliste kann von einer umfangreichen Liste elektronischer Zeitschriften, zusammengestellt aus den Weblisten von JADE, ISI, Ingenta, EBSCO und aus den Listen der grossen Verlage, ausgegangen werden (Datei GesamtISSN), die alle Zeitschriften mit der ISSN aufführt. Für die Erstellung dieser Liste können einfache Bearbeitungsprogramme eingesetzt werden, entwickelt mit JavaScript und z.T. mit der ActiveX-Technologie, deren Anwendung allerdings auf den IE beschränkt ist.

Die vorliegende Bestandsliste ist grösstenteils durch Vergleich von EZB-Listen mit der GesamtISSN-Liste entstanden, wovon auch die ISI-Liste von Thomson-Reuters ein wesentlicher Teil ist. Inzwischen ist aber ein grösserer Bestand von EZB-Titeln integriert worden, die nicht in der GesamtISSN-Liste gefunden wurden und die daher nicht mit der ISSN ergänzt werden konnten.

Es ist möglich, EZB- oder andere Zeitschriftenlisten zu übernehmen ohne den Vergleich mit diesen Basislisten, also nur mit den aufgelisteten Titeln und ohne ISSN. In diesem Fall entsteht nur bei gleichlautenden Titeln ein gewisser Nachteil. Diese könnten evtl., um Verwechslungen zu vermeiden, mit der ISSN ergänzt werden. Sonst aber funktionieren die im Suchsystem vorhandenen Verknüpfungen mit der EZB und der ZDB auch ohne ISSN, und die Verknüpfungen mit Google und GoogleScholar sind ja ohnehin nur über die Titel möglich. Allerdings muss für die Verknüpfung mit Google Scholar die Schreibweise der Titel an die von Google Scholar vorwiegend erfasste Schreibweise so weit wie möglich angeglichen werden.

Die Bestandsliste dieses Systems basiert im wesentlichen auf dem Vergleich der EZBgesamtliste2 mit G-File und GesamtISSNPlus über die Datei BearbEZB3.htm (mit der Erläuterungsdatei ErlEZB.htm).

Viele Änderungen an der Bestandsliste können sehr leicht manuell vorgenommen werden: die Datei G-File.txt wird geöffnet. Änderungen durch die Suchen-Ersetzen-Option. Anschliessend speichern. Mit dem Programm BearbGListen.htm wird die korrigierte Datei automatisch auf die Einzeldateien G1 bis G9 aufgeteilt.

Eine Anzahl von Änderungen oder Korrekturen können Sie mit dem Bearbeitungsprogramm BearbG.htm überwiegend automatisch vornehmen.


Allgemeines zur Codierung

Die Codierung geschieht in möglichst einfacher Schreibweise, so werden die Variablen am Anfang der Funktionen nicht eigens deklariert. Benennungen von Dateien, von Funktionen und den vielen Variablen sind nicht vereinheitlicht, sondern nach und nach der Entwicklung dieses Systems gewählt worden. Innerhalb des gesamten Codes gibt es auch teilweise überflüssige, nicht mehr verwendete Codes.

Verwendete Suchmethoden sind: indexOf, lastIndexOf, search und match. Mehrfach werden Regular Expressions verwendet. Die Suche in der umfangreichen Bestandsliste geschieht vorwiegend, indem die Bestandsliste in ein Array zerlegt wird und die einzelnen Elemente nacheinander mit der IndexOf-Methode abgefragt werden. Eine andere mehrmals verwendete Möglichkeit besteht darin, auf die Bestandsliste als Ganzes die besonders schnelle Match-Methode mit Reg. Exp. anzuwenden und danach den entstandenen Array abzuarbeiten.

Unterschiede der verwendeten Browser: IE verarbeitet grössere Datenmengen besser als Mozilla. Geringe Unterschiede in der Navigation: In Mozilla kein Einfügen über den entsprechenden Button, sondern nur mit der Tastenkombination Strg-V.

Gleichlautende Titel

Gleichlautende Titel stellen ein gewisses Problem dar. Die in der Bestandsliste enthaltenen gleichlautenden Titel können falsche ISSN und falsche fachliche Zutragungen aufweisen, Fehler, die beim Einarbeiten von gleichlautenden Titeln ohne ISSN entstehen. Um dies zu vermeiden, zeigt das Einarbeitungsprogramm neuerdings gleichlautende Titel nicht nur in einem separaten Fenster an, sondern vergleicht gefundene Titel mit der Liste gleichlautender Titel im 1. Textareafeld und kennzeichnet identifizierte Titel mit einem ?, so dass diese Titel über die Suchfunktionen des Suchsystems leicht zu ermitteln sind. Gleichlautende Titel werden mit dem Verweis gleiche Titel? angezeigt. Bei dessen Anklicken wird die Datei fensterG.htm gestartet. Die hier angezeigten gleichlautenden Titel sind mit der EZB verknüpft.

Mit dem Programm BearbGgleich.htm können Sie noch nicht gekennzeichnete gleichlautende Titel in der Bestandsliste bearbeiten, indem Sie die Bestandsdatei G-File.txt mit einer Liste von gleichlautenden Titeln vergleichen, die sich in einem Textareafeld dieser Datei, gleichzeitig auch im 1. Textareafeld der Datei G9a.htm befindet. Als Ergebnis erhalten Sie die Datei G-FileE.txt, die alle als gleichlautend gefundenen Titel mit einem ? kennzeichnet. G-FileE.txt kann als G-File gespeichert werden und anschliessend mit BearbGListen.htm die korrigierte Datei automatisch auf die Einzeldateien G1 bis G9 aufgeteilt werden.

Eine Liste gleichlautender Titel aus der mit ISSN ergänzten EZBListe (=EZBgesamtISSN.txt) erhält man über BearbEZB4.htm.

Serientitel

Diese stellen ein weiteres Problem dar, insofern die auf den Serienvermerk (z.B. auf Part A, Part B usw.) folgenden Zusätze weggelassen werden müssen, weil diese von Google Scholar nicht erfasst werden. Zur Überprüfung können mit dem Programm BearbEZB3.htm in einem separaten Fenster alle in der EZB enthaltenen Titel in Serien angezeigt werden. Eine Liste dieser Serien ist hier vorhanden.

Titel mit hinzugefügten Abkürzungen

Abkürzungen hinter dem vollen Zeitschriftentitel werden im allgemeinen weggelassen, weil sie auch von Google Scholar nicht erfasst werden. Nachträglich können die fälschlich übernommenen Abkürzungen durch ein spezielles Bearbeitungsprogramm entfernt werden, das alle vorhandenen Titel der Bestandsliste mit einer Liste vergleicht, die die in der EZB enthaltenen problematischen Titel (d.h. Titel, hinter denen die Abkürzung ohne trennendes Zeichen folgt) aufführt.