bitcoin

Informationen erfassen und bearbeiten. Einfache und effektive Verfahren mittels Webformularen und JavaScript

Vorbemerkung

Bei Internetrecherchen stossen Sie auf ein riesiges Angebot an Informationen: Datenbankergebnisse, Zeitschriftenlisten zu allen möglichen Themen usw. Wie kann man auf dieses alles zugreifen, verarbeiten und mit anderen Informationen und Daten verknüpfen, um zusätzliche Informationen zu gewinnen? Der Zugriff auf Daten entfernter Rechner und deren Verknüpfung ist für Informationsanbieter im Internet kein so grosses Problem. Sie haben im allgemeinen direkten Zugriff auf die Daten eines anderen Anbieters, d.h. vom eigenen Rechner oder Server zu den entfernten Rechnern einer Quelle A oder B, wie das folgende Schema I zeigt.

Schema I: Datenübernahme und Bearbeitung bei Internetanbietern


 

Der Rechner oder Server des Anbieters erhält Informationen aus den verschiedenen Quellen A oder B, bearbeitet und schickt diese an die einzelnen Computer der Benutzer.

Ihr eigener Computer kann wohl auch als Server fungieren, aber dieser hat normalerweise keinen direkten Zugriff auf den Rechner eines Anbieters. Ausserdem: Die Informations- und Datenbanksysteme im Internet verfügen über sehr leistungsfähige und schnelle Rechner, mit denen diese Informationen gespeichert, verarbeitet und gesendet werden. Mit diesen kann ihr eigener Computer nicht konkurrieren. Andererseits sind die handelsüblichen Computer in den letzten Jahren erstaunlich leistungsfähig geworden, was die Schnelligkeit und die Speicherkapazität betrifft.

Es ist also trotzdem und jetzt sogar sehr leicht möglich ist, auf diese Informationen direkt zuzugreifen und selbst sehr grosse Datenmengen in einfachen Formularen zu speichern, was erstaunlich ist und in dieser Schrift gezeigt werden soll. Schema II zeigt vereinfacht die Datenübernahme, wie sie mit der hier beschriebenen Technologie erfolgt.

Informationssysteme sind im allgemeinen von ausgebildeten Informatikern mit schwer verständlichen und schwer erlernbaren Programmiersprachen programmiert. Ausserdem ist der verwendete Code normalerweise nicht einsehbar. In diesem Bereich waltet, um es etwas überspitzt auszudrücken, eine elitäre und esoterische Atmosphäre.

Gottseidank existiert aber die sehr leicht verständliche und erlernbare Programmiersprache JavaScript. Vor Jahren las ich zufällig über sie eine Notiz in einer Zeitung, wo es hiess, dass mit JavaScript jetzt quasi eine revolutionäre Programmiersprache entstanden sei, die es fortan allen erlauben würde, eigene Programme zu entwickeln, also quasi eine Demokratisierung des bisher nur für Eingeweihte zugänglichen Programmierens.

Das hat mich motiviert, mich einmal mit dieser Programmiersprache zu beschäftigen. Nachdem ich mir die grundlegenden Kenntnisse angeeignet hatte, wollte ich die in JavaScript enthaltenen Möglichkeiten auf die vorhin genannten Informationen im Internet anwenden. Man kann diese zwar wie üblich in einer Datei speichern, kann aber auf diese mit JavaScript leider nicht zugreifen. JavaScript besitzt keine Zugriffsberechtigung dafür. Ausserdem wäre es umständlich, immer erst Webseiten zu speichern, bevor man auf ihren Inhalt zugreift. Erst nach einiger Überlegung kam ich, wohlgemerkt als Programmieranfänger, auf die Idee, die Informationen durch Copy und Paste in ein Formularfeld einzufügen. Als dies auch mit relativ grossen Datenmengen problemlos gelang, war mir klar, dass damit ein sehr wichtiger Schritt getan war. Wenn die Informationen erst einmal in einem Formularfeld erfasst sind, können sie beliebig weiter bearbeitet werden. Sollen sie allerdings auch gespeichert werden, so ist dies nicht mit reinem JavaScript, sondern mit der Erweiterung durch dieActive-X-Technologie möglich, die allerdings auf den IE beschränkt ist.

Auf diese Weise können auch sehr große Datenmengen sofort in Formularfeldern erfaßt, bearbeitet und gespeichert werden. Daß Formularfelder als Datenbanken fungieren und ausschließlich mit JavaScript und ActiveX operieren können, ist bisher noch ungewöhnlich und kaum bekannt. In Hand- und Lehrbüchern fand ich bisher dafür noch keine Beispiele. Bisher wird JavaScript eher für bloße Erweiterungen von Webseiten, für Animationen usw. eingesetzt. Als vollwertige Programmiersprache wird JavaScript nicht ernst genommen, oder vielleicht sogar als Spielzeug betrachtet. Andererseits hat sich JavaScript weiter entwickelt. Viele Erweiterungen sind hinzugekommen, die JavaScript sogar als sehr schwierig erscheinen lassen, die aber in dieser Schrift nicht berücksichtigt zu werden brauchen, weil alle hier besprochenen Anwendungen mit dem ganz einfachen JavaScript auskommen, das sich auch über Jahre hinweg kaum geändert hat.

Nach dem Durchlesen dieser Schrift sollten Sie in der Lage sein, selbst eigene Informations- und Datenbanksysteme mit großen Datenbeständen zu erstellen, was phänomenal und - sollte diese hier beschriebene Technik erst einmal größere Verbreitung finden - geradezu revolutionär erscheint. Sie selbst werden hiermit aufgerufen, dazu beizutragen.

Schema II: Datenübernahme und Bearbeitung mit der hier dargestellten Technik


 
Mit Ihrem Computer übernehmen Sie direkt die Informationen der Quellen A und B. Diese werden in Ihrem Computer gespeichert oder nur temporär übernommen, nach verschiedenen Kriterien bearbeitet und durchsucht.

Die Quelle A sind hierbei im allgemeinen die von verschiedenen Anbietern (z.B. der EZB) angezeigten Zeitschriftenlisten, die Quelle B die von Datenbanken angezeigten Suchergebnisse. Diese beiden Quellen werden durch ein auf Webformularen basierendem JavaScript-Programm aufgeschlüsselt und die einzelne Elemente miteinander verknüpft. Vor allem werden die Zeitschriftentitel aus den Zitaten erfaßt und mit den Titeln der übernommenen Zeitschriftenlisten verknüpft. So werden die zusätzlichen Informationen gewonnen, die in Datenbankergebnissen nicht oder nur unzureichend gegeben sind, z.B. die Verfügbarkeit von Volltexten und deren Zugänglichkeit. So können auch umfangreiche Literaturverwaltungssysteme leicht erstellt und diese wiederum mit der Zeitschriftenverwaltung verbunden werden, so daß ganz neuartige Systeme, wie es Contents-Linking II  darstellt, entstehen

Daten mit Copy und Paste erfassen

Daten und Informationen auf Webseiten oder im Textformat können sehr einfach durch Copy und Paste in ein Formular übernommen werden. Sie stehen damit temporär, d.h. vorübergehend für eine Bearbeitung zur Verfügung. Das etwas umständliche Abspeichern dieser Daten in einer Datei kann hierbei umgangen werden. Sollen indes diese Daten anschließend dauernd zur Verfügung stehen, so kann in einem lokal installierten Formular dies mittels des ActiveX-Objektes geschehen. Eine kurzgefaßte Einführung in dessen Anwendung finden Sie hier

Dieses Erfassen von Daten mit Copy und Paste und mit Hilfe eines einfachen Webformulars ist ein besonders schnelles und effektives Verfahren, das für viele Aufgabenstellungen der Computerarbeit anwendbar ist. Natürlich werden dabei evtl. relevante, auf der Oberfläche einer Webseite nicht sichtbare, d.h. im SourceCode verborgene Informationen nicht miterfaßt. Man könnte zwar auch diesen Code anzeigen lassen und durch Copy und Paste übernehmen,was aber weniger praktikabel und in diesen Beispielen auch nicht relevant ist.

Eine kurzgefaßte Einführung in das Programmieren mit JavaScript finden Sie hier


Inhaltsverzeichnis

1 Einfache Beispiele der Informationserfassung und Bearbeitung

1.1 Texte oder Liste in ein Eingabefeld einfügen

1.2 Zugriff auf fest eingespeicherten Text im Eingabefeld

1.3 Eine einfache Suchmaschine

1.4 Beispiel: Wörter anzeigen mit Häufigkeit

2 Listen und Datenbanken

2.1 Alphabetisches Ordnen einer Liste

2.2 Listen miteinander vergleichen

2.2.1 Zwei Zeitschriftenlisten über die ISSN miteinander vergleichen

2.2.2 Zwei Zeitschriftenlisten mittels des Zeitschriftentitels miteinander vergleichen

3  Linksysteme

3.3  Arbeitsweise eines einfachen Linksystems

3.4 Arbeitsweise eines erweiterten Linksystems

4 Datenbanksysteme

4.1 Contents Literaturverwaltung

4.2 Aufbau und Arbeitsweise

4.3 Aseza-Datenbank

5 Bestandsliste


1 Einfache Beispiele der Informationserfassung und Bearbeitung

1.1 Webformulare. Texte oder Liste in ein Eingabefeld einfügen

Webformulare sind grundlegende Bestandteile dieses Copy und Paste-Verfahrens. Ein Webformular in seiner einfachsten Form besteht aus mindestens einem Eingabefeld und einem Schalter, Button genannt. Dieser ist oft der Schalter zum Abschicken des Formulars, ein sogen. Submit-Button. Ein einfaches Formular kann aus bloßem HTML-Code bestehen ohne JavaScript. Bei den meisten der in den Beispielen gezeigten Webformularen dagegen wird über Start-Buttons jeweils eine entsprechende JavaScript-Funktion ausgelöst, wodurch die in das Eingabefeld eingefügten oder eingegebenen Werte, Texte, Daten usw. bearbeitet werden, wie das folgende Beispiel zeigt.

Markieren, kopieren (Copy) und fügen Sie den vorigen Text in das Eingabefeld ein (Paste):


Klicken Sie auf den Start-Button. Sie sehen, daß der Text ohne jede Formatierung, aber sonst in der gleichen Weise angezeigt wird. Das gleiche geschieht, wenn Sie einen Text von einem Word-Programm übernehmen. Auch hier werden alle Formatierungen ausgelassen. Probieren Sie dieses mit verschiedenen Web- oder Dokumentseiten aus!

Trefferliste einer Datenbank (Current Contents) kopieren und einfügen

Suchfrage: formation/%3Cin%3Eti

Suche in folgenden Datenbeständen gestartet:

Current Contents Connect

Current Contents Connect


Treffer 1 - 100 von 48262 for SET #1 (TS=


Masek, J; Turek, I; Kudrnovsky, J, et al.
Compositional dependence of the formation energies of substitutional and interstitial Mn in partially compensated (Ga,Mn)As
ACTA PHYS POL A, 105: (6) 637-644 JUN 2004


Beljonne, D; Ye, AJ; Shuai, Z, et al.
Chain-length dependence of singlet and triplet exciton formation rates in organic light-emitting diodes
ADV FUNCT MATER, 14: (7) 684-692 JUL 2004


Shin, HJ; Jeong, DK; Lee, JG, et al.
Formation of TiO2 and ZrO2 nanotubes using atomic layer deposition with ultraprecise control of the wall thickness
ADVAN MATER, 16: (14) 1197-+ JUL 19 2004

Fügen Sie diese Liste vollständig per Copy und Paste in das obige Eingabefeld ein und klicken Sie auf den Start-Button.

Die Alert-Anzeige stellt die Liste mit allen Zeilenumbrüchen dar. In der anschließend unformatiert ausgeschriebenen Darstellung werden die Zeilenumbrüche durch Sternchen ersetzt. Die einzelnen Treffer sind durch 3 Sternchen von einander getrennt, die einzelnen Teile innerhalb eines Treffers durch 1 Sternchen. Dadurch bleibt die Struktur der Liste für die weitere Bearbeitung erfaßbar, ein sehr wichtiger Umstand für diese Art von Datenerfassung.

Der HTML-Quellcode für das oben verwendete einfache Webformular mit einem mehrzeiligen Eingabefeld und einem Startbutton sieht in vereinfachter, aber funktionsfähiger Schreibweise so aus

Innerhalb dieses Codes ist der Eventhandler onclick bei der Definition des Buttons eingefügt. Durch das Klicken auf diesen Button wird über die frei gewählte Funktionsbezeichnung starte() das JavaScript-Programm gestartet.

Der JavaScript-Quellcode für das 1. Beispiel, ebenfalls in etwas vereinfachter Schreibweise

Beachten Sie, daß der hier angegebene JavaScript-Code sich innerhalb des oben angegebenen HTML-Codes, d.h. zwischen <html> und </html> befindet und mit diesem zusammen den Quellcode für dieses Formular bildet!

Das in einem Webformular enthaltene mehrzeilige Eingabefeld ist im Gegensatz zu einem einzeiligen Eingabefeld fähig, auch eine große Datenmenge von mehreren hundert KB auf einmal aufzunehmen, jedenfalls mit dem IE, der in dieser und auch in anderer Hinsicht anderen Browsern vorzuziehen ist. Diese Tatsache, die manchen verblüffen mag, kann man ausnutzen, um die im Internet angezeigten Trefferlisten von Datenbanken oder Listen von Zeitschriften, Zitaten, Texten usw. zu erfassen und zu bearbeiten. Auch im Textformat vorliegende Dateien von Aufsätzen, ja ganze Bücher können auf diese Weise erfaßt, durchsucht, verändert werden, z.B. können die für ein Register relevanten Begriffe erfaßt und alphabetisch geordnet werden, das Vorkommen von bestimmten Wörtern kann untersucht, eine Abkürzungsliste erstellt werden usw.


1.2 Zugriff auf fest eingespeicherten Text im Eingabefeld

Man kann den zu beabeitenden Text wie oben beschrieben in ein Eingabefeld einfügen. Man kann ihn ebenso als festen Wert einspeichern, um auf diesen wiederholt, z.B. zwecks einer Recherche, zuzugreifen. Dazu wird der Text zwischen den beiden Textarea-Tags des Quellcodes im Editor eingefügt und anschließend der ganze Quellcode zusammen mit dem eingefügten Text gespeichert, wie das folgende Beispiel zeigt:

Der hier eingespeichert Text besteht aus 5 Sätzen. Der Anfang ist noch im Eingabefeld zu erkennen. Über den Bildlaufpfeil kann man die folgenden Teile des Textes sichtbar machen. Der hier eingeschriebene Text kann auch aus sehr vielen Sätzen bestehen. Es können auch sehr umfangreiche Texte, Listen oder sonstige Daten in ein Formular fest eingespeichert werden, so daß dieses Formular wie eine Datenbank fungiert. Dabei werden die zu speichernden Daten zwischen die beiden Textarea-Tags des Formulars hineinkopiert und dieses dann gespeichert. Der Quellcode dafür sieht so aus

Wenn Sie das Formular starten, wird in einem Alert-Fenster zunächst die Anzahl der Sätze angezeigt, danach der in dem Eingabefeld enthaltene Text ausgeschrieben. Diesmal werden nicht die Zeilenumbrüche, sondern die einzelnen Sätze jeweils durch ein Sternchen gekennzeichnet.


1.3 Eine einfache Suchmaschine

Bei einer Suchmaschine werden ein oder mehrere Begriffe in einem gegebenen Text, einer Liste, einer Datenbank usw. gesucht. Dabei ist es gleichgültig, ob das zu Suchende in einem gegebenen Text oder in einer umfangreichen strukturierten Datenbank zu suchen ist. Das Prinzip ist immer das gleiche und im Grunde sehr einfach.

In diesem Beispiel ist der oben genannte zu durchsuchende Text quasi als Datenbank zwischen den beiden Textarea-Tags eines Formulars, wie bereits gezeigt, gespeichert. Im selben Formular muß außerdem für die zu suchenden Begriffe ein Eingabefeld vorhanden sein, in diesem Fall ein einzeiliges Eingabefeld

Diese Befehlszeile bezeichnet immer ein einzeiliges Eingabefeld, hier mit der frei gewählten Benennung eingabe.

Die Suchfunktion wird mittels eines JavaScripts ausgeführt, das wiederum über einen Button mittels des Event-Handlers onclick gestartet wird. Der Code dazu lautet

Als Ergebnis werden alle Sätze angezeigt, in denen die Suchbegriffe vorkommen. Diese sind markiert.


1.4 Beispiel: Wörter anzeigen mit Häufigkeit

Eine Anwendungsmöglichkeit kann darin bestehen, für einen längeren Text oder sogar ein ganzes Buch eine Wortliste zu erstellen, die evtl. für die Anlegung eines Registers benutzt werden kann. Das dafür erforderliche Programm-Skript, das dem vorigen Skript etwas ähnlich ist, kann etwa so aussehen

Als Ergebnis werden alle in dem oben (1.2) eingespeicherten Text vorkommenden Wörter angezeigt, sofern sie mit Großbuchstaben beginnen. Daß hierbei auch die am Anfang eines Satzes, d.h. nach einem Punkt großgeschriebenen Wörter wie Aber, Da, Das usw. ausgeschrieben werden, läßt sich in diesem Beispiel leider nicht vermeiden. Hinter jedem Wort wird angegeben, wie häufig dieses vorkommt.


II Listen und Datenbanken

In Datenbanken sind Daten gesammelt und gespeichert. Daten können z.B. Texte, Zeitschriftentitel oder Aufsatzzitate sein. Wesentlich für Datenbanken ist, daß ihre Inhalte strukturiert sind und daß sie bearbeitet, ergänzt, verändert und vor allem durchsucht werden können.

Datenbanken sind Tabellen vergleichbar:

Index Datenfeld 1 Datenfeld 2 Datenfeld 3
1 [Datensatz:] Autor Titel Zeitschrift
2 [Datensatz:] Autor Ttiel Zeitschrift
3 [Datensatz:] Autor Titel Zeitschrift


Die obige Tabelle zeigt vereinfacht das Schema einer Aufteilung von 3 Zeitschriftenaufsätzen (= Datensätzen) auf die Datenfelder Autor, Titel und Zeitschrift. Dazu kommt eine vorangehende Spalte für die Index-Nummer.

Die einzelnen Datensätze oder Elemente einer Datenbank müssen eine Indexierung und zumindest ein Datenfeld aufweisen. Die Indexierung erlaubt die Zugriffsmöglichkeit auf einen Datensatz, und in den Datenfeldern ist der Inhalt eines Datensatzes untergebracht. Datenbanken weisen eine kleinere oder größere Strukturierung auf, d.h. sie sind durch mehrere oder eine Vielzahl von Datenfeldern gegliedert, was einer Tabelle mit entsprechend vielen Spalten entspricht. Listen z.B. von Zeitschriftentiteln können unter bestimmten Bedingungen wie Datenbanken behandelt werden. Eine einfach untereinander geschriebene Liste von Zeitschriftentiteln ist zunächst noch keine Datenbank. Es fehlt die Einteilung in Index und Dateninhalt. Wie dies auf sehr einfache Weise mit Hilfe des Arrayobjekts erreicht werden kann, wird im folgenden erläutert.

Eine Liste weist bereits die für ein Arrayobjekt typischen Eigenschaften auf, d.h. sie besteht aus einer Anzahl von Elementen bzw. Datensätzen E mit jeweils verschiedenem Inhalt:

E1 (........) E2(..........) E3 (............) E4 (................) usw.

Die einzelnen Elemente brauchen noch nicht einmal näher mit Nummern usw. bezeichnet zu werden, um aus ihnen ein Array-Objekt zu bilden. Es genügt, daß sie durch ein bestimmtes Zeichen oder durch eine bestimmte Anordnung von einander abgegrenzt sind. Überwiegend werden Listen durch einfaches Untereinanderschreiben angelegt, manchmal mit, manchmal ohne zusätzliche Numerierung, wie z.B. die im WWW veröffentlichten Zeitschriftenlisten vieler Verlage oder die Fachlisten der Elektronischen Zeitschriftenbibliothek (EZB). Hier ein Ausschnitt aus einer ihrer Webseiten

Wenn diese Liste kopiert und in dieses Formularfeld   eingefügt wird, so werden nach Klicken auf den Button  die einzelnen Titel der Liste angezeigt und ausgeschrieben.  Der Code hierfür ist denkbar einfach:

a=document.forma4.area.value;// die eingelesene Liste
aa=a.split(/\n/);     // Array gebildet durch neue Zeile
alert(aa.length); //  Zahl der Elemente
for(x=0;x<aa.length;x++)  // Anzeige und Ausschreiben  in der For-Schleife
{
alert(aa[x]);
document.write("<br>"+aa[x]);
}

Relevante Informationsquellen - speziell für die Literatursuche und -beschaffung -sind neben den Listen von Literaturzitaten bzw. den Ergebnislisten von Datenbanken eben diese Zeitschriftenlisten, die von Verlagen und Informationsdiensten oder auch, wie im Falle der EZB, von einem Bibliotheksdienst angezeigt werden. Wenn diese verschiedenen Quellen entsprechend bearbeitet oder miteinander verbunden werden, können zusätzliche Informationen entstehen, die in den originalen Listen nicht enthalten sind. So können z.B. zahlreiche Hyperlinkverknüpfungen entstehen, wie weiter unten gezeigt wird.

2.1 Alphabetisches Ordnen einer Liste

Eine Listen- oder Datenbankbearbeitung kann darin bestehen, daß aus einer gegebenen Datenmenge die relevanten Teile entnommen und neu angeordnet werden, daß Teile verändert oder entfernt werden, daß z.B. bestimmte Zeichen wie Bindestriche oder Klammern oder bestimmte Buchstabenfolgen entfernt werden. Ein besonders einfaches und gleichzeitig sehr effektives Beispiel ist das alphabetische Anordnen einer Liste. In einem JavaScript müssen dafür nur wenige Zeilen geschrieben werden:

1)
T=document.forma.area.value;
2) Ta=T.split(">"),
3) Tb=Ta.sort(),
4) for(x=0;x<Tb.length-1;x++)
5) if(Tb[x]!=Tb[x+1])
6) document.write("<br>"+Tb[x]);

Die in das Eingabefeld
area eingefügte Liste wird in Zeile 1 ausgelesen. Zeile 2 macht aus der Zeichenkette oder dem String T über das Trennungszeichen ">" ein Array. In 3) wird dieser Array alphabetisch angeordnet. In der For-Schleife wird jedes Element Tb[x] mit dem nächstfolgenden Tb[x+1] verglichen und nur dann in 6) ausgeschrieben, wenn sie verschieden sind. So wird neben der Alphabetisierung gleichzeitig auch die Doppeleintragung von Elementen entfernt. Dieses ist, wie schon gesagt, ein besonders einfaches, aber auch sehr effizientes Beispiel, das Sie an einem Beispiel ausprobieren können

Ein Beispiel für verschiedene Anzeigeoptionen von Zeitschriftenlisten finden Sie im Multisuchsystem E-Connect:


2.2 Listen miteinander vergleichen

Um kompliziertere Bearbeitungen handelt es sich, wenn die einzelnen Elemente innerhalb einer Liste verglichen, Einträge mit abweichenden oder identischen Teildaten gekennzeichnet werden usw. Dazu gehört auch die Veränderung oder Erweiterung einer Liste durch bestimmte Daten, z.B. die Ergänzung einer Zeitschriftenliste durch die ISSN. Dies kann dadurch geschehen, daß die zu ergänzende Liste mit einer anderen Liste verglichen und aus dieser die fehlenden Daten entnommen werden. Um ein anderes Beispiel handelt es sich, wenn zu einem Zeitschriftentitel die abgekürzte Schreibweise zu ermitteln und/oder hinzuzufügen ist.

2.2.1 Zwei Zeitschriftenlisten über die ISSN miteinander vergleichen

Im folgenden Beispiel wird die Bestandsliste elektronischer Zeitschriften einer einzelnen Bibliothek mit einer umfassenden Bestandsliste (über 9000 Titel) verglichen.

Liste A: Ein Ausschnitt aus der Liste einer Bibliothek (UB Bochum):

>Annals of Nuclear Energy 03064549 03064549
>Annals of Oncology (-2001) 09237534 09237534
>Annals of Operations Research 02545330
>Annals of Otology, Rhinology & Laryngology 00034894

Liste B: Ein Ausschnitt aus der Bestandsliste (im Multisuchsystem enthaltend):

>ANNALS OF NUTRITION AND METABOLISM=02506807=KARG*DD*ER*HL*J*MHH*OL*RE*TUM*TIB*GÖ
>ANNALS OF OCCUPATIONAL HYGIENE=00034878*FREI(AFTER 2 YEARS
>ANNALS OF ONCOLOGY=09237534=HW=KLUW*AA*BHU*ER(-2001*TUM(-2001*TIB(-2001*FZK(-2001*GÖ(-2001
>ANNALS OF OPERATIONS RESEARCH=02545330=KLUW*AA*BHU*ER*HA*HL*J*MHH*MP*OL*POT*RE*TUM*TIB*GÖ
>ANNALS OF OTOLOGY RHINOLOGY AND LARYNGOLOGY=00034894=PUB*AA*DD*ER*FB*HE*HL*J*KI*MHH*RE*GÖ

Liste A gibt außer dem Titel eine oder mehrere ISSN sowie ggf. eine zeitliche Beschränkung (z.B. -2002) an. Die Bestandsliste B enthält außerdem eine Anzahl von Kennzeichen für die besitzenden Bibliotheken (*AA*BHU*ER*HA*HL) ,Verlagsangaben (=KLUW =KARG =PUB usw.) sowie ebenfalls zeitliche Angaben. In Liste B ist im allgemeinen nur jeweils die ISSN der JADE-Datenbank angegeben. Liste B kann auf Grund ihrer Strukturierung durch entsprechende Zeichen ( > =, * ( ) als Datenbank fungieren.

Die einzelnen Titel der Liste B sollen mit denen der Liste A verglichen, bei identischen Titeln soll ein Kennzeichen hinzugefügt werden, das den Besitz für eine bestimmte Bibliothek angibt, hier *BO für die UB Bochum.

Da beide Listen bereits alphabetisch geordnet sind und von wenigen Ausnahmen abgesehen jeder Zeitschriftentitel nur einmal aufgeführt wird bzw. mehrere gleichlautende Titel hinter einander stehen, braucht nur eine der beiden Listen in ein Array umgewandelt zu werden. Auf die andere Liste kann als einheitliche Zeichenkette, als Stringobjekt, zugegriffen werden. Es wird also in diesem Fall nur für die Liste B ein Array gebildet. Aus jedem Element wird die ISSN ermittelt, die jeweils in der gesamten Liste A gesucht wird. Liste A bleibt also als String bestehen.

Für diese Prozedur werden im wesentlichen nur wenige Codezeilen benötigt:

Bei der Demonstration dieses Beispiels werden beide Listen nur bis zum Buchstaben A verglichen. Zusätzlich zum oben genannten Code kommen nur noch die Code-Zeilen für einen Trefferzähler und ein neu zu öffnendes Fenster hinzu. In der ausgeschriebenen Bestandsliste sind die Treffer markiert, am Ende einer Trefferzeile ist als Kennzeichen *BO+ hinzugefügt. Die Trefferzahl wird ganz unten angegeben:

2.2.2 Zwei Zeitschriftenlisten mittels des Zeitschriftentitels miteinander vergleichen

Wesentlich schwieriger ist der Vergleich zweier Listen, wenn nur eine Liste die Zeitschriftentitel mit ISSN aufführt und wenn deren Schreibweisen zusätzlich teilweise von einander abweichen. Im oberen Beispiel war die Zeitschriftenliste der Elektronischen Zeitschriftenbibliothek (EZB) zu sehen, die in dieser Anzeigeform lediglich die Titel der Zeitschriften aufführt. Um diese Liste mit einer Gesamtzeitschriftenliste mit ISSN, die im wesentlichen aus der JADE-Liste besteht und ca. 29000 Titel umfaßt, zu vergleichen, müssen die Schreibweisen beider Listen einander angeglichen werden. Die Schreibweise dieser Gesamtliste entspricht im wesentlichen der von JADE praktizierten Schreibweise. Die oben genannte Bestandsliste B basiert ebenfalls auf dieser Schreibweise.

Im folgenden wird die durch das Bearbeitungsprogramm erreichte Angleichung gezeigt. Auf die in der Schreibweise der EZB-Liste aufgeführten eingegebenen Titel folgen die durch das Programm ausgeschriebenen Titel in der Schreibweise der Gesamt-Liste G, die ebenfalls in einigen Punkten (z.B. bei Serienangaben) abgeändert wurden.

Auf Doppelpunkt, Bindestrich oder Schrägstrich folgende Zusätze zum Titel werden enfernt:

METABOLISM - CLINICAL AND EXPERIMENTAL
METABOLISM 00260495

BJU INTERNATIONAL : BRITISH J OF UROLOGY
BJU INTERNATIONAL 14644096

ARCHIVE OF APPLIED MECHANICS / INGENIEUR ARCHIV
ARCHIVE OF APPLIED MECHANICS 09391533

In runden und eckigen Klammern Stehendes wird entfernt:

ACM TRANSACTIONS ON DATABASE SYSTEMS (ACM TODS)
ACM TRANSACTIONS ON DATABASE SYSTEMS 03625915

J OF SYNCHROTRON RADIATION [SYNCHROTRON RADIATION ONLINE]
J OF SYNCHROTRON RADIATION 09090495

Unterreihen werden in den EZB-Listen in sehr unterschiedlicher Weise angegeben. SERIES, PART und SECTION werden in beiden Listen entfernt, in den EZB-Listen außerdem die ergänzende Angabe hinter dem Doppelpunkt. Serienhinweise werden normalerweise nur mit einem Buchstaben oder einer Ziffer angegeben. Beispiele:

PROCEEDINGS ROYAL SOCIETY OF LONDON SERIES A : MATHEMATICAL PHYSICAL AND ENGINEERING SCIENCES (1996 -)
PROCEEDINGS ROYAL SOCIETY OF LONDON A 13645021

PHYSICA A : STATISTICAL MECHANICS AND ITS APPLICATIONS
PHYSICA A 03784371

PHYSICA STATUS SOLIDI (A) - APPLIED RESEARCH
PHYSICA STATUS SOLIDI A 00318965

J DE PHYSIQUE II
J DE PHYSIQUE 2=1155-4312

Die Demonstration zeigt Ihnen, wie es funktioniert

Bei diesem Beispiel werden von 169 Titeln 133 Treffer erzielt. Der überwiegende Teil der nichtgefundenen Titel ist in der Gesamtliste nicht enthalten. Einzelne Titel wurden wegen einer abweichenden Schreibweise nicht gefunden: z.B. ANGLO SAXON ENGLAND anstatt ANGLOSAXON ENGLAND , ANTI CANCER DRUGS anstatt ANTICANCER DRUGS , ARCHIVES OF SEXUAL BEHAVIOR anstatt ARCHIVES OF SEXUAL BEHAVIOUR .

Das hier verwendete Programm ist eine stark vereinfachte Version Die erweiterte Version dieses Programms, das mit einer weit größeren Genauigkeit von den hier gesuchten Titeln alle bis auf ganz wenige ermittelt, ist in dieses Einarbeitungssystem    integriert, über das EZB-Listen ohne ISSN direkt in die o.g. Bestandsliste eingearbeitet werden.

Dieses Beispiel zeigt, daß es durchaus möglich ist, Zeitschriftenlisten allein über die Titel zu vergleichen. Die Trefferquote ist dabei nicht viel niedriger als bei einem Vergleich über die ISSN. Allerdings ist dafür ein wesentlich größerer Programmieraufwand nötig.


 3 Linksysteme 

 3.1 Verknüpfungen

Ein Linksystem ist zunächst nichts anderes als ein Verlinkungs- oder Verknüpfungssystem im WWW, basierend auf der Hyperlinktechnik. Man unterscheidet statische und dynamische Verknüpfungen. Hyperlinkverweise auf Webseiten bestehen überwiegend aus statischen Verknüpfungen. Dynamische Verknüpfungen dagegen entstehen dadurch, dass eine gegebene Internetadesse dynamisch durch bestimmte Daten verändert und dann angesteuert wird. Das geschieht z.B. bei der Übermittlung von Suchwörtern an Suchmaschinen und Datenbanken. Dazu ein einfaches Beispiel. Die Internetadresse des Such-formulars von Google ist:

http://www.google.de/search?q=+&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=

An der Stelle q= wird nun ein Stichwort eingefügt, etwa production.

Die Adresse ändert sich dann in:

http://www.google.de/search?q=production+&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=

Mit JavaScript lassen sich sehr leicht solche Verknüpfungen konstruieren. Dabei werden im wesentlichen folgende Codezeilen verwendet:

L="http://www.google.de/search?q=+&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=";
La=L.replace("q=","q="+a);verweis="<b>Google</b>".link(La);document.write(verweis);

L ist die Internetadresse von Google. La ist die veränderte Adresse, wobei a das Suchwort ist. verweis ist der ausgeschriebene Hyperlinkverweis, bei dessen Anklicken die betreffende Suche in Google gestartet wird.

Das lässt sich über ein einfaches Suchformular demonstrieren):  

Im Formurlarfeld ist selection eingegeben. Starten Sie das Formular, wird zunächst Google als Hyperlink ausgeschrieben. Klickt man auf den Hyperlink, erscheint die Ergebnisanzeige von Google und in der Adressenzeile des Browsers der Suchstring:

https://www.google.de/search?q=selection+&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=


Der vollständige Code für dieses Formular lautet:

<htm>
<form name="forma">
    <p><strong><input type="text" size="20" name="E"> <input
    type="button" value="Start" onclick="starte()"> </strong></p>
</form>
<script>
function starte()
{
a=document.forma.E.value;
L="http://www.google.de/search?q=+&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=";
La=L.replace("q=","q="+a);
verweis="<b>Google</b>".link(La);
document.write(verweis);
}
</script>
</htm>

Diese Verknüpfungen sind, wie schon erwähnt, generell in Suchdiensten, Internetdatenbanken und anderen Internetangeboten zu finden. Deren Suchergebnisse enthalten Hyperlinks, die z.B. den Standort einer Zeitschrift in einem Verbundkatalog ermitteln oder zu deren Homepage und elektronischen Version hinführen. In manchen Datenbanken führen Hyperlinks auch unmittelbar zum Volltext hin. Mit dieser mit dem englischen Fachausdruck Reference Linking bezeichneten bibliographischen Verknüpfungstechnik wird mehr oder weniger das Problem gelöst, wie ein auf einer Webseite zitierter oder von einer Datenbank als Treffer angezeigter Aufsatz so mit einer URL verbunden werden kann, daß als Ziel des Hyperlinks z.B. die entsprechende elektronische Version angesteuert wird.

Die folgende Abb  zeigt eine Einzeltitelanzeige der JADE-Aufsatzdatenbank mit den Verknüpfungen: Verfassernamen Suche, Fernleihe für Standortermittlung und WWW-Ausgabe des Anbieters: Volltext, wenn Lizenz:


 

Solche Verknüpfungen finden sich auch in den hier dargestellten Linksystemen, die ähnlich wie Linkresolver arbeiten. Dabei werden Suchwörter, Zeitschriftentitel oder ISSN-Angaben mit URL-Adressen so verknüpft, daß die angewählten Adressen die Homepages der Zeitschriftenanbieter, vielfach sogar die einzelnen Online-Aufsätze und gleichzeitig auch die Bestandsnachweise liefern.

3.2  Verknüpfungen über Suchadressen, Open-URL und Google Scholar


Der Zugang vom vorliegenden Zitat zum Volltextangebot der Anbieters kann in manchen Fällen über deren Suchmaschinen, d.h. über deren Suchadressen  erfolgen. Hierbei werden in den offenen Suchstring dieser Systeme einige Suchbegriffe aus dem vorliegenden Titel eingefügt. Fast immer kann auf diese Weise das betreffende Zitat gezielt, manchmal unter mehreren Treffern sich ganz oben befindend, angesteuert werden, z.B. bei PubMed:

LM="http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=search&db=PubMed&term=";
LM1=LM.replace("term=","term="+AU2+"[au]"+"+"+Twa2);

Hier wird der in LM gespeicherte Suchstring von PubMed hinter term= durch die Verfasserangabe Au2 und durch die Titelwörter Twa2 ergänzt.

Voraussetzung für diese Verknüpfung ist, dass die Suchadresse des Systems nicht, wie leider oft, verborgen und verschlüsselt auftritt, sondern offen ist wie hier bei PubMed .

Eine ganz ähnliche Verknüpfungsmöglichkeit ergibt sich durch die Anwendung der sogen Open-URL, einem Standardformat für die Adressierung im Internet, die ähnlich aufgebaut ist wie die vorige Suchadresse. Auch hier wird die vorliegende Adresse durch einige Angaben, z.B. durch Titelwörter, Verfasser, Jahr usw., ergänzt. So lautet z.B. die Open-URL für Springerlink:

LinkSb="http://www.springerlink.com/openurl.asp?genre=article&issn=&volume=&issue=&spage=";

Hier werden die ISSN, Band, Heft und Seitenangabe ergänzt. Diese Open-URL wäre an sich eine gute Verknüpfungsmoglichkeit. Leider ist sie aber vom jeweiligen Anbieter abhängig, der nicht immer seine Volltexte über eine Open-URL zugänglich macht. Ausserdem sind relativ genaue Angaben, wie ISSN, Band, Heft und Seite erforderlich, die nicht immer und auch etwas schwierig den Zitaten zu entnehmen sind. Der weit verbreitete Linkresolver SFX von ExLibris verwendet ebenfalls eine solche Open-URL mit den eben genannten Nachteilen.

Diese Nachteile können inzwischen durch eine andere Art der Verknüpfung vermieden werden, ich meine die über Google Scholar und Google. Diese funktioniert  sogar sehr schnell, zuverlässsig und direkt. Es zeigt sich, dass Google Scholar und Google fast immer einen Zugang zum Volltext eines Artikels anzeigen, falls wesentliche Daten wie Sachtitel, Verfasser und Zeitschriftentitel dem Zitat entnommen und in den offenen Suchstring dieser Suchmaschinen eingefügt werden. Die ISSN ist hierbei nicht zu verwenden. Sie ist wie auch sonstige Metadaten inzwischen insgesamt für Linksysteme nicht mehr notwendig (siehe ASEZA und Contents-Linking ).

Das Multisuchsystems E-Connect enthält in Contents-Linking und in PubMed- Linking Linkysteme, bei denen Verknüpfungen zu den Trefferlisten einer Reihe von Datenbanken hergestellt werden. Die Linksysteme funktionieren hierbei ähnlich wie kommerzielle Linkresolver, die ebenfalls nicht nur den Zugang zum Volltext herstellen, sondern auch die Verfügbarkeit nach dem Durchsuchen einer Bestandsliste ermitteln und anzeigen.


3.3  Arbeitsweise eines einfachen Linksystems

Das folgende Beispiel zeigt, wie ein einfaches Linksystem arbeitet. Im oberen Texteingabefeld des Formulars sind bereits einige Treffer einer Datenbank fest eingespeichert . Diese werden durch die folgenden Zeilen eingeleitet:

Suchfrage: polynomial/%3Cin%3Eti

Suche in folgenden Datenbeständen gestartet:

Current Contents Connect


Current Contents Connect
Treffer 1 - 100 von 1250 for SET #1 (TS=

(Die ersten beiden Treffer:)

Cash, GG
Relationship between the Hosoya polynomial and the
hyper-Wiener index
APPL MATH LETT, 15: (7) 893-895 OCT 2002


Wolf, C
Hausdorff and topological dimension for polynomial
automorphisms of C-2
ERGOD THEOR DYN SYST, 22: 1313-1327 Part 4 AUG 2002

Die beiden Treffer werden durch 3 Sternchen als Trennungszeichen *** in ein Array verwandelt:
Cash, GG*Relationship between the Hosoya polynomial and the*hyper-Wiener index*APPL MATH LETT, 15: (7) 893-895 OCT 2002***Wolf, C*Hausdorff and topological dimension for polynomial*automorphisms of C-2*ERGOD THEOR DYN SYST, 22: 1313-1327 Part 4 AUG 2002

In jedem einzelnen Element des Arrays (=Treffer) markiert das letzte Sternchen den Anfang des Zeitschriftentitels:

Cash, GG*Relationship between the Hosoya polynomial and the*hyper-Wiener index*APPL MATH LETT, 15: (7) 893-895 OCT 2002

Die einzelnen ermittelten Teile des Treffers:

Titel: Cash, GG*Relationship between the Hosoya polynomial and the*hyper-Wiener index
Erscheinungsvermerk: , 15: (7) 893-895 OCT 2002
Zeitschriftentitel: APPL MATH LETT

Der Zeitschriftentitel wird duch ein Komma begrenzt, dahinter folgt der Erscheinungsvermerk.

Das entsprechende Skript lautet demnach

In dem zugehörigen Formular können Sie über ein Menü 3 verschiedene Kataloge anwählen: A=ZDB, B=GBV, C=BVB. Wenn Sie das Formular starten , werden die aus den Treffern extrahierten Zeitschriftentitel als Hyperlinks ausgeschrieben. Klicken Sie auf einen dieser Titel, wird die Verbindung über Link2a (erweitert mit dem Titel zu Link2b) entsprechend dem im Menü ausgewählten Katalog hergestellt, eine Suche mit dem betreffenden Zeitschriftentitel eingeleitet und sofort das Suchergebnis gezeigt. In diesem Beispiel wird nicht zu allen Titeln ein positives Ergebnis erzielt. Beachten Sie, daß in diesem Beispiel abgekürzte Zeitschriftentitel gegeben sind, die am besten über die EZB, nur teilweise über die ZDB gefunden werden. In einigen Fällen, vor allem wenn ein Zeitschriftentitel mit einem Sachbegriff identisch ist, werden auf diese Weise auch zu viele Treffer gefunden.

Eine weitere Erläuterung und Demonstration dieses Linksystems finden Sie hier


3.4 Arbeitsweise eines erweiterten Linksystems

 Das vorige Beispiel zeigt, daß die Verknüpfung von Zeitschriftentiteln, zumal von abgekürzten, mit der Suchadresse eines Internetdiesnstes nicht immer am vorteilhaftesten ist. Es können zu viele oder gleichlautende Treffer erzielt werden. Besser wäre eine Verknüpfung mit der ISSN, die aber in Zitaten nicht immer angezeigt wird. Daher sollten die aus den Treffern extrahierten Zeitschriftentitel vor der Verknüpfung möglichst mit einer Bestandsliste verglichen werden, aus der die ISSN entnommen werden. Ausserdem könnten aus der Bestandsliste noch weitere Daten entnommen werden, die zu weiteren Verknüpfungen und zusätzlichen Informationen führen: über Verlags- und Publikationsangaben könnten die Volltexte der einzelnen Zitate angesteuert werden, und über die Besitznachweise von Bibliotheken könnte ermittelt werden, ob ein Zitat im Volltext für eine bestimmte Bibliothek verfügbar bzw. frei verfügbar ist. Natürlich lassen sich noch weitere Verknüpfungen einrichten, besonders die über Google und Google Scholar, die aber keinerlei zusätzliche, aus einer Bestandsliste zu ermittlende Daten benötigen.

Ein solches durch eine Bestandsliste erweitertes Linksystem soll an einem vereinfachten Beispiel demonstriert werden.  Es handelt sich um ein einfaches Formular, das im Unterschied zum vorangehenden unten ein weiteres Formularfeld zeigt, in dem die Anfänge einer Bestandsliste, der die Zeitschriftentitel mit dem Buchstaben A enthält, zu erkennen sind. 
    Der Code hierfür lautet:

Auch hier ist die Trefferliste von Current Contents bereis fest in das Formular eingespeichert. Ebenso ein Teil der Bestandsliste, der die hier angezeigten Zeitschriftentitel mit dem Buchstaben A enthält. Wenn Sie das Formular starten, werden die Treffer mit den beiden Hyperlinks ausgeschrieben. Der Zeitschriftentitel führt zu einer Verbindung mit der EZB und der Eintrag Katalog zu einer solchen mit dem ausgewählten Verbundkatalog. Kann eine Verknüpfung nicht über die ISSN erfolgen, weil der Zeitschriftentitel nicht in der Bestandsliste gefunden wurde, so wird eine solche über den Titel hergestellt. Das ist in der angezeigten Ergebnisseite bei Treffer 6 bis 8 der Fall für die Zeitschrift ARTERIOGENESIS, die nicht in der Bestandsliste gefunden wurde. Allerdings kommt auch über den Titel kein Suchergebnis zustande, weil es sich hierbei um keine Zeitschrift, sondern um einen Sammelband handelt. In der letzten Zeile eines Treffers sind die Kennzeichen derjenigen Bibliotheken angegeben, die eine Lizenz auf die elektronische Version der angegebenen Zeitschrift besitzen.

4 Datenbanksysteme