Zur automatisierten Speicherung und Bereitstellung von Sachverhaltsinformationen
mittels Frage-Antwort-System

Dipl.-Ing.ök. Eberhardt Gering, Vortrag Dezember 1981

 
Sowohl die Bedürfnisse der Nutzer  gesellschaftswissenschaftlicher Informationen als auch die neuen technischen und programmtechnischen Möglichkeiten geben Veranlassung, den Anteil der Sachverhaltsinformationen( SVI ) an den bereitzustellenden wissenschaftlichen Informationen schnell und zielstrebig zu vergrößern.

Im Unterschied zur Informationstätigkeit auf den Gebieten Naturwissenschaft und Technik, bei der zu einem großen Teil mit formalisierten sprachlichen Gebilden vom Typ „Objekt - Merkmalsname - Merkmalsaussage“  operiert werden kann, liegt bei den gesellschaftswissenschaftlichen ( sozial- und geisteswissenschaftlichen )  Disziplinen  der Schwerpunkt auf solchen Sachverhaltsinformationen (inklusive Fakteninformationen ), die als sprachlich vollständige Aussagesätze gegeben sind.

Mit Programmsystemen, die ein weitgehendes Abbilden der Semantik von Sachverhaltsinformationen  auf syntaktische, vom Computer interpretierbare Informationsstrukturen ermöglichen, und mit dem Bereitstellen leistungsfähiger EDVA (z.B. EC 1055) */ entstehen gegenwärtig erste technische Voraussetzungen für das automatisierte Verarbeiten von natürlichsprachigen Informationen. Die in diesen Richtungen erfolgenden Forschungsarbeiten sind international unter der Bezeichnung „Frage - Antwort - System“  (engl. question-answering-system; russ. informacionno-logiceskaja sistema) bekannt.
 

*/ Siehe Verzeichnis der Abkürzungen am Ende des Beitrages.



 
Ein Frage-Antwort-System (FAS) besteht im Prinzip aus einem maschinenlesbaren Bestand an Informationen und aus einem Programmsystem, das auf die vom Nutzer gestellten Anfragen aus dem Informationsbestand entsprechende Antworten erzeugt. Eingabeinformationen und Fragen können bei fortgeschrittenen FAS in einer Sprache formuliert sein, die gegenüber der natürlichen Sprache nur noch wenigen Einschränkungen unterliegt. Gleiches gilt für die automatisch erzeugten Antworten.
 
Der Frage-Antwort-Prozeß vollzieht sich in direkter Mensch-Maschine-Kommunikation. /1/  FAS benötigen neben Algorithmen zur Analyse natürlichsprachiger Sätze vor allem ein internes Modell der auf das jeweilige Informationsgebiet bezogenen Außenwelt (sogen. Wissen über die Welt), das dem System durch Eingabe zusätzlicher Informationen  (Hintergrundinformationen) vermittelt werden muß.  In der Regel verfügen FAS über Fähigkeiten zum logischen Einordnen neuer Informationen in den Speicher und zum Ableiten von Aussagen, die in den gespeicherten Informationen nur implizit enthalten sind (mittels bestimmter Formen logischen Schließens). Auf Grund dieser und weiterer Eigenschaften werden FAS den Systemen der künstlichen Intelligenz zugerechnet.
 
In der DDR erfolgen seit längerem Forschungsarbeiten zu Programmsystemen vom Typ FAS. Bereits in den siebziger Jahren entstand mit "FAS-75" der Prototyp eines Frage-Antwort-Systems ( vgl. Literaturangabe am Schluß des Beitrages).  Mit dem im VEB Robotron Zentrum für Forschung und Technik entstehenden System „FAS-80“ wird gegenwärtig eine bestimmte Forschungsetappe abgeschlossen. Bei Anschluß der erforderlichen Entwicklungsarbeiten könnte FAS-80 in absehbarer Zeit zu einem auf dem Gebiet der gesellschaftswissenschaftlichen Information und Dokumentation (GID) einsetzbaren Programmsystem gestaltet werden. 
Allerdings läßt die Leistungsfähigkeit dieses Systems erst das Verarbeiten relativ kleiner Mengen an Informationen zu.  Weiterreichende Lösungen werden unter anderem in einer Verbindung von FAS und Datenbank gesehen. Damit wird das Ziel verfolgt, zu den in einer Datenbank gespeicherten Informationsbeständen ( z.B. Dokumentennachweise, kurze Texte oder einzelne Aussagesätze ) mittels eines in natürlicher Sprache zu führenden Recherchedialogs einen bequemeren und rationelleren Zugang zu schaffen, als es mit den vorhandenen, formalisierten Anfragesprachen möglich ist.
 
Die mit FAS und ähnlichen Projekten für die Informationstätigkeit entstehenden Möglichkeiten sind unter anderem an den Fragetypen, die mit solchen Systemen bearbeitet werden können, erkennbar.  FAS-80 sieht das Beantworten folgender Fragetypen vor (in Klammern werden zu jedem Typ  Beispiel-Fragesätze angedeutet):
 
  • Entscheidungsfragen  (Gibt es Forschungsarbeiten zu .....?)
  • Einfach-Ergänzungsfragen  (Wo erfolgen Forschungen zu .....?)
  • Mehrfach-Ergänzungsfragen  (Welche Einrichtungen arbeiten an Forschungsthemen  zur .....?)
  • Ergänzungsfragen nach der Anzahl bestimmter Objekte (Wieviel interdisziplinäre Forschungsaufgaben bearbeitet .....?)
  • Globalfragen  (Was ist über Forschungen zu ..... bekannt ?)
  • Kausalitätsfragen  (Was sind die Ursachen für .....?)
  • Definitionsfragen  (Was bedeutet der Begriff .....?)
  • Vergleichsfragen  (Wodurch unterscheiden sich .....?).
 
Die letztgenannten vier Fragetypen werden unter dem Begriff „Essayfragen“ zusammengefaßt. Für das Erkennen und Beantworten von Essayfragen sieht FAS-80 das Einsetzen von besonderen, erst zu einem Teil bereitstehenden Heuristiken vor.
 
Das automatisierte Verarbeiten und Bereitstellen von SVI stellt erhöhte Anforderungen an die von den Informationsspezialisten auszuführenden Tätigkeiten des Erschließens und Bewertens der für die Eingabe in die EDVA vorgesehenen Informationen. Die damit verbundenen Probleme (insbesondere der Mangel an intellektueller Bearbeitungskapazität) werden einer automatisierten Verarbeitung von SVI auch in Zukunft noch relativ enge Grenzen setzen. Es ist zweckmäßig,  die im Entstehen begriffenen technischen Möglichkeiten und die verfügbaren personellen Kapazitäten zunächst auf ausgewählte Informationsgebiete in besonders wichtigen Bereichen der Forschung bzw. auf oberen Ebenen der Forschungsleitung zu konzentrieren.
 
Mit der Einführung von Systemen des Typs FAS in die Informationsprozesse wird sich die Bedeutung der direkten Kommunikation zwischen Anwender (Informationsspezialist oder Nutzer) und EDVA beträchtlich erhöhen. In diesem Zusammenhang ist die breite Anwendung der Mikroelektronik in der Volkswirtschaft der DDR auch für die gesellschaftswissenschaftlichen Informationsprozesse von grundlegender Bedeutung.
Für die Perspektive wird eine Haupttendenz der Nutzung der Mikroelektronik im dezentralen Einsatz vielseitig nutzbarer „intelligenter“ Terminals bestehen. Ein Beispiel dafür sind die 1982 im VEB Kombinat Robotron in Serienproduktion gehenden  Bürocomputer  (Typen A 5120 und A 5130). Diese auf Mikrorechnerbasis arbeitenden Computer können für die Zwecke der GID als Datenerfassungsgerät (lateinisch-kyrillischer Zeichenvorrat) und, in Direktverbindung mit einem Zentralrechner, als Terminal mit Bildschirmgerät und Seriendrucker eingesetzt werden. 
Die im Computer verfügbare Speicherkapazität ermöglicht außerdem eine dezentralisierte automatisierte Bearbeitung von Informationsteilprozessen, z.B. Formulieren zulässiger Fragen an den Speicher eines FAS; Aufbau und Führung von Informationsrecherchesystemen im Rahmen von Systemen der Dokumenteninformation; statistische Auswertungen zentral gespeicherter Fonds u.a.m.

 
 
Verwendete Abkürzungen
EC kyrillische Abkürzung für „Einheitliches System elektronischer Rechentechnik“
EDVA Elektronische Datenverarbeitungsanlage
FAS Frage-Antwort-System
GID Gesellschaftswissenschaftliche Information und Dokumentation
SVI Sachverhaltsinformation
VEB Volkseigener Betrieb
WMZ WMZ Wissenschaftlich-methodisches Zentrum



 
Literatur
/1/ Das Frage-Antwort-System „FAS-75“: Wissenschaftlicher Informationsbericht / VEB Robotron Zentrum für Forschung und Technik; Böttger, H.; Helbig, H.; Zänker, F. u.a. – Dresden 1978. – 110 Seiten
   


Der obige Text ist Teil eines Vortrages über „Einige Fragen der Perspektive der automatisierten Verarbeitung gesellschaftswissenschaftlicher Informationen“, gehalten auf der 1. Weiterbildungsveranstaltung des Wissenschaftlich- Methodischen Zentrums für gesellschaftswissenschaftliche Information und Dokumentation  in Bad Stuer, 30. November bis 3. Dezember 1981

 
 

Bearbeitung für die Aufnahme ins Internet:
September 2005
Mai 2009


Zum Beitrag FAS-Konzept

Zum Themenkomplex Informationswissenschaft

Zur Willkommenseite