Elexis API documentation
Version 2.1.6 as of December 11 2011

eaustria.dame.modell.extrahierung
Interface Extrahierungsstrategie

All Known Implementing Classes:
CDAExtrahierung, EdifactExtrahierung, HL7Textbefundextrahierung, PDFExtrahierung, Scheinextrahierungsstrategie, Textextrahierung

public interface Extrahierungsstrategie

Schnittstelle zum unabhängigen Extrahieren von Daten aus DAME-Dokumenten. Jede Extrahierungsstrategie unterstützt ein konkretes Format eines DAME-Dokuments und liefert sowohl Metadaten also auch Inhalt in einem bestimmten Format.

Author:
leo

Method Summary
 void extrahieren()
          Führt die Extrahierung durch.
 ExtrahierteNachricht getNachricht()
          Liefert die erste extrahierte Nachricht oder null, wenn keine Nachrichten vorhanden sind.
 java.util.List<ExtrahierteNachricht> getNachrichten()
          Liefert extrahierte Nachrichten.
 java.io.InputStream getRestdaten()
          Liefert den Datenstrom des restlichen Dokuments oder null, wenn das gesamte Dokument verarbeitet wurde.
 void setDokumentdaten(java.io.InputStream ein)
          Setzt den Eingabedatenstrom, der dieses Dokument ausmacht.
 void setNachrichtenprototyp(ExtrahierteNachricht prototyp)
          Setzt einen Prototypen, der bereits mit Metadaten aus einer vorher angewandten Strategie intialisiert ist.
 void setNurMetadatenExtrahieren(boolean s)
          Extrahiert nur Metadaten, keine Inhalte.
 

Method Detail

setDokumentdaten

void setDokumentdaten(java.io.InputStream ein)
Setzt den Eingabedatenstrom, der dieses Dokument ausmacht.


setNachrichtenprototyp

void setNachrichtenprototyp(ExtrahierteNachricht prototyp)
Setzt einen Prototypen, der bereits mit Metadaten aus einer vorher angewandten Strategie intialisiert ist. Diese Nachricht wird als erste Nachricht für diese Strategie verwendet. Den Prototypen benötigt man, wenn eine Dokument eingebettet ein anderes Dokument enthält, die Metadaten aber im äußeren Dokument zu finden sind.


setNurMetadatenExtrahieren

void setNurMetadatenExtrahieren(boolean s)
Extrahiert nur Metadaten, keine Inhalte.

Parameters:
s - true, wenn nur Metadaten extrahiert werden sollen. ExtrahierteNachricht.getInhaltAlsHtml und ExtrahierteNachricht.getInhalt liefern in diesem Fall immer null.

extrahieren

void extrahieren()
                 throws java.io.IOException
Führt die Extrahierung durch. Siehe getRestdaten(), um nicht extrahierte Dokumentbestandteile zu erhalten.

Throws:
java.io.IOException

getNachrichten

java.util.List<ExtrahierteNachricht> getNachrichten()
Liefert extrahierte Nachrichten. Auch bei einem Fehler wurde zumindest die erste Nachricht teilweise extrahiert.


getNachricht

ExtrahierteNachricht getNachricht()
Liefert die erste extrahierte Nachricht oder null, wenn keine Nachrichten vorhanden sind.


getRestdaten

java.io.InputStream getRestdaten()
Liefert den Datenstrom des restlichen Dokuments oder null, wenn das gesamte Dokument verarbeitet wurde. Normalerweise bleibt nur dann ein Datenstrom übrig, wenn ein Dokument ein eingebettetes Dokument enthielt. Der gelieferte Datenstrom zeigt auf den Anfang dieser eingebetteten Daten.


Elexis API documentation
Version 2.1.6 as of December 11 2011

Copyright 2005-2011 by Gerry Weirich, Elexis