|
Elexis API documentationVersion 2.1.6 as of December 11 2011 | |||||||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |
java.lang.Objecteaustria.dame.modell.extrahierung.Textextrahierung
public class Textextrahierung
Extrahiert reinen Text. Dieser Extrahierer sollte erst ziemlich am Schluss aufgerufen werden, da er jedes Textformat akzeptiert.
Constructor Summary | |
---|---|
Textextrahierung()
|
Method Summary | |
---|---|
void |
extrahieren()
Führt die Extrahierung durch. |
ExtrahierteNachricht |
getNachricht()
Liefert die erste extrahierte Nachricht oder null , wenn
keine Nachrichten vorhanden sind. |
java.util.List<ExtrahierteNachricht> |
getNachrichten()
Liefert extrahierte Nachrichten. |
java.io.InputStream |
getRestdaten()
Liefert den Datenstrom des restlichen Dokuments oder null ,
wenn das gesamte Dokument verarbeitet wurde. |
static boolean |
könntePassen(byte[] inhalt)
Prüft anhand einer Stichprobe des Inhalts, ob es sich um eine Textdatei handeln könnte. |
void |
setDokumentdaten(java.io.InputStream ein)
Setzt den Eingabedatenstrom, der dieses Dokument ausmacht. |
void |
setNachrichtenprototyp(ExtrahierteNachricht prototyp)
Setzt einen Prototypen, der bereits mit Metadaten aus einer vorher angewandten Strategie intialisiert ist. |
void |
setNurMetadatenExtrahieren(boolean s)
Extrahiert nur Metadaten, keine Inhalte. |
Methods inherited from class java.lang.Object |
---|
equals, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
Constructor Detail |
---|
public Textextrahierung()
Method Detail |
---|
public static boolean könntePassen(byte[] inhalt)
inhalt
-
public void extrahieren() throws java.io.IOException
Extrahierungsstrategie
Extrahierungsstrategie.getRestdaten()
, um nicht extrahierte Dokumentbestandteile
zu erhalten.
java.io.IOException
public void setDokumentdaten(java.io.InputStream ein)
Extrahierungsstrategie
setDokumentdaten
in interface Extrahierungsstrategie
public void setNachrichtenprototyp(ExtrahierteNachricht prototyp)
Extrahierungsstrategie
setNachrichtenprototyp
in interface Extrahierungsstrategie
public void setNurMetadatenExtrahieren(boolean s)
Extrahierungsstrategie
setNurMetadatenExtrahieren
in interface Extrahierungsstrategie
s
- true
, wenn nur Metadaten extrahiert werden sollen.
ExtrahierteNachricht.getInhaltAlsHtml und ExtrahierteNachricht.getInhalt
liefern in diesem Fall immer null
.public java.util.List<ExtrahierteNachricht> getNachrichten()
Extrahierungsstrategie
getNachrichten
in interface Extrahierungsstrategie
public ExtrahierteNachricht getNachricht()
Extrahierungsstrategie
null
, wenn
keine Nachrichten vorhanden sind.
getNachricht
in interface Extrahierungsstrategie
public java.io.InputStream getRestdaten()
Extrahierungsstrategie
null
,
wenn das gesamte Dokument verarbeitet wurde.
Normalerweise bleibt nur dann ein Datenstrom übrig, wenn ein Dokument
ein eingebettetes Dokument enthielt. Der gelieferte Datenstrom zeigt
auf den Anfang dieser eingebetteten Daten.
getRestdaten
in interface Extrahierungsstrategie
|
Elexis API documentationVersion 2.1.6 as of December 11 2011 | |||||||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |