public class BinaryXMLParser extends AbstractBinaryReferenceParser
BinaryReferenceのコンテンツ解析Parser。 tikaのXMLParserを利用してPDFの解析を行う。
tika標準のXML用ParserはDcXMLParserであるが、 メタデータ情報を取得する処理が含まれているため、Index生成用コンテンツ解析には不要。 直接XMLParserを利用する。
| コンストラクタと説明 |
|---|
BinaryXMLParser() |
| 修飾子とタイプ | メソッドと説明 |
|---|---|
protected java.util.Set<org.apache.tika.mime.MediaType> |
getCustomSupportTypes() |
protected org.apache.tika.parser.Parser |
parserInstance() |
getParser, getSupportTypes, parseprotected org.apache.tika.parser.Parser parserInstance()
protected java.util.Set<org.apache.tika.mime.MediaType> getCustomSupportTypes()
getCustomSupportTypes クラス内 AbstractBinaryReferenceParser