public class BinaryPDFParser extends AbstractBinaryReferenceParser
BinaryReferenceのコンテンツ解析Parser。 tikaのPDFParserを利用してPDFの解析を行う。
tika標準のPDF用ParserはJournalParserであるが、 内部で実行されるGrobidRESTParserはメタデータ情報を取得する目的のため、 Index生成用コンテンツ解析には不要。直接PDFParserを利用する。
| コンストラクタと説明 |
|---|
BinaryPDFParser() |
| 修飾子とタイプ | メソッドと説明 |
|---|---|
protected org.apache.tika.parser.Parser |
parserInstance() |
getCustomSupportTypes, getParser, getSupportTypes, parse