类 TikaShell

java.lang.Object
cn.toutatis.xvoid.axolotl.toolkit.tika.TikaShell

public class TikaShell extends Object
Tika 工具壳
作者:
Toutatis_Gc
  • 字段概要

    字段
    修饰符和类型
    字段
    说明
    static final org.apache.tika.mime.MimeType
    MS_EXCEL Excel 97-2003文件版本 application/vnd.ms-excel 后缀为[.xls]
    static final org.apache.tika.mime.MimeType
    OOXML_EXCEL Excel 2007及以上版本 application/vnd.openxmlformats-officedocument.spreadsheetml.sheet 后缀为[.xlsx]
  • 构造器概要

    构造器
    构造器
    说明
     
  • 方法概要

    修饰符和类型
    方法
    说明
    detect(File file, org.apache.tika.mime.MimeType mimeType)
     
    detect(File file, org.apache.tika.mime.MimeType mimeType, boolean alreadyPreCheck)
     
    detect(File file, org.apache.tika.mime.MimeType wantedMimeType, boolean throwException, boolean alreadyPreCheck)
    判断文件是否正常并且为需要的格式 1.文件预检查 2.文件后缀是否匹配 3.文件媒体类型是否匹配
    detect(InputStream ins, org.apache.tika.mime.MimeType wantedMimeType, boolean throwException)
    判断文件是否正常并且为需要的格式 流的情况较为特殊,由于流获取内容仅为字节,在获取文件类型时仅能获取较为特殊的几种类型,因此需要进行额外的判断 Excel文件本身为ZIP压缩类型,其中有特殊的标志文件可以进行判断,其余特殊类型请自行实现判断或提交PR进行类型补充
    detectThrowException(File file, org.apache.tika.mime.MimeType mimeType)
     
    static org.apache.tika.mime.MimeType
    获取文件类型
    预检查文件是否正常
    preCheckFileNormal(File file, boolean throwException)
    预检查文件是否正常
    预检查文件是否正常并抛出异常

    从类继承的方法 java.lang.Object

    clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
  • 字段详细资料

    • MS_EXCEL

      public static final org.apache.tika.mime.MimeType MS_EXCEL
      MS_EXCEL Excel 97-2003文件版本 application/vnd.ms-excel 后缀为[.xls]
    • OOXML_EXCEL

      public static final org.apache.tika.mime.MimeType OOXML_EXCEL
      OOXML_EXCEL Excel 2007及以上版本 application/vnd.openxmlformats-officedocument.spreadsheetml.sheet 后缀为[.xlsx]
  • 构造器详细资料

    • TikaShell

      public TikaShell()
  • 方法详细资料

    • detect

      public static DetectResult detect(File file, org.apache.tika.mime.MimeType mimeType)
    • detect

      public static DetectResult detect(File file, org.apache.tika.mime.MimeType mimeType, boolean alreadyPreCheck)
    • detectThrowException

      public static DetectResult detectThrowException(File file, org.apache.tika.mime.MimeType mimeType)
    • detect

      public static DetectResult detect(File file, org.apache.tika.mime.MimeType wantedMimeType, boolean throwException, boolean alreadyPreCheck)
      判断文件是否正常并且为需要的格式 1.文件预检查 2.文件后缀是否匹配 3.文件媒体类型是否匹配
      参数:
      file - 文件
      wantedMimeType - 想要匹配的MIME类型
      throwException - 是否抛出异常
      alreadyPreCheck - 文件是否已通过预检查
      返回:
      检测结果
    • detect

      public static DetectResult detect(InputStream ins, org.apache.tika.mime.MimeType wantedMimeType, boolean throwException)
      判断文件是否正常并且为需要的格式 流的情况较为特殊,由于流获取内容仅为字节,在获取文件类型时仅能获取较为特殊的几种类型,因此需要进行额外的判断 Excel文件本身为ZIP压缩类型,其中有特殊的标志文件可以进行判断,其余特殊类型请自行实现判断或提交PR进行类型补充
      参数:
      ins - 文件流
      wantedMimeType - 想要匹配的MIME类型
      throwException - 是否抛出异常
      返回:
      检测结果
    • getMimeType

      public static org.apache.tika.mime.MimeType getMimeType(File file)
      获取文件类型
      参数:
      file - 文件
      返回:
      MIME类型
    • preCheckFileNormalThrowException

      public static DetectResult preCheckFileNormalThrowException(File file)
      预检查文件是否正常并抛出异常
      参数:
      file - 文件
      返回:
      检测结果
    • preCheckFileNormal

      public static DetectResult preCheckFileNormal(File file)
      预检查文件是否正常
      参数:
      file - 文件
      返回:
      检测结果
    • preCheckFileNormal

      public static DetectResult preCheckFileNormal(File file, boolean throwException)
      预检查文件是否正常
      参数:
      file - 文件
      throwException - 是否抛出异常
      返回:
      检测结果