- saveTo(File) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- scan(String[], Class<? extends Annotation>...) - 类 中的方法cn.wanghaomiao.seimi.core.SeimiScanner
-
- ScanConfig - cn.wanghaomiao.seimi.core中的类
-
- ScanConfig() - 类 的构造器cn.wanghaomiao.seimi.core.ScanConfig
-
- Seimi - cn.wanghaomiao.seimi.core中的类
-
- Seimi() - 类 的构造器cn.wanghaomiao.seimi.core.Seimi
-
- seimiAgentHost() - 接口 中的方法cn.wanghaomiao.seimi.core.SeimiCrawler
-
设置SeimiAgent的主机地址,如 seimi.wanghaomiao.cn or 10.10.15.211
- seimiAgentHost() - 类 中的方法cn.wanghaomiao.seimi.def.BaseSeimiCrawler
-
- seimiAgentPort() - 接口 中的方法cn.wanghaomiao.seimi.core.SeimiCrawler
-
seimiAgent监听端口
- seimiAgentPort() - 类 中的方法cn.wanghaomiao.seimi.def.BaseSeimiCrawler
-
- SeimiBeanResolveException - cn.wanghaomiao.seimi.exception中的异常错误
-
- SeimiBeanResolveException(String) - 异常错误 的构造器cn.wanghaomiao.seimi.exception.SeimiBeanResolveException
-
- SeimiBeanResolver - cn.wanghaomiao.seimi.core中的类
-
根据Bean中字段定义的XPath路径自动提取数据
- SeimiBeanResolver() - 类 的构造器cn.wanghaomiao.seimi.core.SeimiBeanResolver
-
- SeimiContext - cn.wanghaomiao.seimi.core中的类
-
初始化上下文环境
- SeimiContext() - 类 的构造器cn.wanghaomiao.seimi.core.SeimiContext
-
- SeimiCrawler - cn.wanghaomiao.seimi.core中的接口
-
- SeimiHttpHandler - cn.wanghaomiao.seimi.httpd中的类
-
- SeimiHttpHandler(Map<String, CrawlerModel>) - 类 的构造器cn.wanghaomiao.seimi.httpd.SeimiHttpHandler
-
- SeimiInitExcepiton - cn.wanghaomiao.seimi.exception中的异常错误
-
启动初始化异常
- SeimiInitExcepiton(String) - 异常错误 的构造器cn.wanghaomiao.seimi.exception.SeimiInitExcepiton
-
- SeimiInterceptor - cn.wanghaomiao.seimi.core中的接口
-
爬虫执行方法的通用拦截器
- SeimiProcessExcepiton - cn.wanghaomiao.seimi.exception中的异常错误
-
运行处理异常
- SeimiProcessExcepiton(String) - 异常错误 的构造器cn.wanghaomiao.seimi.exception.SeimiProcessExcepiton
-
- SeimiProcessor - cn.wanghaomiao.seimi.core中的类
-
- SeimiProcessor(List<SeimiInterceptor>, CrawlerModel) - 类 的构造器cn.wanghaomiao.seimi.core.SeimiProcessor
-
- SeimiQueue - cn.wanghaomiao.seimi.core中的接口
-
定义系统队列的基本接口,可自由选择实现,只要符合规范就行。
- seimiQueue - 类 中的变量cn.wanghaomiao.seimi.httpd.HttpRequestProcessor
-
- SeimiRedirectStrategy - cn.wanghaomiao.seimi.http中的类
-
之所以要自行覆盖默认实现,是因为默认实现在post/redirect/post这种情况下不会传递原有请求的数据信息,只会传递一个uri其他的都丢了,
这显然是非常不理想的,所以必须重写覆盖。
- SeimiRedirectStrategy() - 类 的构造器cn.wanghaomiao.seimi.http.SeimiRedirectStrategy
-
- seimiScanner - 类 中的变量cn.wanghaomiao.seimi.core.SeimiContext
-
- SeimiScanner - cn.wanghaomiao.seimi.core中的类
-
上下文加载器
- SeimiScanner(AnnotationConfigApplicationContext) - 类 的构造器cn.wanghaomiao.seimi.core.SeimiScanner
-
- setBodyType(BodyType) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setCallBack(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setCharset(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setClazz(Class<? extends BaseSeimiCrawler>) - 类 中的方法cn.wanghaomiao.seimi.struct.CrawlerModel
-
- setContent(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setContext(ApplicationContext) - 类 中的方法cn.wanghaomiao.seimi.struct.CrawlerModel
-
- setCrawlerName(String) - 类 中的方法cn.wanghaomiao.seimi.def.BaseSeimiCrawler
-
- setCrawlerName(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setCurrentReqCount(int) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setData(byte[]) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setHost(String) - 类 中的方法cn.wanghaomiao.seimi.def.DefaultRedisQueue
-
- setHttpMethod(HttpMethod) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setHttpResponse(HttpResponse) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setInstance(BaseSeimiCrawler) - 类 中的方法cn.wanghaomiao.seimi.struct.CrawlerModel
-
- setMaxReqCount(int) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setMemberMethods(Map<String, Method>) - 类 中的方法cn.wanghaomiao.seimi.struct.CrawlerModel
-
- setMeta(Map<String, String>) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setMeta(Map<String, String>) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setParams(Map<String, String>) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setParams(Map<String, String>) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setPassword(String) - 类 中的方法cn.wanghaomiao.seimi.def.DefaultRedisQueue
-
- setPort(int) - 类 中的方法cn.wanghaomiao.seimi.def.DefaultRedisQueue
-
- setQueue(SeimiQueue) - 类 中的方法cn.wanghaomiao.seimi.def.BaseSeimiCrawler
-
- setqueueClass(Class<? extends SeimiQueue>) - 类 中的方法cn.wanghaomiao.seimi.struct.CrawlerModel
-
- setqueueImpl(SeimiQueue) - 类 中的方法cn.wanghaomiao.seimi.struct.CrawlerModel
-
- setQuueNamePrefix(String) - 类 中的方法cn.wanghaomiao.seimi.def.DefaultRedisQueue
-
- setRealUrl(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setReferer(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setReponseEntity(HttpEntity) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setRequest(Request) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- setSeimiAgentRenderTime(long) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setSeimiAgentScript(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setSeimiAgentUseCookie(Boolean) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setSkipDuplicateFilter(boolean) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setStop(boolean) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setUrl(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Request
-
- setUrl(String) - 类 中的方法cn.wanghaomiao.seimi.struct.Response
-
- start(String...) - 类 中的方法cn.wanghaomiao.seimi.core.Seimi
-
主启动
start master
- start(Response) - 接口 中的方法cn.wanghaomiao.seimi.core.SeimiCrawler
-
针对startUrl生成首批的response回调这个初始接口
- startAll() - 类 中的方法cn.wanghaomiao.seimi.core.Seimi
-
- startAllWorkersWithHttpd(int) - 类 中的方法cn.wanghaomiao.seimi.core.Seimi
-
- startUrls() - 接口 中的方法cn.wanghaomiao.seimi.core.SeimiCrawler
-
设置起始url
- startWithHttpd(int, String...) - 类 中的方法cn.wanghaomiao.seimi.core.Seimi
-
按名称启动爬虫并开启http服务接口API
- startWorkers() - 类 中的方法cn.wanghaomiao.seimi.core.Seimi
-
- StrFormatUtil - cn.wanghaomiao.seimi.utils中的类
-
- StrFormatUtil() - 类 的构造器cn.wanghaomiao.seimi.utils.StrFormatUtil
-
- StructValidator - cn.wanghaomiao.seimi.utils中的类
-
- StructValidator() - 类 的构造器cn.wanghaomiao.seimi.utils.StructValidator
-