public class HttpCrawler
extends java.lang.Object
| 构造器和说明 |
|---|
HttpCrawler() |
| 限定符和类型 | 方法和说明 |
|---|---|
void |
close()
关闭爬取流
|
java.util.List<ProxyIP> |
getList()
获取代理ip链表
|
void |
proxyInit(java.lang.String proxyText)
代理初始化
|
void |
setDir(java.lang.String dir)
保存爬取网页发的文件夹
|
void |
setList(java.util.List<ProxyIP> list)
设置代理IP
|
void |
startCrawler(java.lang.String webURL,
int min,
int max)
开始爬取
|
public void proxyInit(java.lang.String proxyText)
throws java.lang.Exception
proxyText - 自定义代理ip文本java.lang.Exception - 代理错误public void startCrawler(java.lang.String webURL,
int min,
int max)
throws java.lang.Exception
webURL - 要爬取的网址max - 最长时间爬一次min - 最短时间爬一次java.lang.Exception - 爬取失败public void setDir(java.lang.String dir)
dir - 文件夹public void close()
public java.util.List<ProxyIP> getList()
public void setList(java.util.List<ProxyIP> list)
list - 代理IP链表Copyright © 2018. All Rights Reserved.