类 RecursiveCharacterTextSplitter
java.lang.Object
top.aoyudi.rag.impl.RecursiveCharacterTextSplitter
- 所有已实现的接口:
TextSplitter
递归字符文本分割器,按自然边界分割文本为指定大小的块
-
字段概要
字段修饰符和类型字段说明private final intprivate final intstatic final int默认块重叠(字符数)static final int默认块大小(字符数)默认分隔符列表(按优先级排序) -
构造器概要
构造器构造器说明使用默认参数创建文本分割器RecursiveCharacterTextSplitter(int chunkSize, int chunkOverlap, List<String> separators) 创建自定义参数的文本分割器 -
方法概要
修饰符和类型方法说明private StringfindSeparator(String text, List<String> separators) 查找文本中可用的最高优先级分隔符mergeSplits(List<String> splits, String separator) 合并分割结果并添加重叠splitDocument(Document document) 将文档分割成块将文本分割成块递归分割文本为指定大小的块splitTextWithMetadata(String text, Map<String, Object> metadata) 将带元数据的文本分割成块
-
字段详细资料
-
DEFAULT_CHUNK_SIZE
public static final int DEFAULT_CHUNK_SIZE默认块大小(字符数)- 另请参阅:
-
DEFAULT_CHUNK_OVERLAP
public static final int DEFAULT_CHUNK_OVERLAP默认块重叠(字符数)- 另请参阅:
-
DEFAULT_SEPARATORS
默认分隔符列表(按优先级排序) -
chunkSize
private final int chunkSize -
chunkOverlap
private final int chunkOverlap -
separators
-
-
构造器详细资料
-
RecursiveCharacterTextSplitter
public RecursiveCharacterTextSplitter()使用默认参数创建文本分割器 -
RecursiveCharacterTextSplitter
创建自定义参数的文本分割器
-
-
方法详细资料
-
splitDocument
从接口复制的说明:TextSplitter将文档分割成块- 指定者:
splitDocument在接口中TextSplitter- 参数:
document- 文档对象- 返回:
- 分割后的文档块列表
-
splitText
从接口复制的说明:TextSplitter将文本分割成块- 指定者:
splitText在接口中TextSplitter- 参数:
text- 文本内容- 返回:
- 分割后的文本块列表
-
splitTextWithMetadata
从接口复制的说明:TextSplitter将带元数据的文本分割成块- 指定者:
splitTextWithMetadata在接口中TextSplitter- 参数:
text- 文本内容metadata- 元数据- 返回:
- 分割后的文档块列表
-
splitText
private List<String> splitText(String text, int chunkSize, int chunkOverlap, List<String> separators) 递归分割文本为指定大小的块 -
findSeparator
查找文本中可用的最高优先级分隔符 -
mergeSplits
合并分割结果并添加重叠
-