类 DocumentEmbeddingGenerator
java.lang.Object
top.aoyudi.rag.impl.DocumentEmbeddingGenerator
- 所有已实现的接口:
EmbeddingGenerator
-
字段概要
字段 -
构造器概要
构造器 -
方法概要
修饰符和类型方法说明float[]将文本转换为向量表示private float[]generateEmbedding(List<String> words) 基于词频和词汇表生成嵌入向量private voidnormalizeVector(float[] vector) 归一化向量preprocessText(String content) 文本预处理:分词、小写转换、过滤private voidupdateVocabulary(List<String> words) 更新词汇表,只保留高频词
-
字段详细资料
-
构造器详细资料
-
DocumentEmbeddingGenerator
public DocumentEmbeddingGenerator()
-
-
方法详细资料
-
generate
从接口复制的说明:EmbeddingGenerator将文本转换为向量表示- 指定者:
generate在接口中EmbeddingGenerator- 参数:
content- 输入文本- 返回:
- 向量数组
-
preprocessText
文本预处理:分词、小写转换、过滤 -
updateVocabulary
更新词汇表,只保留高频词 -
generateEmbedding
基于词频和词汇表生成嵌入向量 -
normalizeVector
private void normalizeVector(float[] vector) 归一化向量
-