enbedding model

Spring 对于Embedding模型的API支持

ref-nobody 创建时间 2025年5月4日 | 本文最后更新于 2025年5月4日 No Comments

嵌入(Embeddings)是将文本、图像或视频转化为数值表征的技术,这些数值能够捕捉输入数据之间的关联性。 其核心原理是将文本、图像及视频转换为浮点数数组(即向量)。这些向量经过特殊设计,能够准确反映原始数据的语义特征。嵌入数组的长度被称为向量的维度。 通过计算两个文本向量表征之间的数值距离,应用程序可以判定原始对象之间的相似度。这种基于向量距离的相似性度量,为语义检索等应用场景提供了数学基础。 EmbeddingModel接口专为AI和机器学习领域的嵌入模型集成而设计,主要功能是将文本转换为数值向量(即嵌入表征)。这些嵌入向量在语义分析、文本分类等任务中具有关键作用。 该接口的设计聚焦两大核心目标:

Read More

检索增强生成(RAG)

ref-nobody 创建时间 2025年4月30日 | 本文最后更新于 2025年4月30日 No Comments

检索增强生成(Retrieval Augmented Generation,RAG)是一种有助于克服大型语言模型在处理长篇内容、事实准确性以及上下文感知方面所面临限制的技术。 Spring AI 通过提供一种模块化架构来支持 RAG,这种架构允许你自行构建定制的 RAG 流程,或者使用通过Advisor API 提供的现成 RAG 流程。 Advisors Spring…

Read More

向量数据库

ref-nobody 创建时间 2025年4月30日 | 本文最后更新于 2025年4月30日 No Comments

代码已上传至github仓库:https://github.com/itaiit/spring-ai-learn 向量数据库是一种专门类型的数据库,在人工智能应用中发挥着关键作用。 在向量数据库中,查询与传统关系型数据库有所不同。它们不是寻找精确匹配,而是执行相似性搜索。当给出一个向量作为查询时,向量数据库会返回与查询向量“相似”的向量。 向量数据库用于将您的数据与人工智能模型集成。使用它们的第一步是将您的数据加载到向量数据库中。然后,当要将用户查询发送给人工智能模型时,会先检索一组相似的文档。这些文档随后作为用户问题的上下文,并与用户的查询一起发送给人工智能模型。这种技术被称为检索增强生成(Retrieval Augmented Generation,RAG)。 要将数据插入向量数据库,需将其封装在一个 Document 对象内。Document 类封装了来自数据源(如 PDF 或 Word 文档)的内容,并包含以字符串形式表示的文本。它还包含以键值对形式呈现的元数据,包括诸如文件名等详细信息。 当插入向量数据库时,文本内容会通过嵌入模型转换为数值数组,即浮点数数组(float),这被称为向量嵌入(vector…

Read More