enbedding model归档 - itaiit‘s site

Spring 对于Embedding模型的API支持

ref-nobody 创建时间 2025年5月4日 | 本文最后更新于 2025年5月4日 No Comments

嵌入（Embeddings）是将文本、图像或视频转化为数值表征的技术，这些数值能够捕捉输入数据之间的关联性。其核心原理是将文本、图像及视频转换为浮点数数组（即向量）。这些向量经过特殊设计，能够准确反映原始数据的语义特征。嵌入数组的长度被称为向量的维度。通过计算两个文本向量表征之间的数值距离，应用程序可以判定原始对象之间的相似度。这种基于向量距离的相似性度量，为语义检索等应用场景提供了数学基础。 EmbeddingModel接口专为AI和机器学习领域的嵌入模型集成而设计，主要功能是将文本转换为数值向量（即嵌入表征）。这些嵌入向量在语义分析、文本分类等任务中具有关键作用。该接口的设计聚焦两大核心目标：

检索增强生成（RAG）

ref-nobody 创建时间 2025年4月30日 | 本文最后更新于 2025年4月30日 No Comments

检索增强生成（Retrieval Augmented Generation，RAG）是一种有助于克服大型语言模型在处理长篇内容、事实准确性以及上下文感知方面所面临限制的技术。 Spring AI 通过提供一种模块化架构来支持 RAG，这种架构允许你自行构建定制的 RAG 流程，或者使用通过Advisor API 提供的现成 RAG 流程。 Advisors Spring…

向量数据库

ref-nobody 创建时间 2025年4月30日 | 本文最后更新于 2025年4月30日 No Comments

代码已上传至github仓库：https://github.com/itaiit/spring-ai-learn 向量数据库是一种专门类型的数据库，在人工智能应用中发挥着关键作用。在向量数据库中，查询与传统关系型数据库有所不同。它们不是寻找精确匹配，而是执行相似性搜索。当给出一个向量作为查询时，向量数据库会返回与查询向量“相似”的向量。向量数据库用于将您的数据与人工智能模型集成。使用它们的第一步是将您的数据加载到向量数据库中。然后，当要将用户查询发送给人工智能模型时，会先检索一组相似的文档。这些文档随后作为用户问题的上下文，并与用户的查询一起发送给人工智能模型。这种技术被称为检索增强生成（Retrieval Augmented Generation，RAG）。要将数据插入向量数据库，需将其封装在一个 Document 对象内。Document 类封装了来自数据源（如 PDF 或 Word 文档）的内容，并包含以字符串形式表示的文本。它还包含以键值对形式呈现的元数据，包括诸如文件名等详细信息。当插入向量数据库时，文本内容会通过嵌入模型转换为数值数组，即浮点数数组（float），这被称为向量嵌入（vector…

enbedding model

Spring 对于Embedding模型的API支持

检索增强生成（RAG）

向量数据库

You Missed

Spring Websocket配置流程分析

自定义Security认证流程

Virtual Thread（jdk21，JEP444，翻译）

Spring Boot对于aop的解析