ai

1.面试问题 #

请您详细阐述什么是RAG（检索增强生成）中的Embedding（嵌入）技术？它的核心原理、作用以及在RAG工作流程中的重要性。

Embedding（嵌入） 是RAG（检索增强生成）系统中的一项核心技术。它指的是将文本、图像、音频、视频等各种形式的信息，映射到高维向量空间中的密集向量（一串数字） 的过程。这些向量在语义空间中充当信息的"坐标"，能够捕捉对象之间的语义关系和隐含意义。

核心价值：

每个Embedding向量就像文本的"数字指纹"，它包含了该文本的语义信息。例如，在向量空间中，"猫"和"狗"的向量会非常接近，而"开心"和"悲伤"的向量则会相距较远。

工作原理：

向量化：用户查询（如"what's happening in the news today?"）首先通过一个Embedding模型被转换成一个查询向量（Query Vector）
语义空间：这个查询向量位于一个高维的搜索空间中，该空间预先存储了所有经过Embedding处理的现有信息源的向量
相似度计算：系统随后会在这个向量空间中进行数学计算（例如余弦相似度），来衡量查询向量与知识库中所有文档块向量之间的相似度
相关性判断：相似度越高，表示两段信息在语义上越相关

Embedding在RAG系统中扮演着承上启下的关键角色，是实现"检索"功能的基础。

传统的关键词检索依赖于精确的词汇匹配，存在以下问题：

Embedding通过将文本映射到语义空间，使得这些问题迎刃而解。

知识库构建阶段：
- 原始文档经过分块（Chunking） 处理后，每个文本块都会被送入Embedding模型生成对应的Embedding向量
- 这些Embedding向量随后被存储到向量数据库（如FAISS） 中，形成一个可供高效检索的知识索引
检索生成阶段：
- 当用户提出问题时，用户查询同样会通过Embedding模型生成一个查询向量
- 系统利用这个查询向量，在向量数据库中进行相似度搜索，快速找出与用户查询语义最相关的文本块
- 这些检索到的相关文本块将作为上下文，与用户原始问题一同提供给大语言模型（LLM），引导LLM生成准确、可靠的回答

在RAG中，有多种Embedding模型可供选择：

选择合适的Embedding模型对RAG系统的检索效果至关重要。

在回答此类问题时，建议：

这样的回答既展现了技术深度，又体现了对实际应用的理解，能够给面试官留下良好印象。