ai

1. 面试题目 #

请详细阐述什么是Re-Reading（重读）技术？它在大型语言模型（LLM）中扮演什么角色？请分析其核心原理、优缺点，并结合Spring AI框架，说明如何通过自定义Advisor实现Re-Reading功能，包括具体的接口选择和提示词改写策略。

2. 参考答案 #

2.1 Re-Reading（重读）技术的核心概念 #

Re-Reading（重读），也称为Re2，是一种旨在提高大型语言模型（LLM）推理能力的技术。其核心思想是通过引导LLM对用户提出的问题进行重新阅读和审视，从而更深入地理解问题意图和约束，最终生成更准确、更深入的回答。

2.2 Re-Reading在LLM中的作用与价值 #

2.2.1 核心原理 #

对于复杂或模糊的问题，LLM在首次阅读时可能无法完全捕捉所有细节或潜在的逻辑关系。Re-Reading机制通过重复输入和明确指令，促使模型进行二次甚至多次的"思考"和"理解"，从而激活更深层次的推理能力。这类似于人类在面对难题时会反复阅读题目以确保理解无误。

2.2.2 优点 #

提高回答准确性： 帮助模型更全面地理解问题，减少误解，生成更精确的答案。
增强回答深度： 促使模型进行更细致的推理，提供更深入、更全面的信息。
适用于复杂问题： 对于需要多步推理、包含多重约束或表述不清晰的问题尤其有效。

2.2.3 缺点 #

成本增加： 由于需要重复处理输入，会导致模型推理的计算成本（如Token消耗）加倍。因此，在面向C端用户或对成本敏感的应用中，需要谨慎使用。

2.3 基于Spring AI实现Re-Reading Advisor #

在Spring AI框架中，可以通过自定义Advisor来实现Re-Reading功能。Advisor在Spring AI中扮演着类似AOP（面向切面编程）中切面的角色，允许在AI调用前后插入自定义逻辑。

2.3.1 实现步骤 #

1. 创建自定义Advisor类： 自定义的Advisor类需要实现Spring AI提供的核心接口，以支持同步和流式请求的拦截。

对于同步请求，需要实现CallAroundAdvisor接口。
对于流式请求，需要实现StreamAroundAdvisor接口。通过同时实现这两个接口，可以确保自定义的Re-Reading逻辑能够通用地应用于不同类型的AI调用。

注意： 在Spring AI 1.0版本中，对应的接口是CallAdvisor和StreamAdvisor，但在后续版本中已更新为CallAroundAdvisor和StreamAroundAdvisor以提供更灵活的环绕通知能力。

2. 修改用户提示词（Prompt）：在自定义Advisor的前置处理逻辑中（例如，在aroundCall或aroundStream方法调用AI模型之前），对用户的原始输入文本进行改写。改写的目的是通过明确的指令引导模型重新阅读问题。

示例提示词改写格式： 通常，改写的格式会将原始输入重复一遍，并添加一个明确的指令，例如：

{Input_Query}
Read the question again: {Input_Query}

其中，{Input_Query}代表用户原始的提问内容。这种方式直观地告诉模型："这是问题，请你再读一遍这个问题。"

3. 传递改写后的提示词给模型： 将经过Advisor改写后的提示词传递给大型语言模型进行处理。模型接收到这个包含重复指令的提示词后，会根据其内部机制进行更深入的理解和推理，从而生成最终的答案。

2.4 具体代码实现 #

2.4.1 自定义Re-Reading Advisor #

@Component
public class ReReadingAdvisor implements CallAroundAdvisor, StreamAroundAdvisor {

    private static final String RE_READING_PROMPT_TEMPLATE = 
        "{originalQuery}\n\n" +
        "Please read the question again carefully: {originalQuery}\n" +
        "Think step by step and provide a comprehensive answer.";

    @Override
    public ChatResponse aroundCall(CallAroundAdvisor.CallAroundAdvisorInput input, 
                                 CallAroundAdvisor.CallAroundAdvisorChain chain) {

        // 前置处理：修改提示词
        String originalQuery = input.getRequest().getInstructions();
        String enhancedPrompt = RE_READING_PROMPT_TEMPLATE
            .replace("{originalQuery}", originalQuery);

        // 创建新的请求
        ChatRequest enhancedRequest = ChatRequest.builder()
            .withInstructions(enhancedPrompt)
            .withModel(input.getRequest().getModel())
            .withTemperature(input.getRequest().getTemperature())
            .build();

        // 调用链继续执行
        return chain.next(CallAroundAdvisor.CallAroundAdvisorInput.builder()
            .withRequest(enhancedRequest)
            .build());
    }

    @Override
    public Flux<ChatResponse> aroundStream(StreamAroundAdvisor.StreamAroundAdvisorInput input,
                                         StreamAroundAdvisor.StreamAroundAdvisorChain chain) {

        // 前置处理：修改提示词
        String originalQuery = input.getRequest().getInstructions();
        String enhancedPrompt = RE_READING_PROMPT_TEMPLATE
            .replace("{originalQuery}", originalQuery);

        // 创建新的请求
        ChatRequest enhancedRequest = ChatRequest.builder()
            .withInstructions(enhancedPrompt)
            .withModel(input.getRequest().getModel())
            .withTemperature(input.getRequest().getTemperature())
            .build();

        // 调用链继续执行
        return chain.next(StreamAroundAdvisor.StreamAroundAdvisorInput.builder()
            .withRequest(enhancedRequest)
            .build());
    }
}

2.4.2 配置和使用Re-Reading Advisor #

@Configuration
public class ReReadingConfig {

    @Bean
    public ChatClient chatClient(OpenAiChatModel chatModel, 
                               ReReadingAdvisor reReadingAdvisor) {
        return ChatClient.builder(chatModel)
            .withAdvisors(reReadingAdvisor)  // 注册Re-Reading Advisor
            .build();
    }
}

2.4.3 服务层使用示例 #

@Service
public class ReReadingService {

    @Autowired
    private ChatClient chatClient;

    public String processComplexQuery(String userQuery) {
        // 使用配置了Re-Reading Advisor的ChatClient
        return chatClient.prompt()
            .user(userQuery)
            .call()
            .content();
    }

    // 流式处理
    public Flux<String> processComplexQueryStream(String userQuery) {
        return chatClient.prompt()
            .user(userQuery)
            .stream()
            .content();
    }
}

2.5 高级Re-Reading策略 #

2.5.1 条件性Re-Reading #

@Component
public class ConditionalReReadingAdvisor implements CallAroundAdvisor {

    @Override
    public ChatResponse aroundCall(CallAroundAdvisor.CallAroundAdvisorInput input,
                                 CallAroundAdvisor.CallAroundAdvisorChain chain) {

        String originalQuery = input.getRequest().getInstructions();

        // 根据查询复杂度决定是否启用Re-Reading
        if (shouldApplyReReading(originalQuery)) {
            String enhancedPrompt = createReReadingPrompt(originalQuery);

            ChatRequest enhancedRequest = ChatRequest.builder()
                .withInstructions(enhancedPrompt)
                .withModel(input.getRequest().getModel())
                .withTemperature(input.getRequest().getTemperature())
                .build();

            return chain.next(CallAroundAdvisor.CallAroundAdvisorInput.builder()
                .withRequest(enhancedRequest)
                .build());
        }

        // 简单查询直接处理
        return chain.next(input);
    }

    private boolean shouldApplyReReading(String query) {
        // 基于查询长度、关键词等判断是否需要Re-Reading
        return query.length() > 100 || 
               query.contains("复杂") || 
               query.contains("详细") ||
               query.contains("分析");
    }

    private String createReReadingPrompt(String originalQuery) {
        return String.format("""
            原始问题：%s

            请仔细重新阅读上述问题，并按照以下步骤进行思考：
            1. 理解问题的核心要求
            2. 识别问题中的关键信息
            3. 分析问题的隐含约束
            4. 提供全面、准确的回答

            重新阅读后的问题：%s
            """, originalQuery, originalQuery);
    }
}

2.5.2 多轮Re-Reading #

@Component
public class MultiRoundReReadingAdvisor implements CallAroundAdvisor {

    private static final int MAX_RE_READING_ROUNDS = 3;

    @Override
    public ChatResponse aroundCall(CallAroundAdvisor.CallAroundAdvisorInput input,
                                 CallAroundAdvisor.CallAroundAdvisorChain chain) {

        String originalQuery = input.getRequest().getInstructions();
        StringBuilder enhancedPrompt = new StringBuilder();

        // 构建多轮重读提示词
        for (int i = 1; i <= MAX_RE_READING_ROUNDS; i++) {
            enhancedPrompt.append(String.format("第%d次阅读：%s\n", i, originalQuery));
        }

        enhancedPrompt.append("\n请基于以上多次阅读，提供最准确、最全面的回答。");

        ChatRequest enhancedRequest = ChatRequest.builder()
            .withInstructions(enhancedPrompt.toString())
            .withModel(input.getRequest().getModel())
            .withTemperature(input.getRequest().getTemperature())
            .build();

        return chain.next(CallAroundAdvisor.CallAroundAdvisorInput.builder()
            .withRequest(enhancedRequest)
            .build());
    }
}

2.6 性能优化与成本控制 #

2.6.1 智能启用策略 #

@Component
public class SmartReReadingAdvisor implements CallAroundAdvisor {

    @Value("${ai.re-reading.enabled:true}")
    private boolean reReadingEnabled;

    @Value("${ai.re-reading.complexity-threshold:0.7}")
    private double complexityThreshold;

    @Override
    public ChatResponse aroundCall(CallAroundAdvisor.CallAroundAdvisorInput input,
                                 CallAroundAdvisor.CallAroundAdvisorChain chain) {

        if (!reReadingEnabled) {
            return chain.next(input);
        }

        String originalQuery = input.getRequest().getInstructions();
        double complexity = calculateQueryComplexity(originalQuery);

        if (complexity >= complexityThreshold) {
            return applyReReading(input, chain);
        }

        return chain.next(input);
    }

    private double calculateQueryComplexity(String query) {
        // 基于查询长度、关键词密度、句子结构等计算复杂度
        double lengthScore = Math.min(query.length() / 200.0, 1.0);
        double keywordScore = calculateKeywordDensity(query);
        double structureScore = calculateStructuralComplexity(query);

        return (lengthScore + keywordScore + structureScore) / 3.0;
    }

    private double calculateKeywordDensity(String query) {
        String[] complexKeywords = {"分析", "比较", "解释", "为什么", "如何", "详细"};
        long keywordCount = Arrays.stream(complexKeywords)
            .mapToLong(keyword -> query.split(keyword).length - 1)
            .sum();

        return Math.min(keywordCount / 3.0, 1.0);
    }

    private double calculateStructuralComplexity(String query) {
        // 基于句子数量、问号数量等计算结构复杂度
        int sentenceCount = query.split("[.!?]").length;
        int questionCount = query.split("\\?").length - 1;

        return Math.min((sentenceCount + questionCount) / 5.0, 1.0);
    }
}

2.7 实际应用场景 #

2.7.1 复杂问题解答 #

// 适用于需要深度分析的问题
public class ComplexQuestionService {

    @Autowired
    private ChatClient chatClient; // 已配置Re-Reading Advisor

    public String answerComplexQuestion(String question) {
        return chatClient.prompt()
            .user(question)
            .call()
            .content();
    }
}

2.7.2 代码审查和优化建议 #

// 适用于需要仔细分析的代码审查场景
public class CodeReviewService {

    public String reviewCode(String code) {
        String prompt = "请仔细审查以下代码，找出潜在问题并提供优化建议：\n" + code;

        return chatClient.prompt()
            .user(prompt)
            .call()
            .content();
    }
}

2.8 总结 #

Re-Reading技术通过引导LLM重新审视问题，能够显著提升复杂场景下的回答质量。在Spring AI框架中，通过自定义Advisor可以灵活地实现这一功能，同时结合智能启用策略和成本控制机制，可以在保证效果的同时控制计算成本。这种技术特别适用于需要深度分析、复杂推理或高精度回答的应用场景。