Spring AI集成Ollama与DeepSeek：构建企业级AI应用的完整指南

作者：很菜不狗2025.09.17 18:38浏览量：1

简介：本文详细阐述如何通过Spring AI框架集成Ollama本地模型服务与DeepSeek大模型，实现企业级AI应用开发。内容涵盖环境配置、核心接口调用、性能优化及典型场景实践，为开发者提供全流程技术指导。

一、技术架构与核心优势

Spring AI作为Spring生态的AI扩展框架，通过标准化接口设计实现了对多种AI服务（包括本地模型与云端大模型）的统一调用。Ollama作为开源本地模型运行环境，支持DeepSeek等主流模型的无缝部署，形成”本地计算+云端能力”的混合架构。这种组合既保证了数据隐私性，又通过DeepSeek的先进算法提升了模型质量。

1.1 架构设计要点

分层解耦：Spring AI作为抽象层隔离底层AI服务细节
动态路由：支持根据请求特征自动选择Ollama或DeepSeek
异步处理：通过Spring Reactive实现高并发场景下的非阻塞调用

典型调用链：

Spring MVC Controller 
→ Spring AI Service Layer 
→ (条件判断) Ollama Client / DeepSeek HTTP Client 
→ 响应聚合与格式化

二、环境准备与依赖管理

2.1 开发环境配置

Ollama安装：

curl -fsSL https://ollama.ai/install.sh | sh
ollama pull deepseek-r1:7b  # 以7B参数模型为例

Spring Boot项目初始化：

<!-- pom.xml 关键依赖 -->
<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter</artifactId>
    <version>0.8.0</version>
</dependency>
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-webflux</artifactId>
</dependency>

2.2 模型服务配置

创建application.yml配置：

spring:
  ai:
    providers:
      ollama:
        base-url: http://localhost:11434
        model: deepseek-r1:7b
      deepseek:
        api-key: ${DEEPSEEK_API_KEY}
        base-url: https://api.deepseek.com
        model: deepseek-chat

三、核心实现方案

3.1 双模型服务封装

@Configuration
public class AiProviderConfig {
    @Bean
    public OllamaChatClient ollamaClient() {
        OllamaChatClient client = new OllamaChatClient();
        client.setBaseUrl("http://localhost:11434");
        return client;
    }
    @Bean
    public DeepSeekClient deepSeekClient(
            @Value("${spring.ai.providers.deepseek.api-key}") String apiKey) {
        return new DeepSeekClientBuilder()
                .apiKey(apiKey)
                .build();
    }
}

3.2 智能路由策略实现

@Service
public class AiRoutingService {
    @Autowired
    private OllamaChatClient ollamaClient;
    @Autowired
    private DeepSeekClient deepSeekClient;
    public ChatResponse routeRequest(ChatRequest request) {
        // 简单路由策略示例：根据请求长度决定
        if (request.getMessage().length() < 50) {
            return ollamaClient.chat(request);
        } else {
            return deepSeekClient.chat(request);
        }
    }
}

3.3 性能优化实践

连接池配置：

@Bean
public WebClient deepSeekWebClient() {
    return WebClient.builder()
            .clientConnector(new ReactorClientHttpConnector(
                    HttpClient.create()
                            .responseTimeout(Duration.ofSeconds(30))
                            .doOnConnected(conn -> 
                                conn.addHandlerLast(new ReadTimeoutHandler(30))
                                     .addHandlerLast(new WriteTimeoutHandler(30)))
            ))
            .build();
}

缓存层设计：

@Cacheable(value = "aiResponses", key = "#request.hashCode()")
public ChatResponse getCachedResponse(ChatRequest request) {
    return routeRequest(request);
}

四、典型应用场景

4.1 智能客服系统实现

@RestController
@RequestMapping("/api/chat")
public class ChatController {
    @Autowired
    private AiRoutingService aiService;
    @PostMapping
    public Mono<ChatResponse> chat(
            @RequestBody ChatRequest request,
            @RequestParam(required = false) String model) {
        return Mono.fromCallable(() -> {
            if (model != null && model.equalsIgnoreCase("deepseek")) {
                return deepSeekClient.chat(request);
            }
            return aiService.routeRequest(request);
        }).subscribeOn(Schedulers.boundedElastic());
    }
}

4.2 文档摘要生成服务

@Service
public class DocumentSummaryService {
    @Autowired
    private DeepSeekClient deepSeekClient;
    public String summarizeDocument(String content) {
        SummaryRequest request = SummaryRequest.builder()
                .text(content)
                .maxTokens(200)
                .build();
        SummaryResponse response = deepSeekClient.summarize(request);
        return response.getSummary();
    }
}

五、部署与运维方案

5.1 容器化部署配置

# Dockerfile示例
FROM eclipse-temurin:17-jdk-jammy
WORKDIR /app
COPY target/ai-service.jar app.jar
EXPOSE 8080
ENV OLLAMA_HOST=host.docker.internal
ENTRYPOINT ["java", "-jar", "app.jar"]

5.2 监控指标设计

@Bean
public MicrometerCollectorRegistry registry() {
    return new MicrometerCollectorRegistry(
            Metrics.globalRegistry
    );
}
// 在调用点添加指标
public ChatResponse routeRequest(ChatRequest request) {
    Timer timer = Metrics.timer("ai.request.duration", 
            "model", request.getModelHint());
    return timer.record(() -> {
        // 实际调用逻辑
    });
}

六、最佳实践建议

模型选择策略：
- 简单问答：优先使用Ollama本地模型
- 复杂推理：切换至DeepSeek云端服务
- 敏感数据：强制使用本地部署

异常处理机制：

public ChatResponse safeRouteRequest(ChatRequest request) {
    try {
        return routeRequest(request);
    } catch (OllamaException e) {
        log.warn("Ollama调用失败，切换至DeepSeek", e);
        return deepSeekClient.chat(request);
    } catch (DeepSeekException e) {
        log.error("DeepSeek调用失败", e);
        throw new ServiceUnavailableException("AI服务暂时不可用");
    }
}

成本优化方案：
- 设置DeepSeek调用的每日配额
- 对高频简单请求实施本地缓存
- 使用模型蒸馏技术减少大模型调用

七、未来演进方向

模型联邦学习：在保护数据隐私前提下实现模型协同训练
自适应路由：基于实时性能指标的动态模型选择
边缘计算集成：将Ollama部署至边缘节点实现地理就近服务

本方案通过Spring AI框架实现了Ollama与DeepSeek的无缝集成，既保证了企业数据的安全性，又获得了先进AI模型的能力支持。实际部署中建议从简单场景入手，逐步扩展至复杂业务系统，同时建立完善的监控体系确保服务质量。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

开发者热搜

Spring AI集成Ollama与DeepSeek：构建企业级AI应用的完整指南

一、技术架构与核心优势

1.1 架构设计要点

二、环境准备与依赖管理

2.1 开发环境配置

2.2 模型服务配置

三、核心实现方案

3.1 双模型服务封装

3.2 智能路由策略实现

3.3 性能优化实践

四、典型应用场景

4.1 智能客服系统实现

4.2 文档摘要生成服务

五、部署与运维方案

5.1 容器化部署配置

5.2 监控指标设计

六、最佳实践建议

七、未来演进方向

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者