开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27632776
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101066000
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151064400
高质量推理数据集全览：解锁DeepSeek推理能力的密钥
本文汇总了覆盖数学、代码、科学、谜题四大领域的高质量推理数据集，旨在为开发者提供复现DeepSeek超强推理能力的核心资源，助力构建高效推理模型。
Nicky2025.09.25 17:424900
深度解析ResNet：推理模型大小与框架设计全览
本文详细探讨ResNet推理模型的存储占用与框架设计，分析不同版本ResNet的模型大小、参数构成及优化策略，并深入解析其核心架构与实现原理。
JC2025.09.25 17:42600
ResNet推理模型存储与框架解析：从模型大小到架构设计
本文深度解析ResNet推理模型的存储需求及框架设计，涵盖模型参数量、存储优化策略及核心架构原理，为开发者提供模型部署与优化的实用指南。
JC2025.09.25 17:42000
FlashMLA赋能DeepSeek-V2-Lite：云上推理性能跃升16%实战解析
本文深度解析FlashMLA技术如何实现DeepSeek-V2-Lite模型推理性能16%优化，通过实测数据对比、架构原理剖析及云上部署方案，为开发者提供可复用的性能调优路径。
公子世无双2025.09.25 17:42000
多线程图预运行优化：prerun_graph_multithread深度解析与实践
本文深入探讨prerun_graph_multithread技术，解析其通过多线程并行预处理图结构数据，优化计算效率与资源利用的核心机制，并提供从设计到实现的全流程指导。
梅琳marlin2025.09.25 17:42100
KServe：解锁云原生模型推理的标准化路径
本文深入解析KServe作为云原生模型推理服务框架的核心设计，从架构、部署模式到实际场景应用，探讨其如何通过标准化接口与自动化运维能力，助力企业构建高效、可扩展的AI推理服务。
谁偷走了我的奶酪2025.09.25 17:42600
云原生赋能AI：DeepSeek分布式推理的效能跃迁路径
本文深入探讨云原生技术如何通过容器化、服务网格、动态编排等核心能力，为DeepSeek分布式推理系统提供资源弹性、服务治理与全局优化的技术支撑，揭示其实现推理吞吐量提升300%、延迟降低60%的底层逻辑，并提供从架构设计到运维优化的全链路实践指南。
Nicky2025.09.25 17:42100
深入vLLM核心：大模型推理框架源码解析（一）
本文聚焦大模型推理框架vLLM的源码结构，从架构设计、关键模块实现及性能优化策略入手，结合代码示例与行业实践，为开发者提供可落地的技术洞察。
菠萝爱吃肉2025.09.25 17:42100
DistilQwen-ThoughtX：重新定义推理模型的变长思维链革命
本文深度解析DistilQwen-ThoughtX模型如何通过动态思维链长度、知识蒸馏优化及多任务适应能力，在复杂推理任务中超越DeepSeek蒸馏模型，为开发者提供高效部署与定制化开发指南。
JC2025.09.25 17:42200
NVIDIA TensorRT-LLM深度解析：大模型推理的加速引擎
本文深入解析NVIDIA TensorRT-LLM框架的技术架构、核心优化策略及实际应用场景，通过量化、算子融合与硬件感知设计，显著提升大模型推理效率，为开发者提供性能调优与部署的实用指南。
热心市民鹿先生2025.09.25 17:424400

创作

写文章

我的文章

最热文章

活动