开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27625576
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101057300
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151053600
科普揭秘：语音识别技术原理全解析
本文深入解析语音识别的技术原理，从信号预处理到声学模型、语言模型，再到解码与后处理，帮助读者全面理解这一技术。
新兰2025.09.23 12:53100
基于MFCC与模板匹配的语音识别MATLAB实现详解
本文详细介绍了基于MFCC特征提取与模板匹配算法的语音识别系统实现过程，包含MATLAB源码解析与GUI设计思路，适合语音信号处理领域的学习者与开发者参考。
暴富20212025.09.23 12:53100
零成本语音转文本：免费API的完整实现指南
本文详细解析如何通过免费语音识别API快速实现语音转文本功能，涵盖技术选型、代码实现、优化策略及典型场景应用，助力开发者低成本构建智能语音应用。
rousong2025.09.23 12:53100
卷积神经网络（CNN）在语音识别中的深度应用解析
本文全面解析卷积神经网络（CNN）在语音识别中的应用，涵盖基础原理、模型架构、优势挑战及实践建议，为开发者提供深度技术指南。
JC2025.09.23 12:53100
FSMN及其变体：语音识别端到端模型的深度解析与演进
本文深度解析了语音识别领域的FSMN（Feedforward Sequential Memory Networks）端到端模型及其变体，从基础架构、核心创新点、性能优势到实际应用场景，全面探讨了FSMN模型如何通过独特的记忆单元设计提升语音识别精度与效率。同时，分析了其变体模型在处理长序列、降低计算复杂度等方面的改进，为开发者及企业用户提供了技术选型与优化的实用参考。
狼烟四起2025.09.23 12:53100
vosk-api离线语音识别API：开启语音技术自主可控新篇章
vosk-api离线语音识别API以多语言支持、轻量化架构和离线运行能力为核心优势，为开发者提供隐私安全、低延迟的语音识别解决方案，适用于隐私敏感场景和资源受限环境。
公子世无双2025.09.23 12:53100
iOS 10语音识别API实战指南：从入门到进阶
本文详细介绍了如何在iOS 10中利用Speech框架实现语音识别功能，涵盖权限配置、API调用、错误处理及性能优化等关键环节，帮助开发者快速构建高效语音交互应用。
4042025.09.23 12:53100
端到端语音指令识别全流程解析：从数据到模型实战指南
本文详细阐述端到端语音指令识别模型的完整实现路径，涵盖数据生成、模型架构设计、训练优化及测试评估全流程。通过代码示例与理论分析结合，为开发者提供可复用的技术方案。
问答酱2025.09.23 12:53100
如何用Transformers精准优化：多语种Whisper模型微调全攻略
本文聚焦如何使用Transformers库对Whisper模型进行多语种语音识别任务的微调，详细阐述从数据准备、模型选择到训练优化的全流程，并提供可复用的代码示例与实用建议。
热心市民鹿先生2025.09.23 12:53100
低延迟流式语音识别：人机交互新范式的技术实践
本文聚焦低延迟流式语音识别技术在人机交互场景中的应用，从技术原理、场景适配、性能优化及实践案例四方面展开，探讨其如何通过实时响应与动态处理能力，推动语音交互向自然化、智能化方向发展。
起个名字好难2025.09.23 12:53100

创作

写文章

我的文章

最热文章

活动