开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27626976
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101058400
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151055200
基于Ernie-Bot构建智能语音对话系统：技术实现与优化路径
本文详细阐述如何基于Ernie-Bot大语言模型构建智能语音对话系统，涵盖语音识别、语义理解、对话生成、语音合成等核心模块的技术实现方案，并提供从开发到部署的全流程指导。
梅琳marlin2025.09.19 17:53200
基于多模态交互的文本语音互相转换系统设计
本文围绕文本语音互相转换系统的核心架构展开，系统梳理了从算法模型到工程实现的完整链路，重点解析了语音识别、语音合成、实时交互等关键模块的设计原则，并提出了基于深度学习的优化方案与工程实践建议。
carzy2025.09.19 17:53100
听懂未来：AI语音识别技术的演进与应用实战
本文聚焦AI语音识别技术的最新进展，从深度学习架构、多模态融合、端侧部署三个维度解析技术突破，结合医疗、教育、车载等场景的实战案例，探讨如何通过算法优化、数据治理和工程实践实现高效语音交互，为开发者提供从模型训练到场景落地的全流程指导。
梅琳marlin2025.09.19 17:53200
从Kaldi语音识别到文字语音播放：技术实现与场景应用
本文围绕Kaldi语音识别引擎展开，系统阐述其技术架构、文字识别流程及语音合成播放的实现方法，结合实际案例说明技术落地路径，为开发者提供从语音到文字再到语音的全链路解决方案。
新兰2025.09.19 17:53200
中文语音识别引擎：一站式下载指南与技术解析
本文全面解析中文语音识别引擎的核心技术，提供开源与商业引擎的对比分析及下载指南，助力开发者快速构建高效语音交互系统。
rousong2025.09.19 17:53200
语音合成（TTS）初体验：从零到一的实战指南
本文通过实战案例，系统梳理语音合成（TTS）技术的核心原理、工具选型、开发流程及优化策略，结合代码示例与场景分析，为开发者提供从环境搭建到效果调优的全流程指导。
demo2025.09.19 17:53600
基于Transformers的多语种Whisper微调实践指南
本文深入探讨如何使用Transformers库对Whisper模型进行多语种语音识别任务的微调，涵盖数据准备、模型加载、训练配置、微调过程及评估优化等关键环节，助力开发者构建高效语音识别系统。
搬砖的石头2025.09.19 17:53300
基于Python的语音唤醒：speech_recognition与PocketSphinx实战指南
本文深入解析如何利用speech_recognition库与PocketSphinx引擎实现离线语音唤醒功能，涵盖技术原理、环境配置、代码实现及优化策略，为开发者提供从理论到实践的完整方案。
梅琳marlin2025.09.19 17:53500
在Javascript中实现语音识别：从原理到实践指南
本文详细解析了在Javascript应用程序中实现语音识别的技术路径，涵盖Web Speech API、第三方库集成及跨浏览器兼容方案，通过代码示例与性能优化策略，为开发者提供从基础到进阶的完整指南。
c4t2025.09.19 17:534000
Web端语音识别新路径：WebRTC与Whisper的融合实践
本文深入探讨了Web端语音识别的实现方法，通过结合WebRTC技术实现实时音频采集，并利用Whisper模型进行高效语音识别，为开发者提供了完整的解决方案。
Nicky2025.09.19 17:531800

创作

写文章

我的文章

最热文章

活动