开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27617576
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101051700
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151043800
基于Transformers的Whisper多语种语音识别微调实践
本文围绕使用Transformers库对Whisper模型进行多语种语音识别任务微调展开，从模型原理、数据准备、微调策略到实践案例，提供系统化技术指南。
Nicky2025.10.10 19:12100
Vosk语音识别：开源框架的深度解析与实践指南
本文深入解析Vosk语音识别框架的技术特性、应用场景及开发实践，从模型架构、跨平台部署到实时处理优化，为开发者提供从入门到进阶的全流程指导。
狼烟四起2025.10.10 19:12100
MRCP赋能美团语音交互：技术实践与场景化应用解析
本文深入探讨MRCP（Media Resource Control Protocol）在美团语音交互系统中的技术实现与业务价值，通过协议优化、服务架构设计及典型场景案例，揭示其如何提升语音服务稳定性与用户体验。
php是最好的2025.10.10 19:12200
Trae【孤岛多媒体】智能体：重新定义AI多媒体创作边界
Trae【孤岛多媒体】智能体以文生图、克隆音色、语音合成为核心，通过模块化架构与低代码开发模式，为开发者与企业提供高效、可控的AI多媒体解决方案。本文深度解析其技术实现与行业价值。
梅琳marlin2025.10.10 19:12900
文字转语音：语音合成技术全解析与工程实践
本文系统梳理文字转语音（TTS）的核心技术原理、主流实现方案及工程化实践要点，涵盖语音合成算法、模型架构、性能优化等关键环节，结合实际开发场景提供可落地的技术指南。
热心市民鹿先生2025.10.10 19:12700
文字转语音与语音转文字：技术解析、应用场景与开发实践
本文深度解析文字转语音与语音转文字技术原理、应用场景及开发实践，提供技术选型建议与代码示例，助力开发者高效实现功能集成。
da吃一鲸8862025.10.10 19:12400
鸿蒙Next原生API：解锁实时语音识别新范式
本文深入解析鸿蒙Next系统原生API在实时语音识别中的应用，涵盖API能力、实现步骤、性能优化及典型场景，助力开发者快速构建高效语音交互应用。
蛮不讲李2025.10.10 19:12600
语音识别技术原理与应用深度解析
本文从信号处理、声学模型、语言模型到解码算法，系统解析语音识别核心技术原理，结合传统方法与深度学习框架，探讨技术演进路径与实际应用场景，为开发者提供从理论到实践的完整认知框架。
c4t2025.10.10 19:12700
JavaScript+Whisper：语音识别与NLP的Web端融合实践
本文探讨如何利用JavaScript与Whisper模型实现浏览器端的语音识别与自然语言处理结合，涵盖技术原理、实现方案、性能优化及典型应用场景，为开发者提供从理论到实践的完整指南。
4042025.10.10 19:12500
OpenAI Whisper实时语音识别：解锁高效语音转文本新范式
本文深入解析OpenAI Whisper在实时语音识别中的技术突破，通过分块处理、硬件优化及模型轻量化实现近乎实时转录，结合多语言支持与高准确率优势，为开发者提供从环境配置到部署优化的全流程指南。
沙与沫2025.10.10 19:12300

创作

写文章

我的文章

最热文章

活动