开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27627476
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101058800
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151055600
Spring AI集成OpenAI：构建智能语音交互系统的全链路实践
本文深入探讨如何通过Spring AI框架集成OpenAI的语音能力，实现文字转语音（TTS）与语音转文字（ASR）功能。通过详细的技术实现路径、代码示例和最佳实践，帮助开发者快速构建高效稳定的语音交互系统。
很酷cat2025.10.10 19:02100
基于Torchaudio的语音识别全流程解决方案解析与实践
本文深度解析基于Torchaudio的语音识别解决方案，涵盖数据预处理、模型构建、训练优化及部署全流程，提供可复用的代码框架与工程实践建议。
暴富20212025.10.10 19:02100
10K star！免费离线语音转文字神器，碾压付费垃圾
一款获10K star的免费离线语音转文字工具，凭借其高效、精准与零成本特性，远超市场上众多付费软件，成为开发者与企业用户的首选。
宇宙中心我曹县2025.10.10 19:02000
开源语音识别引擎技术选型指南：性能、生态与适用场景深度解析
本文通过对比Mozilla DeepSpeech、Kaldi、Vosk、NVIDIA NeMo等主流开源语音识别引擎，从模型架构、训练效率、部署成本、多语言支持等维度展开深度分析，结合实测数据与典型场景需求，为开发者提供技术选型参考框架。
新兰2025.10.10 19:02100
在Javascript中实现语音交互：Web Speech API全解析与实践指南
本文深入探讨如何在Javascript应用程序中通过Web Speech API实现语音识别功能，从基础原理到高级应用，提供完整的实现方案与优化策略，帮助开发者快速构建语音交互应用。
公子世无双2025.10.10 19:02000
深度解析DeepSpeech语音识别项目：从理论到实践的全流程实现
本文详细解析DeepSpeech语音识别项目的实现原理与工程实践，涵盖模型架构、数据预处理、训练优化及部署应用全流程，为开发者提供可落地的技术指南。
demo2025.10.10 19:02400
Android原生SpeechRecognizer：从基础到进阶的语音识别实践
本文深入探讨Android原生SpeechRecognizer组件，从基础使用到高级功能，涵盖权限配置、API调用、错误处理及优化建议，助力开发者高效集成语音识别功能。
KAKAKA2025.10.10 19:02000
端到端语音识别新选择：WeNet框架深度调研
本文深度调研端到端语音识别框架WeNet，从架构设计、性能优化、工业部署及实践建议等方面进行全面解析，为开发者提供技术选型与工程落地的实用指南。
有好多问题2025.10.10 19:02000
Android原生SpeechRecognizer：从基础到进阶的语音识别实践
本文深入解析Android原生SpeechRecognizer的架构、核心API、使用场景及优化策略，结合代码示例与实战经验，为开发者提供完整的语音识别集成指南。
c4t2025.10.10 19:02300
Vosk离线语音识别：构建高效自主的语音交互方案
本文深入探讨Vosk离线语音识别框架的技术优势、部署方案及实践案例，解析其如何在无网络环境下实现高精度语音转写，为开发者提供从模型选择到性能优化的全流程指南。
问答酱2025.10.10 19:02100

创作

写文章

我的文章

最热文章

活动