开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27619276
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101052800
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151046000
基于Transformers的Whisper多语种语音识别微调指南
本文详细介绍如何使用Hugging Face Transformers库对Whisper模型进行多语种语音识别任务的微调，涵盖数据准备、模型加载、训练策略及部署应用全流程。
php是最好的2025.09.19 17:53300
TTS文字转语音：从原理到简易实现的完整指南
本文深入解析TTS技术原理，提供Python实现方案与优化建议，涵盖离线/在线方案对比、语音库选择、参数调优等核心环节，助力开发者快速构建文字转语音功能。
KAKAKA2025.09.19 17:53200
SpeechT5全解析：语音合成、识别与多功能应用指南
本文深入探讨SpeechT5在语音合成、识别及多场景下的技术实现与应用价值，提供从基础功能到进阶优化的完整方案，助力开发者高效构建智能语音系统。
很菜不狗2025.09.19 17:53200
AI科普：语音识别准不准？ASR评测全解析
本文深度解析ASR效果评测的核心原理与实践方法，从评测指标、数据集构建到实际应用优化，帮助开发者与用户科学评估语音识别系统性能。
Nicky2025.09.19 17:53200
Android原生SpeechRecognizer：从基础到进阶的语音识别实践
本文深入解析Android原生SpeechRecognizer的架构设计、核心功能及实战技巧，涵盖从基础API调用到异常处理、性能优化的全流程，提供可复用的代码示例与工程化建议。
php是最好的2025.09.19 17:53200
两天千星奇迹：Whisper蒸馏技术开启语音识别新纪元
OpenAI的Whisper模型经蒸馏技术优化后，语音识别速度提升数倍，项目上线两天GitHub收获千星关注，本文深度解析技术原理、性能对比与实战应用。
沙与沫2025.09.19 17:53200
声”动未来：AI语音识别技术演进与实战指南
本文深入探讨AI语音识别技术的最新进展，从算法突破、模型优化到实战应用场景，解析技术实现细节与行业落地策略，为开发者与企业提供可复用的技术方案。
搬砖的石头2025.09.19 17:53200
声景交互革命：AR眼镜上的语音AI可视化实践
本文深入探讨语音AI与AR眼镜融合的前沿技术，解析如何通过实时语音分析、3D声场建模和动态可视化，将口语和声音转化为可交互的视觉元素，为开发者提供从算法设计到硬件集成的全流程指南。
新兰2025.09.19 17:53100
深入解析：PaddleSpeech中英混合语音识别技术全貌
本文深入解析PaddleSpeech框架下的中英混合语音识别技术，从技术原理、模型架构、训练优化到应用实践，为开发者提供全面指导。
rousong2025.09.19 17:53100
CTC算法：语音识别中的动态对齐利器
CTC（Connectionist Temporal Classification）算法通过动态时间规整机制解决语音识别中的输入输出长度不匹配问题，本文从数学原理、网络结构、训练优化三个维度展开技术解析，并提供PyTorch实现示例与工程优化建议。
梅琳marlin2025.09.19 17:53200

创作

写文章

我的文章

最热文章

活动