开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27627476
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101058800
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151055600
vosk实时语音识别：免费SDK赋能开发者高效集成语音功能
本文详细解析了Vosk实时语音识别SDK的免费特性、技术优势及实际应用场景。通过开源生态、多语言支持、低延迟处理等关键点，为开发者提供低成本、高灵活性的语音识别解决方案，助力快速构建智能语音应用。
carzy2025.10.10 19:12100
基于Transformers的Whisper多语种语音识别微调实践
本文围绕使用Transformers库对Whisper模型进行多语种语音识别任务微调展开，从模型原理、数据准备、微调策略到实践案例，提供系统化技术指南。
Nicky2025.10.10 19:12100
Vosk语音识别：开源框架的深度解析与实践指南
本文深入解析Vosk语音识别框架的技术特性、应用场景及开发实践，从模型架构、跨平台部署到实时处理优化，为开发者提供从入门到进阶的全流程指导。
狼烟四起2025.10.10 19:12100
FireRedASR：小红书开源ASR模型，方言歌词识别新突破！
小红书开源工业级自动语音识别模型FireRedASR，支持普通话、方言及歌词精准识别，提供高性能、低延迟的语音转文本解决方案。
热心市民鹿先生2025.10.10 19:12100
UniApp中语音识别与智能问答集成指南
本文详细阐述在UniApp框架中集成语音识别与智能问答系统的技术方案，涵盖API对接、数据处理及跨平台适配等核心环节，提供可落地的开发指导。
demo2025.10.10 19:12100
uniapp集成百度语音识别在iOS端的深度避坑指南
本文聚焦uniapp集成百度语音识别在iOS端遇到的典型问题，从权限配置、麦克风冲突到网络请求拦截，提供全流程解决方案，助力开发者高效解决兼容性难题。
渣渣辉2025.10.10 19:12100
低延迟流式语音识别：人机交互新范式
本文探讨低延迟流式语音识别技术在人机语音交互场景中的核心价值，从技术原理、实时性优化、端到端架构设计三个维度展开分析，结合智能客服、车载语音、医疗问诊等典型场景，阐述如何通过流式处理、模型轻量化、硬件加速等技术手段实现毫秒级响应，为开发者提供架构选型与性能调优的实践指南。
快去debug2025.10.10 19:12100
Voila：全双工对话新标杆，195ms超低延迟端到端语音模型来了！
本文介绍新型开源端到端AI语音模型Voila，其以195ms超低延迟实现全双工对话，突破传统技术瓶颈，为开发者与企业提供高性能、易集成的语音交互解决方案。
暴富20212025.10.10 19:12100
听懂未来：AI语音识别技术如何重塑人机交互格局
本文深度解析AI语音识别技术的前沿突破，从算法革新到行业应用，结合实战案例揭示技术落地路径，为开发者与企业提供从理论到实践的全维度指南。
沙与沫2025.10.10 19:12100
JavaScript文字转语音：SpeechSynthesisUtterance深度解析与实践
本文深入探讨JavaScript的SpeechSynthesisUtterance接口，解析其如何实现文字转语音的语音合成播放功能，包括基础用法、高级配置、跨浏览器兼容性处理及实际应用场景，助力开发者高效集成语音合成技术。
菠萝爱吃肉2025.10.10 19:12100

创作

写文章

我的文章

最热文章

活动