开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27626176
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101058100
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151054400
在Javascript中实现语音交互：Web Speech API深度解析与实战指南
本文深入探讨如何在Javascript应用程序中集成语音识别功能，重点解析Web Speech API的SpeechRecognition接口，涵盖基础实现、高级优化、跨浏览器兼容方案及实际应用场景，为开发者提供完整的语音交互开发指南。
rousong2025.10.10 19:02200
IOS音视频实战：ASR与Siri的离线在线语音识别方案解析
本文深入探讨了iOS平台上的ASR（自动语音识别）与Siri语音识别方案，涵盖离线与在线两种模式的技术原理、实现细节及优化策略，为开发者提供全面的语音识别解决方案。
渣渣辉2025.10.10 19:02300
Vosk语音识别：开源框架的技术解析与实践指南
本文深度解析Vosk语音识别框架的核心特性、技术架构及实际应用场景，通过代码示例与工程实践指导，帮助开发者快速掌握离线语音识别解决方案的部署与优化方法。
梅琳marlin2025.10.10 19:02200
AI科普文章 | 语音识别准不准？—— ASR 效果评测原理与实践
本文深入探讨ASR（自动语音识别）系统的准确性评测方法，从理论到实践全面解析，帮助开发者与用户科学评估语音识别效果，提升技术应用价值。
carzy2025.10.10 19:02000
开源语音识别引擎横向评测：技术选型与落地实践指南
本文深度对比Kaldi、Mozilla DeepSpeech、Vosk及ESPnet四大开源语音识别引擎，从架构设计、模型性能、部署友好性等维度展开评估，为开发者提供技术选型参考。
很菜不狗2025.10.10 19:02100
Voila：195ms超低延迟开启AI语音全双工新时代
本文详细介绍开源端到端AI语音模型Voila，其195ms超低延迟实现全双工对话，突破传统模型局限，适用于实时交互场景，为开发者提供优化建议。
渣渣辉2025.10.10 19:02200
Android TTS语音播报实践：从基础到进阶的全流程指南
本文系统阐述Android TTS语音播报的实现原理、核心API使用方法及进阶优化技巧，通过代码示例与场景分析，帮助开发者快速掌握TTS功能开发。
狼烟四起2025.10.10 19:02600
从语音识别到图形交互：语音识别技术中的图像化应用与开发实践
本文探讨语音识别技术与图形交互的结合，重点分析语音识别相关图片在开发中的应用场景、技术实现及优化策略，为开发者提供从算法到实践的完整指南。
问答酱2025.10.10 19:02000
HarmonyOS语音识别API调用指南：零基础快速上手案例
本文通过一个可直接复制的HarmonyOS语音识别案例，详细讲解如何调用系统级语音识别API，包含环境配置、代码实现、权限处理等关键步骤，帮助开发者快速实现语音交互功能。
carzy2025.10.10 19:02200
从零掌握语音识别：系统性入门指南与视频教程推荐
本文为语音识别初学者提供系统性学习路径，涵盖基础原理、工具链、实战案例及优质视频教程推荐，帮助开发者快速掌握核心技能。
狼烟四起2025.10.10 19:02100

创作

写文章

我的文章

最热文章

活动