开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27621576
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101053700
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151049600
深度解析：iOS实时语音识别——苹果生态下的技术突破与应用实践
本文深入探讨苹果iOS系统中的实时语音识别技术，解析其技术架构、开发实践及典型应用场景，为开发者提供从理论到落地的全流程指导。
新兰2025.09.23 12:53300
深入解析：语音识别API的技术原理与应用实践
本文详细解析了语音识别API的定义、技术原理、应用场景及选型建议，帮助开发者与企业用户快速掌握这一关键技术，提升开发效率与应用效果。
快去debug2025.09.23 12:53300
开源语音识别工具链解析：从模型到部署的高效实践 | 开源专题 No.78
本文深度解析开源语音识别技术栈，从主流框架对比、模型优化策略到部署方案，为开发者提供全链路技术指南，助力实现高效语音处理。
暴富20212025.09.23 12:53300
基于DTW阈值的语音识别算法全流程解析
本文详细解析了基于DTW（动态时间规整）阈值的语音识别算法流程，涵盖预处理、特征提取、DTW计算、阈值设定及结果后处理等核心环节，并探讨了阈值优化策略与实际应用建议。
carzy2025.09.23 12:53300
语音识别上传与操作全解析：从基础到实践的完整指南
本文详细解析语音识别上传的核心流程与操作步骤，涵盖技术原理、API调用、代码实现及优化建议，为开发者提供可落地的技术方案。
很菜不狗2025.09.23 12:53300
Vosk实时语音识别：免费SDK助力开发者高效集成
Vosk提供免费开源的实时语音识别SDK，支持多语言、低延迟和离线部署，适用于开发者与企业快速集成语音交互功能。本文详细解析其技术特性、应用场景及开发实践。
梅琳marlin2025.09.23 12:53300
流式语音识别与流媒体口令交互：技术解析与场景实践
本文聚焦流式语音识别技术在流媒体场景下的口令交互应用，系统解析技术原理、架构设计及优化策略，结合实时性、准确性和安全性三大核心需求，提供从模型优化到工程落地的全流程指导，助力开发者构建高效可靠的语音交互系统。
da吃一鲸8862025.09.23 12:53300
Python实现ASR语音识别：原理与技术全解析
本文深入解析ASR语音识别技术的核心原理，结合Python实现方案，从信号处理、声学模型到语言模型全流程拆解，提供可落地的技术实现路径与优化建议。
KAKAKA2025.09.23 12:53300
uniapp实现语音输入：微信小程序与H5跨端实践指南
本文详细解析了uniapp框架下实现语音输入功能的技术方案，涵盖微信小程序和H5双端实现原理、核心API调用、录音权限管理及跨平台兼容性处理，提供完整的代码示例和优化建议。
demo2025.09.23 12:53300
跨端音频处理全攻略：uniapp中实现H5录音和上传、实时语音识别（兼容App小程序）和波形可视化
本文详细解析了uniapp框架下如何实现H5录音、音频文件上传、实时语音识别功能，并兼容App与小程序环境，同时提供了波形可视化的实现方案。
十万个为什么2025.09.23 12:53300

创作

写文章

我的文章

最热文章

活动