开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27630976
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101062600
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151060900
WFST在语音识别中的深度应用与优化实践
本文深入探讨了WFST（加权有限状态转换器）在语音识别系统中的应用原理、技术实现与优化策略。通过理论解析与工程实践结合，系统阐述了WFST如何实现声学模型与语言模型的动态组合，并提供了从模型构建到解码优化的全流程技术方案。
JC2025.09.23 12:53100
游戏人AI配音初探：Whisper语音识别的技术解析与实践
本文聚焦游戏开发者初次接触AI配音时，如何利用Whisper语音识别技术实现高效语音处理，从技术原理、应用场景到实践案例展开深度解析。
蛮不讲李2025.09.23 12:53100
2021年语音识别技术全景：从算法到应用的深度解析
本文系统梳理2021年语音识别技术发展脉络，涵盖端到端模型架构革新、多模态融合应用、工业级部署方案三大维度，结合代码示例解析Transformer与Conformer核心原理，为开发者提供从理论到工程落地的全流程指导。
公子世无双2025.09.23 12:53100
AudioGPT：全场景语音技术革新者 | 开源日报 No.114
AudioGPT开源项目实现语音技术全栈覆盖，集成语音识别、增强、分离与风格迁移四大核心能力，为开发者提供一站式语音处理解决方案。
php是最好的2025.09.23 12:53100
如何为网页集成类Siri语音助手：技术实现与场景化设计指南
本文从技术架构、核心功能实现、用户体验优化三个维度，详细解析如何为网页开发类Siri语音交互系统，涵盖语音识别、语义理解、语音合成等关键环节，并提供可落地的代码示例与工程化建议。
菠萝爱吃肉2025.09.23 12:53100
基于Web Speech与ChatGPT的智能语音机器人开发指南
本文详细介绍如何利用Web Speech API实现语音交互，结合ChatGPT API构建智能对话核心，开发支持语音输入输出的浏览器端智能机器人，涵盖技术原理、实现步骤与优化策略。
快去debug2025.09.23 12:53100
Vosk离线语音识别：构建高效可靠的本地化语音方案
本文深入解析Vosk离线语音识别框架的技术原理、部署优势及实施路径，结合多场景应用案例与性能优化策略，为开发者提供从模型选择到系统集成的全流程指导，助力构建高可用、低延迟的本地化语音交互系统。
Nicky2025.09.23 12:53100
语音识别与图形化表达：探索语音识别相关图片的应用与价值
本文深入探讨语音识别技术与图形化表达的融合，重点分析语音识别相关图片的生成、应用场景及技术实现，为开发者及企业用户提供实用指导。
宇宙中心我曹县2025.09.23 12:53100
CMUSphinx：开源语音识别引擎的技术解析与应用实践
CMUSphinx作为开源语音识别引擎，其SDK的开源特性为开发者提供了灵活、可定制的语音处理解决方案。本文深入剖析其技术架构、应用场景及开发实践，助力开发者高效构建语音识别应用。
快去debug2025.09.23 12:53100
uniapp全平台语音处理：H5录音、实时识别与波形可视化实战指南
本文详细介绍在uniapp中实现H5录音、音频上传、实时语音识别及波形可视化的完整方案，覆盖H5、App和小程序多端兼容实现，提供核心代码与优化建议。
Nicky2025.09.23 12:53100

创作

写文章

我的文章

最热文章

活动