开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27613576
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101047200
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151038500
OpenAI 计划推出 GPT-4o 语音模式：AI 语音交互新纪元来临
OpenAI 宣布将推出 GPT-4o 语音模式，实现低延迟、高拟真的无缝语音交互，或重塑智能客服、教育、娱乐等领域应用场景。本文深度解析技术原理、应用场景及开发者机遇。
新兰2025.10.10 19:01000
Flutter仿微信语音交互全解析：从按钮到页面的完整实现方案
本文深入解析Flutter中仿微信语音发送功能的实现，涵盖按钮交互设计、录音管理、页面状态控制等核心模块，提供可复用的完整代码示例。
沙与沫2025.10.10 19:01000
基于torchaudio的语音识别：全流程解决方案与实践指南
本文深入探讨基于torchaudio库的语音识别解决方案，从音频预处理、特征提取到模型训练与部署的全流程技术解析，结合实际案例与代码示例，为开发者提供可落地的语音识别系统开发指南。
php是最好的2025.10.10 19:01100
前端断网语音识别：构建离线与在线协同的语音网络体系
在弱网或断网环境下实现语音识别功能，是提升用户体验的关键技术突破。本文深入解析前端断网语音识别的技术原理、实现路径及网络协同策略，为开发者提供从本地模型优化到混合识别架构设计的完整方案。
da吃一鲸8862025.10.10 19:01100
解读PaddleSpeech：中英混合语音识别的技术突破与应用实践
本文深入解析PaddleSpeech中英混合语音识别技术的核心原理、模型架构及实际应用场景，帮助开发者快速掌握技术要点，并提供从环境配置到模型优化的全流程指导。
新兰2025.10.10 19:01000
基于HMM的Python语音识别模型：从理论到实践
本文深入解析HMM（隐马尔可夫模型）在语音识别中的应用，结合Python实现从特征提取到解码的全流程，提供可复用的代码框架与优化策略。
很酷cat2025.10.10 19:01100
探索AI声音技术：数字音频、语音识别与TTS全解析
本文全面解析AI声音技术的三大核心领域——数字音频处理、语音识别及TTS（文本转语音），涵盖基础原理、技术进展及实际应用示例，助力开发者与企业用户掌握关键技术要点。
菠萝爱吃肉2025.10.10 19:01100
vosk实时语音识别：免费SDK助力开发者高效集成
本文介绍Vosk实时语音识别SDK的免费特性、技术优势、应用场景及集成方法，助力开发者快速实现语音交互功能。
KAKAKA2025.10.10 19:01100
深度解析：语音识别开源项目与源码全攻略
本文从技术原理、开源生态、源码解析三个维度全面剖析语音识别开源项目，提供从环境搭建到模型调优的完整指南，帮助开发者快速掌握核心开发技能。
蛮不讲李2025.10.10 19:01100
WebRTC与Whisper：Web端语音识别的黄金组合实践
本文深入探讨如何利用WebRTC获取音频流，结合Whisper模型实现Web端实时语音识别，提供技术实现细节与优化建议。
谁偷走了我的奶酪2025.10.10 19:01300

创作

写文章

我的文章

最热文章

活动