开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27618976
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101052800
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151045500
GPT-4o 语音模式来袭：OpenAI 推动 AI 语音交互革命｜AGI 掘金资讯 7.29
OpenAI 计划推出 GPT-4o 语音模式，实现无缝 AI 语音交互，将语音识别、生成与实时对话能力深度整合，为开发者与企业用户提供低延迟、高自然度的语音 AI 解决方案，重塑人机交互体验。
半吊子全栈工匠2025.09.19 15:01100
Voila：195ms超低延迟AI语音新标杆
本文介绍了新型开源端到端AI语音模型Voila，其以195ms超低延迟实现全双工对话，并详细解析了其技术架构、性能优势及实际应用价值。
公子世无双2025.09.19 15:01100
方言语音识别新突破：提示词工程驱动的适应性优化
本文探讨提示词工程在语音识别方言适应中的核心作用，从方言特征建模、动态调整机制、多方言混合模型三个维度展开技术分析，提出基于提示词优化的方言识别系统设计框架，并给出具体实现建议。
carzy2025.09.19 15:01100
科大迅飞语音听写（流式版）WebAPI：Web前端与H5的语音交互革命
本文深入探讨科大迅飞语音听写（流式版）WebAPI在Web前端与H5开发中的应用，涵盖语音识别、语音搜索、语音听写等核心功能，提供详细技术实现与优化策略。
问题终结者2025.09.19 15:01100
封装语音输入组件：从基础实现到工程化实践指南
本文详细解析了如何封装一个支持语音输入的输入框组件，涵盖Web Speech API原理、多浏览器兼容方案、状态管理与UI交互设计，并提供可复用的TypeScript实现代码。
梅琳marlin2025.09.19 15:01100
OpenAI Whisper中文语音识别：能力解析与实战指南
本文深度解析OpenAI Whisper模型对中文语音识别的支持能力，从技术原理、性能表现到实际应用场景展开分析，为开发者提供选型参考与优化建议。
demo2025.09.19 15:01100
Flutter仿新版微信语音交互：从设计到实现的全流程解析
本文详细解析了如何使用Flutter框架实现仿新版微信的语音发送交互功能，涵盖界面设计、手势识别、录音控制、权限管理及UI动画等核心环节，提供完整的代码实现方案和优化建议。
Nicky2025.09.19 15:01100
Dolphin开源：东方语音技术的革命性突破
本文深度解析支持40种东方语种及22种中国方言的语音大模型Dolphin的开源意义，从技术架构、应用场景到开发实践，为开发者提供全方位指南。
公子世无双2025.09.19 15:01100
纯前端实现文字语音互转：技术路径与实践指南
本文深入探讨纯前端环境下实现文字与语音互转的技术方案，涵盖Web Speech API、第三方库集成及性能优化策略。通过代码示例与场景分析，为开发者提供无需后端支持的完整解决方案，助力构建轻量级语音交互应用。
狼烟四起2025.09.19 15:01100
Whisper语音识别模型：从原理到本地部署全解析
本文深入解析Whisper语音识别模型的核心架构、技术优势及多场景应用，结合医疗、教育、工业领域的真实案例，提供从环境配置到模型调优的完整本地部署方案，助力开发者快速实现离线语音处理能力。
起个名字好难2025.09.19 15:01100

创作

写文章

我的文章

最热文章

活动