开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27624176
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101055800
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151052100
深度融合：人工智能赋能语音识别技术的未来图景
本文探讨人工智能与语音识别技术的深度融合路径，通过分析端到端模型优化、多模态交互、自适应学习等核心技术方向，结合医疗、教育、IoT等场景的落地案例，揭示AI如何推动语音识别向高精度、强适应、全场景方向演进。
新兰2025.09.19 15:01100
基于MFCC与HMM的湖南方言识别系统实现与Matlab实践
本文详细阐述基于MFCC特征提取与隐马尔可夫模型（HMM）的湖南方言识别系统实现方法，包含MFCC参数优化、HMM模型训练及Matlab源码解析，为方言语音识别研究提供可复现的技术方案。
十万个为什么2025.09.19 15:01100
清华大学Dolphin模型：东方语言识别新标杆
清华大学推出Dolphin语音识别模型，专攻40种东方语言，方言识别准确率提升54%，为多语言场景提供高效解决方案。
沙与沫2025.09.19 15:01100
无监督学习赋能语音识别：唤醒词与打包技术解析
本文深入探讨无监督学习在语音识别领域的应用，重点分析唤醒词识别与语音打包技术。通过理论解析与案例结合，揭示无监督学习如何提升语音识别效率与准确性，为开发者提供实用指导。
搬砖的石头2025.09.19 15:01300
优化语音识别准确率：技术路径与工程实践
本文聚焦语音识别准确率提升，从算法优化、数据增强、工程部署三个维度展开，结合声学模型改进、语言模型融合、数据清洗等关键技术，提供可落地的解决方案。
rousong2025.09.19 15:01100
从实验室到生活场景：语音识别技术的演进与突破
本文深入探讨语音识别技术的核心发展脉络，从传统算法到深度学习变革，剖析工业级应用的技术挑战与解决方案，并展望多模态交互、边缘计算等未来趋势，为开发者提供技术选型与场景落地的实践参考。
rousong2025.09.19 15:01100
实时语音转文字（RealtimeSTT）技术解析与行业实践指南
本文全面解析实时语音转文字（RealtimeSTT）的技术原理、核心优势及典型应用场景，通过技术架构拆解、行业痛点分析与代码示例，为开发者及企业用户提供从技术选型到场景落地的全流程指导。
起个名字好难2025.09.19 15:01100
中国电信攻克方言壁垒：语音大模型解锁30种方言，GPT-4o尚难企及
中国电信自主研发的语音大模型突破方言识别技术瓶颈，成功攻克"最难方言"温州话，并实现30种方言的语音交互能力，在方言保护与AI技术融合领域树立新标杆。
很酷cat2025.09.19 15:01100
GPT-4o 语音模式来袭：OpenAI 推动 AI 语音交互革命｜AGI 掘金资讯 7.29
OpenAI 计划推出 GPT-4o 语音模式，实现无缝 AI 语音交互，将语音识别、生成与实时对话能力深度整合，为开发者与企业用户提供低延迟、高自然度的语音 AI 解决方案，重塑人机交互体验。
半吊子全栈工匠2025.09.19 15:01100
Voila：195ms超低延迟AI语音新标杆
本文介绍了新型开源端到端AI语音模型Voila，其以195ms超低延迟实现全双工对话，并详细解析了其技术架构、性能优势及实际应用价值。
公子世无双2025.09.19 15:01100

创作

写文章

我的文章

最热文章

活动