开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27623276
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101054700
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151050700
10K star开源神器：免费离线语音转文字工具，颠覆付费软件体验
一款开源免费离线的语音转文字工具在GitHub斩获10K star，其离线运行、高精度识别、多语言支持等特性，全面超越同类型付费软件，成为开发者与企业的效率利器。
KAKAKA2025.10.10 19:01100
万星的文本转语音开源项目：技术解析与生态构建全攻略
本文深度解析万星团队开源的文本转语音项目，从技术架构、性能优化到生态构建展开探讨，为开发者提供从快速入门到高阶应用的完整指南。
carzy2025.10.10 19:01100
Vosk离线语音识别：构建高效本地化语音处理方案
本文详细介绍Vosk离线语音识别框架的技术特性、应用场景及实施路径，通过模型适配、性能优化与多平台集成策略，为开发者提供完整的离线语音识别解决方案。
carzy2025.10.10 19:01100
纯前端语音文字互转：无需后端的全栈解决方案实践指南
本文深入探讨纯前端实现语音与文字互转的技术路径，涵盖Web Speech API、浏览器兼容性优化、离线场景处理及性能优化策略，提供完整代码示例与工程化建议。
demo2025.10.10 19:01100
基于Kaldi的语音识别与文字语音播放技术深度解析
本文详细探讨了基于Kaldi框架的语音识别技术实现文字转换，以及文字到语音的播放机制。通过代码示例与理论分析，为开发者提供从语音到文字、再从文字到语音的全流程技术指南。
有好多问题2025.10.10 19:01100
深度学习驱动下的中文语音识别：多语种扩展与技术实践
本文探讨深度学习在中文语音识别中的核心作用，分析多语种识别的技术挑战与实践路径。通过剖析声学模型、语言模型及端到端架构的创新，结合实际开发建议，为开发者提供从中文到多语种扩展的技术指南。
有好多问题2025.10.10 19:01100
SpringBoot快速集成FunASR：语音识别实战指南
本文详细介绍如何在SpringBoot项目中集成FunASR语音识别模型，涵盖环境配置、依赖管理、核心代码实现及优化策略，帮助开发者快速构建高效语音识别服务。
狼烟四起2025.10.10 19:01100
vosk离线语音识别困境解析：开源方案识别问题全攻略
本文深入探讨vosk离线语音识别工具在应用中出现的"无法识别"问题，从模型适配、环境配置、数据处理三个维度剖析原因，提供系统化的解决方案和优化建议，帮助开发者提升开源离线语音识别的准确率和稳定性。
很酷cat2025.10.10 19:01100
成熟语音识别模型：语音识别领域的深度解析与实践
本文深入探讨语音识别领域中成熟模型的技术特性、应用场景及优化策略，通过解析模型架构、训练方法与部署方案，为开发者与企业提供从理论到实践的全面指导。
公子世无双2025.10.10 19:01100
WhisperX：重新定义实时语音处理的边界
本文深入解析WhisperX技术架构，从实时语音转录的准确性优化到多说话人识别的创新实现，结合应用场景与代码示例，为开发者提供从部署到优化的全流程指南。
菠萝爱吃肉2025.10.10 19:01100

创作

写文章

我的文章

最热文章

活动