【資料圖】
12月5日,火山引擎正式發布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0)。模型推理能力提升,通過深度理解上下文完成精準識別,上下文整體關鍵詞召回率提升20%;支持多模態視覺識別,不僅“聽懂字”還能“看懂圖”,通過單圖和多圖等視覺信息輸入讓文字識別更精準;支持日語、韓語、德語、法語等13種海外語種的精準識別。
[責任編輯:linlin]
標簽: 語音識別 2 0 模型 精準 識別 豆包 上下文 支持 視覺 提升
版權聲明 法律顧問 免責條款 關于我們 聯系我們
Copyright?2014-2016 洞察網 版權所有 京ICP備12018864號-15