BTCC / BTCC Square / 528BTC /
Mistral 發布名為 Voxtral 的全新 AI 音頻模型

Mistral 發布名為 Voxtral 的全新 AI 音頻模型

Author:
528BTC
Published:
2025-07-17 06:07:00

據這家法國人工智能公司稱,Voxtral 旨在在實際應用中提供實用的語音智能。 該 AI 音頻模型的性能優於頂級開源音頻轉錄模型之一 WhisPEr large-v3。

Voxtral 由 Mistral Small 3.1 提供支持

Voxtral 由大型語言模型 (LLM) Mistral Small 3.1 提供支持。 該音頻 AI 模型可以理解多種語言,例如英語、法語、西班牙語、葡萄牙語、意大利語、德語、荷蘭語、印地語等。

該音頻模型能夠轉錄長達 30 分鐘的音頻。 此外,Voxtral 還能理解長達 40 分鐘的音頻,方便用戶輕鬆交談並提出相關問題。 用戶還可以要求其生成音頻文件的文本摘要,或提供分析和詳細見解。 此外,他們還可以執行其他操作,例如通過 API 調用運行函數。

MistralVoxtral 提供兩種版本的“語音理解模型”,分別為 Voxtral Small 和 Voxtral Mini。 兩種模型均能夠與基於語音的提示或基於音頻和文本的提示組合進行交互。

兩種模型中,功能更強大的 Voxtral Small 具有 240 億個參數,非常適合生產規模部署。 Mistral寫道“Voxtral Small 在所有任務上都與 GPT-4o-mini 和 Gemini 2.5 Flash 具有競爭力。”

來源:Mistral AI。

Voxtral Mini 是一款輕量級的方案,擁有 3B 參數,是本地和邊緣部署的理想之選。 其 API 版本 Voxtral Mini Transcribe 不僅經濟高效,而且性能優於 OpENAI 的 Whisper,價格不到後者的一半。

Voxtral Small (24B) 和 Voxtral Mini (3B) 均可從 Hugging Face 下載並本地託管。 開發者還可以通過單個 APi 調用將音頻模型集成到任何應用程序中。 起價為每分鐘 0.001 美元,這使得轉錄可擴展。 Mistral 表示,Voxtral 將在勒查特未來幾週內將在網絡應用程序或移動應用程序中推出。

Mistral 是歐洲領先的人工智能公司之一。 據報導,該公司成立於 2023 年,已從 Andreessen HoroWitz、Nvidia、三星和 Salesforce 等知名公司籌集了超過 10 億歐元(約 12 億美元)的資金。

KEY 差異線:加密貨幣項目用來獲得媒體報導的秘密工具

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列