IBM、他を凌駕する新音声認識モデル「Granite Speech 3.3 8B」を発表
人工知能(AI)ツールが高度化し利便性が増す中、人々はこれらのツールと人間同様の対話を求めるようになっている。これは特に、カスタマーサービス用チャットボット、音声アシスタント、音声要約ツールなどにおいて顕著だ。こうしたモデルが人間の発話を正確に理解できれば、家庭でも職場でもより有用な存在となる。こうした背景を受け、IT大手IBM(IBM)はこのほど、ビジネス用途に特化した新音声認識モデル「Granite Speech 3.3 8B」を発表した。
確信ある投資はここから始まる:
- TipRanksの新KPIデータで企業の実績を容易に分析し、スマートな投資判断を
- TipRanksのSmart Valueニュースレターで過小評価された市場に強い銘柄を直接受信
興味深いことに、このモデルは英語音声をテキストに変換し、フランス語、スペイン語、日本語、中国語などへの翻訳も可能で、IBMのテキストベースモデル「Granite 3.3 8B Instruct」をファインチューニングして開発された。さらにオープンソースであり、AIモデルを公開・共有するプラットフォーム「Hugging Face」で誰でも利用可能だ。しかし最も印象的なのは、公開以来このモデルがHugging Faceの「Open ASR」リーダーボードで首位を獲得している点である。実際、精度と性能の面でOpenAIやMeta(META)といった大手のモデルをも上回った。
この優れた性能は、IBMが実際の使用環境を想定し、ボイスメール、オーディオブック、決算説明会など多様な音声データでトレーニングを行った結果だ。さらに、バックグラウンドノイズを追加したり意図的に音声の一部をカットするなどしてモデルの頑健性を高めている。とはいえ音声認識の分野では依然課題も残されており、IBMはAIが人間の聴解能力に匹敵するまでにあと5~10年を要すると見ている。
IBMの目標株価は?
ウォールストリートのアナリストたちは、過去3ヶ月間に付与された7つの「買い」、5つの「保有」、2つの「売り」レーティングに基づき、IBM株に対し「穏健買い」の総合評価を付けている(下図参照)。また平均目標株価は269.46ドルで、これは現行価格から6.8%の下落余地を示唆している。

翻訳者:Sn1p3rZ