
Whisperを超える精度のリアルタイム文字起こしローカルAI「Moonshine Voice」、日本語にも対応(生成AIクローズアップ) | テクノエッジ TechnoEdge
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、ローカルで起動できるリアルタイム文字起こしAI「Moon...

Seamless会話を即座に文章にするオープンMoonshine Voice(2.5億パラメータ)がWhisper(15億)を上回る精度。ラズパイに実装可能。話者識別や音声コマンドも装備
2026/03/02 08:28

kusaretAmicalで使ってみたい
2026/03/02 10:55

kalmalogyおお。
2026/03/02 11:13

dickbruna会議のサマライズ目的の文字起こし、Large v3 turboに頼り切ってるのでこれは朗報かも。
2026/03/02 12:15

similaウィスパーの次は月の輝きか。どうしても月経と絡めてくる界隈かよ
2026/03/02 12:22★

kurage_lizardwhisperは日本語だとしょうもなくていつ改善されるんだろうって思っていたがこれは期待して良いのだろうか
2026/03/02 13:05★★★★

T-norf生成AIのシステム応用は、一定割合は音声関連になると思うので気になる。ただ、よほど画期的じゃないと、古くてメジャーなツール名しかググっても出てこず、使う場面まで覚えていられるかなspeach to text , speach 2 text
2026/03/02 15:18

swdrskerTypelessの代用になるか
2026/03/02 16:20

ImamuraWhisperは時々全然聞き取ってないくだりが入るので2回通してる。1回目に聞き取らなかったところを2回目はちゃんと文字に起こしてることがある(2回目に聞き取り失敗するところもある)。これはどうかなー
2026/03/02 16:43★★

misshikiローカルで動く音声AI「Moonshine Voice」はWhisperを超える精度と低遅延処理を実現し、日本語など多言語対応。Raspberry Piなど軽量機器でも動作可能。
2026/03/02 17:13

j74th音声認識、ラズパイでも動くらしい
2026/03/02 19:27

dollarss音声書き起こしローカルAI
2026/03/02 19:30

spark64日本語エラー率13%てのは高いのか低いのか。Streamもあるのかないのか
2026/03/02 19:53

kyahi227AIに関してGoogleのクラウド提供物以外は全般的に日本語対応が著しく劣るのは仕方ないだろ。Googleとそれ以外では抱えてるデータや専門家が質量共に違いすぎる。
2026/03/02 20:09

haususuahahdhwhisperって無料でローカルで使えるってだけで大して性能良くないよな。
2026/03/03 02:01