RocketWhisper
ライブ翻訳 🎬 搭載 ✨ v2.2.5
Windows版はこちら →

声を、テキストに。 瞬時に。正確に。完全オフラインで。

Apple Intelligence 対応。爆速の Apple SpeechAnalyzer + オンデバイス AI で、
APIキー不要・完全オフラインの音声認識 & テキスト整形。
どんな動画の音声も即時に字幕翻訳する新・ライブ翻訳も搭載。

0
認識エンジン
0
LLMプロバイダ
0
オフライン認識
0
月額料金
RocketWhisper - AI voice input for Mac — Apple Intelligence, fully offline | Product Hunt
Apple Intelligence
macOS 26 の SpeechAnalyzer で爆速認識 + Foundation Models でAPIキー不要のAI整形
Neural Engine 加速
Apple Silicon の Neural Engine と Metal GPU でリアルタイム認識
🔒
完全プライバシー
音声データは端末から一切外部に送信されません
🎯
高精度日本語
7つの句読点ルールと専門用語辞書で自然な日本語テキストを生成
Screenshots

実際の画面を見る

メニューバーからワンクリック。全ての機能を直感的なタブで。

Model タブ - 認識エンジン選択
Model — 認識エンジン Apple SpeechAnalyzer (macOS 26+) と WhisperKit の 4 モデルをワンクリックで切り替え。
Text Processing タブ - 句読点・辞書・修正ルール
Text Processing — テキスト整形 自動句読点・単語辞書・正規表現対応の自動修正ルール。日本語認識に特化した 7 段階ルール。
Launcher タブ - 音声コマンド・ボイスランチャー
Launcher — 音声で起動 音声コマンド・ボイスランチャー・音声検索。「〜を調べて」でアプリや URL を即起動。
Per-App タブ - アプリ別処理モード
Per-App — アプリ別モード エディタでは句読点あり、チャットではカジュアルに。アプリごとに処理を自動切替。
For MacBook Neo — A18 Pro · 8GB RAM · ¥99,800

MacBook Neo を開いたその日から、
Apple Intelligence 音声入力。

“Built for Apple Intelligence” を掲げる Apple の新しいエントリー Mac、MacBook Neo。
RocketWhisper v2.2.5 は、8GB RAM / 256GB SSD の Neo でも モデル DL なし・API キーなしで即座に動くよう最適化されました。

0 MB
モデルダウンロード
SpeechAnalyzer は macOS 26 に内蔵
0
必要な API キー
Foundation Models で AI 整形
¥0
クラウド送信コスト
Neural Engine で全処理完結
🔧 これまでの課題
8GB RAM の Neo で Whisper モデルはやや重い
エントリー構成の Neo は、ストレージも RAM も限られます。 数百 MB〜数 GB の Whisper モデルを初回起動でダウンロードし、 推論時にメモリへ展開するのは、快適な体験とは言いがたいものでした。
  • Whisper モデル 500 MB〜3 GB の DL が必要
  • 256 GB SSD の空きを圧迫
  • 初回起動まで数分のダウンロード待ち
✨ v2.2.5 の回答
macOS 26+ では SpeechAnalyzer がデフォルト
v2.2.5 は、macOS 26+ のデフォルト音声エンジンを Apple の SpeechAnalyzer (OS 内蔵) に変更しました。 モデルはすでに OS に含まれているため、RocketWhisper は インストール直後から動きます
  • モデル DL 不要 — その場で起動可能
  • Neural Engine + 統合メモリで低負荷・省電力
  • Foundation Models の AI 整形も API キー不要
“Built for Apple Intelligence” な Mac のための、
“Built for Apple Intelligence” 音声入力。
もちろん M1 ∼ M4 の上位 Mac でも、WhisperKit との切替で最高の柔軟性を維持します。
Why RocketWhisper?

Mac標準の音声入力ではできないこと

RocketWhisperは、macOS内蔵の音声入力にはない高度な機能を提供します。

macOS 標準音声入力
  • × 専門用語の辞書登録ができない
  • × 誤認識の自動修正ルールがない
  • × AI による文章整形がない
  • × 選択テキストをAIで編集できない
  • × 音声コマンドが限定的
  • × アプリごとの処理切替がない
  • × 句読点の制御ができない
  • × 音声でアプリを起動できない
  • × 音声で検索できない
  • × Apple のサーバーに音声を送信
RocketWhisper PRO
  • 単語辞書で社名・人名・専門用語を正確に認識
  • 正規表現対応の自動修正ルール
  • Apple Intelligence + GPT-4o / Claude / Gemini で自動整形
  • AIコマンドで選択テキストを音声指示で編集
  • 「改行」「削除」等の音声コマンド
  • アプリ別モードで自動切替
  • 7段階の自動句読点エンジン
  • ボイスランチャーでアプリ・URL起動
  • 音声検索で「〜を調べて」とGoogle検索
  • Apple SpeechAnalyzerで爆速認識(macOS 26+)
  • 100%ローカル処理、データ送信なし
Features

21のプレミアム機能

プロフェッショナルの要求に応える、妥協のない機能群。

🎤

高精度音声認識

Neural Engine と CoreML による高精度認識。4つの WhisperKit モデル + Apple SpeechAnalyzer から用途に応じて選択可能。

🔒

完全オフライン動作

すべての音声認識処理は端末上で完了。インターネット接続不要で、機密情報も安全にテキスト化。

グローバルショートカット

デフォルト ⌥Space で、どのアプリからでも即座に音声入力を開始。カスタマイズ可能。右Optionキーにも対応。

AI テキスト整形

Apple Intelligence・OpenAI・Claude・Gemini・Groq・ローカルLLMの6プロバイダ対応。Apple Intelligence ならAPIキー不要で即利用可能。文法修正、ビジネス文、要約、翻訳を自動処理。

🔍

音声検索

「〜について調べて」「〜を検索して」「〜って何?」等、10パターンの音声コマンドでGoogle検索を即座に起動。

🚀

ボイスランチャー

音声でアプリ起動やURL表示。キーワードを話すだけで、よく使うツールに即座にアクセス。

💻

アプリ別処理モード

アプリごとに異なる処理設定を自動適用。エディタでは句読点あり、チャットではカジュアルに。

💬

音声コマンド

「改行」「段落」「削除」等の音声コマンドで、手を使わずにテキスト編集。7つの組み込みコマンド搭載。

自動句読点挿入

日本語に特化した7段階の句読点ルールで、自然な読点・句点・疑問符を自動挿入。

🛠

自動修正ルール

正規表現対応の修正ルールで誤認識を自動修正。27件のハルシネーションフィルターも内蔵。

🎶

フローティング波形インジケーター NEW

録音中に画面上にミニイコライザー風の波形バーを表示。ドラッグで移動可能、常に最前面で録音状態を視覚的に確認。

右Option 押し続けモード NEW

右Optionキーを押している間だけ録音し、離すと自動停止して認識開始。Push-to-Talk スタイルで、より直感的な音声入力を実現。

🌐

Fnキー Push-to-Talk NEW

Fnキー(🌐)を押している間だけ録音するPush-to-Talkモード。ダブルタップで常時録音に切替も可能。Wispr Flow や macOS 音声入力と同じ操作感。

📂

バッチ処理

複数の音声ファイルを一括で文字起こし。ドラッグ&ドロップで追加し、TXT・SRT・VTT形式でエクスポート。

Processing Pipeline

6段階テキスト処理パイプライン

認識テキストを自動的に高品質な出力に変換する、インテリジェントな処理フロー。

Stage 0
🚀 ランチャー
キーワードでアプリ起動
Stage 0.5
🔍 音声検索
「〜を調べて」で検索
Stage 1
💬 音声コマンド
改行・削除等を検出
Stage 2
📚 辞書・修正
用語置換と誤認識修正
Stage 3
✎ 句読点挿入
7ルールで自然な句読点
Stage 4
✨ AI整形
LLMで文章をブラッシュアップ
AI Integration

5つのAIプロバイダを統合

用途・予算・プライバシーレベルに合わせて、最適なAIを選択。

OpenAI
GPT-4o
GPT-4o mini
GPT-4 Turbo
Claude
Sonnet 4.5
Haiku 4.5
Opus 4.5
Gemini
2.5 Pro
2.5 Flash
2.0 Flash
Groq
LLaMA 3.3 70B
LLaMA 3.1 8B
超高速・無料枠あり
ローカル
LM Studio
Ollama
完全プライベート

内蔵テンプレート

💼 ビジネス
🙌 カジュアル
📑 要約
🌐 翻訳
🔧 文法修正
カスタム
Whisper Models

4つのAIモデル

速度と精度のバランスに応じて最適なモデルを選択。すべてオンデバイスで動作。

モデル サイズ 速度 精度 用途
Small 500 MB ⚡⚡⚡⚡ リアルタイム入力
Medium 1.5 GB ⚡⚡⚡ バランス重視
Large V3 Turbo 推奨 1.6 GB ⚡⚡⚡ 高精度・高速
Large V3 3.0 GB ⚡⚡ 最高精度が必要な場面

※ 日本語の音声認識には Large V3 Turbo 以上のモデルを推奨します。Small / Medium では漢字変換やカタカナ語の精度が低下する場合があります。

Specifications

動作環境

💻 システム要件

  • macOS 14.0 Sonoma 以降
  • Apple Silicon 推奨 (M1 / M2 / M3 / M4)
  • RAM 8GB 以上 (16GB 推奨)
  • ストレージ 200MB + モデル (最大3GB)
  • マイク入力

🎤 入出力

  • 入力: マイク (リアルタイム録音)
  • 出力: 直接テキスト入力 / クリップボード
  • ショートカット (⌥Space) / 右Option / Fnキー (タップ&Push-to-Talk)
  • AIコマンド (⌃⇧Space) で選択テキスト編集
  • アプリ検出による自動処理切替

🌐 対応言語

  • 日本語 (メイン対象)
  • English / 中文 / 한국어
  • Français / Deutsch / Español
  • Português / Italiano / Русский

🔐 プライバシー

  • 音声認識は100%ローカル処理
  • 音声データの外部送信なし
  • AI整形はユーザーのAPIキーで直接接続
  • App Sandbox + Hardened Runtime
RocketWhisper

あなたの声で、仕事を加速させよう。

7日間のフルトライアル。クレジットカード不要。

v2.2.5 | macOS 14.0 Sonoma 以降 | Apple Silicon & Intel 対応 | ライブ翻訳は macOS 26+

よくある質問

RocketWhisperは無料で使えますか?+

すべての機能を無料でお試しいただけます。トライアル期間終了後は買い切りライセンス(個人版4,800円)が必要です。月額料金は一切かかりません。

インターネット接続なしで使えますか?+

完全オフラインで動作します。音声データはすべてMac内で処理され、外部サーバーに一切送信されません。

認識精度はどの程度ですか?+

OpenAI Whisperの最新モデル(large-v3-turbo)を搭載し、日本語の認識精度は業界トップクラスです。73個のハルシネーション対策と専門用語登録で実用的な精度を実現しています。

Apple Silicon (M1/M2/M3/M4) に対応していますか?+

はい、Apple Siliconにネイティブ対応しています。チップの性能を最大限に活用して高速な音声認識を実現します。Intel Macでも動作します。

MacBook Neo (A18 Pro / 8GB RAM) で快適に動きますか?+

はい、MacBook Neo に最適化されています。v2.1.0 から macOS 26+ のデフォルト音声エンジンを Apple の SpeechAnalyzer(OS内蔵)に切り替えたため、WhisperKit モデルのダウンロード(数百MB〜数GB)が不要です。8GB RAM / 256GB SSD の Neo でも、インストール直後からストレージや RAM を圧迫せずに使えます。Foundation Models によるAI整形もオンデバイス完結で、APIキーやクラウド送信は一切必要ありません。v2.2.1 で追加されたライブ翻訳も Apple Translation を使うため完全オンデバイスで動作します。

ライブ翻訳機能とは何ですか?🎬+

v2.2.1 で追加された新機能です。Mac 上で再生されるあらゆる音声(Web 会議・動画・Podcast など)を Apple SpeechAnalyzer で認識し、Apple Translation で別言語に翻訳してデスクトップ上に Netflix 風のフローティング字幕として表示します。クラウド送信ゼロ・APIキー不要・完全オンデバイス。英語講演を日本語字幕で見る、中国語ニュースを日本語で追うなど、言語の壁を越える体験を提供します。ドラッグで字幕位置を変更可能、履歴行数・ソース表示も細かく設定できます。macOS 26 以降が必要です。

会議の議事録作成に使えますか?+

リアルタイム音声入力でも、録音ファイルからのバッチ処理でも文字起こしできます。AI処理機能で結果を自動的に要約・整形することも可能です。

動画の字幕作成はできますか?+

MP4・MKV・AVI・MOV・WebMなどの動画ファイルから直接文字起こしが可能です。SRT・VTT形式での字幕ファイル出力にも対応しています。