RocketWhisper

声を、テキストに。
瞬時に、正確に。

完全オフライン・買い切りのAI音声認識・文字起こしソフト

16 プレミアム機能
73 ハルシネーション対策
100% オフライン動作
無料ダウンロード
Scroll

こんな悩みはありませんか?

プライバシーが心配

音声入力したいけど、クラウドに音声データを送りたくない...

認識精度が低い

他の音声認識ソフトは誤変換が多くて使い物にならない...

専門用語が認識されない

業界特有の用語や固有名詞がうまく変換されない...

句読点が面倒

句点や読点を手動で入力するのが面倒...

RocketWhisperが解決します

OpenAI Whisperで高精度認識

世界最高水準のAI音声認識エンジンを搭載。日本語の認識精度は業界トップクラス。

完全ローカル処理

すべての音声処理はあなたのPC内で完結。データは外部に一切送信されません。

専門用語カスタム辞書

業界用語や固有名詞を登録。Whisperの初期プロンプト機能で認識精度を向上。

自動句読点挿入

AIが文脈を理解して自然な位置に句読点を自動挿入。手間なく完璧な文章を作成。

NEW

NVIDIAグラフィックボードで
爆速認識

お使いのPCにNVIDIA製GPUが搭載されていれば、音声認識処理が数倍〜10倍以上高速化
面倒な設定は一切不要 ── 起動するだけで自動的にGPUを検出し、最適な高速化を適用します。

CPU のみ 通常速度
GPU 使用 数倍〜10倍以上高速
設定不要・自動検出
GPUがなくてもCPUで動作
NVIDIA CUDA対応
NEW

声でAI操作 & Web検索

2つの強力な新機能で、音声認識がさらにパワフルに進化しました。

AIコマンドモード

テキストを選択してホットキーを押し、「翻訳して」「要約して」「敬語に直して」と声で指示するだけ。AIが即座にテキストを処理します。

テキスト選択 + 音声指示でAI処理
翻訳・要約・敬語変換など自由自在
どのアプリでも使用可能

音声検索

「東京タワーについて調べて」と話すだけで、デフォルトブラウザでGoogle検索を自動実行。調べ物がこれまで以上にスムーズに。

「〇〇について調べて」で即検索
日本語・英語の10種類以上のフレーズに対応
デフォルトブラウザで自動起動

100%オフライン対応
AI処理機能もローカルLLM(LM Studio / Ollama)を使えば、完全オフライン・完全無料を実現!
もちろんOpenAI・Gemini・Claude・Groq等のクラウドLLMにも対応しています。

NEW

右Alt 押し続けで即座に音声入力

トランシーバーのように、右Altキーを押している間だけ録音。離すと自動で認識開始。
余計な操作なし、直感的なPush-to-Talkで音声入力がさらに快適に。

押し続けモード

右Altを押し続ける → 話す → 離す → 自動認識。短い文章の入力に最適です。

ダブルタップモード

右Altを素早く2回タップ → 常時録音開始。もう一度タップで停止。長い文章に最適です。

Alt+Tab等の通常ショートカットはそのまま使用可能
Windowsメニュー起動を完全抑制
v1.1.1からデフォルトのホットキーに設定
NEW

ホットキーひとつでカスタム指示を即実行

よく使うAI処理を専用ホットキーに登録。話すだけで翻訳・敬語変換・要約などが自動適用されます。
AIコマンドモードのように毎回「翻訳して」と指示する必要はありません。最大20個まで登録可能。

使い方

例: 「英語に翻訳」をCtrl+Shift+1に登録 → ホットキーを押す → 日本語で話す → もう一度ホットキー → Whisper認識 → LLMが英語に翻訳 → 結果を自動出力

4つのプリセット

🌐 英語に翻訳 / 💼 ビジネス文体 / 📝 要約 / ✔️ 文法修正 をすぐに使えるプリセットとして搭載。もちろん自由にカスタム追加も可能です。

指示ごとに専用ホットキーを割り当て
音声指示不要 ── 話すだけでAI処理が自動適用
自動コピー&自動貼り付けに対応

充実のプレミアム機能

01

高精度音声認識

Whisper small/medium/large-v3-turbo/large-v3の4モデルに対応。用途に合わせて最適なモデルを選択できます。

02

完全オフライン

インターネット接続は一切不要。飛行機内でも、オフライン環境でも、いつでもどこでも使えます。

03

グローバルホットキー

カスタマイズ可能なショートカットで、どのアプリからでも即座に音声入力を開始。右Alt押し続けモードにも対応。

04

バッチ処理

複数の音声・動画ファイルを一括で文字起こし。会議録音やインタビュー音声、動画ファイル(MP4, MKV等)をまとめて処理できます。

05

認識履歴

過去の認識結果を自動保存。検索機能で必要なテキストをすぐに見つけて再利用できます。

06

音声コマンド

「改行」「段落」「削除」の音声コマンドで、声だけで文章を整形。

07

誤認識自動修正

カスタムルールと正規表現で誤認識を自動修正。73種類のハルシネーション対策も内蔵。

08

専門用語登録

業界用語や固有名詞を登録して認識精度を向上。Whisperの初期プロンプト機能を活用。

09

アプリ別処理モード

使用するアプリに応じて異なる処理設定を自動適用。メールは敬語、メモはカジュアルに。

10

AI処理(LLM連携)

OpenAI、Gemini、Claudeはもちろん、ローカルLLM(LM Studio/Ollama)にも対応。完全オフラインでもAI処理が可能。

11

録音中インジケーター

タスクトレイ格納時にホットキー録音すると、リアルタイム波形表示付きのフローティングウィンドウで録音状態を確認できます。

12

音声ランチャー

特定のキーワードを話すと、登録したアプリケーションを自動起動。「メモ帳」と言えばメモ帳が開きます。

13

AIコマンドモード

テキストを選択して専用ホットキー+音声指示で、翻訳・要約・敬語変換などをAIが即座に処理します。

14

音声検索

「〇〇について調べて」と話すだけで、デフォルトブラウザでGoogle検索を自動実行。10種類以上のフレーズに対応。

15

右Alt 押し続けモード

右Altキーを押している間だけ録音、離すと自動停止。ダブルタップで常時録音モードにも切り替え可能。

16

カスタム指示

よく使うAI処理を専用ホットキーに登録。翻訳・敬語変換・要約など最大20個、ワンキーで即実行。

かんたん3ステップ

1

モデルをダウンロード

アプリを起動して、お好みのWhisperモデルをダウンロード。小さなモデルなら数分で完了。

2

マイクで話すかファイルを選択

録音ボタンを押して話すか、既存の音声ファイルをドラッグ&ドロップ。

3

認識結果をコピー・保存・貼り付け

テキストをクリップボードにコピー、ファイル保存、または直接アプリに貼り付け。

こんな方におすすめ

ライター・ブロガー

思考を止めずに文章を書き続けられます。アイデアを即座にテキスト化。

議事録作成者

会議録音を素早く文字起こし。バッチ処理で複数ファイルも一括変換。

プライバシー重視のユーザー

音声データは一切外部送信されません。機密情報も安心して音声入力できます。

動作環境・スペック

動作環境

対応OS Windows 11 / Windows 10(バージョン1809以降)
※ 64ビット版のみ対応。32ビット版は非対応
CPU 必須: x64 (64ビット) 対応プロセッサ
推奨: Intel Core i5 / AMD Ryzen 5 以上
メモリ 最小: 4GB RAM
推奨: 8GB RAM以上(large-v3-turboモデル使用時は8GB以上推奨)
ディスク容量 アプリ本体: 約200MB
モデル: 75MB〜2.9GB(選択するモデルによる)
ランタイム .NET 8.0 Desktop Runtime
※ Full版は同梱。Lite版は初回起動時にインストールを案内
その他 マイク(リアルタイム認識用)
インターネット接続(モデルダウンロード時・クラウドLLMのAI処理機能使用時)
※ ローカルLLM(LM Studio/Ollama)使用時はインターネット不要

モデル別 メモリ・ディスク要件

モデル ファイルサイズ 推奨メモリ 特徴
medium 1.5GB 8GB 5秒以内の短い発話に最適
large-v3-turbo 1.6GB 8GB 5〜20秒の発話におすすめ(高速)
large-v3 2.9GB 16GB 20秒以上の長い発話に最適(最高精度)

テクニカルスペック

フレームワーク .NET 8.0 WPF
認識エンジン OpenAI Whisper (Whisper.NET 1.9.0)
対応言語 日本語 / 英語 / 中国語 / 韓国語 / 自動検出
対応入力形式 WAV / MP3 / FLAC / OGG / M4A / WMA
出力形式 テキスト / クリップボードコピー / 直接貼り付け
GPU高速化 NVIDIA CUDA 対応(自動検出)
NVIDIA製GPUがあれば自動的に高速化。GPUがなくてもCPUで問題なく動作します

今すぐ無料でダウンロード

🍎 Mac版はこちら | 🐧 Linux版はこちら

最新バージョン: 1.2.0

Lite

RocketWhisper Lite

約50MB

高速インターネット環境をお持ちの方におすすめ。インストール後、初回起動時にAIモデルをダウンロードします。

  • 軽量インストーラー(約50MB)
  • 初回起動時にモデルを自動ダウンロード
  • 4種類のモデルから選択可能
  • .NET Runtime は別途インストール
必要なもの: インターネット接続(初回のみ)、.NET 8.0 Desktop Runtime

Lite版 vs Full版 比較

項目 Lite版 Full版
インストーラーサイズ 約50MB 約1.7GB
AIモデル 初回起動時にダウンロード large-v3-turbo同梱
.NET Runtime 別途インストール必要 同梱(自動インストール)
オフライン使用 モデルダウンロード後は可能 インストール直後から可能
初回起動 モデルDL後に使用開始 即座に使用可能
おすすめ環境 高速インターネット環境 オフライン・セキュリティ重視

動作要件: Windows 11 / 10 (64bit)、RAM 8GB以上推奨、.NET 8.0 Desktop Runtime

よくある質問

RocketWhisperは無料で使えますか?

はい、すべての機能を無料でお試しいただけます。トライアル期間終了後は買い切りライセンス(個人版4,800円)のご購入が必要です。月額料金は一切かかりません。

🔒

インターネット接続なしで使えますか?

はい、完全オフラインで動作します。音声データはすべてお使いのPC内で処理され、外部サーバーに一切送信されません。プライバシーを重視する方に最適です。

🎯

認識精度はどの程度ですか?

OpenAI Whisperの最新モデル(large-v3-turbo)を搭載し、日本語の認識精度は業界トップクラスです。73個のハルシネーション対策と専門用語登録で実用的な精度を実現しています。

GPUがなくても使えますか?

はい、CPUのみでも動作します。NVIDIA GPUをお持ちの場合はCUDA加速が自動的に有効になり、認識速度が大幅に向上します。設定不要で完全自動です。

📋

会議の議事録作成に使えますか?

はい、リアルタイム音声入力でも、録音ファイルからのバッチ処理でも文字起こしできます。AI処理機能で結果を自動的に要約・整形することも可能です。

🎬

動画の字幕作成はできますか?

はい、MP4・MKV・AVI・MOV・WebMなどの動画ファイルから直接文字起こしが可能です。SRT・VTT形式での字幕ファイル出力にも対応しています。