よくある質問(FAQ)
7日間の無料試用版をご用意しています。試用期間中はすべての機能を制限なくお試しいただけます。
試用期間終了後は、ライセンスをご購入いただくことで引き続きご利用いただけます:
- 個人版: 4,800円(1PC単位)
- 法人版: 59,800円(PC台数無制限)
音声認識機能は、初回のモデルダウンロード後は完全にオフラインで動作します。
AI処理機能を使用する場合:
- クラウドAPI(OpenAI / Anthropic / Groq / Gemini): インターネット接続が必要
- ローカルLLM(LM Studio / Ollama): インターネット接続不要(完全オフライン)
音声データはどこにも送信されません。音声認識処理はすべてお使いのコンピュータ内で完結します。
AI処理機能を使用する場合、認識結果のテキストのみが送信されます:
- クラウドAPI(OpenAI / Anthropic / Groq / Gemini): 認識結果テキストが各プロバイダのサーバーに送信されます
- ローカルLLM(LM Studio / Ollama): データは外部に送信されません(完全オフライン)
詳細はプライバシーポリシーをご確認ください。
認識精度は使用するモデルによって異なります。
- large-v3-turbo: 高精度・高速(日本語認識率93%以上)【デフォルト・推奨】
- large-v3: 最高精度(日本語認識率95%以上)
- medium: 高精度(日本語認識率90%以上)
- small: 良好(日本語認識率85%以上)
クリアな音声であれば、large-v3-turbo以上のモデルで実用的な精度が得られます。
はい、CPUのみでも動作します。ただし、GPUがあると認識速度が大幅に向上します。GPUなしの場合は、large-v3-turboまたはsmallモデルの使用をおすすめします。
現在、RocketWhisperはWindows専用です。将来的に他のプラットフォームへの対応を検討しています。
はい、日本語、英語、中国語、韓国語に対応しています。また、自動言語検出機能により、話している言語を自動的に判別することもできます。
はい、複数の方法で保存できます。
- テキストファイル(.txt)として保存
- SRT/VTT形式の字幕ファイルとして保存
- クリップボードにコピー
- 認識履歴に自動保存(後から参照可能)
はい、長時間の音声ファイルも処理できます。ファイルは自動的に適切なサイズに分割されて処理されます。ただし、PCのスペックによって処理時間は変わります。
設定画面の「専門用語」タブで、認識させたい用語を登録してください。Whisperの初期プロンプト機能を使用しており、登録された用語は認識精度が向上します。
また、「テキスト処理」タブの誤認識修正ルールでは、認識後の文字列置換も可能です。
設定画面の「アプリ別処理」タブで、使用するアプリケーションごとに異なる処理モードを設定できます。例えば、メールソフトでは敬語を使った丁寧な文体、メモ帳ではカジュアルな文体といった使い分けが可能です。
お問い合わせ方法
バグ報告
バグを発見された場合は、以下の情報を含めてメールでご報告ください。
バグ報告に含めるべき情報
- RocketWhisperのバージョン(設定画面で確認可能)
- Windowsのバージョン(Windows 11、ビルド番号)
- 使用しているWhisperモデル(small/medium/large-v3-turbo/large-v3)
- 問題の詳細な説明
- 何をしようとしたか
- 何が起こったか
- 期待していた動作
- 再現手順(問題を再現する手順)
- エラーメッセージ(表示された場合)
- スクリーンショット(問題を説明するのに役立つ場合)
機能リクエスト
新機能のアイデアやご要望がありましたら、お気軽にメールでお知らせください。
機能リクエストに含めるべき情報
- 機能の概要(どんな機能が欲しいか)
- ユースケース(どのような場面で使いたいか)
- 期待される効果(この機能があるとどう便利になるか)
- 参考情報(似た機能を持つ他のアプリなど)
謝辞
RocketWhisperは以下のオープンソースライブラリを利用しています:
- OpenAI Whisper - 音声認識エンジン
- Whisper.NET - .NET向けWhisperラッパー
- NAudio - オーディオライブラリ
- CommunityToolkit.Mvvm - MVVMツールキット
これらのプロジェクトの開発者・コントリビューターの皆様に感謝いたします。