1. インストール方法
動作要件
- Windows 11 (64bit)
- .NET 8.0 Desktop Runtime
- RAM 8GB以上推奨
- GPU(CUDA対応)があると高速化
インストール手順
- ダウンロードページから最新版をダウンロード
- ダウンロードしたZIPファイルを展開
RocketWhisper.exeを実行- 初回起動時、使用するWhisperモデルをダウンロード
モデルの選び方
| モデル | サイズ | 精度 | 速度 | おすすめ用途 |
|---|---|---|---|---|
| small | 466MB | 高 | 速い | 低スペックPC向け |
| medium | 1.5GB | 高 | 普通 | 5秒以内の音声におすすめ |
| large-v3-turbo | 1.6GB | 高 | 速い | 5〜20秒の音声におすすめ |
| large-v3 | 2.9GB | 最高 | やや遅い | 20秒以上の音声におすすめ |
💡 選び方のポイント
- 短い音声(5秒以内):medium がおすすめ
- 中程度の音声(5〜20秒):large-v3-turbo がおすすめ
- 長い音声(20秒以上):large-v3 が高精度
※ 大きなモデルは短い音声で繰り返しが発生することがあります。短い発話が中心の場合は medium をお試しください。
2. 基本的な使い方
マイク入力で音声認識
- RocketWhisperを起動
- 録音ボタン(マイクアイコン)をクリック
- マイクに向かって話す
- 停止ボタンをクリック
- 認識結果がテキストエリアに表示される
ファイルから音声認識
- ファイル選択ボタンをクリック
- 音声ファイル(WAV/MP3/FLAC/OGG/M4A/WMA)を選択
- 自動的に認識処理が開始
- 認識結果がテキストエリアに表示される
ドラッグ&ドロップ対応
音声ファイルをRocketWhisperのウィンドウにドラッグ&ドロップするだけで、すぐに認識を開始できます。
認識結果の利用
- コピー: コピーボタンでクリップボードにコピー
- 保存: 保存ボタンでテキストファイルとして保存
- 自動コピー: 設定で有効にすると認識完了時に自動コピー
- 自動貼り付け: 設定で有効にすると認識完了時に自動貼り付け
3. 設定
歯車アイコンをクリックして設定画面を開きます。8つのタブで詳細な設定が可能です。
モデル・言語タブ
- モデル選択: 使用するWhisperモデルを選択
- 言語: 認識言語(日本語/英語/中国語/韓国語/自動検出)
- 句読点プロンプト: Whisperに句読点を含む認識結果を出力させる(推奨)
入力デバイスタブ
- マイクデバイス: 使用するマイクを選択
- 自動コピー: 認識完了時に自動でクリップボードにコピー
- 自動貼り付け: 認識完了時に自動でアクティブウィンドウに貼り付け
ホットキータブ
- 録音開始/停止ホットキー: どのアプリからでも録音を開始できるショートカット
- 右Alt (押し続け): 右Altを押し続けて録音、離して停止するモード(ダブルタップで常時録音も可能)
- キャンセルホットキー: 録音をキャンセルするキー(デフォルト: Escape)
- AIコマンドホットキー: テキスト選択+音声指示でAI処理を実行するキー(デフォルト: Ctrl + Space)
専門用語タブ
- カスタム用語登録: 認識精度を向上させるための用語を登録
- トークン使用量: Whisperは最大224トークン相当の用語を受け付けます(日本語約100語)
テキスト処理タブ
- 句読点自動挿入: 認識後に後処理で句読点を追加
- 改行自動挿入: 長い文章を自動的に改行
- 音声コマンド: 音声コマンド機能の有効/無効
誤認識修正タブ
- 自動修正: 誤認識パターンを自動修正する機能の有効/無効
- プリセットルール: AI・技術用語、数字・日付、一般的な誤り、フィラー削除をワンクリックで追加
- カスタムルール: 独自の修正ルールを追加・編集(正規表現対応)
アプリ別処理タブ
- 処理モード: アプリごとに異なるテキスト処理設定を適用
- アプリマッピング: 特定のアプリに処理モードを割り当て
AI処理タブ
- AIプロバイダ: OpenAI、Anthropic、Groq、Gemini、ローカルLLMから選択
- モデル選択: 使用するAIモデルを選択
- APIキー: 各プロバイダのAPIキーを入力
- 接続テスト: 設定が正しいか確認
句読点プロンプトと句読点自動挿入の違い
| 機能 | 処理タイミング | 仕組み |
|---|---|---|
| 句読点プロンプト | 認識中(Whisper内部) | AIが文脈を理解して自然な位置に句読点を出力 |
| 句読点自動挿入 | 認識後(後処理) | 「です」「ます」等の後に機械的に句点を挿入 |
まずは句読点プロンプトのみで試し、足りなければ句読点自動挿入も有効にすることをおすすめします。
ライセンスタブ
- ライセンス種別: 無料版、個人ライセンス、ビジネスライセンス
- ライセンスキー: ライセンスキーの入力と認証
4. グローバルホットキー
どのアプリケーションを使用中でも、設定したキーの組み合わせで即座に録音を開始できます。
設定方法
- 設定画面を開く
- 「ホットキー」タブを選択
- 入力欄をクリック
- 使用したいキーの組み合わせを押す(例:
Ctrl + Shift + R) - 「有効」にチェックを入れる
使い方
- テキストエディタやブラウザなど、任意のアプリを開く
- 設定したホットキーを押す → 録音開始
- 話し終えたら再度ホットキーを押す → 録音停止
- 自動貼り付けが有効なら、認識結果が自動的に入力される
おすすめのホットキー
右Alt (押し続け)- 押し続けで録音、離して停止(デフォルト・最もおすすめ)Ctrl + Shift + R- Record(録音)のR(トグル式)F9- ファンクションキー(他と競合しにくい)
右Alt 押し続けモード(Push-to-Talk)
右Altキーを押し続けている間だけ録音し、離すと自動で停止する直感的な操作モードです。
基本操作
| 操作 | 動作 |
|---|---|
| 右Altを押し続ける → 離す | 押している間だけ録音(Push-to-Talk) |
| 右Altを素早く2回タップ | 常時録音モードに切り替え(もう一度タップで停止) |
| 右Alt押し中に他のキー | 録音キャンセル(Alt+Tab等の通常操作はそのまま使用可能) |
設定方法
- 設定画面を開く
- 「ホットキー」タブを選択
- 録音開始/停止ホットキーの「右Alt (押し続け)」ボタンをクリック
- 「有効」にチェックを入れて保存
従来のホットキーとの違い
| モード | 録音開始 | 録音停止 |
|---|---|---|
| 従来のホットキー | 1回押す | もう1回押す(トグル) |
| 右Alt 押し続け | 押し続ける | 離す(自動停止) |
| 右Alt ダブルタップ | 素早く2回タップ | もう1回タップ |
💡 おすすめ
短い文章の入力には「押し続け」、長い文章には「ダブルタップ(常時録音)」がおすすめです。v1.0.5からデフォルトのホットキーは「右Alt (押し続け)」に設定されています。
録音キャンセル
録音中にEscapeキーを押すと、認識処理を行わずに録音をキャンセルできます。押し続けモード・常時録音モードのどちらでもキャンセル可能です。
- デフォルトキー: Escape
- カスタマイズ: 設定画面 → ホットキータブ → キャンセルホットキー
- 有効/無効: チェックボックスで切り替え可能
5. バッチ処理
複数の音声ファイルや動画ファイルを一括で文字起こしできます。動画ファイルはFFmpegで音声を自動抽出して文字起こしします。
バッチ処理の手順
- メニューから「バッチ処理」を選択
- 処理したいファイルを追加(複数選択可)
- 出力形式を選択(テキスト/SRT/VTT)
- 「処理開始」をクリック
- 処理完了まで待機
対応フォーマット
- 音声入力: WAV, MP3, FLAC, OGG, M4A, WMA
- 動画入力: MP4, MKV, AVI, MOV, WebM, WMV, FLV
- 出力: TXT(プレーンテキスト), SRT(字幕), VTT(Web字幕)
※ 動画ファイルの文字起こしにはFFmpegが必要です。インストーラー版には同梱されています。
6. 認識履歴
過去の認識結果は自動的に保存され、いつでも参照・再利用できます。
履歴の確認
- 履歴ボタン(時計アイコン)をクリック
- 過去の認識結果一覧が表示される
- 項目をクリックして詳細を確認
履歴の操作
- 検索: キーワードで過去の認識結果を検索
- コピー: 選択した結果をクリップボードにコピー
- 削除: 不要な履歴を削除
- エクスポート: 履歴をファイルとして出力
履歴の保存場所
履歴データは %APPDATA%\RocketWhisper\history.json に保存されます。
7. テキスト処理(句読点・改行)
認識結果に句読点や改行を自動的に挿入する機能です。2つの方法があります。
句読点プロンプト(推奨)
Whisper AIに句読点を含む認識結果を出力させる機能です。
- 仕組み: サンプル文をWhisperに渡すことで、句読点を含む出力を促す
- メリット: AIが文脈を理解して自然な位置に句読点を付ける
- 対応言語: 日本語、英語、中国語、韓国語
句読点自動挿入(後処理)
認識後にルールベースで句読点を追加する機能です。
- 仕組み: 「です」「ます」などの文末パターンを検出して句点を挿入
- メリット: Whisperが句読点を出力しなかった場合の補完に使える
- 注意点: パターンマッチのため、文脈に依存しない機械的な処理
改行自動挿入
長い文章を適切な位置で改行します。
- 接続詞(「しかし」「また」など)の前で改行
- 100文字以上の長い文を句点で分割
おすすめの設定
- まず句読点プロンプトのみを有効にして試す
- 句読点が足りない場合は句読点自動挿入も有効にする
- 長文の場合は改行自動挿入も検討
8. 音声コマンド
音声で改行や削除などの操作ができます。
利用可能なコマンド
| コマンド | トリガーフレーズ | 動作 |
|---|---|---|
| 改行 | 「改行」「かいぎょう」「エンター」 | 改行を挿入 |
| 段落 | 「段落」「だんらく」「新しい段落」 | 2回改行(段落区切り) |
| 削除 | 「削除」「取り消し」「デリート」 | 直前の単語を削除 |
💡 句読点について
句読点(。、?!)は「句読点プロンプト」や「句読点自動挿入」機能で自動的に挿入されます。設定画面のテキスト処理タブで有効にしてください。
使い方のコツ
- コマンドは文章の区切りではっきりと発声する
- コマンド前後に少し間を置くと認識精度が向上
- 設定画面で音声コマンドの有効/無効を切り替え可能
9. 専門用語登録
業界特有の用語や固有名詞を登録して、認識精度を向上させます。
登録方法
- 設定画面を開く
- 「専門用語」タブを選択
- 用語を入力して「追加」をクリック
登録容量について
Whisperが受け付ける専門用語の登録容量には上限があります(最大224文字相当)。
- 日本語: 約100語程度
- 英語: 約50語程度
登録容量は設定画面でリアルタイムに確認できます。上限を超えると古い用語が無視されるため、よく使う用語を優先的に登録してください。
この機能は完全無料です
専門用語登録はWhisperの初期プロンプト機能を使用しており、すべてローカルで処理されます。APIコストは一切かかりません。
10. 誤認識修正ルール
特定の誤認識パターンを自動的に修正するルールを設定できます。IMEの単語登録のように、認識された文字列を別の文字列に置換します。
ルールの追加方法
- 設定画面を開く
- 「誤認識修正」タブを選択
- 「誤認識パターンを自動修正する」にチェックを入れる
- 「修正ルールを編集...」ボタンをクリック
- 「検索パターン」と「置換文字列」を入力
- 「ルールを追加」をクリック
基本的な使い方(シンプル置換)
正規表現を使わずに、単純な文字列置換ができます。
| 検索パターン | 置換文字列 | 説明 |
|---|---|---|
| マイクロソフト | Microsoft | カタカナ認識を英語に修正 |
| モジョソフト | Mojosoft | 会社名を正しい表記に |
| ウィスパー | Whisper | 製品名を正しい表記に |
正規表現の使用(高度な置換)
「正規表現を使用」にチェックを入れると、高度なパターンマッチングが可能です。
| 検索パターン | 置換文字列 | 説明 |
|---|---|---|
| マイクロ\s*ソフト | Microsoft | スペースの有無に関係なく置換 |
| ですね$ | ですね。 | 文末の「ですね」の後に句点を追加 |
正規表現の記号説明:
\s*: 空白文字(スペース、タブなど)が0個以上あることを表します。「マイクロ\s*ソフト」は「マイクロソフト」「マイクロ ソフト」の両方にマッチします。$: 行の末尾を表します。「ですね$」は行末の「ですね」にのみマッチし、文中の「ですね」には反応しません。
内蔵ハルシネーション対策
RocketWhisperには73種類のWhisperハルシネーション対策が内蔵されています。「ご視聴ありがとうございました」などの不要なフレーズは自動的に削除されます。
💡 専門用語登録との違い
- 専門用語登録: Whisperに「この単語が出るかも」とヒントを与え、認識精度を向上させる
- 誤認識修正ルール: 認識結果を後から別の文字列に置換する
両方を組み合わせて使うと、より正確な認識結果が得られます。
11. アプリ別処理モード
使用するアプリケーションに応じて、異なるテキスト処理設定を自動的に適用できます。
処理モード一覧
処理モードは、句読点挿入・改行・音声コマンドなどの設定をまとめたプリセットです。
| モード | アイコン | AI必須 | 説明 |
|---|---|---|---|
| スマート | ✨ | 不要 | 句読点・改行を自動で整形(標準設定) |
| シンプル | 📋 | 不要 | 認識したテキストをそのまま出力 |
| ビジネス | 💼 | 必須 | 敬語・丁寧な文体に自動変換 |
| カジュアル | 💬 | 必須 | 親しみやすい文体に変換 |
| 要約 | 📝 | 必須 | テキストを簡潔に要約 |
| 翻訳(日→英) | 🌐 | 必須 | 日本語を英語に翻訳 |
| 文法修正 | ✔️ | 必須 | 誤認識・文法を自動修正 |
💡 ヒント
「AI必須」のモードを使用するには、設定画面の「AI処理」タブでAIプロバイダを設定してください。
アプリへのモード割り当て
- 設定画面を開く
- 「アプリ別処理」タブを選択
- 「アプリを追加」をクリック
- 対象アプリを選択(実行中のアプリ一覧から選択または手動入力)
- 適用する処理モードを選択
活用例
- メールソフト: 句読点・改行を自動挿入(スマートモード)
- プログラミングエディタ: 整形なし(シンプルモード)
- メモ帳: 箇条書き向けの設定(カスタムモード)
標準の処理モード
アプリが未登録の場合は「標準」モードが適用されます。標準モードの設定は「テキスト処理」タブで変更できます。
12. AI処理(LLM連携)
外部のAI(LLM)と連携して、認識結果を自動的にビジネス敬語やカジュアル文体に変換したり、要約・翻訳を行う機能です。ローカルLLM(LM Studio/Ollama)を使えば、オフライン環境でもAI処理が利用できます。
対応AIプロバイダ
| プロバイダ | モデル例 | 特徴 |
|---|---|---|
| OpenAI | gpt-4o, gpt-4o-mini | 高精度、安定した品質 |
| Anthropic | Claude 4.5 Sonnet/Haiku | 自然な日本語、長文対応 |
| Groq | LLaMA 3.3 70B, Mixtral | 高速・無料枠あり |
| Google Gemini | gemini-2.5-pro/flash | 無料枠豊富、高品質 |
| ローカルLLM | LM Studio, Ollama | オフライン動作、プライバシー保護 |
設定方法
- 設定画面を開く
- 「AI処理」タブを選択
- 使用するプロバイダを選択
- APIキーを入力(ローカルLLMの場合はベースURLのみ)
- 「接続テスト」で動作確認
AI処理モード
AI処理を設定すると、アプリ別処理で以下のモードが使用可能になります。
| モード | 説明 |
|---|---|
| 💼 ビジネス | 敬語・丁寧な文体に自動変換 |
| 💬 カジュアル | 親しみやすい文体に変換 |
| 📝 要約 | テキストを簡潔に要約 |
| 🌐 翻訳 | 日本語から英語に翻訳 |
| ✔️ 文法修正 | 誤認識・文法を自動修正 |
ローカルLLMの設定例
LM StudioまたはOllamaを使用して、完全オフラインでAI処理を利用できます。
LM Studio の場合
LM Studio側の設定:
- LM Studioを起動
- 使用するモデルを選択
- ステータスバーの User / Power User / Developer から「Power User」もしくは「Developer」を選択
- Developerタブに移動(左側メニューの緑色の「Developer」アイコンをクリック)
- 画面上の「Status: Running」のトグルがオンになっていればサーバーは起動しています
- 「Running」であれば、API URL(例:
http://localhost:1234)が表示されます - サーバーを停止するには、トグルをクリックして「Stopped」にします
RocketWhisper側の設定:
| 項目 | 設定値 |
|---|---|
| プロバイダ | ローカルLLM |
| ベースURL | http://127.0.0.1:1234 |
| モデルID | 空欄のままでOK(サーバーでロード中のモデルを自動使用) |
| APIキー | 空欄のままでOK |
Ollama の場合
Ollama側の設定:
- Ollamaをインストールして起動(バックグラウンドで自動的にAPIサーバーが起動します)
- 使用したいモデルをダウンロード:
ollama pull gemma3 - ダウンロード済みモデルの確認:
ollama list
RocketWhisper側の設定:
| 項目 | 設定値 |
|---|---|
| プロバイダ | ローカルLLM |
| ベースURL | http://localhost:11434 |
| モデルID | ダウンロード済みのモデル名を入力(例: gemma3) |
| APIキー | 空欄のままでOK |
💡 LM StudioとOllamaの違い
| 項目 | LM Studio | Ollama |
|---|---|---|
| デフォルトポート | 1234 | 11434 |
| モデルID | 空欄でOK(ロード中のモデルを自動使用) | 必須(ダウンロード済みモデル名を指定) |
| GUI | あり(デスクトップアプリ) | CLIベース(別途Open WebUI等で補完可能) |
ローカルLLMのメリット
- 完全オフライン: 音声認識もAI処理もインターネット接続不要
- プライバシー保護: 音声データもテキストも外部に一切送信されません
- 無料: APIコストがかかりません
※ /v1 パスは自動的に追加されます
💡 処理フロー
AI処理は、音声認識 → 句読点挿入 → 改行挿入 → AI処理 → 半角→全角変換 の順で処理されます。AI処理が失敗した場合は、元のテキストがそのまま使用されます。
13. AIコマンドモード
テキストを選択して専用ホットキーを押し、音声で指示するだけでAIが即座にテキストを処理する機能です。翻訳、要約、敬語変換など、自由な指示に対応します。
基本的な使い方
- 任意のアプリケーション(メモ帳、ブラウザ、Word等)でテキストを選択
- AIコマンドホットキー(デフォルト:
Ctrl + Space)を押す - ステータスが「音声指示を待機中...」に変わるので、音声で指示(例: 「日本語に翻訳して」「要約して」「敬語に直して」)
- もう一度AIコマンドホットキーを押して録音停止
- AIが処理を実行し、結果がRocketWhisperのテキストエリアに表示されます
使用例
| 選択テキスト | 音声指示 | 結果 |
|---|---|---|
| 英語の文章 | 「日本語に翻訳して」 | 日本語に翻訳されたテキスト |
| 長い議事録 | 「要約して」 | 簡潔な要約 |
| カジュアルなメモ | 「敬語に直して」 | ビジネス文体のテキスト |
| プログラムのコード | 「コメントを追加して」 | コメント付きのコード |
ホットキーの設定
- 設定画面を開く
- 「ホットキー」タブを選択
- 「AIコマンドホットキー」の入力欄をクリック
- 使用したいキーの組み合わせを押す(デフォルト:
Ctrl + Space) - 「有効」にチェックを入れる
前提条件
AIコマンドモードを使用するには、設定画面の「AI処理」タブでAIプロバイダを設定する必要があります。ローカルLLM(LM Studio / Ollama)を使えば、完全オフライン・完全無料で利用できます。
💡 排他制御
通常の録音中はAIコマンドは無効になり、AIコマンド録音中は通常のホットキーは無効になります。誤操作を防ぐ安全設計です。
14. カスタム指示
よく使うAI処理(翻訳、敬語変換、要約など)を専用ホットキーに登録し、音声で話すだけで自動適用する機能です。AIコマンドモードと異なり、毎回「翻訳して」と指示する必要がなく、繰り返し作業を効率化できます。
セットアップ
- 設定画面の「AI処理」タブでAIプロバイダを設定(ローカルLLMでもクラウドAPIでも可)
- 設定画面の「ホットキー」タブで「カスタム指示」セクションを開く
- プリセット(英語に翻訳、ビジネス文体、要約、文法修正)から選択、または「追加」で新規作成
- 使用したいホットキーを割り当てる
- 「有効」にチェックを入れる
基本的な使い方
- 登録済みのカスタム指示ホットキーを押す
- マイクに向かって話す(日本語や英語など、任意の内容)
- もう一度同じホットキーを押して録音停止
- Whisperが音声を認識 → 登録済みのAI処理が自動適用 → 結果を出力
プリセット一覧
| プリセット | アイコン | 動作内容 |
|---|---|---|
| 英語に翻訳 | 🌐 | 認識したテキストを英語に翻訳 |
| ビジネス文体 | 💼 | 敬語・丁寧な文体に整形 |
| 要約 | 📝 | テキストを簡潔に要約 |
| 文法修正 | ✔️ | 誤認識・文法の誤りを修正 |
カスタム指示の追加
- 設定画面の「ホットキー」タブ →「カスタム指示」セクション →「追加」ボタン
- 指示名(例: 「フランス語に翻訳」)を入力
- プロンプト(例: 「以下のテキストをフランス語に翻訳してください」)を入力
- 専用ホットキーを割り当て
- 「保存」で完了
最大20個まで登録できます。
💡 AIコマンドモードとの違い
AIコマンドモードは、テキストを選択して毎回声で指示を出す汎用ツールです。カスタム指示は、あらかじめ設定したプロンプトをホットキーに紐付けるため、音声指示が不要で繰り返し作業に最適です。
前提条件
カスタム指示を使用するには、設定画面の「AI処理」タブでAIプロバイダを設定する必要があります。ローカルLLM(LM Studio / Ollama)を使えば、完全オフライン・完全無料で利用できます。
💡 排他制御
通常の録音中やAIコマンド録音中はカスタム指示のホットキーは無効になります。誤操作を防ぐ安全設計です。
15. 録音中インジケーター
タスクトレイに格納した状態でホットキー録音を行うと、録音状態を視覚的に確認できるフローティングウィンドウが表示されます。
インジケーターの機能
- リアルタイム波形表示: 16本のバーで音声レベルを視覚化
- 処理モード表示: 現在適用中のモード(スマート、ビジネス等)をアイコンと名前で表示
- フォーカス非奪取: 他のアプリの操作を妨げません
- ドラッグ移動: 好きな位置に移動可能、位置は自動保存
デフォルト位置
初回は画面下部中央(タスクバーの上)に表示されます。ドラッグして移動すると、次回から同じ位置に表示されます。
インジケーターの表示条件
録音中インジケーターは、RocketWhisperがタスクトレイに格納されている状態でホットキー録音を行ったときのみ表示されます。メインウィンドウが表示されている場合は表示されません。
16. 音声ランチャー
特定のキーワードを認識したら、対応するアプリケーションを自動起動する機能です。「メモ帳」と話すだけでメモ帳が開くなど、声だけでアプリを操作できます。
設定方法
- 設定画面を開き、「音声ランチャー・検索」タブを選択
- 「音声ランチャーを有効にする」にチェック
- 「ランチャー設定を編集...」をクリック
- 「追加」ボタンでキーワードと実行ファイルを登録
- 設定画面で「保存」をクリック
登録項目
| 項目 | 説明 | 例 |
|---|---|---|
| キーワード | 起動トリガーとなる言葉 | メモ帳、電卓、ブラウザ |
| 実行ファイル | 起動するアプリのパス | C:\Windows\notepad.exe |
| パラメータ | 起動時の引数(オプション) | --new-window |
| 説明 | メモ(オプション) | メモ帳を起動 |
マッチング仕様
- 完全一致: 認識結果がキーワードと完全に一致した場合のみ起動
- 句読点は無視: 末尾の「、」「。」「!」「?」は自動的に除去されます
- 大文字小文字を区別しない: 英単語は大文字小文字を区別しません
登録のコツ
話す言葉をそのままキーワードとして登録してください。例えば「メモ帳を開いて」と話すなら、キーワードも「メモ帳を開いて」と登録します。短いキーワード(「メモ帳」など)の方が認識しやすくなります。
音声コマンドとの違い
音声コマンド(「改行」「段落」など)はテキスト編集用の機能で、音声ランチャーはアプリケーション起動用の機能です。両方を同時に有効にできますが、同じキーワードが登録されている場合は音声ランチャーが優先されます。
17. 音声検索
通常の音声入力で「〇〇について調べて」と話すだけで、デフォルトブラウザでGoogle検索を自動実行する機能です。
対応フレーズ
| フレーズ | 例 |
|---|---|
| 〇〇について調べて | 「東京タワーについて調べて」 |
| 〇〇を検索して | 「天気予報を検索して」 |
| 〇〇をググって | 「レシピをググって」 |
| 〇〇について教えて | 「Pythonについて教えて」 |
| 〇〇って何? | 「AIって何?」 |
| 〇〇とは | 「機械学習とは」 |
| Search 〇〇 / Look up 〇〇 | 「Search RocketWhisper」 |
| Google 〇〇 | 「Google weather forecast」 |
設定方法
- 設定画面を開く
- 「音声ランチャー・検索」タブを選択
- 「音声検索を有効にする」にチェック
動作の仕組み
録音 → 音声認識 → フレーズ検出 → デフォルトブラウザでGoogle検索を自動起動という流れで動作します。検索フレーズに一致しない場合は、通常のテキスト処理パイプラインに進みます。
💡 音声ランチャーとの違い
音声ランチャーは「登録したキーワードに完全一致でアプリ起動」、音声検索は「検索フレーズのパターンに一致でブラウザ検索」です。両方を同時に有効にできます。
18. トレイアイコン
タスクトレイのアイコンでアプリケーションの状態を確認できます。
アイコンの状態
| 状態 | アイコン | 説明 |
|---|---|---|
| 待機中 | 🎤(青) | 録音待機状態 |
| 録音中 | 🎤(青)+ 🔴(点滅) | 右下に赤い丸が点滅 |
| 処理中 | ⚙️(黄・回転) | Whisperで音声認識中 |
トレイアイコンの操作
- 左クリック: メインウィンドウを表示
- 右クリック: コンテキストメニューを表示
19. トラブルシューティング
ネットワーク接続を確認してください。ファイアウォールやプロキシの設定が原因の場合があります。
- インターネット接続を確認
- ファイアウォールでRocketWhisperを許可
- VPNを一時的に無効化
- large-v3-turboモデルを使用(高精度・高速、デフォルト)
- マイクを口に近づける
- 周囲の騒音を減らす
- 専門用語を登録する(※専門用語の認識精度をさらに向上させたい場合は、large-v3モデルの使用もご検討ください)
- 設定でホットキーが「有効」になっているか確認
- 他のアプリと競合していないか確認
- 管理者権限で実行してみる
- 設定で音声コマンドが「有効」になっているか確認
- コマンドをはっきりと発声する
- コマンドの前後に少し間を置く
- .NET 8.0 Desktop Runtimeがインストールされているか確認
- Windows 11 64bitであるか確認
- アンチウイルスソフトにブロックされていないか確認
問題が解決しない場合
サポートページからお問い合わせください。