はじめに

ここから始めましょう

📥
インストールガイド
RocketMouse AIのダウンロード、インストール、権限設定の方法。
🧩
ブロックエディタの基本
ドラッグ、ドロップ、スナップ、接続の方法を学びましょう。
🚀
最初のマクロ
5分で最初の自動化を作成・実行するステップバイステップガイド。

リファレンス

操作カテゴリ

24カテゴリ、196種類の操作の詳細ドキュメント。

🖱
マウス操作
クリック、ダブルクリック、ドラッグ、ドロップ、ホイール、移動、修飾キー操作。
16種類
⌨️
キーボード
キーストローク送信、修飾キー対応のテキスト貼り付け。
2種類
🪟
ウィンドウ管理
アクティブ化、閉じる、最小化、最大化、リサイズ、移動。
8種類
🌐
ブラウザ自動化
Playwright搭載Chrome自動化: ナビゲーション、クリック、入力、抽出、スクリプト。
16種類
📊
Excel
セル読み書き、数式、フィルタ、シート管理、Excelマクロ実行。
18種類
📂
ファイル操作
コピー、移動、削除、リネーム、テキストファイル読み書き。
12種類
🔀
制御フロー
if/else、for/while/forEachループ、try-catch、関数、break、continue。
17種類
💾
データ処理
JSON解析、正規表現、文字列操作、数学演算、日付計算。
14種類
👁
画像認識 & OCR
画像認識、テンプレートマッチング、OCRテキスト抽出、色検出。
8種類
🤖
AI自動化
AIクリック、OCR、スマート待機、マクロ自動生成、デバッグ。
6種類
📝
変数 & リスト
変数の定義・削除・検索。リストの作成と操作。
13種類
待機条件
時間、画像、ウィンドウ、色、CPU条件を待機。
5種類
📡
ネットワーク
HTTP GET/POSTリクエスト、ファイルダウンロード。
3種類
⚙️
システム
INIファイル、ダイアログ、クリップボード、サウンド、環境変数、ZIP、Base64、ハッシュ。
13種類

AIブロックガイド

AIブロック詳細 & プロンプト例

各AIブロックのパラメータ、使い方、プロンプト例を解説します。

👁
AIクリック

AIが画面を見て、自然言語で指定したUI要素をクリック。画面端では2パスリファインメントで高精度。

パラメータ: プロンプト(必須)、button(Left/Right/Middle)、clickType(Single/Double)、provider、model、outputX、outputY

プロンプト例:

  • 「保存ボタンをクリック」
  • 「Finderのファイルメニュー」
  • 「ウィンドウ左上の赤い閉じるボタン」
  • 「Safariの検索フィールド」

ヒント: 位置や外観を具体的に。「右下の青い送信ボタン」は「送信」より正確です。

AIスマート待機

AIが画面を定期的に監視し、条件が満たされるまで待機。固定待機の代わりに視覚的な条件判定。

パラメータ: プロンプト(必須)、timeoutMs(デフォルト: 30000)、pollingMs(デフォルト: 2000、最小: 500)、provider、model

プロンプト例:

  • 「ダウンロード完了ダイアログが閉じた」
  • 「メモアプリのウィンドウが画面に表示されている」
  • 「ローディングスピナーが消えた」
  • 「OKボタンのある確認ダイアログが表示されている」

ヒント: 視覚的に確認できる具体的な条件を。「メモアプリのウィンドウが画面に表示されている」は「メモが開いている」より正確。

📖
AI OCR

AIが画面上のテキストを読み取り変数に格納。どんなフォント・言語・アプリでも対応。

パラメータ: prompt(必須)、outputVariable(デフォルト: AiOcrResult)、provider、model

プロンプト例:

  • 「画面に表示されている合計金額を読み取って」
  • 「メモアプリのテキストを読み取って」
  • 「ダイアログのエラーメッセージを読み取って」
  • 「アクティブウィンドウのタイトルを読み取って」
AI検証

AIが画面状態を確認しtrue/falseを返す。操作結果の検証や条件分岐に最適。

パラメータ: プロンプト(必須)、outputVariable(デフォルト: AiValidateResult)、provider、model

プロンプト例:

  • 「ファイルが正常に保存された」
  • 「ログイン画面が表示されている」
  • 「エラーメッセージが表示されている」
  • 「チェックボックスがオンになっている」
🚀
AIオートパイロット

画面を完全自律制御する自律エージェント。デュアルプロバイダのComputer Use: Anthropic(Claude Sonnet 4.6 / Opus 4.7)または OpenAI(GPT-5.5 / GPT-5.4 / computer-use-preview)。スクリーンショット撮影→推論→クリック・入力・スクロールを繰り返しタスク完了まで自動操作。

パラメータ: プロンプト(必須)、maxSteps(デフォルト: 30、最大: 200)、timeoutSeconds(デフォルト: 120、最大: 600)、outputVariable、provider、model

プロンプト例:

  • 「電卓アプリを起動して2+5を計算して」
  • 「テキストエディットを開いてHello Worldと入力して保存して」
  • 「システム設定を開いてダークモードを有効にして」
  • 「Safariを開いてapple.comにアクセスして」

注意: AnthropicまたはOpenAIのAPIキーが必要。AI設定でデフォルトモデルを選択(Sonnet 4.6 / Opus 4.7 / GPT-5.5 / GPT-5.4 / computer-use-preview)。GPT-5.5はTier 1から使えて高速、Sonnet 4.6は複雑なレイアウトに強い、computer-use-previewはTier 3以上が必要。Cmd+Space(Spotlight)は自動化非対応のため、AIはLaunchpad経由でアプリを起動。

💬
AI指示

テキストプロンプトをLLMに送信し、応答を変数に格納。テキスト専用(画面キャプチャなし)。Apple Intelligenceでも動作。

パラメータ: prompt(必須)、outputVariable、provider、model

プロンプト例:

  • 「以下のテキストを3文で要約して: {=myText}」
  • 「英語に翻訳して: {=japaneseText}」
  • 「以下のメールにプロフェッショナルな返信を作成: {=emailContent}」
  • 「{=price}の10%の税額を計算して」
🔶
AI条件判定

AI Visionで画面状態を判定するBoolean(六角形)ブロック。if/whileブロックの条件に使用。

パラメータ: プロンプト(必須)、provider、model

プロンプト例:

  • 「ログイン画面が表示されている」
  • 「画面にエラーメッセージがある」
  • 「ファイルのダウンロードが完了した」
用途別おすすめモデル
AIクリック(高精度)Claude Sonnet 4.6、GPT-4o
AIクリック(低コスト)Gemini 2.5 Flash(無料: 250回/日)、Gemini 2.5 Flash-Lite(無料: 1,000回/日)、GPT-4o-mini
AIスマート待機 / AI検証どのVisionモデルでもOK(Yes/No判定)
AI OCRClaude Sonnet 4.6、GPT-4o(複雑なレイアウト向け)
AIオートパイロットGPT-5.5(高速・Tier 1 OK)、Claude Sonnet 4.6(信頼性)、Claude Opus 4.7 / GPT-5.4 / computer-use-preview
AI指示Apple Intelligence(無料)、Gemini Flash(低コスト)、GPT-4o(高品質)

リファレンス

実行 & デバッグ

▶️
マクロ実行
再生ボタンでスタートブロックから実行。実行中ブロックは緑色ハイライト。一時停止/再開/ステップ実行対応。速度0.1x〜5.0x調整可能。
🐞
ブレークポイント
ブロック右クリックまたはF9で赤い点を設定。マクロは該当ブロック直前で一時停止し、変数確認やステップ実行が可能。
🧪
DryRunモード
マウス/キーボード操作を実際に実行せずロジックをテスト。フロー・条件分岐・変数値を安全に検証。
📊
変数ウォッチ
変数タブで実行中の値をリアルタイム表示。パラメータ内で {=変数名} で参照。ループ変数: {=_loopIndex}, {=_loopIteration}
📝
カスタム関数
FunctionDefine(ハット)で定義、FunctionCallで呼び出し、FunctionReturn(キャップ)で値を返す。再帰は100レベルまで対応。
録画機能
録画ボタンでマウスクリック・キー入力・スクロールを自動記録。録画後、AIが各クリック位置を分析しAIクリックブロックへの変換を提案可能。

リファレンス

キーボードショートカット

Cmd+Z元に戻す
Cmd+Shift+Zやり直し
Cmd+C / Cmd+Vコピー / 貼り付け
Cmd+D選択を複製
Cmd+A全ブロック選択
Delete選択ブロック削除
Cmd+Sプロジェクト保存
Cmd+Shift+S名前を付けて保存
Cmd+Fブロック検索
Homeズームして全体表示
F9ブレークポイント切替
Cmd+Shift+FCブロック展開/折りたたみ
Escape選択解除

ガイド

ブロックエディタ

🎨
7つのブロック形状
スタック、ハット、Cブロック、ブーリアン、レポーター、キャップ、If-Else。各形状は異なる操作タイプを表します。
🔗
スナップ接続
互換コネクタの近くにドラッグすると自動スナップ。視覚ガイドが有効な接続を表示。
🔍
検索 & ミニマップ
インクリメンタル検索で操作を即座に発見。ミニマップで大規模マクロを俯瞰。
↩️
元に戻す & やり直し
すべての編集を追跡。Cmd+Zで元に戻す、Cmd+Shift+Zでやり直し。
🐞
デバッグツール
ブレークポイント設定、ステップ実行、変数のリアルタイム確認、DryRunモード。
マクロ記録
マウスとキーボードのアクションを自動記録。カスタマイズ可能なブロックが生成されます。
🖱
ナビゲーション & ズーム
トラックパッド
2本指スワイプワークスペースをパン(スクロール)
ピンチイン/アウトズームイン/アウト
マウス
右クリック+ドラッグワークスペースをパン(スクロール)
Cmd+スクロールホイールズームイン/アウト
Homeキー全ブロックにフィットしてズーム

v2.0 新機能

AI Vision セットアップガイド

AI Visionブロック(AIクリック、AIスマート待機、AI OCR、AI検証、AI条件判定)にはVision対応LLMプロバイダが必要です。AIオートパイロットは別枠で、Anthropic(Sonnet/Opus)またはOpenAI(GPT-5.5/5.4/computer-use-preview)のComputer Useを使用するため、対応するAPIキーが必要です。

AI設定の構成

AI設定は5つのセクションで構成されています:

  1. AIアシスタント — チャットパネル用プロバイダ(説明・診断・マクロ生成)。macOS 26+ではApple Intelligenceがデフォルト(無料・オンデバイス・APIキー不要)。
  2. デフォルトプロバイダ — 全AI Visionブロック共通(AIクリック、AI OCR、AIスマート待機、AI検証、AI条件判定)。Vision対応クラウドプロバイダが必要。
  3. AIオートパイロット — オートパイロットブロック専用。AI設定でデフォルトモデルを選択(Anthropic Sonnet 4.6 / Opus 4.7、または OpenAI GPT-5.5 / GPT-5.4 / computer-use-preview)。対応するプロバイダのAPIキーが必要。
  4. 各プロバイダの設定 — クラウドプロバイダごとのAPIキー・モデル・Temperature設定(OpenAI、Anthropic、Gemini、Groq、カスタム/ローカルLLM)。
  5. セルフヒーリング — 画像/OCR操作が失敗した場合、AI Visionが自然言語で自動リトライ。
Apple Intelligence の設定方法 (macOS 26+)

Apple IntelligenceはAIアシスタントを無料・APIキー不要・完全プライベートで動かします。使用前にMacで一度だけセットアップが必要です:

⚠ 事前準備: モデルのダウンロード完了が必須です

  1. システム設定を開く
  2. 「Apple Intelligence と Siri」を選択
  3. 「Apple Intelligence をオンにする」をクリック
  4. モデルのダウンロード完了を待機(Wi-Fi環境で数分〜数十分)
  5. 完了後、RocketMouse AI → AI設定 → AIアシスタントセクションで「Apple Intelligence」がデフォルトプロバイダとして表示されます

要件: macOS 26以降、Apple Silicon(M1以降)。Intel Macは非対応。
注意: モデルのダウンロードが完了していない場合、プロバイダリストにApple Intelligenceは表示されません。システム設定でステータスを確認してください。

Apple Intelligence 対応状況(ブロック別)

ブロック Apple Intelligence クラウドプロバイダ 理由
AIアシスタント(チャット・説明・診断) 対応(デフォルト) 対応 テキストのみ
AI指示 対応 対応 テキストのみ
AIマクロ生成 対応 対応 テキストのみ
AIクリック 非対応 必須 Vision必須(スクリーンショット分析)
AIスマート待機 非対応 必須 Vision必須(スクリーンショット分析)
AI OCR 非対応 必須 Vision必須(スクリーンショット分析)
AI検証 非対応 必須 Vision必須(スクリーンショット分析)
AIオートパイロット 非対応 AnthropicまたはOpenAI Computer Use API(Sonnet/Opus または GPT-5.5/5.4/computer-use-preview)
AI条件判定 非対応 必須 Vision必須(スクリーンショット分析)
💡
Apple Intelligence の能力について

Apple Intelligenceはコンパクトなオンデバイスモデルで動作します。要約、テキスト整形、簡単な計算、短い指示には適していますが、知識ベースの質問(日付、事実、一般知識など)では不正確な結果を返すことがあります。高い精度や幅広い知識が必要なタスクには、OpenAI、Anthropic、Geminiなどのクラウドプロバイダをご利用ください。

Vision対応プロバイダ & 推奨モデル

プロバイダ Vision対応 推奨モデル 備考
OpenAI 対応 gpt-5.5 最新フラッグシップ(Tier 1から)。gpt-5.5-mini(安価)、gpt-4o(旧世代)も可
Anthropic 対応 claude-sonnet-4-6 バランス型。claude-opus-4-7(最高性能)、claude-haiku-4-5-20251001(高速・安価)も可
Google Gemini 対応 gemini-2.5-flash(無料: 250回/日) 高速・低コスト。gemini-2.5-pro(最高性能)も可
Groq 非対応 テキストのみ。AIアシスタントでは使用可、AI Visionブロックでは使用不可
カスタム / ローカルLLM モデル次第 モデルによる Vision対応のOpenAI互換APIが必要(例: LM StudioのVisionモデル)
Apple Intelligence 未対応 テキストのみ(macOS 26+)。AIアシスタント用。将来のアップデートでVision対応の可能性

セットアップ手順

1️⃣
APIキーを取得

お好みのプロバイダでアカウントを作成:

2️⃣
AI設定を開く
メニューバーから設定 > AI設定...を選択(またはツールバーの脳アイコンをクリック)。
3️⃣
デフォルトプロバイダとAPIキーを設定
  1. 「デフォルトプロバイダ」セクションでプロバイダを選択(例: OpenAI、Gemini)
  2. 「各プロバイダの設定」まで下にスクロールし、選んだプロバイダを展開
  3. APIキーを貼り付けてテストをクリックして接続確認
  4. AIオートパイロットを使う場合: AIオートパイロットセクションでデフォルトモデルを選択(Anthropic Sonnet/Opus または OpenAI GPT-5.5/5.4/computer-use-preview)し、各プロバイダの設定で対応するプロバイダを展開してAPIキーを入力
4️⃣
AI Visionブロックを使う
ブロックパレットのAIカテゴリ(紫)を開き、AIクリックブロックをワークスペースにドラッグ。「OKボタンをクリック」のような説明を入力してマクロを実行!
💡
最良の結果を得るためのヒント
  • 具体的に記述: 「右下の青い送信ボタンをクリック」は「送信をクリック」より正確に動作
  • セルフヒーリングを有効に(AI Visionオプション内)画像/OCR操作が失敗した時にAIで自動リトライ
  • ブロック単位のオーバーライド: 各AI Visionブロックに独自のプロバイダ/モデル設定が可能
  • 録画強化: まずクリックを録画し、AIに分析させてAIクリックブロックへの変換を提案してもらう
  • コスト削減: gemini-2.5-flash(無料: 250回/日)やgemini-2.5-flash-lite(無料: 1,000回/日)を活用。日次制限内なら完全無料!

さらにヘルプが必要ですか?

お探しの情報が見つかりませんか?お気軽にお問い合わせください。

サポートに連絡