RocketMouse AIを使いこなすために必要な情報
24カテゴリ、196種類の操作の詳細ドキュメント。
各AIブロックのパラメータ、使い方、プロンプト例を解説します。
AIが画面を見て、自然言語で指定したUI要素をクリック。画面端では2パスリファインメントで高精度。
パラメータ: プロンプト(必須)、button(Left/Right/Middle)、clickType(Single/Double)、provider、model、outputX、outputY
プロンプト例:
「保存ボタンをクリック」「Finderのファイルメニュー」「ウィンドウ左上の赤い閉じるボタン」「Safariの検索フィールド」ヒント: 位置や外観を具体的に。「右下の青い送信ボタン」は「送信」より正確です。
AIが画面を定期的に監視し、条件が満たされるまで待機。固定待機の代わりに視覚的な条件判定。
パラメータ: プロンプト(必須)、timeoutMs(デフォルト: 30000)、pollingMs(デフォルト: 2000、最小: 500)、provider、model
プロンプト例:
「ダウンロード完了ダイアログが閉じた」「メモアプリのウィンドウが画面に表示されている」「ローディングスピナーが消えた」「OKボタンのある確認ダイアログが表示されている」ヒント: 視覚的に確認できる具体的な条件を。「メモアプリのウィンドウが画面に表示されている」は「メモが開いている」より正確。
AIが画面上のテキストを読み取り変数に格納。どんなフォント・言語・アプリでも対応。
パラメータ: prompt(必須)、outputVariable(デフォルト: AiOcrResult)、provider、model
プロンプト例:
「画面に表示されている合計金額を読み取って」「メモアプリのテキストを読み取って」「ダイアログのエラーメッセージを読み取って」「アクティブウィンドウのタイトルを読み取って」AIが画面状態を確認しtrue/falseを返す。操作結果の検証や条件分岐に最適。
パラメータ: プロンプト(必須)、outputVariable(デフォルト: AiValidateResult)、provider、model
プロンプト例:
「ファイルが正常に保存された」「ログイン画面が表示されている」「エラーメッセージが表示されている」「チェックボックスがオンになっている」画面を完全自律制御する自律エージェント。デュアルプロバイダのComputer Use: Anthropic(Claude Sonnet 4.6 / Opus 4.7)または OpenAI(GPT-5.5 / GPT-5.4 / computer-use-preview)。スクリーンショット撮影→推論→クリック・入力・スクロールを繰り返しタスク完了まで自動操作。
パラメータ: プロンプト(必須)、maxSteps(デフォルト: 30、最大: 200)、timeoutSeconds(デフォルト: 120、最大: 600)、outputVariable、provider、model
プロンプト例:
「電卓アプリを起動して2+5を計算して」「テキストエディットを開いてHello Worldと入力して保存して」「システム設定を開いてダークモードを有効にして」「Safariを開いてapple.comにアクセスして」注意: AnthropicまたはOpenAIのAPIキーが必要。AI設定でデフォルトモデルを選択(Sonnet 4.6 / Opus 4.7 / GPT-5.5 / GPT-5.4 / computer-use-preview)。GPT-5.5はTier 1から使えて高速、Sonnet 4.6は複雑なレイアウトに強い、computer-use-previewはTier 3以上が必要。Cmd+Space(Spotlight)は自動化非対応のため、AIはLaunchpad経由でアプリを起動。
テキストプロンプトをLLMに送信し、応答を変数に格納。テキスト専用(画面キャプチャなし)。Apple Intelligenceでも動作。
パラメータ: prompt(必須)、outputVariable、provider、model
プロンプト例:
「以下のテキストを3文で要約して: {=myText}」「英語に翻訳して: {=japaneseText}」「以下のメールにプロフェッショナルな返信を作成: {=emailContent}」「{=price}の10%の税額を計算して」AI Visionで画面状態を判定するBoolean(六角形)ブロック。if/whileブロックの条件に使用。
パラメータ: プロンプト(必須)、provider、model
プロンプト例:
「ログイン画面が表示されている」「画面にエラーメッセージがある」「ファイルのダウンロードが完了した」| AIクリック(高精度) | Claude Sonnet 4.6、GPT-4o |
| AIクリック(低コスト) | Gemini 2.5 Flash(無料: 250回/日)、Gemini 2.5 Flash-Lite(無料: 1,000回/日)、GPT-4o-mini |
| AIスマート待機 / AI検証 | どのVisionモデルでもOK(Yes/No判定) |
| AI OCR | Claude Sonnet 4.6、GPT-4o(複雑なレイアウト向け) |
| AIオートパイロット | GPT-5.5(高速・Tier 1 OK)、Claude Sonnet 4.6(信頼性)、Claude Opus 4.7 / GPT-5.4 / computer-use-preview |
| AI指示 | Apple Intelligence(無料)、Gemini Flash(低コスト)、GPT-4o(高品質) |
{=変数名} で参照。ループ変数: {=_loopIndex}, {=_loopIteration}。Cmd+Z | 元に戻す |
Cmd+Shift+Z | やり直し |
Cmd+C / Cmd+V | コピー / 貼り付け |
Cmd+D | 選択を複製 |
Cmd+A | 全ブロック選択 |
Delete | 選択ブロック削除 |
Cmd+S | プロジェクト保存 |
Cmd+Shift+S | 名前を付けて保存 |
Cmd+F | ブロック検索 |
Home | ズームして全体表示 |
F9 | ブレークポイント切替 |
Cmd+Shift+F | Cブロック展開/折りたたみ |
Escape | 選択解除 |
| トラックパッド | |
| 2本指スワイプ | ワークスペースをパン(スクロール) |
| ピンチイン/アウト | ズームイン/アウト |
| マウス | |
| 右クリック+ドラッグ | ワークスペースをパン(スクロール) |
| Cmd+スクロールホイール | ズームイン/アウト |
| Homeキー | 全ブロックにフィットしてズーム |
AI Visionブロック(AIクリック、AIスマート待機、AI OCR、AI検証、AI条件判定)にはVision対応LLMプロバイダが必要です。AIオートパイロットは別枠で、Anthropic(Sonnet/Opus)またはOpenAI(GPT-5.5/5.4/computer-use-preview)のComputer Useを使用するため、対応するAPIキーが必要です。
AI設定は5つのセクションで構成されています:
Apple IntelligenceはAIアシスタントを無料・APIキー不要・完全プライベートで動かします。使用前にMacで一度だけセットアップが必要です:
⚠ 事前準備: モデルのダウンロード完了が必須です
要件: macOS 26以降、Apple Silicon(M1以降)。Intel Macは非対応。
注意: モデルのダウンロードが完了していない場合、プロバイダリストにApple Intelligenceは表示されません。システム設定でステータスを確認してください。
| ブロック | Apple Intelligence | クラウドプロバイダ | 理由 |
|---|---|---|---|
| AIアシスタント(チャット・説明・診断) | ✅ 対応(デフォルト) | ✅ 対応 | テキストのみ |
| AI指示 | ✅ 対応 | ✅ 対応 | テキストのみ |
| AIマクロ生成 | ✅ 対応 | ✅ 対応 | テキストのみ |
| AIクリック | ❌ 非対応 | ✅ 必須 | Vision必須(スクリーンショット分析) |
| AIスマート待機 | ❌ 非対応 | ✅ 必須 | Vision必須(スクリーンショット分析) |
| AI OCR | ❌ 非対応 | ✅ 必須 | Vision必須(スクリーンショット分析) |
| AI検証 | ❌ 非対応 | ✅ 必須 | Vision必須(スクリーンショット分析) |
| AIオートパイロット | ❌ 非対応 | AnthropicまたはOpenAI | Computer Use API(Sonnet/Opus または GPT-5.5/5.4/computer-use-preview) |
| AI条件判定 | ❌ 非対応 | ✅ 必須 | Vision必須(スクリーンショット分析) |
Apple Intelligenceはコンパクトなオンデバイスモデルで動作します。要約、テキスト整形、簡単な計算、短い指示には適していますが、知識ベースの質問(日付、事実、一般知識など)では不正確な結果を返すことがあります。高い精度や幅広い知識が必要なタスクには、OpenAI、Anthropic、Geminiなどのクラウドプロバイダをご利用ください。
| プロバイダ | Vision対応 | 推奨モデル | 備考 |
|---|---|---|---|
| OpenAI | ✅ 対応 | gpt-5.5 |
最新フラッグシップ(Tier 1から)。gpt-5.5-mini(安価)、gpt-4o(旧世代)も可 |
| Anthropic | ✅ 対応 | claude-sonnet-4-6 |
バランス型。claude-opus-4-7(最高性能)、claude-haiku-4-5-20251001(高速・安価)も可 |
| Google Gemini | ✅ 対応 | gemini-2.5-flash(無料: 250回/日) |
高速・低コスト。gemini-2.5-pro(最高性能)も可 |
| Groq | ❌ 非対応 | — | テキストのみ。AIアシスタントでは使用可、AI Visionブロックでは使用不可 |
| カスタム / ローカルLLM | ⚠ モデル次第 | モデルによる | Vision対応のOpenAI互換APIが必要(例: LM StudioのVisionモデル) |
| Apple Intelligence | ❌ 未対応 | — | テキストのみ(macOS 26+)。AIアシスタント用。将来のアップデートでVision対応の可能性 |
お好みのプロバイダでアカウントを作成:
sk-で始まる)sk-ant-で始まる)gemini-2.5-flash(無料: 250回/日)やgemini-2.5-flash-lite(無料: 1,000回/日)を活用。日次制限内なら完全無料!お探しの情報が見つかりませんか?お気軽にお問い合わせください。