בנה סוכן מולטי-מודל עם Claude Code
בנה סוכן מולטי-מודל עם Claude Code
מה תבנה
סוכן שמנתב משימות לדגמי בינה מלאכותית שונים באופן אוטומטי — Opus לחשיבה עמוקה, Haiku לשאלות מהירות, Gemini לחיפוש באינטרנט.
הבעיה
אתה מריץ Claude Opus על כל הודעה. "מה זה 15% טיפ על 80 דולר?" — Opus. "תזכור לי לקנות חלב" — Opus. "נתח לי חוזה של 40 עמודים" — גם Opus. אחד מהדברים האלה צריך את ה-AI החזק ביותר בעולם. השניים האחרים צריכים מחשבון ודף רשימות. אתה שורף טוקנים יקרים על רשימות קניות.
מה אתה בונה
אגנט עם ארבעה מודלים משני ספקים, ניתוב אוטומטי בהתאם להקשר השיחה, ולוח בקרה לעקוב אחרי חיסכון עלויות. אותו אגנט, שלוש מוחות, 70% פחות הוצאה.
שלב 1: הכן את רשימת המודלים שלך
כרגע לאגנט שלך יש מוח אחד. בואו נתן לו שלוש.
Update my OpenClaw config to set up three models: Claude Opus as the heavy-duty model for complex tasks, Claude Haiku as the fast model for simple questions, and keep Sonnet as the default. Set Haiku as the fallback if the primary model is unavailable. Add clean aliases so I can reference them easily.
מה Claude Code עושה: זה מעצב מחדש את קונפיגורציית המודלים שלך עם מודל ראשוני וגיבויים. OpenClaw תומך בשרשרות גיבוי של מודלים — אם המודל הראשוני שלך כבוי או מוגבל בקצב, זה באופן אוטומטי מנסה את הבא. כינויים כמו opus, sonnet ו-haiku נותנים לך שמות קצרים שאתה יכול להשתמש בהם בכל מקום בקונפיגורציה.
נסה זאת: הרץ openclaw gateway status — אתה אמור לראות את כל שלושת המודלים ברשימה.
שלב 2: הוסף Gemini לחיפוש מידע
Claude מעולה בהנמקה אבל לא יכול לגלוש באינטרנט באופן טבעי. Gemini יכול. בואו נוסיף אותו כמודל המחקר שלך.
Add Google Gemini as a custom model provider in my OpenClaw config. Use my GEMINI_API_KEY environment variable. Set it up as a Google Generative AI provider with Gemini 2.0 Flash. I want to be able to route research questions to it.
מה Claude Code עושה: זה מוסיף בלוק ספק חדש לקונפיגורציה שלך באמצעות מערכת הספק המותאם של OpenClaw. OpenClaw לא נעול לחברת ה-AI אחת — אתה יכול לערבב Anthropic, OpenAI, Google, DeepSeek וגם מודלים מקומיים דרך Ollama. כל ספק מקבל את מפתח ה-API שלו וגם רשימת מודלים. עכשיו לאגנט שלך יש ארבעה מודלים משני ספקים.
נסה זאת: בדוק את הקונפיגורציה שלך — אתה אמור לראות ספקים של anthropic וגם google ברשימה.
שלב 3: צור ניתוב חכם
יש לך את המודלים. עכשיו תגיד לאגנט מתי להשתמש בכל אחד.
Set up agent bindings in my OpenClaw config so different conversations use different models. Create three agent entries: "daily" using Sonnet (my default), "researcher" using Gemini, and "analyst" using Opus. Then add bindings that route my main Telegram DM to "daily", and set up two Telegram groups I can create for testing — one for research, one for deep analysis. Walk me through creating those Telegram groups if needed.
מה Claude Code עושה: זה יוצר מספר אגנטים וקשרים בקונפיגורציה שלך — כללים שמנתבים שיחות לאגנטים ספציפיים בהתאם לערוץ, קבוצה או שולח. מערכת הקשרים משתמשת בהיכרות: התאמת עמית ישירה מנצחת התאמת קבוצה, שמנצחת ברירת מחדל ברמת ערוץ. זה אומר שהצ'אט הראשי שלך מקבל Sonnet, אבל שאלות מחקר בקבוצת המחקר באופן אוטומטי פוגעות ב-Gemini.
נסה זאת: בדוק את הקונפיגורציה שלך — agents.list אמור להיות עם שלוש ערכים, ומערך bindings אמור למפות כל אחד להקשר שונה.
שלב 4: בדוק את הניתוב
הכל מוגדר. בואו נאמת שכל מודל מקבל את התנועה הנכונה.
Restart the OpenClaw gateway to pick up the new config, then show me how to verify which model is handling each conversation. I want to test by sending messages in different contexts and checking the logs to confirm the correct model is being used.
מה Claude Code עושה: זה מאתחל את הגטוויי שוב ומראה לך איך לקרוא את יומני הניתוב. כל הודעה ביומן מראה איזה מודל עיבד אותה — אתה תראה anthropic/claude-sonnet-4-6 לצ'אט הראשי שלך, google/gemini-2.0-flash לחיפוש, ו-anthropic/claude-opus-4-6 לעבודה עמוקה. הניתוב קורה בשקט — אתה פשוט שולח הודעה, והמוח הנכון עונה.
נסה זאת: שלח שאלה פשוטה בצ'אט הראשי שלך, שאלת חיפוש אינטרנט בקבוצת המחקר, ושאלת ניתוח מורכבת בקבוצת העבודה העמוקה. בדוק את היומנים — כל אחד אמור להראות מודל שונה.
שלב 5: בדוק את חיסכון העלויות שלך
התגמול האמיתי: כמה אתה חוסך?
Show me the OpenClaw dashboard at localhost:18789 and walk me through the token usage stats. I want to see how many tokens each model consumed and estimate my cost savings compared to running everything on Opus.
מה Claude Code עושה: זה פותח את לוח הבקרה המקומי שבו OpenClaw עוקב אחרי השימוש. לוח הבקרה מראה צריכת טוקנים לפי מודל, לפי אגנט, לפי תקופת זמן. אתה יכול לחשב חיסכון על ידי השוואה: אם כל הטוקנים היו הולכים ל-Opus ($15/M קלט) מול הפיצול בפועל על פני Haiku ($0.25/M), Sonnet ($3/M) וגם Gemini ($0.10/M עבור Flash).
נסה זאת: פתח http://localhost:18789 בדפדפן שלך. עבור לסטטיסטיקת שימוש. אחרי כמה ימים של שימוש, אתה תראה את החיסכון האמיתי — בדרך כלל 60-80% עבור עומסי עבודה מעורבים.
מה בנית
זוכר שהיית משלם מחירי Opus עבור תזכורות לרשימת קניות? לאגנט שלך יש עכשיו ארבעה מודלים משני ספקים, ניתוב אוטומטי בהתאם להקשר השיחה, ולוח בקרה לעקוב אחרי הכל. אתה מריץ את אותו הגדר שחברות משתמשות בו עבור ה-AI בייצור — שכבת אחת של ארגון, מודלים מתמחים מרובים.
קח זאת הלאה
- הוסף מודל מקומי — הגדר Ollama עם Llama 3 עבור משימות פשוטות ללא חיבור, בעלות אפס
- ניתוב לכל הודעה — הגדר החלפת מודלים בהתאם לתוכן ההודעה, לא רק ערוץ
- הגדר התראות עלויות — השתמש בעבודות cron כדי להודיע לך כאשר ההוצאה היומית חוצה סף