Skip to content

LangChain ו-Browser-Use

כיצד ליצור סוכן חכם באמצעות LangChain ו-Browser-Use: מדריך צעד-אחר-צעד

מדריך זה צעד-אחר-צעד יראה לכם כיצד ליצור סוכן AI המסוגל לחפש מידע בגוגל ולנתח דפי אינטרנט, תוך שימוש ב-LangChain וב-Browser-Use.

שלב 1: התקנת הספריות הנדרשות

ראשית, יש להתקין את ספריות Python הנדרשות. פתחו מסוף (terminal) או שורת פקודה (command prompt) והריצו את הפקודה הבאה:

pip install -U langchain langchain-openai langchain-community browser-use python-dotenv serpapi google-search-results numexpr

שלב 2: הגדרת מפתחות API

כדי לעבוד עם OpenAI ו-SerpAPI, נדרשים מפתחות API.

  • OpenAI API Key: קבלו את מפתח ה-API שלכם באתר OpenAI (openai.com).
  • SerpAPI API Key: SerpAPI מספק API לעבודה עם תוצאות חיפוש. הירשמו באתר serpapi.com (זמינה גרסת ניסיון חינמית), היכנסו לחשבון שלכם ומצאו את מפתח ה-API שלכם בדף ה-Dashboard.

צרו קובץ .env באותה ספרייה שבה יימצא סקריפט ה-Python שלכם, והוסיפו לשם את המפתחות בפורמט הבא:

OPENAI_API_KEY=המפתח_שלך_ל־OpenAI  
SERPAPI_API_KEY=המפתח_שלך_ל־SerpAPI

שלב 3: יצירת סקריפט Python (browser_agent.py)

צרו קובץ browser_agent.py והדביקו לתוכו את הקוד הבא:

import asyncio
import logging
import os
from dotenv import load_dotenv

from langchain.agents import AgentType, initialize_agent
from langchain.tools import Tool
from langchain_openai import ChatOpenAI


# הגדרת רישום אירועים (logging)
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

load_dotenv()

# טעינת מפתחות API מקובץ .env
os.environ["SERPAPI_API_KEY"] = os.getenv("SERPAPI_API_KEY")
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

async def main():
    # אתחול מודל השפה
    llm = ChatOpenAI(model="gpt-4o-mini", temperature=0) # ניתן לנסות מודלים אחרים

    # הגדרת כלי חיפוש (דוגמה פשוטה, ללא חיפוש ממשי בגוגל)
    search_tool = Tool(
        name="Google Search",
        func=lambda query: f"Ищу в Google: {query}",  # יש להחליף בחיפוש ממשי באמצעות SerpAPI בעת הצורך
        description="מחפש מידע בגוגל."
    )


    # הגדרת המשימה עבור הסוכן
    task = """
    Find the latest news about OpenAI.
    Then visit one of the found websites and find the names of the founders.
    """

    # יצירת הסוכן
    agent = initialize_agent(
        tools=[search_tool],
        llm=llm,
        agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
        verbose=True,
    )

    # הפעלת הסוכן
    try:
        result = await agent.arun(task)
        print(f"תוצאה: {result}")
    except Exception as e:
        logging.error(f"אירעה שגיאה: {e}")

if __name__ == "__main__":
    asyncio.run(main())

שלב 4: הפעלת הסוכן

פתחו מסוף (terminal) או שורת פקודה (command prompt), נווטו לספרייה המכילה את הקובץ browser_agent.py והריצו אותו:

python browser_agent.py

שלב 5: שיפור הסוכן (יכולות מתקדמות)

  • חיפוש ממשי בגוגל: החליפו את פונקציית ה-lambda ב-search_tool בקוד המשתמש ב-SerpAPI לחיפוש ממשי בגוגל. זה ידרוש לימוד של תיעוד SerpAPI.
  • אינטראקציה עם דפי אינטרנט (Browser-Use): כדי להוסיף פונקציונליות של אינטראקציה עם דפי אינטרנט (פתיחת קישורים, חילוץ טקסט וכו'), יהיה צורך להשתמש בספריית browser-use. התיעוד של ספרייה זו יסייע לכם להוסיף את הכלים המתאימים לסוכן שלכם.
  • שימוש בזיכרון: לשמירת הקשר (context) בין שאילתות, ניתן להשתמש במנגנוני הזיכרון של LangChain.
  • שרשרות פעולות מורכבות יותר: LangChain מאפשרת ליצור שרשרות פעולות (Chains) מורכבות יותר לפתרון משימות מורכבות יותר.

דוגמה זו מדגימה את המבנה הבסיסי. ליישום סוכן מלא המקיים אינטראקציה עם הדפדפן ועם חיפוש גוגל, תידרש עבודה נוספת עם SerpAPI ו-browser-use. אל תשכחו לפנות לתיעוד של ספריות אלו לקבלת מידע מפורט יותר.


כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *