Google Colab היא פלטפורמת ענן שנוצרה על ידי Google, המיועדת לעבודה עם מחברות Jupyter Notebook אינטראקטיביות. היא מספקת כלים עוצמתיים לכתיבה והרצת קוד ב-Python, ניתוח נתונים, אימון מודלים של למידת מכונה ועבודה שיתופית על פרויקטים.
Colab מספקת גישה למשאבי חישוב עוצמתיים, כולל מעבדים גרפיים (GPU) ומעבדי טנזור (TPU). זה מאפשר לפתור משימות מורכבות, כמו עיבוד נתונים גדולים או אימון רשתות נוירונים, ללא צורך לרכוש חומרה יקרה. Colab בנויה על בסיס Jupyter Notebook, ומספקת ממשק נוח לעבודה עם קוד, טקסט וויזואליזציות. ניתן להריץ תאי קוד, להוסיף טקסט הסבר, ליצור גרפים וויזואליזציות ישירות בדפדפן. ניתן להתחיל להשתמש ב-Colab מיד עם הפתיחה. אין צורך להתקין תוכנות נוספות, ספריות או דרייברים. הכל כבר מוגדר ומוכן לעבודה. ניתן לחבר את חשבון Google Drive שלך, מה שמאפשר לטעון נתונים בקלות, לשמור פרויקטים ולהבטיח גישה לקבצים מכל מקום. Colab תומכת בעבודה שיתופית. ניתן לשתף את הפרויקטים שלך עם עמיתים, לערוך את המחברות בו זמנית ולדון בשינויים בזמן אמת.
מהו Google Colab?
- אתה מריץ מחברת Jupyter בדפדפן, מה שחוסך את הצורך בהתקנת סביבה מקומית.
- הקוד מורץ על שרתים מרוחקים של Google, והתוצאות מוצגות במחברת שלך.
- נתונים יכולים להיטען מהתקן מקומי או מהענן, כמו Google Drive.
- ניתן להשתמש ב-Colab לכתיבת קוד Python, עבודה עם ספריות ללמידת מכונה (לדוגמה, TensorFlow, PyTorch), ניתוח נתונים באמצעות Pandas או יצירת ויזואליזציות דרך Matplotlib ו-Seaborn.
כיצד נראה Google Colab?
ממשק Colab מורכב ממספר חלקים עיקריים:
תאי קוד: אלו הם תאים שבהם תכתוב ותריץ את הקוד שלך ב-Python.
תאי טקסט: כאן תוכל להוסיף תיאורים, הסברים והערות לקוד שלך.
תפריט: למעלה קיים תפריט עם אפשרויות שונות לעבודה עם המחברת (קובץ, עריכה, תצוגה, כלים וכו').
מנהל קבצים: משמאל קיימת חלונית מנהל הקבצים, שבה תוכל לצפות בקבצים ותיקיות בסביבת Colab שלך.
ב-Google Colab, אתה עובד בסביבת ענן,
שבה מערכת הקבצים מאורגנת כמו במחשב רגיל עם תיקיות וקבצים.
Colab מספקת כלים לניווט, יצירה, צפייה ועריכה של קבצים.
אתה יכול לקיים אינטראקציה עם מערכת הקבצים באמצעות פקודות קסם של Jupyter (מתחילות ב-%
)
ופקודות bash (מתחילות ב-!
).
רשימת הפקודות העיקריות:
%pwd
(print working directory):- תיאור: מציגה את ספריית העבודה הנוכחית (היכן אתה כרגע "נמצא" במערכת הקבצים).
- דוגמה:
%pwd
- תוצאה:
/content
(או ספרייה נוכחית אחרת)
%ls
(list):- תיאור: מציגה רשימה של קבצים ותיקיות בספרייה הנוכחית.
- דוגמה:
%ls
- תוצאה: רשימת קבצים ותיקיות, לדוגמה:
sample_data/ my_file.txt
%cd <נתיב>
(change directory):- תיאור: עוברת לספרייה המצוינת.
- דוגמה:
%cd sample_data
- תוצאה: ספריית העבודה הנוכחית משתנה ל-
/content/sample_data
!head -<מספר שורות> <שם קובץ>
:- תיאור: מציגה את השורות הראשונות בקובץ טקסט מצוין.
- דוגמה:
!head -5 README.md
- תוצאה: 5 השורות הראשונות של הקובץ
README.md
.
!cat <שם קובץ>
:- תיאור: מציגה את התוכן של קובץ טקסט מצוין.
- דוגמה:
!cat sample_file.txt
- תוצאה: כל התוכן של הקובץ
sample_file.txt
.
!echo "<טקסט>" > <שם קובץ>
- תיאור: יוצרת קובץ חדש עם השם המצוין וכותבת לתוכו את הטקסט. אם הקובץ כבר קיים, הוא יידרס.
- דוגמה:
!echo "זה הקובץ החדש שלי!" > new_file.txt
- תוצאה: יוצרת קובץ
new_file.txt
עם התוכןזה הקובץ החדש שלי!
.
נקודות מפתח:
פקודות קסם (%
) – אלו הן פקודות מיוחדות של Jupyter לעבודה עם סביבת Colab.
פקודות bash (!
) – אלו הן פקודות המורצות בשורת הפקודה של Linux.
נתיב לקובץ: נתיב לקובץ מציין היכן בדיוק נמצא הקובץ במערכת הקבצים (לדוגמה, /content/sample_data/my_file.txt
).
ספרייה נוכחית: המיקום שלך במערכת הקבצים (משתנה על ידי הפקודה %cd
).
העלאת קבצים ל-Google Colab
קיימות מספר דרכים להעלות קבצים ל-Colab, ואנו נסקור את הנפוצות ביותר מביניהן.
העלאה דרך מנהל הקבצים (GUI) 1
- תיאור: הדרך הפשוטה ביותר להעלות קבצים, במיוחד קטנים, – היא להשתמש בממשק הגרפי של מנהל הקבצים ב-Colab.
- כיצד לעשות זאת:
- פתח את חלונית מנהל הקבצים משמאל (אייקון התיקייה).
- לחץ על אייקון ההעלאה (בדרך כלל זה אייקון עם פלוס או חץ למעלה).
- בחלון שנפתח, בחר את הקבצים במחשב שלך שברצונך להעלות.
- לחץ "פתח" או "העלה".
- יתרונות: פשטות, בהירות, לא דורש כתיבת קוד.
- חסרונות: מתאים לקבצים קטנים, צריך לעשות ידנית.
העלאה דרך קוד Python (google.colab.files.upload()
) 2
- תיאור: דרך זו מאפשרת להעלות קבצים באמצעות קוד Python, מה שנותן יותר גמישות.
- כיצד לעשות זאת:
- ייבא את המודול
files
מהספרייהgoogle.colab
.python from google.colab import files
- קרא לפונקציה
files.upload()
python uploaded = files.upload()
- בעת הרצת קוד זה, יופיע חלון דיאלוג, שבו תוכל לבחור קבצים להעלאה.
- ייבא את המודול
- יתרונות: ניתן להשתמש בקוד, נותן אפשרות לעיבוד תוכנתי של קבצים שהועלו.
- חסרונות: דורש כתיבת קוד, קצת פחות אינטואיטיבי ממנהל הקבצים.
uploaded
, כאשר המפתחות הם שמות הקבצים, והערכים הם התוכן שלהם בצורת מחרוזות בייט.# דוגמה לשימוש בקבצים שהועלו for file_name, file_data in uploaded.items(): print(f"קובץ: {file_name}") # עיבוד נתוני הקובץ # לדוגמה: # import pandas as pd # df = pd.read_csv(io.BytesIO(file_data)) # print(df.head())
- שכפול רפוזיטורי GitHub (
git clone
)- תיאור: אם הקבצים שלך נמצאים ברפוזיטורי GitHub, אתה יכול להעלות אותם על ידי שכפול הרפוזיטורי ל-Colab.
- כיצד לעשות זאת:
- השתמש בפקודה
git clone
עם כתובת ה-URL של הרפוזיטורי.python !git clone <URL_רפוזיטורי>
לדוגמה:python !git clone https://github.com/username/my_repository.git
- לאחר שכפול הרפוזיטורי, התוכן יהיה זמין בתיקייה, הנקראת כמו הרפוזיטורי.
- השתמש בפקודה
- יתרונות: קל להעלות את כל הקבצים מרפוזיטורי, דרך נוחה לפרויקטים עם בקרת גרסאות.
- חסרונות: מתאים רק לקבצים ברפוזיטורי GitHub.
<div align="center">
<img src="https://i.ibb.co/7R1QG5Q/colab-git-clone.png" alt="שכפול רפוזיטורי GitHub ב-Colab" width="600" >
<p><em>שכפול רפוזיטורי GitHub ב-Colab</em></p>
</div>
- הורדת קובץ בודד מ-GitHub
- תיאור: אם אתה זקוק רק לקובץ אחד או מספר קבצים מרפוזיטורי GitHub, אתה יכול להוריד אותם באמצעות קישור ישיר.
- כיצד לעשות זאת:
- פתח את הקובץ הרצוי ברפוזיטורי GitHub.
- לחץ על הכפתור "View raw" (תצוגה גולמית).
- העתק את כתובת ה-URL של קובץ זה.
- השתמש ב-
wget
אוcurl
להורדת הקובץ.python !wget <URL_קובץ>
אוpython !curl <URL_קובץ> -o <שם_קובץ_ב-colab>
- יתרונות: פשוט להוריד רק את הקבצים הרצויים, ללא שכפול הרפוזיטורי כולו.
- חסרונות: נדרש לדעת את הקישור הישיר לקובץ.
איזו דרך לבחור?
- לקבצים קטנים שצריך להעלות במהירות ובידנית, מתאים מנהל הקבצים.
- אם נדרש לעבד תוכנתית קבצים שהועלו, השתמש ב-
files.upload()
. - להעלאת פרויקטים שלמים, השתמש ב-
git clone
. - להורדת קבצים בודדים, השתמש ב-
wget
אוcurl
.