ברוכים הבאים ליחידת הלימוד "למידת מכונה (מבוא)" בקורס מבוא לבינה מלאכותית (20551). יחידה זו תציג את העקרונות הבסיסיים של למידה מנתונים, שהיא אבן יסוד בתחום הבינה המלאכותית המודרנית. נחקור כיצד מכונות יכולות ללמוד דפוסים, לקבל החלטות ולבצע תחזיות על בסיס נתונים, ונדון בסוגי הלמידה המרכזיים ובאלגוריתמים בסיסיים. הבנה מעמיקה של נושאים אלו חיונית להצלחה בקורס ובהמשך הדרך בתחום.
עקרונות בסיסיים של למידה מנתונים
למידת מכונה (Machine Learning) היא ענף בבינה מלאכותית המאפשר למערכות ללמוד מנתונים, לזהות דפוסים ולבצע תחזיות או החלטות, ללא תכנות מפורש עבור כל משימה. במקום לתת למחשב סט כללים קשיח, אנו מספקים לו נתונים ומאפשרים לו "לגלות" את הכללים בעצמו. המטרה היא שמערכת הלמידה תשפר את ביצועיה במשימה מסוימת ככל שהיא צוברת יותר ניסיון (נתונים).
מדוע למידת מכונה חשובה?
- אוטומציה של משימות מורכבות: משימות שקשה לתכנת באופן ידני, כמו זיהוי תמונות או דיבור.
- גילוי תובנות ודפוסים: חילוץ ידע מנתונים גדולים ומורכבים.
- התאמה וגמישות: מערכות שיכולות להסתגל לשינויים בסביבה או בנתונים.
סוגי למידה מרכזיים
בתחום למידת המכונה, אנו מבחינים בין מספר סוגי למידה עיקריים, הנבדלים זה מזה באופן שבו הם משתמשים בנתונים ובמטרת הלמידה. שני הסוגים הבסיסיים והנפוצים ביותר הם למידה מודרכת ולמידה בלתי מודרכת.
למידה מודרכת
מטרה: חיזוי פלט (תווית) על בסיס קלט. דוגמאות: סיווג (Classification) - חיזוי קטגוריה בדידה (למשל, האם תמונה מכילה חתול או כלב), רגרסיה (Regression) - חיזוי ערך רציף (למשל, מחיר בית).
נתונים: נתונים מתויגים (קלט + פלט רצוי).
שימושים: זיהוי ספאם, אבחון רפואי, המלצות מוצרים.
למידה בלתי מודרכת
מטרה: גילוי מבנה נסתר בנתונים. דוגמאות: אשכול (Clustering) - קיבוץ דוגמאות דומות יחד, הפחתת ממדים (Dimensionality Reduction) - פישוט הנתונים תוך שמירה על המידע החשוב.
נתונים: נתונים לא מתויגים (קלט בלבד).
שימושים: פילוח לקוחות, זיהוי חריגים, דחיסת נתונים.
אלגוריתמים בסיסיים בלמידת מכונה
כדי להמחיש את סוגי הלמידה, נכיר שני אלגוריתמים בסיסיים ונפוצים: עצי החלטה (למידה מודרכת - סיווג) ורגרסיה לינארית (למידה מודרכת - רגרסיה).
עצי החלטה קלים להבנה ולפרשנות. הם פועלים על ידי פיצול חוזר ונשנה של הנתונים לקבוצות הומוגניות יותר ויותר, בהתבסס על ערכי התכונות. המטרה היא למצוא את הפיצולים הטובים ביותר שממקסמים את טוהר הקבוצות (כלומר, שכל קבוצה תכיל כמה שיותר דוגמאות מאותה תווית).
המודל של רגרסיה לינארית פשוט יחסית: y = b0 + b1*x1 + b2*x2 + ... + bn*xn, כאשר y הוא הפלט המנובא, x_i הן תכונות הקלט, ו-b_i הם המקדמים (משקולות) שהאלגוריתם לומד מהנתונים. המקדמים נלמדים בדרך כלל באמצעות מזעור סכום ריבועי השגיאות (Mean Squared Error - MSE).
שאלות לדיון
- הסבירו את ההבדל המהותי בין למידה מודרכת ללמידה בלתי מודרכת, ותנו דוגמה לתרחיש שבו כל אחת מהן תהיה עדיפה.
- תארו בקצרה כיצד עץ החלטה "לומד" מנתונים, ומהם היתרונות העיקריים של מודל זה.
- מהי המטרה של רגרסיה לינארית, וכיצד היא שונה מעץ החלטה בהקשר של סוג הפלט שהיא מפיקה?
- כיצד זמינות נתונים מתויגים משפיעה על היכולת שלנו ליישם אלגוריתמים של למידה מודרכת?
נקודות לתשובת מודל
לשאלה: "הסבירו את ההבדל המהותי בין למידה מודרכת ללמידה בלתי מודרכת, ותנו דוגמה לתרחיש שבו כל אחת מהן תהיה עדיפה."
- הבדל מהותי: למידה מודרכת דורשת נתונים מתויגים (קלט ופלט רצוי), בעוד שלמידה בלתי מודרכת פועלת על נתונים לא מתויגים (קלט בלבד).
- מטרות שונות: מודרכת מכוונת לחיזוי פלט על בסיס קלט (סיווג/רגרסיה). בלתי מודרכת מכוונת לגילוי מבנים, דפוסים או אשכולות בנתונים.
- דוגמה ללמידה מודרכת: חיזוי האם מייל הוא ספאם (סיווג). נדרשים מיילים רבים שסומנו מראש כ"ספאם" או "לא ספאם" כדי לאמן את המודל.
- דוגמה ללמידה בלתי מודרכת: פילוח לקוחות. ללא ידע מוקדם על קבוצות לקוחות, האלגוריתם יזהה אשכולות של לקוחות בעלי התנהגות או מאפיינים דומים.