מבוא לבינה מלאכותית — מרחב למידה אישי

ברוכים הבאים ליחידת הלימוד "למידת מכונה (מבוא)" בקורס מבוא לבינה מלאכותית (20551). יחידה זו תציג את העקרונות הבסיסיים של למידה מנתונים, שהיא אבן יסוד בתחום הבינה המלאכותית המודרנית. נחקור כיצד מכונות יכולות ללמוד דפוסים, לקבל החלטות ולבצע תחזיות על בסיס נתונים, ונדון בסוגי הלמידה המרכזיים ובאלגוריתמים בסיסיים. הבנה מעמיקה של נושאים אלו חיונית להצלחה בקורס ובהמשך הדרך בתחום.

עקרונות בסיסיים של למידה מנתונים

למידת מכונה (Machine Learning) היא ענף בבינה מלאכותית המאפשר למערכות ללמוד מנתונים, לזהות דפוסים ולבצע תחזיות או החלטות, ללא תכנות מפורש עבור כל משימה. במקום לתת למחשב סט כללים קשיח, אנו מספקים לו נתונים ומאפשרים לו "לגלות" את הכללים בעצמו. המטרה היא שמערכת הלמידה תשפר את ביצועיה במשימה מסוימת ככל שהיא צוברת יותר ניסיון (נתונים).

מדוע למידת מכונה חשובה?

אוטומציה של משימות מורכבות: משימות שקשה לתכנת באופן ידני, כמו זיהוי תמונות או דיבור.
גילוי תובנות ודפוסים: חילוץ ידע מנתונים גדולים ומורכבים.
התאמה וגמישות: מערכות שיכולות להסתגל לשינויים בסביבה או בנתונים.

סוגי למידה מרכזיים

בתחום למידת המכונה, אנו מבחינים בין מספר סוגי למידה עיקריים, הנבדלים זה מזה באופן שבו הם משתמשים בנתונים ובמטרת הלמידה. שני הסוגים הבסיסיים והנפוצים ביותר הם למידה מודרכת ולמידה בלתי מודרכת.

למידה מודרכת (Supervised Learning): סוג של למידת מכונה שבו האלגוריתם לומד ממערך נתונים מתויג, כלומר, נתונים שבהם לכל דוגמה יש גם את הפלט (התווית) הרצוי. המטרה היא ללמוד מיפוי מפלט לקלט, כך שניתן יהיה לחזות את התווית עבור דוגמאות חדשות ולא מוכרות.

למידה בלתי מודרכת (Unsupervised Learning): סוג של למידת מכונה שבו האלגוריתם לומד ממערך נתונים שאינו מתויג. המטרה היא לגלות דפוסים נסתרים, מבנים או קשרים בתוך הנתונים עצמם, ללא ידע מוקדם על הפלטים הרצויים.

למידה מודרכת

מטרה: חיזוי פלט (תווית) על בסיס קלט. דוגמאות: סיווג (Classification) - חיזוי קטגוריה בדידה (למשל, האם תמונה מכילה חתול או כלב), רגרסיה (Regression) - חיזוי ערך רציף (למשל, מחיר בית).

נתונים: נתונים מתויגים (קלט + פלט רצוי).

שימושים: זיהוי ספאם, אבחון רפואי, המלצות מוצרים.

למידה בלתי מודרכת

מטרה: גילוי מבנה נסתר בנתונים. דוגמאות: אשכול (Clustering) - קיבוץ דוגמאות דומות יחד, הפחתת ממדים (Dimensionality Reduction) - פישוט הנתונים תוך שמירה על המידע החשוב.

נתונים: נתונים לא מתויגים (קלט בלבד).

שימושים: פילוח לקוחות, זיהוי חריגים, דחיסת נתונים.

אלגוריתמים בסיסיים בלמידת מכונה

כדי להמחיש את סוגי הלמידה, נכיר שני אלגוריתמים בסיסיים ונפוצים: עצי החלטה (למידה מודרכת - סיווג) ורגרסיה לינארית (למידה מודרכת - רגרסיה).

עצי החלטה (Decision Trees): אלגוריתם למידה מודרכת המשמש בעיקר למשימות סיווג (ולעיתים גם רגרסיה). הוא בונה מודל בצורת עץ, שבו כל צומת פנימי מייצג בדיקה על תכונה מסוימת, כל ענף מייצג תוצאה של הבדיקה, וכל עלה מייצג את התווית הסופית (ההחלטה).

עצי החלטה קלים להבנה ולפרשנות. הם פועלים על ידי פיצול חוזר ונשנה של הנתונים לקבוצות הומוגניות יותר ויותר, בהתבסס על ערכי התכונות. המטרה היא למצוא את הפיצולים הטובים ביותר שממקסמים את טוהר הקבוצות (כלומר, שכל קבוצה תכיל כמה שיותר דוגמאות מאותה תווית).

רגרסיה לינארית (Linear Regression): אלגוריתם למידה מודרכת המשמש למשימות רגרסיה, כלומר, חיזוי ערך רציף. הוא מניח קשר לינארי בין תכונות הקלט לבין פלט המטרה, ומנסה למצוא את הקו הישר (או המישור, בממדים גבוהים יותר) המתאים ביותר לנתונים, הממזער את שגיאת החיזוי.

המודל של רגרסיה לינארית פשוט יחסית: y = b0 + b1*x1 + b2*x2 + ... + bn*xn, כאשר y הוא הפלט המנובא, x_i הן תכונות הקלט, ו-b_i הם המקדמים (משקולות) שהאלגוריתם לומד מהנתונים. המקדמים נלמדים בדרך כלל באמצעות מזעור סכום ריבועי השגיאות (Mean Squared Error - MSE).

חשיבות הבחירה בין למידה מודרכת לבלתי מודרכת: זוהי נקודה קריטית למבחן וליישום מעשי. הבחירה בין למידה מודרכת לבלתי מודרכת תלויה באופן מהותי בזמינות נתונים מתויגים ובמטרת המשימה. אם יש לנו נתונים עם תוויות ברורות ואנו רוצים לחזות תוויות אלו עבור נתונים חדשים, נבחר בלמידה מודרכת. אם הנתונים אינם מתויגים ואנו מעוניינים לגלות מבנים נסתרים או לקבץ דוגמאות דומות, למידה בלתי מודרכת היא הכלי המתאים. טעות בבחירה עלולה להוביל לבחירת אלגוריתם שאינו מתאים לבעיה או לתוצאות חסרות משמעות.

שאלות לדיון

הסבירו את ההבדל המהותי בין למידה מודרכת ללמידה בלתי מודרכת, ותנו דוגמה לתרחיש שבו כל אחת מהן תהיה עדיפה.
תארו בקצרה כיצד עץ החלטה "לומד" מנתונים, ומהם היתרונות העיקריים של מודל זה.
מהי המטרה של רגרסיה לינארית, וכיצד היא שונה מעץ החלטה בהקשר של סוג הפלט שהיא מפיקה?
כיצד זמינות נתונים מתויגים משפיעה על היכולת שלנו ליישם אלגוריתמים של למידה מודרכת?

נקודות לתשובת מודל

לשאלה: "הסבירו את ההבדל המהותי בין למידה מודרכת ללמידה בלתי מודרכת, ותנו דוגמה לתרחיש שבו כל אחת מהן תהיה עדיפה."

הבדל מהותי: למידה מודרכת דורשת נתונים מתויגים (קלט ופלט רצוי), בעוד שלמידה בלתי מודרכת פועלת על נתונים לא מתויגים (קלט בלבד).
מטרות שונות: מודרכת מכוונת לחיזוי פלט על בסיס קלט (סיווג/רגרסיה). בלתי מודרכת מכוונת לגילוי מבנים, דפוסים או אשכולות בנתונים.
דוגמה ללמידה מודרכת: חיזוי האם מייל הוא ספאם (סיווג). נדרשים מיילים רבים שסומנו מראש כ"ספאם" או "לא ספאם" כדי לאמן את המודל.
דוגמה ללמידה בלתי מודרכת: פילוח לקוחות. ללא ידע מוקדם על קבוצות לקוחות, האלגוריתם יזהה אשכולות של לקוחות בעלי התנהגות או מאפיינים דומים.

מצאתם טעות או שחסר משהו?