תעשיית הבינה המלאכותית חווה קפיצת מדרגה משמעותית מאז עידן BERT (ראשי תיבות של "Bidirectional Encoder Representations from Transformers" – מודל שפה שפיתחה גוגל ב-2018) ועד לשינוי הפרדיגמה שהביאו מערכות צ'אט תואמות הנחיות. כעת, נקודת המפנה הבאה היא מודלים המסוגלים להסקת מסקנות, המרחיבים את טווח היכולות מעבר לשאלות ותשובות פשוטות אל בעיות רב שלביות בתחומי מדע, מתמטיקה, תכנות ותהליכים סוכניים מורכבים. לצד היכולות, מתחדד הצורך ביעילות חישובית ויכולת פריסה גמישה בענן ובתשתיות מקומיות.
התפתחות ושינוי פרדיגמה: מהנחיות להסקת מסקנות
המודלים האוטורגרסיביים הראשונים הצטיינו בניבוי המילה הבאה והפיקו טקסט רציף אך חסר שליטה. שילוב טכניקות יישום הנחיות ושיטות חיזוק איפשר למודלים להיצמד למבנה ולכוונה, לדוגמה להפיק טקסט תמציתי או מבנה נקודתי. השלב הבא הוא הסקת מסקנות: המודל לומד לפרק שאלה מורכבת לתת בעיות, לבנות תהליך היסק ולספק תשובה מנומקת. האימון מתבסס לא רק על זוגות של ״שאלה ותשובה״, אלא גם על עקבות הסקה המציגות דרכי פתרון אפשריות, באופן הדומה להוראה אנושית המעדיפה שיטה על פני תשובה סופית בלבד.
מהי הסקת מסקנות במודלים גנרטיביים
הסקה מאפשרת למודל להתמודד עם בעיות רב שלביות כמו בעיות תנועה, הוכחות מתמטיות, ניתוחים מדעיים, פירוק משימות קוד או תהליכי שאילת נתונים מרובים. במקום ניסיון יחיד להפיק תשובה, המודל מפעיל תהליך חשיבה הדרגתי, מתייחס למקורות או לכלים נדרשים, ויכול להקדיש יותר שלבים חישוביים לשם דיוק ואמינות. היתרון בא לידי ביטוי במיוחד כאשר יש צורך בשילוב פעולות כמו חישוב, חיפוש, שליפת נתונים או קריאה לכלים חיצוניים.
משפחת Nemotron: נתונים, כלים ומיקוד ארגוני
המודלים במשפחת Nemotron נשענים על נקודת פתיחה פתוחה, משפרים אותה באמצעות איחוד נתונים באיכות גבוהה וטכניקות אימון מתקדמות ומפרסמים גם סט נתונים להמשך פיתוח קהילתי. היכולות ממוקדות בצרכי ארגונים: הסקת מסקנות, מתמטיקה, תכנות, שאלות מדע, ציות להנחיות ושיח טכני מדויק. דגש מיוחד ניתן לצמצום ״הזיות״, לעקביות מבנית בהתאם לדרישה ולתפקוד יעיל הכולל קריאה לכלים ושרשור פעולות. יתרון חשוב הוא מודל יחיד התומך גם במענה מהיר כאשר המשימה מורכבת, ללא צורך לתפעל שני מודלים נפרדים.
ארכיטקטורה ויעילות חישובית
המשפחה כוללת שלושה גדלים צפופים המיועדים לטווחי חומרה שונים. Nano סביב שמונה מיליארד פרמטרים מותאם ליחידות עיבוד גרפיות בעלות זיכרון בינוני, Super סביב ארבעים ותשעה מיליארד פרמטרים מתאים ליחידה ארגונית נפוצה, ו Ultra סביב מאתיים חמישים ושלושה מיליארד פרמטרים הפועל בתוך חצי אשכול טיפוסי.
בחירה, הערכה ופריסה בארגון
מומלץ להתייחס למודלים כאל עובדים דיגיטליים בעלי סט מיומנויות שונה, ולבצע תהליך הערכה ייעודי מול צרכים פנימיים. כלים מובנים להערכה מאפשרים לייצר מערכי מבחן מדויקים מתוך נתוני הארגון ולבחון מודלים פתוחים וסגורים זה לצד זה. לצד שיקולי ביצועים, יש לשקלל מגבלות נתונים, מיקום גיאוגרפי, רגולציה ופריסה מקומית או בענן. במסגרת אימוץ והטמעה, תפקיד מרכזי יש לייעוץ תפעולי בנושא. תפקידו של יועץ בינה מלאכותית הוא לסייע בבחירת מודלים, בבניית בקרות איכות ותהליכי עדכון רציפים ובתכנון ארכיטקטורת סוכנים וכלי עזר.
שיתופי פעולה ואקוסיסטם פתוח
הסביבה היישומית תשגשג בזכות תרומה של קהילות וחברות רבות. שיתופי פעולה עם פרויקטי בסיס קיימים מאפשרים נקודת פתיחה חזקה, וממנה ניתן להרחיב יכולות ולהחזיר לקהילה נתונים, טכניקות וכלי אימון. מגמה מרכזית נוספת היא הנגשת יכולות הסקה לשפות ולתרבויות נוספות, תוך ניצול העברה בין תחומים שבהם הידע אוניברסלי כמו מתמטיקה ותכנות, ושילוב מומחיות מקומית עבור היסטוריה, תרבות ושפה.
דיבור לטקסט בקצב חדש: Parakeet
בתחום עיבוד הדיבור, האתגר המשולב הוא דיוק גבוה, תמיכה במבטאים ובשפות וזמן תגובה מהיר. Parakeet מבוסס על גרסאות משופרות של Conformer ומיישם מנגנוני דגימה מרחבית ושליטה חכמה על הקשב כדי להפחית עלות חישובית בהזרמות מידע ארוכות. לצד זה, תכנון המפענח והתזמון היעיל של פעולות על גבי יחידות עיבוד גרפיות באמצעות טכניקות ייעודיות משפרים משמעותית את קצב העיבוד, לעיתים פי שניים עד שלושה, בלי לפגוע באיכות. הידע הארכיטקטוני והתשתיתי מפורסם במתכונת פתוחה ומזמין אימוץ ושילוב בקהילת הקוד הפתוח.
מבט קדימה: עובדים דיגיטליים ותפעול רציף
חזון העבודה הדיגיטלית מתאר סביבה שבה סוכנים מבוססי מודלים משתלבים בעבודת הצוות האנושי, פותרים מטלות חוזרות ומסובכות טכנית ומפנים מקום ליצירה, ניתוח והובלת מהלכים. עתיד זה נשען על מערכות מרובות מודלים הפועלות יחד, קריאה חכמה לכלים, עדכון רציף של ידע ארגוני ומנגנוני משוב מבוקרים. רכיבי תוכנה לניהול מחזור חיים והזנת נתונים מתמשכת מאפשרים לשמר עדכניות, לשפר ביצועים ולבנות אמון תפעולי.