
העולם המדעי כולו עוקב לאחרונה אחר פרסום תקדימי: מודל הבינה המלאכותית הסיני DeepSeek-R1, שכבר נחשב לאחד המצליחים בעולם, הפך למודל הראשון מסוגו שמתועד במחקר שעבר ביקורת עמיתים בכתב העת היוקרתי Nature. מאז הכרזתו, גנב המודל את ההובלה במאגר המודלים העולמי Hugging Face, עם קרוב ל-11 מיליון הורדות - כשהוא חותר בעוצמה תחת מודלי הענק האמריקאיים.
החידוש המדובר אינו רק בביצועים של R1, אלא בשקיפות יוצאת הדופן של פרסומיהם. במסגרת הביקורת המדעית, נדרש צוות DeepSeek להציג לראשונה נתונים מלאים אודות שיטות האימון, מקורות המידע, ואמצעי האבטחה נגד תוצרי תוכנה מזויפים. כבר בשלב הראשוני נשמעה ביקורת מצד מומחים במערב, חלקם אף האשימו את החברה הסינית בהעתקת תוצרי OpenAI במסגרת תהליך הדיסטילציה (distillation), אך בראיונות עם צוות החוקרים התברר שלא נעשה שימוש ישיר בתוצרים של OpenAI. במקום זאת, המודל מבוסס על טכניקת אימון חדשנית של למידת חיזוק בלבד (reinforcement learning), תוך שימוש באסטרטגיית Group Relative Policy Optimization - מבלי לעבור אימון של fine-tuning מסורתי.
בפן הטכני, המודל השיג יעילות עלות מדהימה גם בפן הכלכלי - עלות האימון עמדה על 294,000 דולר בלבד, נמוכה עשרות מונים מהממוצע בשוק הבינלאומי, וזאת בעיקר בזכות שימוש בכ-512 שבבי Nvidia H800. שבבים אלה פותחו במיוחד לשוק הסיני עם מגבלות חומרה בהתאם לרגולציה האמריקאית, אך הוכיחו עצמם כמספיקים גם לאימון מודל בקנה מידה עצום. ההובלה הייתה כה משמעותית, עד ששוק הטכנולוגיה האמריקאי הגיב מיד - מניית Nvidia ספגה זעזוע זמני, וחברות אמריקאיות רבות החלו לבחון מחדש את היתרון התחרותי שלהן.
צעד נוסף אל עבר פתיחות ושקיפות התקבל עם פרסום הדוחות המלאים של תהליך השיפוט, שאפשרו לקהילת החוקרים לבחון בעצמם את תקפות המודל ותוקף התוצאות. מומחי AI מהאוניברסיטאות המובילות ציינו כי התהליך שהונהג כאן עשוי להציב סטנדרט חדש לאחריות התעשייה ולכונן אמון מחודש בכלי AI עוצמתיים. כפי שציינו מספר מרואיינים, המהפכה שמוביל DeepSeek-R1 עלולה להביא לגל של פיתוחים ומהלכים דומים במערב ואף בישראל בשנים הבאות.
0 תגובות