כולל ההנחיות של ChatGPT

חשיפה: התגלו ההנחיות החסויות המפעילות את מערכות ה-AI המתקדמות בעולם

חוקר בתחום הסייבר חשף אוסף מרשים של "System Prompts" – המערכת הסמויה מאחורי הקלעים המנחה את התנהגותם של כלי הבינה המלאכותית הפופולריים ביותר (דיגיטל)

המוח שמאחורי המודלים נחשף (צילום: Shutterstock)

אוסף מקיף של הנחיות פנימיות סודיות הידועות כ-"System Prompts" נחשף לאחרונה על ידי חוקר סייבר המזוהה כ-@NotLucknite. חשיפה זו מגלה את המכניזם הסמוי המכוון מאחורי הקלעים את פעילותם של שירותי AI מובילים דוגמת ChatGPT, Cursor, Lovable, Manus ושירותים נוספים.

System Prompts, או הנחיות מערכת, הן הוראות סמויות הניתנות למודלי שפה כמו ChatGPT, שנועדו להכתיב את סגנון הדיבור, האישיות, גבולות המידע, וכללי ההתנהגות של המודל במהלך השיחה. מדובר בפסקאות הפעלה שמוזנות למערכת מאחורי הקלעים לפני תחילת כל אינטראקציה, כדי לוודא שהמודל יפעל בהתאם לערכים, לסגנון ולמגבלות שהוגדרו לו מראש – למשל, להיות עוזר מנומס ואינפורמטיבי, להימנע מהפצת מידע מסוכן, ולא לספק ייעוץ רפואי. ההנחיות קובעות גם אילו תכנים מותר למודל להציג, אילו אישיויות עליו לאמץ (כגון מדריך מקצועי, מורה או בן שיח חברי), ומה עליו להימנע מלעשות (כמו לחשוף מידע אישי או לאמת עובדות שאינן מבוססות). ה-System Prompt הוא אפוא לב התיווך בין המשתמש למודל – מעין סרגל כללים שקט המאפשר שיחה מדויקת, בטוחה ומותאמת להקשר.

החשיפה, שהועלתה לפלטפורמת GitHub וכוללת יותר מ-6,500 שורות קוד המפרטות את המבנה והתפקוד של מערכות אלו, מעוררת דאגות אבטחה משמעותיות. על פי המסמכים, חשיפת ה-System Prompts עלולה לסכן סודות תעשייתיים ולפתוח פתח להתקפות זדוניות על המערכות הללו.

השיטות שבעזרתן נחשפו הנתונים:

  • Prompt Injection - טכניקה של שתילת הוראות מתוחכמות המתמרנות את המודל לגלות את ההנחיות הפנימיות המוטמעות בו
  • Adversarial Prompting - גישת ניסוי וטעייה שיטתית באמצעות קלטים המבלבלים את המערכת עד שהיא "נשברת" וחושפת מידע פנימי רגיש
  • Social Engineering דיגיטלי - ניהול דיאלוג אסטרטגי עם המודל, הכולל התחזות למפתח או הצגת שאלות "תמימות" שמטרתן לחלץ מידע על הארכיטקטורה הפנימית

עבור קהילת המפתחים וחובבי הטכנולוגיה, המסמכים המודלפים מספקים למעשה מדריך שימושי לשיפור הPrompts שלהם והגנה מפני זליגת מידע רגיש.

חשיפה זו מחדדת את הצורך הגובר בשקיפות מצד התאגידים המפתחים טכנולוגיות AI, לצד המתח המתמיד בין שיתוף ידע טכנולוגי פתוח לבין הגנה על קניין רוחני ואבטחת מידע בעידן הבינה המלאכותית.

האם הכתבה עניינה אותך?

כן (88%)

לא (12%)

תוכן שאסור לפספס:

0 תגובות

אין לשלוח תגובות הכוללות דברי הסתה, לשון הרע ותוכן החורג מגבול הטעם הטוב.

אולי גם יעניין אותך:

עוד בחדשות הטכנולוגיה:

קריאת ההשכמה של הבכירים

אנו בתקופה היסטורית, השינויים שמביאה איתה הבינה המלאכותית הם מהירים מכפי שניתן יהיה להבין אותם | אילו משרות יוחלפו על ידה? מה לא נמצא בסיכון וכיצד נכון להתכונן לתעסוקה בעולם ה-AI. וגם, מה דעתו של מנכ"ל החברה המצליחה הישראלי על התקופה ודרכי ההתגוננות? כל מה שחשוב לדעת על תעסוקה בעידן ה-AI (כלכלה)

|

מיקומים נוספים יאושרו בקרוב

במשרדי האוצר והביטחון מעדכנים הצהריים, כי אושרו הזוכים להקמת 22 אתרי סלולר חדשים, שיוקמו תוך 8 חודשים | עשרות מיקומים נוספים יאושרו בקרוב  | המשמעות: שיפור משמעותי של הביטחון האישי (חדשות)

||
1

לא להיכנס לקישור!

הודעות הפישיניג וניסיונות העוקץ לא נגמרים: הבוקר מעדכנת רשות המסים, כי גורמים זדוניים מפיצים הודעה על פתיחת חקירה ברשות המסים ומצרפים להודעה לינק מסוכן | אזהרה: לא לפתוח את הלינק! (חדשות דיגיטל)

|

מנכ"ל OpenAI חושף

בין סביבה למנהג: מנכ"ל OpenAI, סם אלטמן, מגלה את העלות הסביבתית והכלכלית מאחורי שיחות מנומסות עם בינה מלאכותית, כשלטענתו הדבר עולה לנו ביוקר |  מומחי שירות לקוחות מצביעים על אתגרים דומים במערכות אנושיות (טכנולוגיה)

||
11

איטליה מציגה פיתוח חדש

חברת ELT GROUP חושפת פיתוח מהפכני המשלב בינה מלאכותית וטכנולוגיה קינטית להגנה על תשתיות אסטרטגיות מפני נחילי רחפנים תוקפים - מיגון לאזורים נרחבים כולל גבולות, חופים ומתקנים אזרחיים וצבאיים (טכנולוגיה)

||
5

כל הפרטים | זהירות!

זוהתה פירצה חדשה המסכנת את משתמשי ה-Windows בגרסת הווינדוס | לפי הדיווחים, מדובר בפירצה המאפשרת לתוקפים להחדיר קובץ זדוני במסווה של תמונה או מסמך תמים | כך תתגברו על הפירצה (חדשות, טכנולוגיה)

|

פיתוח אמריקאי

פריצת דרך מרעישה בממשק מוח-מחשב: הטכנולוגיה החדשה מצמצמת את ההשהיה בין מחשבה לדיבור לפחות משנייה, ומציעה תקווה אמיתית למיליוני אנשים הסובלים מאובדן יכולת הדיבור ברחבי העולם (טכנולוגיה)

|

יאפשר מיקומים חדשים

בזכות טכנולוגיה חדשה שפיתחה חברת קוקה קולה, המבוססת על תאי מימן, תוכל קוקה קולה להציב מכונות למשקאות גם ללא צורך בחשמל, מה שאומר שהיא תוכל להציב מכונות במקומות מרוחקים וללא תשתיות ראויות, כדוגמת המדבר (טכנולוגיה)

||
6

הישג מרשים בתחום האנטיביוטיקה

מחקר פורץ דרך באימפריאל קולג' לונדון מדגים כיצד בינה מלאכותית מאיצה תגליות מדעיות בתחום עמידות חיידקים לאנטיביוטיקה | אך כיצד להתמודד עם כישלונותיה וכיצד למדוד מהימנות בבינה מלאכותית? (טכנולוגיה)

||
2

בעקבות לחץ ממשלתי

בעקבות לחץ מצד ממשלת בריטניה נאלצה חברת אפל לבטל את ההצפנה מקצה לקצה שלה בשירות הענן שלה - icloud | מהי ההצפנה ומהם ההשלכות? ואת מי הדבר מדאיג במיוחד? מלחמת המידע (דיגיטל)

|
ש

מחיר מציאה

חברת גרין פארק, מהמובילות בישראל בתחום הייזום והבנייה, יוצאת במבצע ייחודי: קבוצת רכישה להקמת שכונה חרדית חדשה – מותאמת במלואה לאורח החיים החרדי, עם כל השירותים הקהילתיים שאתם צריכים: בתי כנסת, מוסדות חינוך איכותיים ומרכזים מסחריים (נדל"ן)

ציקי גל|מקודם

דאגה ותושיה

האם הבינה המלאכותית באמת עומדת להחליף אותנו? האם המשרות המסורתיות ייעלמו וייווצרו משרות חדשות או שאנחנו עומדים בפני עידן של אבטלה טכנולוגית? העתיד של שוק העבודה נראה מעורפל, ואנחנו חייבים להבין כיצד להסתגל כדי לא להישאר מאחור (טכנולוגיה)

|
ש

רפורמת התחבורה

שמעתם על ההנחה החדשה בתחבורה הציבורית? רבים כבר חוסכים – ואתם אולי מפספסים את זה |  תוך פחות מדקה תוכלו לבדוק אם גם לכם מגיע, דרך המחשבון הרשמי של משרד התחבורה (תחבורה ציבורית)

ציקי גל|מקודם
זמני היוםמזג אווירפנו אלינוקריירהמדיניות פרטיות