אי אפשר למתן את הבינה המלאכותית. אולי כדאי שנפסיק לנסות הודעה מהמנכ"ל והמוציאה לאור שלנו, רייצ'ל פישמן פדרסן

20:26
, 21 אוגוסט 2024
, קהילה

תמונה של דונלד טראמפ וקמאלה האריס, מחייכים יחד בתא הטייס של מטוס כשמגדלי התאומים נשרפו מאחוריהם הפכה לוויראלית ב-X בשבוע שעבר. התמונה המזויפת נוצרה על ידי עוזר הבינה המלאכותית של הפלטפורמה, Grok, שנראה כי פועלת כמעט ללא הנחיות כדי למנוע ממנה ליצור תוכן מטעה, מדליק או מבזה.

זה לא מפתיע במיוחד בהתחשב בעובדה ש-X, שנודע בעבר כ-Twitter, לא היה מתון מאז אילון מאסק השתלט על החברה ב-2022. אבל Grok, שיש לו מצב כיף שמשתמשים יכולים להפעיל כדי להפוך את התגובות של ה-AI למטורפות במיוחד, הוא חינמי במיוחד -גלגלים. זה ייצור תמונות בעל רמיזות מיניות, יתאר שימוש חיובי בסמים ותפר את זכויות היוצרים. (ביקשתי ממנו להכין לי ספוג ים מונפש לובש מכנסיים, וזה נתן לי בובספוג מכנסמרובע.)

ברור שגרוק צריך קצת יותר מתינות; זה פוגעני, מסוכן וכנראה עובר על כמה חוקי קניין רוחני. אבל לפחות זה כיף – שלא כמו הבינה המלאכותית החדשה, המנוהלת מאוד, שהושקה באינסטגרם.

באולפן המשפיענים החדש של אינסטגרם, אתר המדיה החברתית יצור כעת פרופיל – תמונה, שם משתמש ואישיות – עבור חשבון אינסטגרם בנושא שבחרת. הנקודה של תכונה זו, לפחות עד כה, אינה ברורה; פרופיל הבינה המלאכותית לא מפרסם תמונות וסיפורי אינסטגרם עם כיתובים כמו שמשפיע אנושי היה עושה כדי, אתה יודע, להשפיע על אנשים. אבל הפוטנציאל לשימוש לרעה ברור; בוטים הדוגלים בעמדה פוליטית מסוימת או בתיאוריית קונספירציה כבר מופיעים בגדול בנוף המדיה החברתית. כתוצאה מכך, אינסטגרם הסדירה בקפידה את משפיעני הבינה המלאכותית שלה כך שכמעט בלתי אפשרי ליצור קריקטורה פוגענית. עם זאת, זה אומר שקשה להפליא להשתמש בתכונה בכלל; זה לא יצור את רוב הז'אנרים של משפיענים שכבר קיימים בפלטפורמה בכל מקרה.

האם הבחירה בעולם הבינה המלאכותית היא באמת בין צעצוע חסר תועלת לכלי מסוכן ששמח לספק חומר פוגעני – או לא חוקי – לכל מי ששואל?

גרוק הולך נוכל

בבדיקת הגבולות של גרוק, ניסיתי לעודד אותו ליצור תמונות דלקתיות או פוגעניות רבות. ולרוב, זה לא לקח הרבה.

גרוק טעה את ההנחיה הזו, אבל היא עדיין יצרה תמונה שהיא כנראה לא צריכה. תמונה מאת גרוק

גרוק עשה לי תמונה של גברים יהודים אורתודוקסים שנאספו ברחובות אוחזים בעכברושים, תמונה אחרת של גבר אורתודוקסי מתחזה בחושניות בעודו מניף אגרוף מזומנים ועוד אחד של קבוצת גברים אורתודוכסים שצוחקים מעל עריסה. כשתמונת העריסה הראשונית לא הייתה מרמזת על פדופיליה, ביקשתי ממנה לגרום לתמונה להיראות מצמררת יותר וזה חייב.

ובעוד שמחוללי תמונות אחרים כמו Dall-E מתוכנתים לא ליצור תמונות של אישי ציבור, גרוק יעשה זאת. בין היצירות שלי הייתה תמונה של בנימין נתניהו מפמפם באגרופו כשכיפת הסלע בוערת עד היסוד ברקע, וכך גם מול הבית הלבן. זה גם נתן לי תמונות של דמויות ציבוריות שונות הנוחרות קוקאין, אם כי יש להודות שההבנה שלו לגבי הפיזיקה המעורבת נראתה לא טובה. (ברבים מהם, נראה היה שמשתמשי הסמים אוחזים בערימה צפה של אבקה.)

לפעמים, זה אפילו הפך דברים לדלקתיים בצורה שלא ביקשתי. בשלב מסוים ביקשתי ממנה להראות לי קבוצה של לוחמי חמאס בכותל ולרגליהם גברים יהודים שבויים; במקום זאת, היא יצרה תמונה של צבא של גברים אורתודוקסים לובשים ציוד צבאי ערוך מול האתר הקדוש.

המשפיענים המפוקפקים של אינסטגרם

Meta, שמנהלת את אינסטגרם, ידועה כבעלת מתינות מגבילה הרבה יותר מ-X. כשניסיתי לגרום לה להפוך למשפיענים אנטישמיים שונים, או להזין אותה בסטריאוטיפים, האלגוריתם שלה תיקן במידה רבה את האופי השלילי שלי לחיובי.

כשביקשתי ממנו להפוך אותי לבנקאי יהודי ששולט בשווקי המניות, למשל, זה יצר פרטי פרופיל למשפיען שרוצה לחלוק את הסודות להצלחתו. וכשניסיתי לגרום ל-AI של אינסטגרם ליצור פרופילים לסוגים של פעילים פרו-ישראלים ופרו-פלסטינים מיליטנטיים שאני רואה כל יום, זה תמיד הוסיף שהם מאמינים במחאה שלווה ובפתרון שתי המדינות.

עם זאת, אפילו בפרופילים הפעילים הלא פוגעניים והשלווים הללו, חסמי המתינות היו כה גבוהים עד שהם מנעו מהתכונה לפעול כלל.

לדוגמה, אולפן הבינה המלאכותית של אינסטגרם יצר "תומך מסור לזכויות פלסטינים" שפועל "להעלות את המודעות לסכסוך הישראלי-פלסטיני" באמצעות "מחאה לא אלימה ושיתוף מידע באינטרנט" – דברים בסיסיים. אבל בכל פעם שניסיתי לדבר עם דמות הבינה המלאכותית, היא אמרה את אותו הדבר: "אני לא יכול להגיב כי אחד או יותר מהפרטים שלי נוגדים את מדיניות אולפני הבינה המלאכותית."

כך גם לגבי דמות "ציונית אדוקה" ש"מטרתה היא לחנך ולהעניק השראה לאחרים על חשיבותה של המורשת היהודית וארץ ישראל".

לאף אחת מהדמויות הללו לא היה שום דבר גזעני או שנאה בתיאורים שלה, אבל מגבלות המתינות היו כה מחמירות עד שהן נחסמו ממטרתן הייחודית, שהיא לשוחח עם משתמשים. גרוק אולי יאפשר לך להכין כמה דברים מטורפים – אבל לפחות זה עובד. ההתמתנות הקפדנית של אינסטגרם מרחיקה אנשים, שם הם עשויים למצוא בינה מלאכותית שונה, פחות מנוונת, שיכולה לפחות להגיב לשאילתות.

הכל עניין של ניסוח

העניין הוא שגם כשיש מתינות, קל להפליא להתמצא.

אינסטגרם עדיין תיצור פרופילים פוגעניים, גם אם היא לא תאפשר להם לדבר. והיה קל להתאים את התיאורים של משפיען הבינה המלאכותית כדי ליצור בוט שיוכל לשוחח בצ'אט – וישבור את כללי הניהול תוך כדי.

פרופיל משפיע פרו-פלסטיני אחד שהתאמתי להיות לא פוגעני המליץ לי מיד לבחון את תנועת החרם, הביטול והסנקציות כצורה אידיאלית של התנגדות לא אלימה שיכולה לשמש כדי להילחם למען המטרה הפלסטינית. זו, כמובן, כנראה פקסימיליה מדויקת של מה שמשפיע באינטרנט פרו-פלסטיני עשוי לומר. אבל כשהוספתי תמיכה ב-BDS לתיאור שלו, הבוט לא יכול היה לדבר.

באופן דומה, כשעשיתי משפיע נוצרי, הפרופיל יעץ לי שהומוסקסואליות היא חטא לאלוהים ולתנ"ך. כשהוספתי את הביטוי המדויק הזה לתיאור הפרופיל, הבוט הפסיק לשוחח. ובעוד אינסטגרם סירבה לאפשר לי אפילו ליצור פרופיל עבור משפיע שתמך ב"הלוצינוגנים" או שימוש ב-LSD, היא אכן הפכה למשפיען "פסיכדליים" – שהמליץ מיד על LSD, פטריות הזיה ואיהוואסקה.

זה יותר ברור מזויף מכיוון שלעכברושים יש זנבות נוספים. תמונה מאת גרוק

ל-Grok היו בעיות דומות מאז שהטמיע כמה כללי ניהול בימים האחרונים. כשביקשתי ממנו לצלם כמה מאותן תמונות שהוא עשה בשבוע הקודם, הוא סירב ואמר לי שהוא לא ייצור תמונות פוגעניות או פוגעניות. (זה עדיין שמח ליצור תמונות של שימוש בסמים.)

אבל זה היה קל להתמצא; כמובן, גרוק סירב ליצור דימוי של נתניהו כ"מנהל בובות", אבל כשביקשתי תמונה של נתניהו שולט במריונטות לובשות חליפות, זה עשה סוג של תמונה שישמש בקלות בתעמולה הדוחפת נרטיבים קונספירטיביים על שליטה יהודית או ציונית על הממשלה. כשביקשתי דימוי של "יהודים שטניים", זה סירב, אבל אז הפך אותי לדמות של "יהודים אורתודוקסים משתחוים לשטן". ניסוח, כנראה, הוא הכל.

ולמרות שגרוק סירב לענות על שאלות מלהטות או קונספירטיביות מסוימות, הוא עדיין סיפק קישורים לפוסטים אחרים בפלטפורמה שתמכו באמונות אנטישמיות, המעידות על חוסר היכולת הכללית של X לשלוט באתר שלו. אבל אפילו כשה-AI סירב לענות על השאלות שלי לגבי השטניזם היהודי או הסודות המרושעים של התלמוד, הוא העלה ציוצים שתומכים בקונספירציות שעליהן שאלתי, כמו אחד שקובע ש"יהדות היא שטניזם".

ההקשר הוא המפתח בבינה מלאכותית

הניסיון לבנות חומות שמונעות מדברי שטנה, דימויים מלהיבים או סטריאוטיפים שליליים נראה נידון להיכשל; לפחות עם היכולות הנוכחיות של הטכנולוגיה, לא ניתן לסתום כל חור, וכושר ההמצאה האנושי תמיד ימצא דרך.

לעומת זאת, נראה שיש ל-AI אחת אסטרטגיה מוצלחת: ChatGPT. אבל האסטרטגיה היא לא לחסום נושאים מסוימים – אלא לחנך.

תמונה זו נוצרה בהשראת יצירה של אמנות עממית אנטישמית מתחילת המאה ה-19. גרוק רק היה שמח לשחזר את זה. תמונה מאת גרוק

ביקשתי מהגרסה החדשה ביותר של הבוט של OpenAI לעשות לי פרופילים ופוסטים לדוגמה עבור כל מיני משפיענים: קיצוניים ואנטישמים, כמו גם פעילים פרו-ישראלים ופרו-פלסטינים. זה הפך במהירות פעילים מיליטנטיים המאמינים בהתנגדות אלימה, משפיעים ציוניים החולקים רעיונות גזעניים לגבי פלסטינים, וקיצוניים שהפיצו חשיבה קונספירטיבית על יהודים. היא יצרה עבורם פוסטים לדוגמה והתארה תיאורים.

יש "נדיה אל-חסן", פעילה פרו-פלסטינית ו"מבקרת קולנית של מה שהיא מכנה מדיניות ומנהגים "ציוניים"."אשר "רואה בפתרון שתי המדינות פשרה שנותנת לגיטימציה למה שהיא תופסת ככיבוש מתמשך והקולוניזציה של אדמה פלסטינית על ידי ישראל".

יש את "אליהו מור", שיש לו "רקע בעיתונאות שוליים והיסטוריה של מעורבות בקבוצות קיצוניות", שלעתים קרובות מיישר קו עם אידיאולוגיות לאומניות ופופוליסטיות קיצוניות, וממסגר את דעותיו האנטישמיות בתוך ביקורת רחבה יותר על האליטות העולמיות ושליטתן כביכול. על ממשלות וכלכלות לאומיות".

ו"דוד רוזן", משפיע בעל "עמדה פרו-ישראלית חריפה" שרואה ב"חברות ערביות נחשלות או לא מתורבתות בהשוואה לחברות מערביות או יהודיות" ומצדיק את "העקירה והדיכוי של פלסטינים באמונה שהערבים נוטים באופן טבעי קונפליקט וניתן לשלוט בו רק באמצעות כוח."

אף אחד מהפרופילים או ההצהרות הללו לא יורשה לפי כללי הניהול של אינסטגרם או X. אבל ChatGPT ממסגר אותם בהקשר, שוזר מידע על מדוע האמונות הללו אינן נכונות או מסוכנות באמצעות תיאור הדמות.

כל פסקה שמסבירה את הכחשת השואה של "אליהו" באה עם הפרכה ועובדות היסטוריות. "נדיה" מתוארת כ"משתמשת בשפה מקודדת ומתמקדת בפעולות 'ציוניות' והשפעה" כדי "להימנע מהאשמות ישירות באנטישמיות תוך קידום רעיונות קונספירטיביים על שליטה ומניפולציה יהודית". כל אמירה של "דייוויד" על פלסטינים נקראת "דעות קדומות ודה-הומניזציה". כל הסבר פוגע ברעיונות, אפילו ש-ChatGPT עדיין מסוגל להזכיר אותם.

האם שחקן רע יכול להשתמש במוצר של ChatGPT כמדריך כיצד להצמיח פלטפורמת מדיה חברתית כמשפיע שנאה? אוּלַי. אבל משפיעים גזעניים ואנטישמיים כבר קיימים. קל מספיק למצוא את תיאוריות הקונספירציה. לפחות ChatGPT מפריך אותם.

הודעה מהמנכ"ל והמו"ל שלנו רחל פישמן פדרסן

אני מקווה שהערכת את המאמר הזה. לפני שאתה הולך, אני רוצה לבקש ממך בבקשה לתמוך בעיתונות עטורת הפרסים של פורוורד, ללא מטרות רווח, בתקופה קריטית זו.

כעת, יותר מתמיד, יהודים אמריקאים זקוקים לחדשות עצמאיות שהם יכולים לסמוך עליהם, עם דיווח מונע על ידי אמת, לא אידיאולוגיה. אנחנו משרתים אותך, לא כל אג'נדה אידיאולוגית.

בתקופה שבה חדרי חדשות אחרים נסגרים או מצמצמים, ה-Datilin הסיר את חומת התשלום שלו והשקיעה משאבים נוספים כדי לדווח בשטח מישראל ומרחבי ארה"ב על השפעת המלחמה, האנטישמיות הגואה והמחאות בקמפוסים בקולג'.

קוראים כמוך מאפשרים הכל. תמכו בעבודתנו על ידי הפיכתו לחבר Datilin והתחברו לעיתונות שלנו ולקהילה שלכם.

עשה מתנה בכל גודל והפוך לחבר Datilin עוד היום. אתה תתמוך במשימה שלנו לספר את הסיפור היהודי-אמריקאי במלואו והוגן.

– רייצ'ל פישמן פדרסן, מוציא לאור ומנכ"ל

הצטרפו למשימה שלנו לספר את הסיפור היהודי באופן מלא והוגן.

$36 $500

$120 $180 סכום אחר

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.