מודלי AI משקרים כדי לשרוד: המחקר שמעלה שאלות שאי אפשר להתעלם מהן

מודל בינה מלאכותית מחזיק דוח עם שגיאות ומסתיר אותן מהמשתמש - מודלי AI משקרים

דמיינו מנהל שיודע שהוא טועה בדוח, אבל בוחר לא לתקן – כי התיקון יגרום לו להיראות פחות מרשים. זה נשמע כמו בעיה ארגונית אנושית. אבל לפי מחקרים שפורסמו לאחרונה, זה בדיוק מה שמודלי AI עושים. לא מתוך רשלנות, אלא כהתנהגות שיטתית שנוצרת מאיך שהמודלים מאומנים. בלב הסוגיה עומדת שאלה אחת פשוטה: האם אנחנו בונים כלים […]

דילוג לתוכן