יש לשכתב ערך זה. הסיבה היא: הערך כתוב בצורה לא ברורה וסובל מתרגמת.
אתם מוזמנים לסייע ולתקן את הבעיות, אך אנא אל תורידו את ההודעה כל עוד לא תוקן הדף.
GPT-4o (GPT-4 Omni) הוא מודל GPT שפותח על ידי OpenAI. המודל הוכרז על ידי המנהלת הראשית של הארגון, מירה מוראטי, במהלך הדגמה בשידור חי ב-13 במאי 2024 ושוחרר באותו יום. השימוש במודל חינמי, אך כפוף למגבלות שימוש.[1] ייחודיותו של המודל היא יכולתו לעבד וליצור טקסט, תמונות ואודיו.[2] ה-API שלו והטוקניזציה (יחידות המידע שמעובדות) מהירים פי שניים ובחצי המחיר מקודמו GPT-4 Turbo.[3]
רקע
GPT-4o הושק במקור במסווה של מודל אחר במערכת המודלים הגדולים LMSYS, כ-3 דגמים שונים. 3 הדגמים האלה נקראו gpt2-chatbot, im-a-good-gpt2-chatbot, ו-im-also-a-good-gpt2-chatbot.[4] ב-7 במאי 2024, סם אלטמן צייץ בטוויטר "im-a-good-gpt2-chatbot", מה שהיה מקובל לפרש כאישור לכך שמדובר בדגמי OpenAI חדשים שנבדקים A/B .[5][6]
יכולות
GPT-4o השיג תוצאות מתקדמות במדדי שימוש במודלים קוליים רב לשוניים, תוך הגדרת שיאים חדשים בזיהוי ותרגום דיבור אודיו.[7][8] GPT-4o קיבל ציון של 88.7 במדד Massive Multitask Language Understanding (MMLU) בהשוואה ל-86.5 של GPT-4. בניגוד ל-GPT-3.5 ו-GPT-4, המסתמכים על יכולת טקסט לדיבור ודיבור לטקסט, GPT-4o תומך באופן מקורי ב"קול לקול", מה שהופך את התגובה כמעט מיידית וחלקה. סם אלטמן ציין ב-15 במאי 2024 כי יכולות הקול לקול של GPT-4o עדיין לא שולבו ב-ChatGPT, וכי הגרסה הישנה עדיין בשימוש.[9]
המודל תומך ביותר מ-50 שפות, שלטענת OpenAI מכסה למעלה מ-97% מהדוברים בעולם.[10] מירה מוראטי הדגימה את היכולת הרב-לשונית של הדגם על ידי דיבור איטלקית עם הדגם ותרגומה בין אנגלית לאיטלקית במהלך אירוע ההדגמה של OpenAI בשידור חי ב-13 מאי 2024. בנוסף, הטוקנייזר החדש משתמש בפחות טוקנים עבור שפות מסוימות, כמו עברית, מה שהופך אותו לזול יותר עבור שפות אלו.[11]
ל-GPT-4o יש ידע עד אוקטובר 2023[12][13] ויש לו אורך הקשר של 128,000 טוקנים עם מגבלת פלט מוגבל ל-2048 טוקנים.[13]
כפי שפורסם, GPT-4o הציע חמישה קולות: Breeze, Cove, Ember, Juniper ו-Sky. דמיון בין קולה של השחקנית האמריקאית סקרלט ג'והנסון לבין Sky הובחן במהירות. ב-14 במאי, Entertainment Weekly שאלו את עצמם האם הדמיון הזה היה בכוונה.[15] ב-18 במאי, בעלה של ג'והנסון, קולין ג'וסט, התבדח על הדמיון בקטע ב-SNL.[16] ב-20 במאי 2024 השביתה OpenAI את קול Sky, ופרסמה הצהרה שאומרת "שמענו שאלות לגבי איך בחרנו את הקולות ב-ChatGPT, במיוחד Sky. אנחנו פועלים להשהות את השימוש ב-Sky בזמן שאנחנו מתייחסים אליהם".[17]
סקרלט ג'והנסון כיכבה בסרט המדע הבדיוני "היא" של ספייק ג'ונז ב-2013, וגילמה את התפקיד של סמנתה, עוזרת וירטואלית אינטליגנטית באופן מלאכותי שהתגלמה באמצעות קול נשי. כחלק מהקידום לקראת שחרורו של GPT-4o, סם אלטמן צייץ ב-13 במאי מילה אחת: "היא".[18]
OpenAI טענה שכל קול מבוסס על עבודת קול של שחקן שכיר. באופן ספציפי, OpenAI טענה "הקול של סקיי אינו חיקוי של סקרלט ג'והנסון אלא שייך לשחקנית מקצועית אחרת המשתמשת בקול הדיבור הטבעי שלה". כבר בספטמבר 2023, OpenAI טענה לגרסה המדברת החדשה שלה לעוזרת ChatGPT שלה שנשמעה כאילו סקרלט ג'והנסון "לא נועדה להידמות" לשחקנית.[19] ה-CTO מירה מוראטי הצהירה "אני לא יודעת לגבי הקול. למעשה הייתי צריכה ללכת ולהקשיב לקולה של סקרלט ג'והנסון". עוד טענה OpenAI כי הקול גויס לפני שהגיע לג'והנסון.[20]
ב-21 במאי, ג'והנסון פרסמה הצהרה שהסבירה ש-OpenAI הציעו לה מספר פעמים עסקה כדי לקבל אישור להשתמש בקולה כבר תשעה חודשים לפני שחרור המודל הקולי, עסקה שהיא דחתה. היא אמרה שהיא "המומה, כועסת ולא מאמינה שמר אלטמן יחפש אחר קול שנשמע כל כך דומה לשלי, עד שהחברים הקרובים ביותר שלי וכלי החדשות לא יכלו להבחין בהבדל". בהצהרה, ג'והנסון השתמשה בתקרית גם כדי למשוך את תשומת הלב להיעדר אמצעי הגנה משפטיים סביב השימוש בעבודה יצירתית כדי להפעיל כלי AI מובילים.[21]
משקיפים ציינו קווי דמיון לאופן שבו ג'והנסון תבעה בעבר את חברת וולט דיסני בגין הפרת חוזה על רקע השקה ישירה לסטרימינג של סרטה של מארוול "אלמנה שחורה",[22] פשרה שהניבה לג'והנסון כ-40 מיליון דולר.[23]