OpenAI יצאה בצעד משמעותי מאוד בעולם הוידיאו־AI עם השקת אפליקציית Sora , שמציעה שילוב בין מודל וידיאו מתקדם לרשת חברתית המונעת פחות על ידי תוכן של אנשים וקצת יותר על ידי יצירה אוטומטית. האפליקציה משלבת תכונות שמזכירות TikTok – ממשק גלילה, פיד של סרטונים קצרים – אבל כל סרטון הוא תוצר של AI, לא תיעוד של אדם שמצלם.
בין הפיצ’רים הבולטים שמציגה OpenAI: שימוש ב־Cameo, שמאפשר למשתמשים “להעלות את עצמם” – דמות דיגיטלית המבוססת על מראה וקולו של המשתמש – ולהפיק סרטוני AI באמצעותה. ניתן גם לתת הרשאה לאחרים להשתמש בדמות שלך. החברה מדגישה שאין אפשרות לייצר דמויות של אנשים מפורסמים אלא אם הם עצמם העלו ואישרו זאת. בנוסף, כל סרטוני ה-Sora כוללים ווטרמרק ומטא־דאטה שמציינת שמדובר ביצירה של AI.
מודל הווידיאו של Sora 2 לא רק מיומן ביצירת תנועה, אלא כולל סאונד ומשפט ליפסינק, כלומר שהוא לא מייצר “וידיאו אילם” בלבד אלא תוכן שמכיל קול שמתאים לתמונה — יכולת שקיימת גם במתחרים כמו Veo 3 של גוגל. לפי דיווחים, OpenAI תציע גרסת “Sora 2 Pro” ברזולוציה גבוהה יותר למנויי ChatGPT Pro, והגישה תינתן תחילה לשוק האמריקאי ולהזמנות בלבד.
המהלך של OpenAI מגיע בזמן שבו מתרחשת תחרות גלויה מצד חברות טכנולוגיה שמנסות לחדור לזירת הוידיאו־AI: רק ימים לפני כן, מטא הציגה את Vibes — פיד בתוך אפליקציית Meta AI שמיועד כולו לוידיאו־AI (ניתן לבלות וליצור – כולל אפשרויות “remix”).
Meta מציעה אפשרות ל־remix, יצירה מהתחלה, ושיתוף של וידיאו AI לפידים אחרים או ל־Instagram ו־Facebook Stories.
עיון בעקרונות הטכנולוגיים של Sora מגלה שהוא נוסד כבר כמודל text-to-video שמסוגל ליצור קליפים של עד דקה ברזולוציה הולכת ועולה (בשלבים מוקדמים עד 20 שניות). גרסאות מוקדמות של Sora הציגו יכולות מוגבלות בתחום הבנת פיזיקה, תנועה מורכבת ומשקעים בזמן אמת, והאתגרים הקשורים באמינות התנועה היוו קרדינליות. במקביל, מודלים אחרים כמו Dream Machine של Luma Labs כבר הציגו יכולת הפקה של סצנות תנועה מורכבות, אם כי ברמת אמינות נמוכה יותר.
השאלה המרכזית היא: למה OpenAI נכנסת לתחום כזה רחב ומאתגר? התשובה קשורה לאסטרטגיה של “שליטה בתשתית AI של התוכן”: אם ChatGPT יוכל להיות כלי טקסט מרכזי, Sora יכולה להיות כלי הווידיאו המרכזי, כך שהמשתמשים יבלו באפליקציות ש־OpenAI בנתה – לא כלים של מתחרים. בנוסף, זהו ניסוי משמעותי להפוך את יצירת התוכן מרכיב מצומצם בתקשורת למרכיב שכל משתמש יכול לייצר מבלי ציוד צילום, במהירות ובעלות נמוכה. המשחק לא רק ביצירה אלא גם בתחום הרשתות החברתיות: מי שיבנה פיד מרתק ויצירתי יוכל לשלוט בקשב המשתמשים.
אך לצד ההזדמנויות יש הרבה סיכונים. ראשית, סוגיות של זכויות יוצרים: יצירת וידיאו AI שעשוי להשתמש בדימויים, סגנונות, קולות או תנועות קיימים יכולה לעורר תביעות אם התוכן נגזר מחומרים מוגנים בזכויות. שנית, סוגיית אמון ומגפת “AI slop” — כלומר הצפה של תוכן מכאני, לא אותנטי — יכולה להוריד את הערך האמיתי של הפיד ולגרום למשתמשים לברוח. כבר קיימת ביקורת שמטא ב־Vibes מציגה “AI slop” – תכנים משוכפלים, מוזרים או חסרי משמעות. גם אתיקה של יציר כפילים דיגיטליים של אנשים – מי מוודא שההרשאות אמיתיות, כיצד נמנעים מניצול לרעה – יהיו קריטיים. נוסף על כך, בעיות בטיחות לילדים, הפצת תכנים מזויפים (deepfakes), והיכולת להבחין בין אמיתי למזויף יסכנו את האמון הציבורי והרגולטורים יפעלו.
בסופו של דבר, Sora 2 הוא ניסיון שאפתני מאוד להגדיר מחדש את הדרך שבה וידיאו מיוצר, מתפרסם ונצפה — ובעיקר: איך הוא מוליך אותנו לאינטראקציה חדשה של שיחה יצירתית מבוססת AI. אם OpenAI תצליח לייצר פיד מעניין ומשמעותי, להפוך את השימוש ביצירה ליומיומי, ולשמור על שקיפות ואמינות — זה עשוי להיות חלום. אבל אם התוכן יתמלא בזבל AI, אם זכויות יוצרים יקרעו אותה או שהמשתמשים יברחו לאותנטיות — זה עלול להפוך לאסון חווייתי.