דף הבית הודעות לעיתונות עסקים, מימון וכספים המכון לחדשנות טכנולוגית מכריז על השקת NOOR, מודל עיבוד השפה הטבעית בערבית הגדול בעולם
המכון לחדשנות טכנולוגית מכריז על השקת NOOR, מודל עיבוד השפה הטבעית בערבית הגדול בעולם
חיים נוי 11/04/22 |  צפיות: 501

 

המכון לחדשנות טכנולוגית מכריז על השקת NOOR, מודל עיבוד השפה הטבעית בערבית הגדול בעולם

*המודל הוא החזק ביותר בשפה הערבית עד כה עם 10 מיליארד משתנים

*כולל יישומים בתחומים כמו תקצור אוטומטי, צ'אטבוטים, שיווק מותאם אישית

אבו דאבי, איחוד האמירויות, 11 באפריל 2022, (BUSINESS WIRE):

המכון לחדשנות טכנולוגית - Technology Innovation Institute (TII), מרכז מחקר עולמי ועמוד תווך בתחום המחקר היישומי של מועצת המחקר הטכנולוגי המתקדם של אבו דאבי (ATRC), הודיע ​​היום על השקת NOOR, מודל עיבוד השפה הטבעית (NLP) בערבית הגדול בעולם עד כה.

צוות החוקרים המתקדם ומומחי הבינה המלאכותית (AI) של TII איחד כוחות עם LightOn, חברת טכנולוגיה המשחררת לשימוש בינת מכונות בקנה מידה גדול במיוחד לעסקים, כדי לשנות את מודל עיבוד השפה הטבעית הערבי. למודל NOOR יש את היכולת לבצע משימות מעבר לתחום השפה - ומציע נתונים באיכות גבוהה מקצה לקצה, כולל סריקה, סינון ואצירה בקנה מידה גדול. המודל מאפשר הכשרה והגשה מבוזרת בקנה מידה גדול במיוחד - כדי לספק יישומים המציעים התמחות לטובת להסקת מסקנות ומודלים יעילים.

ד"ר ריי או. ג'ונסון, מנכ"ל, TII ו-ASPIRE, אמר: "עם הפיתוח הזה, אנו נמצאים היטב על המסלול כדי לשפר את יכולות המחקר והאישורים שלנו, כמו גם להעלאת קרנה של אבו דאבי ואיחוד האמירויות כאקו סיסטם מחקרי רציני. צוותי המומחים שלנו הוכיחו שוב שאזור זה יכול להשיג תוצאות מחקר ופיתוח פורצות דרך כדי להשפיע על העולם".

ד"ר אבטסאם אלמאזרואי, מנהל, יחידת AI Cross-Center ב-TII, אמר: "מודלים גדולים של שפה כבשו בסערה את עולם עיבוד השפה הטבעית ואנו גאים להציג מודל חדשני זה עם 10 מיליארד משתנים - מודל NLP הערבי הגדול בעולם. מערך הנתונים הערבי הגדול והייחודי שנאסף כדי להכשיר את המודל הוא תוצאה של חודשים של עבודה קשה שכללה איסוף, גריטה וסינון של מקורות מגוונים. תודה מיוחדת לכל הצוות שעבד על הפרויקט הזה כדי להפוך את NOOR למודל החיפוש בערבית לאקדמאים ועסקים בכל מקום".

פרופ' מרוואן דבה, חוקר ראשי, מרכז המחקר למדע דיגיטלי ויחידת AI Cross-Center, TII, אמר לגבי ההשקה הקרובה: "עם NOOR, TII הרחיב את היקף המודל הסטנדרטי הערבי המודרני על ידי מינוף הידע בתחום מודלי השפה הגדולים לבניית מומחיות חוצת תחומים מתקדמת בדור החדש הזה של מחקר הבינה המלאכותית".

כדי לאצור את ערכות הנתונים הערביות הגדולות בעולם, ערכת הנתונים הייחודית של NOOR, המונה יותר מ-30 מיליארד מילים, משלבת נתוני אינטרנט עם ספרים, שירה, מאמרי חדשות ומידע טכני כדי להרחיב באופן משמעותי את תחולת המודל.

ד"ר אבטסאם אלמאזרואי אמר שמודל NOOR מבוסס על ארכיטקטורת שינוי או לימוד מכונה. מודל הפיענוח בלבד שלו דומה במבנהו ל-GPT-3 והוא מתוכנת להתמודד עם משימות יצירתיות עם ארכיטקטורה משודרגת כדי לשקף את ההתפתחויות האחרונות בעולם למידת המכונה, כולל שיפורים כגון הטמעות מיקום טובות יותר.

כדי להבטיח איכות בקנה מידה גדול בערכת הנתונים של,NOORצוות TII תכנן צינור סינון אוטומטי המבוסס על טכניקות לימוד מכונה. כלים אלו מזהים מלל הרלוונטי להפניות איכותיות ומגנים על המודל מחשיפה לספאם.

 

NOOR עבר אימון באמצעות מחשוב בעל ביצועים גבוהים עם 128 מעבדים גרפיים מסוג A100, והוא ממנף גישת מקבילית תלת-ממדית מתקדמת כדי לאפשר הפצת חישובים תוך הבטחת שימוש יעיל במשאבי החומרה הזמינים.

מנהל היחידה לבינה מלאכותית הבין-מרכזית ציין כי זהו רק הצעד הראשון במאמצי היחידה לתרום לאסטרטגיה הרחבה יותר של איחוד האמירויות לבינה מלאכותית.

המודל נקרא על שם המילה הערבית "אור", כדי לבסס את המתאם של מודל השפה הערבית להארת המוח.

אודות Technology Innovation Institute (TII)

למידע נוסף, בקרו בכתובת www.tii.ae

*מקור: AETOSWire

תמונות / גלריית מולטימדיה זמינים: https://www.businesswire.com/news/home/52671760/en

*מקור: AETOSWire

קשרי מדיה

Technology Innovation Institute

Sneha Sivanand, [email protected]

כיתוב תמונה מצורפת: נור, מודל עיבוד השפה הטבעית (NLP) בערבית הגדול בעולם - צוות יחידת AI, המכון לחדשנות טכנולוגית (צילום: AETOSWire)

מקור: Technology Innovation Institute

תוכן הודעה זו בשפת המקור, מהווה את הגרסה הרשמית והמהימנה היחידה של מסמך זה. תרגומים מסופקים למטרות נוחות בלבד ויש להצליבם מול המסמך בשפת המקור, המהווה את הגרסה היחידה של טקסט זה שהינה בעלת תוקף משפטי.

*** הידיעה מופצת בעולם על ידי חברת התקשורת הבינלאומית BUSINESS WIRE


דירוג המאמר:

תגיות של המאמר:

 חיים נוי

חיים נוי, עיתונאי, עורך ראשי של סוכנות החדשות הבינ"ל IPA, לשעבר עורך ראשי של סוכנות הידיעות עתים, חבר תא מבקרי התיאטרון באגודת העיתונאים



 


מאמרים נוספים מאת חיים נוי
 
Multiply Group משלימה את רכישת Tendam ומכפילה את ה-EBITDA התפעולי תוך הרחבת טביעת הרגל הגלובלית שלה
* Tendam היא קבוצת ההלבשה השניה בגודלה בספרד לפי נתח שוק ואחת מקבוצות ההלבשה המובילות באירופה עם ערוצים שונים. * Tendam מחזיקה ב-12 מותגי אופנה הנמצאים בבעלותה ומציעה גיוון וחשיפה בינלאומית, תוך העמקת נוכחותה של הקבוצה בענפים ממוקדי צרכנים.

Bitget KCGI 2025 מתחמם כאשר קרב הצוותים יוצא לדרך: קהילות מתאחדות, יריבויות ניצתות
Bitget, בורסת המטבעות הקריפטוגרפים המובילה וחברת Web3, הוציאה לדרך את השלב הבא של King’s Cup Global Invitational (KCGI) לשנת 2025, עם תחילתו הרשמית של קרב הצוותים.

ExaGrid מגיעה לרבעון ה-18 ברציפות של תזרים מזומנים חופשי, EBITDA, ופעילות חיובית של רווח והפסד
ExaGrid, הספקית של הפתרון היחיד בענף לאחסון גיבוי בשכבות עם נעילת זמן הכוללת שכבה שאינה חשופה לרשת (תוך יצירת מרווח אוויר), מחיקה מושהה ועמידות בפני שינויים לצורך התאוששות ממתקפות כופר, הודיעה היום כי היא ממשיכה לצמוח ולהניע תזרים מזומנים חופשי (FCF) ו-EBITDA.

eXp Realty מושקת ביפן, ומסמנת את הכניסה הרביעית לשוק גלובלי ב-2025
יפן מצטרפת לאזור אסיה פסיפיק הצומח של eXp, כאשר יותר סוכנים מחפשים מודלים המציעים חופש, בעלות וטווח הגעה גלובלי

Wipro חותמת על עסקת "רשת חכמה" עם חברת החשמל הסעודית
Wipro Limited ‏(NYSE: WIT, BSE: 507685, NSE: WIPRO), חברה מובילה לייעוץ ולשירותי טכנולוגיה מונעי AI, הכריזה היום כי חתמה על הסכם אסטרטגי רב שנתי עם חברת החשמל הסעודית - National Grid SA.

Bitget מחזקת את הנוכחות האזורית בשבוע הבלוקצ'יין של מלזיה 2025
Bitget, בורסת המטבעות הקריפטוגרפים המובילה וחברת Web3, השתתפה בשבוע הבלוקצ'יין של מלזיה 2025, כדי לחזק את קשריה עם הכלכלה הדיגיטלית הצומחת במהירות של דרום מזרח אסיה.

דו"ח הוכחת הרזרבות של Bitget ליולי מראה עלייה של 45% באחזקות המשתמשים ב-Bitcoin (BTC)
Bitget, בורסת המטבעות הקריפטוגרפים המובילה וחברת Web3, פרסמה את נתוני הוכחת הרזרבות (PoR) האחרונים שלה, והם מגלים עלייה חדה בכמות אסימוני ה-Bitcoin המוחזקים על ידי משתמשים, כאשר יתרות ה-Bitcoin זינקו ביותר מ-45% ביולי במונחים של חודש לחודש.

Andersen Consulting מרחיבה את יכולות הטרנספורמציה הדיגיטלית והבינה המלאכותית שלה באמצעות Rysun
Andersen Consulting מחזקת את יכולות הטרנספורמציה הדיגיטלית והבינה המלאכותית שלה באמצעות שיתוף פעולה עם Rysun, חברה לייעוץ טכנולוגי המתמחה בעזרה שהיא מעניקה לארגונים באימוץ AI והטמעת מודרניזציה במערכות ליבה לשמירה על הגמישות והצמיחה.

Andersen Consulting מקדמת את יכולות הטרנספורמציה הדיגיטלית שלה באמצעות Exponential Digital Solutions
Andersen Consulting ממשיכה לבסס את פלטפורמת הייעוץ הדיגיטלית שלה באמצעות שיתוף פעולה עם Exponential Digital Solutions ‏(10xDS), חברה המתמחה בטרנספורמציה מבוססת AI ובטכנולוגיות מתפתחות.

ה-CMA: פיצוי למשקיעים שנפגעו מהפרות שבוצעו במניות "Watani Iron Steel Co
רשות שוק ההון הסעודית (CMA) מודיעה על השלמת פיצוי למשקיעים שנפגעו מההפרות שבוצעו במניות חברת Watani Iron Steel Co., שהתרחשו לפני ואחרי הרישום הישיר של החברה בשוק המקביל (Nomu).
     
 
שיווק באינטרנט על ידי WSI