Arm Mali-G77 GPU - כל הפרטים הקטנים והמוצעים

מְחַבֵּר: Randy Alexander
תאריך הבריאה: 3 אַפּרִיל 2021
תאריך עדכון: 1 יולי 2024
Anonim
Arm Mali-G77 GPU - כל הפרטים הקטנים והמוצעים - טכנולוגיות
Arm Mali-G77 GPU - כל הפרטים הקטנים והמוצעים - טכנולוגיות

תוֹכֶן


לצד ליבת המעבד החדשה Cortex-A77 שלה, חשפה ארם GPU מהדור הבא המיועד לסופי ה- SoC של הדור הבא. ה- Mali-G77, שלא יתבלבל עם מעבד התצוגה החדש של Mali-D77, מסמן את עזיבתו של ארכיטקטורת Bifrost ואת המעבר לוואלהול.

ניכנס לרגע לפרטים הקטנים של הארכיטקטורה החדשה. ראשית, אנו נקפוץ ישר למה שמשתמשים צריכים לצפות מבחינת רווחי ביצועים.

סקירת ביצועים של Mali-G77

זרוע מתגאה בעד 40 אחוזים של ביצועי גרפיקה עם מכשירי Mali-G77 מהדור הבא בהשוואה לדגמי Mali-G76 של ימינו. מספר זה לוקח בחשבון תהליכים כמו גם שיפורים ארכיטקטוניים. ניתן להגדיר את ה- Mali-G77 בין 7 ל -16 ליבות שיידר, וכל ליבה כמעט באותו גודל כמו ליבת ה- G76. משמעות הדבר היא שסמארטפונים מתקדמים ככל הנראה ישלחו עם ספירת ליבה דומה של GPU כפי שהם עושים כיום - אי שם בגיל העשרה הנמוכה. באופן ידני, הדבר מאפשר לנו לבצע כמה הערכות ביצועים ספקולטיביות מול ערכות השבבים הקיימות.

כשמסתכלים במדד הפופולרי של מנהטן GFXBench, דחיפה של ביצועים של 40 אחוזים פותחת עופרת משמעותית מול חומרת הדור הנוכחי. שבב Adreno מהדור הבא של קוואלקום יזדקק לשדרוג ביצועים משמעותי משלו כדי לשמור על רמת המגרש. נראה שהטבלאות הופכות לטובתו של ארם.


מבחינה ארכיטקטונית, ביצועי המשחק מגדילים 20 עד 40%, בעוד שלמידה של מכונות מרוויחה 60%

בהתבסס על חניית כדורים גסה למדי זו, Mali-G77 בעלת 10 ליבות (תצורה שאנו רואים לעתים קרובות מ- Huawei) נראית כמעט ככל האפשר לחלק מהחומרה הגרפית הניידת של הדור הזה. תצורה של 12 ליבות, הנראית בדרך כלל ב- Exynos של סמסונג, מספקת מוביל גדול עבור ה- GPU האחרון של Arm. כמובן שמדדי אמת אמיתיים יהיו תלויים בגורמים אחרים, כולל צומת תהליכים, זיכרון מטמון GPU, תצורת זיכרון LPDDR וסוג היישום שאתה בודק. אז קח את הגרף לעיל עם מינון חזק של מלח.

מבחינת הארכיטקטורה החדשה בלבד, ארם קובע כי ה- Mali-G77 מציע שיפור ממוצע של 30 אחוז ליעילות אנרגטית וצפיפות ביצועים. יש גם דחיפה ענקית של 60 אחוזים ליישומי למידת מכונות, הודות לתמיכה במוצרי INT8 נקודה. הציפיות לביצועי המשחק נקבעות איפשהו בין דחיפה של 20 ל- 40 אחוזים, תלוי בכותרת ובסוג עומסי העבודה הגרפיים המוצעים.

כדי להבין כיצד Arm השיג את הרמת הביצועים הזו, הבה נצלול עמוק יותר בארכיטקטורה.

פגוש את ואלהאל, ממשיך דרכו של ביפרוסט

Vahall הוא ארכיטקטורת ה- GPU הסקלרית של הדור השני של ארם. זהו מנוע ביצוע עיוות בן 16 רחב, שמשמעותו למעשה שה- GPU מבצע 16 הוראות במקביל לכל מחזור, ליחידת עיבוד, ליבה. זה מ -4 ו -8 ברוחב Bifrost.


מאפיינים אדריכליים חדשים אחרים כוללים תזמון הוראות דינמי המנוהל כולו בחומרה ומערך הוראות חדש לגמרי השומר על שוויון תפעולי ל- Bifrost. אחרים כוללים תמיכה בפורמט הדחיסה של AFBC1.3 של Arm, יעדי עיבוד FP16, עיבוד שכבות ויציאות קודקוד.

ה- Mali-G77 עושה 33% יותר מתמטיקה במקביל ל- G76.

המפתחות להבנת השינויים האדריכליים העיקריים נמצאים על ידי בחינת יחידת הביצוע בתוך הליבה. חלק זה של ה- GPU אחראי לפיצוץ מספרים.

בתוך מנוע הביצוע

ב- Bifrost, כל ליבת GPU הכילה שלושה מנועי ביצוע או שניים במקרה של כמה עיצובים Mali-G52 בקצה התחתון. כל מנוע מכיל יחידת בקרת זיכרון מטמון, קובץ רישום ועיוות. ב- Mali-G72 כל מנוע מטפל ב -4 הוראות בכל מחזור, אשר גדלו ל -8 ב- Mali-G76 בשנה שעברה. התפשטות על פני שלוש הליבות הללו מאפשרת 12 ו -24 נקודות נקודה צפה של 32 סיביות (FP32) ממולאות לצבור ריבוי (FMA) לכל מחזור.

עם Valhall ו- Mali-G77, יש רק מנוע ביצוע יחיד בתוך כל ליבת GPU. כמו בעבר, מנוע זה מאכלס את יחידת בקרת העיוות, הרשמה וה- icache, המשותף כעת לשתי יחידות עיבוד. כל יחידת עיבוד מטפלת ב 16 הוראות עיוות בכל מחזור, לתפוקה כוללת של 32 הוראות FMA32 FMA לליבה. זהו דחיפה של 33 אחוזים לתפוקת ההוראה ב- Mali-G76.

הזרוע עבר משלוש ליחידת ביצוע אחת בלבד לכל ליבת GPU, אך כעת יש שתי יחידות עיבוד בתוך ליבת G77.

בנוסף, כל אחת מיחידות העיבוד הללו מכילה שני חסימות פונקציות מתמטיות חדשות. יחידת ההמרה החדשה (CVT) מטפלת בהוראות מספרים בסיסיים, לוגיקה, סניף והמרה. יחידת הפונקציות המיוחדת (SFU) מאיצה את כפל מספרים שלמים, חלוקות, שורש ריבוע, לוגריתמים ופונקציות שלמות מורכבות אחרות.

ביחידת FMA הסטנדרטית נראו מספר ציוצים התומכים ב -16 הוראות FP32 בכל מחזור, 32 FP16 או 64 INT8 הוראות מוצר. אופטימיזציות אלה מייצרות את הרמת הביצועים של 60 אחוזים ביישומי למידת מכונה.

Mapper מרקם מרובע

שינוי המפתח הנוסף ב- Mali-G77 הוא הצגת מיפוי מרקם מרובע, למעלה ממיפוי מרקם כפול בדור הקודם. מיפוי המרקם אחראי למיפוי מצולעי התלת-ממד בסצנה לייצוג הדו-ממדי שרואים על גבי מסך. זה אחראי לדגימה, אינטרפולציה וסינון כדי להחליק תוכן זוויתי ומזיז כדי להימנע מקצוות קשים ואיכותיים.

על מנת למנוע כוונון ביצועים של מרקם נותרה אפשרות לסייע באיכות התמונה, אך הכפילה בביצועי המרקם היא היתרון העיקרי כאן. יחידת המרקם מעבדת כעת 4 טקסלים דו-גלוליים לשעון מ -2 בעבר, 2 טקסלים משולשים לשעון ומתמודדים עם סינון FP16 ו- FP32 מהיר יותר.

מיפוי מרקם המרובע מחולק לשני נתיבים, ומספק צינור קצר יותר לחוטים שפוגעים בתוכן במטמון. נתיב ההחמצה, המטפל בהמרת פורמטים ובפירוק טקסטורה, כולל ממשק רחב יותר למטמון L2. זה מועיל גם לעומסי עבודה של למידת מכונה שעשויים לעיתים קרובות להוציא נתונים חדשים מהזיכרון.

מפגיש הכל ב- Mali-G77

ארם ביצע מספר ציוצים נוספים ל- Mali-G77 בכדי לחפוף עם השינויים הגדולים בארכיטקטורת ואלהול. חסימת הבקרה מפושטת בזכות תכנון יחידת הביצוע היחידה, ואילו המתזמן הדינמי הפנימי מאפשר למעשה הנחיה גמישה יותר הנמצאת בתוך כל ליבה. עם תפוקה גבוהה יותר בכל ליבה, נתוני הנתונים הם גם קצרים ונמוכים יותר בזמן ההשהיה, עד 4 מחזורים בלבד מ -8 בעבר.

העיצוב החדש מיושר טוב יותר לממשק ה- API של Vulkan, ופשט את מתארי הנהגים כדי להוריד את תקורת הנהג כדי לשפר את ביצועי "המתכת".

לסיכום, ה- Mali-G72 ו- Valhall מבצעים שינויים חשובים מ- Bifrost שמבטיחים הגברת ביצועים משמעותיים ליישומי משחק ולמידה של מכונות. חשוב מכך, העיצוב מתאים לאותם תקציבי כוח ושטח כמו Bifrost, ומבטיח שמכשירים ניידים יוכלו להציע ביצועים גבוהים יותר מבלי לדאוג למחירי חום, חשמל וסיליקון. בהתבסס על תחזיות הביצועים, ה- Mali-G77 אמור להיות מסוגל לתת לאנדרנו-גנרל הבא של קוואלקום רווח טוב לכספו.

פיתוח אפליקציות זה כמעט הכרטיס החם ביותר בעיר כרגע. זה כן כיף ללמוד גם מכיוון שיצירת כל אפליקציה חדשה היא פרויקט קטן ומספק....

לא כולם יכולים לשיר או לנגן בכלי. עם זאת, לימוד הפקת מוסיקה ובניית פעימות למועדונים או אמנים עדיין יכולים לאפשר לך התחבר למוזיקאי הפנימי שלך. אתה יכול למד את התוכניות בהן המקצוענים משתמשים עם צרור הפק...

היום