Arm Cortex-A77 - כל מה שצריך לדעת

מְחַבֵּר: Randy Alexander
תאריך הבריאה: 2 אַפּרִיל 2021
תאריך עדכון: 1 יולי 2024
Anonim
Arm Cortex-A77 - כל מה שצריך לדעת - טכנולוגיות
Arm Cortex-A77 - כל מה שצריך לדעת - טכנולוגיות

תוֹכֶן


יחד עם מעבד הגרפי החדש של Mali-G77 ומעבד התצוגה Mali-D77, חשפה ארם את עיצוב המעבדים העדכני ביותר שלה - Cortex-A77. כמו Cortex-A76 של השנה שעברה, Cortex-A77 מיועד ליישומי שכבה מובחרים הדורשים צריכת חשמל נמוכה של חתימה של Arm. הכל החל מסמארטפונים דרך מחשבים ניידים ודי סביר שהוא מעבר לכך.

עם ה- Cortex-A77, זרוע מיקדה את ההוראות המקסימאליות לכל עלייה בביצועי מחזור / שעון (IPC) שהוא יכול לנהל באמצעות ה- Cortex-A76. תדרי השעון, צריכת החשמל והשטח, נועדו להישאר בערך באותה מגרש כדורים, אך הגרעין החדש יכול לפרוץ דרך הדרכה רבה יותר בבת אחת. לשם כך, ארם עיצבה ליבה רחבה עוד יותר מהשנה שעברה וביצעה מספר שיפורים בכדי להאכיל את ליבת ה- CPU מדברים שצריך לעשות. אבל לפני שנגיע לזה, בואו נצלול לסקירה הכללית והמספרים הביצועים ברמה גבוהה.

פגיעה ביעדי ביצועים

בחודש אוגוסט 2018, Arm שיתף באופן לא אופייני מפת דרכים של מעבד עד 2020. החל מ- Cortex-A73 של 2016 ועד לעיצוב "הרקולס" לשנת 2020, החברה מבטיחה עלייה של 2.5x בביצועי המחשוב. נתח הוגן של ההקרנה הענקית הזו הושג עם משמרת המיקרו-ארכיטקטורה העיקרית עם Cortex-A76, מהירויות שעון מודרניות גבוהות יותר, והמעבר מ -16 ל -10 ועכשיו ייצור של 7 ננומטר עם 5 ננומטר לעקוב. בערך 1.8X מהרווחים של מפת הדרכים הושגו כבר בשנה שעברה, וה- Cortex-A77 מספקת עלייה של כ- 20 אחוז נוספים ב- IPC. זה מציב אותנו בדרך למטרה של 2.5x של ארם, אם כי מכשירים ניידים עם תקציבי כוח מוגבלים ותקציב תרמי אינם מצפים לראות את כל הרווחים הללו.


לשם השוואה, Cortex-A76 של השנה שעברה סיפקה דחיפה של 30-35 אחוזים בהשוואה ל- Cortex-A75. השנה אנו בוחנים רווח של 20 אחוז IPC מושתק יותר, אך עדיין משמעותי, בין A77 ל- A76. אלה חדשות טובות מכיוון שזה אומר ביצועים רבים יותר תוך היצמדות לאילוצים תרמיים וכוח דומים כמו בעבר. החילוף הוא כי ה- A77 גדולה בכ -17 אחוז מה- A76, כך שתעלה קצת יותר מבחינת שטח הסיליקון. אם אתה רוצה להשוות עם מנהיגי שולחן העבודה, AMD הצליחה דחיפה של 15 אחוז IPC בין Zen2 ל- Zen +, בעוד ה- IPC של אינטל נשאר סטטי כמעט במשך שנים.כמובן שאנחנו מדברים כאן על פלחי שוק שונים, אבל זה מדגים כיצד צוות התכנון של המעבדים של Arm של הרשת הצליח להשיג דגים מרשימים בדורות האחרונים.

עלות ביצועים של 20% מוצעת עבור ה- SoCs המבוססים על Cortex-A77 מהדור הבא

הנסיגה כאן היא שה- A76 סימנה שינוי מיקרו-ארכיטקטוני משמעותי עם עליות ביצועים אדירות, בעוד אנו חוזרים לשיפורי רמת האופטימיזציה עם ה- A77. אם זה לא יוצא מהדרך, בואו נצלול למה שחדש ב- Arm Cortex-A77.


Cortex-A77 בונה על המיקרו-ארכיטקטורה A76

המפתח להבנת ההבדל בין Cortex-A77 ו- A76 הוא להבין את הכוונה בתכנון ליבה "רחב יותר". בעיקרון, אנו מדברים על היכולת לבצע הוראות נוספות עבור כל מחזור שעון, מה שמגדיל את תפוקת הליבה. ישנם שני חלקים חשובים לביצוע נכון - הגדלת מספר יחידות הביצוע לביצוע העיבוד והבטחתן כי יחידות אלה כלואות היטב בנתונים. נתחיל בחלק האחרון ונתמקד בחלקי החיזוי של המטמון, המטמון והענף של ה- SoC.

Cortex-A77 רואה דחיפה של 50 אחוז למשלוח הרוחב, עד שש הוראות בכל מחזור מארבע עם ה- A76. המשמעות היא הוראות נוספות לכיוון ליבת הביצוע בכל מחזור שעון לקבלת פוטנציאל ביצועים גדול יותר. חלון הביצוע שאינו בסדר הוא גם גדול יותר כתוצאה מכך, גדל ל -160 ערכים כדי לחשוף יותר מקבילות. יש מטמון הוראות 64K מוכר, בעוד שמאגר היעד של הסניף (BTB), שמכיל כתובות למנבא הסניף, גדול ב -33 אחוז מבעבר כדי להתמודד עם הצמיחה בהוראות מקבילות. שום דבר יוצא דופן כאן, זה בעצם גרסה רחבה יותר של העיצוב של השנה שעברה.

התוספת הקדמית המסקרנת יותר היא המטמון החדש 1.5K MOP, המאחסן מקרו-אופים (MOP) שמוזנים חזרה מיחידת הפענוח. ארכיטקטורת ה- CPU של Arm מפענחת הוראות מיישום המשתמש לפעולות מאקרו קטנות יותר ואז מורידה למיקרו-אופים שגרעין הביצוע מבין. אתה יכול לראות זאת בתרשים למעלה בסעיף הפענוח. מטמון ה- MOP משמש להפחתת עונש העלות של סניפים ושטיפות שהוחמצו, כאשר אתה שומר על המקרו-אופציות במקום לפענח אותם שוב, ומגדיל את התפוקה הכוללת של הליבה. שולף מה- MOP ולא את ה- Cache עוקף אחר שלב הפענוח, ושומר מחזור אחד. Arm קובע כי מטמון ה- MOP יכול לפגוע בקצב התאמה של 85 אחוזים ומעלה על פני מגוון עומסי עבודה, מה שהופך אותו לתוספת שימושית מאוד ל- i-cache הסטנדרטי.

עבור למטה לחלק הליבה הביצוע של ה- CPU, שימו לב לתוספת של יחידת ALU ורביעית סניף שני. ה- ALU הרביעי הזה מגדיל את רוחב הפס המסך הכללי של המעבד בכ -50 אחוזים. ALU נוסף זה מסוגל להוראות בסיסיות של מחזור אחד (כגון ADD ו- SUB) בתוספת פעולות של מספר שלם שלם כפל כזה. שני משני ה- ALU האחרים יכולים לטפל רק בהוראות בסיסיות של מחזור אחד, בעוד שהיחידה הסופית טעונה בפעולות מתמטיקה מתקדמות יותר כמו חלוקה, הכפלת צבירה וכו '. יחידת הענף השנייה בתוך ליבת הביצוע מכפילה את מספר הענפים המקבילים במקביל. הליבה יכולה להתמודד, וזה שימושי במקרים בהם שניים מתוך שש ההוראות שנשלחו הן קפיצות ענפים. זה נשמע מעט מוזר, אבל בדיקה פנימית ב- Arm חשפה את היתרונות בביצועים מאימוץ היחידה השנייה הזו.

ה- Cortex-A77 מציע מקבילות משופרות ונקיטה חדשה במטמון קדם-אחיזה

ציוצים אחרים לליבת המעבד כוללים תוספת של צינור הצפנה AES שני. צינורות חנות הנתונים כוללים כעת יציאות נושא ייעודיות להכפלת רוחב הפס של סוגיית הזיכרון. יציאות אלה היו משותפות בעבר עם ה- ALUs, שעלולים לפעמים להפוך לצוואר בקבוק. יש גם מושלם נתונים מהדור הבא שישפר את יעילות הכוח תוך כדי הגדלת רוחב הפס ל- DRAM המערכת.

חלק ממערכת זו ב- Cortex-A77 כוללת גם מערכת החלפה מוקדמת חדשה "מודעת למערכת". זה משפר את ביצועי הזיכרון בהתבסס על המגוון הרחב של ספירות ליבה של מעבד, יכולות אחסון ומטמון ותצורות תת-מערכת זיכרון במכשירים סופיים. החומרה הייעודית לשיחה עם יחידת התזמון הדינמית (DSU) כחלק מאשכול מעבד DynamIQ, המפקח על השימוש במטמון L3 המשותף. הליבה כוללת רמות דינמיות ואגרסיביות דינמיות כדי להפחית את השימוש במטמון במצבים בהם רוחב הפס L3 מוגבל על ידי ליבות מעבד אחרות. גרעינים בעלי ביצועים גבוהים יותר כמו Cortex-A77 נוטים יותר להרוות את הגישה ל- DSU לזיכרון, בעוד שבלוטות כוח נמוכות יותר כמו A55 לא צפויים.

מתאים הכל יחד

יש הרבה שינויים קטנים ב- Cortex-A77 שמסתכמים בכמה הבדלים מהותיים לקודמתה. על קצה המזלג, מטמון ה- MOP החדש של ה- A77 בשילוב חלון הדרכה רחב וממושך יותר מסייע להעסיק את יחידות ה- ALU, הסניף והזיכרון המוגזות בכל מה לעשות. עיצוב ה- Power Cortex-A76 הורחב כדי לשפר את תפוקתו עוד יותר באמצעות ה- A77, מבלי להסתמך על מהירויות שעון גבוהות יותר.

הביצועים הגדולים ביותר שמגדילים את ה- Cortex-A77 מגיעים בצורה של מתמטיקה עם מספר שלם ונקודה צפה. זה מאושר על ידי הסמלים הפנימיים של Arm, המציגים עלייה בביצועים של 20 עד 35 אחוזים במדגם ה- SPEC במלואם ובמוצרי הנקודות הצפות בהתאמה. שיפורי רוחב הפס בזיכרון יושבים איפשהו בין 15 ל -20 אחוזים, ומדגישים שוב כי הרווחים הגדולים ביותר מגיעים בצורה של מספרים. בסך הכל, השיפורים הללו מעניקים ל- A77 עלייה ממוצעת של 20 אחוזים לעומת הדור הקודם. אנו עשויים לראות גם רווחים שוליים נוספים, יותר כתוצאה מתהליכי ייצור מתקדמים יותר של 7 ננומטר בהמשך השנה או בתחילת 2020.

מבחינת סמארטפונים, ה- SoCs המופעלים על ידי Cortex-A77 מיועדים למוצרי דגל בעלי ביצועים גבוהים. הזרוע מצפה במלואה לראות בתכנון מעצמות שימוש 4 + 4 סיביות. סידורי ליבה קטנים. בהתחשב בתפוקה המוגברת וההפחתה הקלה בגודל השטח של ה- A77, סביר להניח שנראה כי מעצבי SoC ממשיכים במגמת 1 + 3 + 4 או 2 + 2 + 4. עם ליבות גדולות עוצמתיות אחד או שתיים עם מטמון גדול יותר ושעונים גבוהים יותר, מגובים בגרעין A77 של 2 או 3 עם גדלי מטמון קטנים יותר ושעונים נמוכות יותר כדי לחסוך בכוח ושטח. בסופו של דבר ה- Cortex-A77 מאיית דברים טובים עבור שבבי סמארטפון והשוק הצומח עבור מחשבים ניידים מבוססי זרוע המחוברים תמיד. היזהר מהודעות הסיליקון בהמשך השנה.

סיימתם עם טוויטר? אמנם זהו כלי נהדר שיכול לעדכן אותך ולהתבדר, אך זה לא לכולם. או אולי אתה פשוט רוצה לקחת הפסקה מהרשתות החברתיות ומהדרמה הפוטנציאלית שלעיתים באה איתה ((אקסים, מישהו?). תהיה אשר תהיה הסי...

במרדף אחר צג LED בלי לבזבז הון? ייתכן שיהיה לנו בדיוק מה שאתה מחפש במוני צג LED 27 אינץ 'של Dell. הוא מוצע במחיר של עד 109.99 דולר ברגע זה.צג Dell זה מציג תצוגת LED IP ברזולוציית 1920 x 1080 (Ful...

אנו ממליצים לך לראות