מיתוס האודיו הגדול: מדוע אינך זקוק ל- DAC 32 סיביות

מְחַבֵּר: Randy Alexander
תאריך הבריאה: 1 אַפּרִיל 2021
תאריך עדכון: 1 יולי 2024
Anonim
מיתוס האודיו הגדול: מדוע אינך זקוק ל- DAC 32 סיביות - טכנולוגיות
מיתוס האודיו הגדול: מדוע אינך זקוק ל- DAC 32 סיביות - טכנולוגיות

תוֹכֶן


כפי שבטח שמתם לב, יש מגמה חדשה בענף הסמארטפונים הכוללת שבבי שמע "באיכות אולפן" בתוך סמארטפוני דגל מודרניים. אמנם DAC 32-bit (ממיר דיגיטלי לאנלוגי) עם תמיכה בשמע 192kHz בהחלט נראה טוב בגיליון המפרט, אך אין כל תועלת בהגדלת הגודל של אוספי האודיו שלנו.

אני כאן כדי להסביר מדוע עומק הסיביות וקצב הדגימה הזה הם רק עוד מקרה של תעשיית האודיו המנצל את היעדר הידע הצרכני ואפילו האודיופיל בנושא. תרם את כובעי החנון שלך, אנו נכנסים לכמה נקודות טכניות ברצינות כדי להסביר את הפרטים הקטנים של שמע שמע. ואני מקווה שאוכיח לך מדוע עליכם להתעלם מרוב ההייפ השיווקי.

האם אתה שומע את זה?

לפני שנצלול פנימה, קטע ראשון זה מציע כמה מידע רקע נדרש על שני המושגים העיקריים של שמע דיגיטלי, עומק סיביות וקצב דגימה.

קצב הדגימה מתייחס לתדירות שבה אנו הולכים ללכוד או לשכפל מידע על משרעת על אות. בעיקרו של דבר, אנו קוצצים צורת גל להמון חלקים קטנים כדי ללמוד עליה יותר בנקודת זמן מסוימת. משפט Nyquist קובע כי התדר הגבוה ביותר האפשרי שניתן ללכוד או לשכפל הוא בדיוק מחצית מקצב הדגימה. זה די פשוט לדמיין, מכיוון שאנו זקוקים למשרעות amplitude עבור החלק התחתון של צורת הגל (אשר ידרשו שתי דגימות) על מנת לדעת במדויק את התדירות שלה.


הגדלת קצב הדגימה (למעלה) מביאה לדגימות נוספות בשנייה, בעוד שעומק סיביות גדול יותר (התחתון) מספק ערכים אפשריים יותר לתעד את המדגם ב.

באודיו אנו עוסקים רק במה שאנו יכולים לשמוע, והרוב המכריע של האנשים משמיעים את זנבותיהם רגע לפני 20kHz. כעת כשאנו יודעים על משפט Nyquist, אנו יכולים להבין מדוע 44.1kHz ו- 48kHz הם תדרי דגימה נפוצים, מכיוון שהם קצת יותר מפי שניים מהתדר המרבי שאנו יכולים לשמוע. אימוץ תקני סטודיו באיכות 96kHz ו- 192kHz אינו קשור לכיבוש נתוני תדרים גבוהים יותר, זה יהיה חסר טעם. אבל עוד נעבור לרגע אחר זה.

כאשר אנו מסתכלים על אמפליטודות לאורך זמן, עומק הסיביות פשוט מתייחס לרזולוציה או למספר הנקודות הזמינות כדי לאחסן את נתוני המשרעת הזו. לדוגמה, 8 ביטים מציעים לנו 256 נקודות שונות לעיגול, תוצאות של 16 סיביות ב 65,534 נקודות, ונתונים בשווי 32 ביטים נותנים לנו 4,294,967,294 נקודות נתונים. אם כי ברור, זה מגדיל מאוד את גודל הקבצים.

יתכן שקל לחשוב מייד על עומק הסיביות מבחינת דיוק המשרעת, אך המושגים החשובים יותר להבין כאן הם של רעש ועיוות. עם רזולוציה נמוכה מאוד, סביר להניח שנפסיד נתחי מידע על amplitude נמוך יותר או ננתק את צמרות צורות הגל, שמכניס אי דיוק ועיוות (שגיאות כימות). מעניין שזה לרוב יישמע כמו רעש אם הייתם מנגנים קובץ ברזולוציה נמוכה, מכיוון שגדלנו למעשה את הגודל של האות הקטן ביותר האפשרי שניתן לתפוס ולהעתיק. זה בדיוק כמו הוספת מקור רעש לצורת הגל שלנו. במילים אחרות, הורדת עומק הסיביות מורידה גם את רצפת הרעש. זה עשוי לעזור גם לחשוב על זה במונחים של דגימה בינארית, שם הסיבית הפחות משמעותית מייצגת את רצפת הרעש.


לכן עומק סיביות גבוה יותר מעניק לנו רצפת רעש גדולה יותר, אך יש גבול סופי עד כמה זה מעשי בעולם האמיתי. לרוע המזל יש רעשי רקע בכל מקום, ואני לא מתכוון לאוטובוס שעובר ברחוב. מכבלים לאוזניות שלך, הטרנזיסטורים במגבר ואפילו האוזניים בתוך הראש, יחס האות לרעש המרבי בעולם האמיתי הוא סביב 124dB, מה שמסתכם בכמויות של 21 סיביות.ז'רגון באסטר:

DAC- ממיר דיגיטלי לאנלוגי לוקח נתוני שמע דיגיטליים והופך אותם לאות אנלוגי לשליחה לאוזניות או לרמקולים.

קצב דגימה- נמדד ב Hertz (Hz), זהו מספר דגימות הנתונים הדיגיטליים שנלכדו בכל שנייה ושניה.

SNR- יחס אות לרעש הוא ההבדל בין האות הרצוי לרעש מערכת הרקע. במערכת דיגיטלית זה מקושר ישירות לעומק הסיביות.

לשם השוואה, 16 סיביות של לכידה מציעות יחס אות לרעש (ההבדל בין האות לרעש הרקע) של 96.33dB, בעוד 24 סיביות מציעות 144.49dB, החורג ממגבלות לכידת החומרה ותפיסת האדם. אז ה- DAC 32 סיביות שלך יהיה למעשה רק אי פעם מסוגל להפיק לכל היותר 21 סיביות של נתונים שימושיים והיתרים האחרים יוסתרו על ידי רעש מעגל. במציאות, עם זאת, חלקי הציוד במחיר בינוני מובילים עם SNR של 100 עד 110dB, כמו שרוב האלמנטים האחרים במעגל יכניסו רעש משלהם. ברור אם כן, קבצי 32 סיביות כבר נראים מיותרים למדי.

כעת, כאשר הבנו את היסודות של שמע דיגיטלי, נעבור לכמה מהנקודות הטכניות יותר.

מדרגות לגן עדן

מרבית הסוגיות סביב ההבנה והתפיסה השגויה של שמע קשורות לאופן בו משאבים וחברות חינוך מנסים להסביר את היתרונות באמצעות רמזים חזותיים. ככל הנראה ראיתם את האודיו המיוצג כסדרה של מדרגות מדרגות לקווים בעומק הסיבוב ובמראה מלבני עבור קצב הדגימה. זה בהחלט לא נראה טוב כשמשווים אותו לצורת גל אנלוגית חלקה למראה, כך שקל להקל על מדרגות מדרגות "חלקות" יותר למראה כדי לייצג צורת גל פלט מדויקת יותר.

למרות שמדובר במכירה קלה לקהל הרחב, האנלוגיה הנפוצה "מדרגות מדרגות" זו היא כיוון שגוי אדיר ואינה מצליחה להעריך את האופן בו עובד שמע שמע דיגיטלי. התעלם מזה.

עם זאת, ייצוג חזותי זה מציג באופן שגוי את אופן פעולתו של שמע. למרות שזה אולי נראה מבולגן, מתמטית הנתונים מתחת לתדר Nyquist, שהם מחצית מקצב הדגימה, נלכדו בצורה מושלמת וניתן לשחזרם בצורה מושלמת. דמיינו זאת, אפילו בתדירות Nyquist, שלעתים קרובות ניתן לייצג כגל מרובע ולא גל סינוס חלק, יש לנו נתונים מדויקים לגבי המשרעת בנקודה מסוימת בזמן שהיא כל מה שאנחנו צריכים. אנו, בני האדם, בדרך כלל בוחנים בטעות את החלל שבין הדגימות, אך מערכת דיגיטלית אינה פועלת באותה צורה.

עומק סיביות מקושר לרוב לדיוק, אבל באמת שהוא מגדיר את ביצועי הרעש של המערכות. במילים אחרות, האות הקטן ביותר לזיהוי או לשחזור.

כשמדובר בנגינה, הדבר עלול להיות קצת יותר מסובך, בגלל המושג הקל להבנה של DACs "להחזיק סדר אפס", שפשוט יעבור בין ערכים בקצב מדגם מוגדר, ויביא לתוצאה מדרגת מדרגות. זה לא בעצם ייצוג הוגן של אופן פעולת ה- DAC שמע, אך בעוד אנו כאן אנו יכולים להשתמש בדוגמה זו כדי להוכיח שאסור לכם בכלל לדאוג למדרגות הללו.

עובדה חשובה לציין היא כי כל צורות הגל יכולות לבוא לידי ביטוי כסכום של גלי סינוס מרובים, תדר בסיסי ורכיבים נוספים בכפולות הרמוניות. גל משולש (או מדרגת מדרגות) מורכב מהרמוניות משונות בשרירי משרעת הולכים ופוחתים. לכן, אם יש לנו המון צעדים קטנים מאוד המתרחשים בקצב הדגימה שלנו, אנו יכולים לומר שיש תוכן נוסף הרמוני נוסף, אך הוא מתרחש בכפול התדר הקולי (Nyquist) הנשמע שלנו וכנראה כמה הרמוניות מעבר לזה, אז ניצחנו בכל מקרה לא אוכל לשמוע אותם. יתר על כן, זה יהיה די פשוט לסנן באמצעות כמה רכיבים.

אם נפריד בין דגימות ה- DAC, נוכל בקלות לראות שהאות הרצוי שלנו מיוצג בצורה מושלמת יחד עם צורת גל נוספת בקצב הדגימה של DAC.

אם זה נכון, עלינו להיות מסוגלים לצפות זאת בניסוי מהיר. בואו ניקח פלט ישר ממחסום DAC בסיסי לסדר אפס ונזין את האות באמצעות 2 פשוט מאודnd להזמין מסנן מעבר נמוך מוגדר במחצית קצב הדגימה שלנו. השתמשתי כאן רק באות של 6 סיביות, רק כדי שנוכל לראות את הפלט באוסילוסקופ. לקובץ שמע של 16 סיביות או 24 סיביות יש הרבה פחות רעש על האות הן לפני ואחרי הסינון.

דוגמה גסה למדי, אך זה מוכיח את הנקודה כי נתוני שמע משוחזרים בצורה מושלמת בתוך גרם המדרגות המבולגן הזה.

וכאילו בקסם, מדרגות המדרגות נעלמו כמעט לחלוטין והפלט "מוחלק", פשוט על ידי שימוש במסנן נמוך-מעבר שאינו מפריע לתפוקת גל הסינוס שלנו. במציאות, כל מה שעשינו הוא לסנן חלקים מהאות שלא הייתם שומעים ממילא. זו ממש לא תוצאה גרועה לארבעה רכיבים נוספים שהם למעשה בחינם (שני קבלים ושני נגדים עולים פחות מ- 5 פני), אך ישנן למעשה טכניקות מתוחכמות יותר בהן אנו יכולים להשתמש בכדי להפחית את הרעש הזה עוד יותר. עדיף, אלה נכללים כסטנדרט ברוב ה- DACs באיכות טובה.

בהתמודדות עם דוגמא מציאותית יותר, כל DAC לשימוש עם שמע יכלול גם פילטר אינטרפולציה, הידוע גם כ- up-sampling. אינטרפולציה היא פשוט דרך לחשב נקודות ביניים בין שתי דגימות, כך שה- DAC שלך עושה הרבה מה"החלקה "זו בכוחות עצמה, והרבה יותר מזה מכפיל או פי ארבעה את שיעור המדגם. עדיף שזה לא תופס שטח קבצים נוסף.

מסנני אינטרפולציה הנפוצים בכל DAC ששווה את המלח הם פיתרון טוב בהרבה מאשר להעביר קבצים עם שיעורי דגימה גבוהים יותר.

השיטות לעשות זאת יכולות להיות מורכבות למדי, אך למעשה ה- DAC שלך משנה את ערך הפלט שלו לעתים קרובות יותר מכפי שרמז לתדר המדגם של קובץ האודיו שלך. זה דוחף את ההרמוניה של מדרגות המדרגות הבלתי נשמעות הרחק מחוץ לתדר הדגימה, ומאפשר שימוש במסננים איטי יותר וניתן להשגה יותר שיש להם פחות אדווה, ולכן שומרים על הקטעים שאנו רוצים לשמוע.

אם אתה סקרן מדוע אנו רוצים להסיר את התוכן הזה שאנחנו לא יכולים לשמוע, הסיבה הפשוטה היא ששכפול הנתונים הנוספים האלה בהמשך שרשרת האות, נניח במגבר, יבזבז אנרגיה. יתרה מזאת, תלוי ברכיבים אחרים במערכת, תוכן "אולטרה-קולי" בתדירות גבוהה יותר עשוי להוביל למעשה לכמויות גבוהות יותר של עיוות בין-מודולציה ברכיבי רוחב פס מוגבלים. לכן, ככל הנראה, קובץ ה- 192 קילו הרץ שלך יגרום נזק רב מתועלת, אם היה תוכן כלשהו אולטרה-קולי בתוך אותם קבצים.

אם היה צורך בהוכחה נוספת, אציג גם פלט מ- DAC איכותי באמצעות Circus Logic CS4272 (בתמונה למעלה). CS4272 כולל קטע אינטרפולציה ומסנן פלט מובנה תלול. כל מה שאנחנו עושים למבחן זה הוא באמצעות בקר מיקרו להזנת ה- DAC שתי דגימות של 16 סיביות גבוהות ונמוכות במהירות 48kHz, ונותן לנו את צורת הגל הפלט המרבית האפשרית במהירות 24kHz. אין משתמשים ברכיבי סינון אחרים, פלט זה מגיע היישר מה- DAC.

אות הפלט של 24 קילו הרץ (למעלה) ממרכיב DAC זה באולפן ודאי לא נראה כמו צורת הגל המלבנית המשויכת לחומר השיווקי הרגיל. קצב הדגימה (Fs) מוצג בתחתית האוסילוסקופ.

שימו לב כיצד גל הסינוס הפלט (למעלה) הוא בדיוק חצי מהמהירות של שעון התדר (התחתון). אין מדרגות מדרגות בולטות וצורת הגל הזו בתדירות גבוהה מאוד נראית כמעט כמו גל סינוס מושלם, לא גל מרובע מסתכל שחומר השיווקי או אפילו הצצה מזדמנת לנתוני הפלט. זה מראה שגם עם שתי דוגמאות בלבד, תיאוריית Nyquist עובדת בצורה מושלמת בפועל ואנחנו יכולים ליצור מחדש גל סינוס טהור, נעדר כל תוכן הרמוני נוסף, ללא עומק סיביות ענק או קצב מדגם.

האמת לגבי 32 סיביות ו -192 קילוהרץ

כמו ברוב הדברים, יש איזו אמת שמסתתרת מאחורי כל הז'רגון והאודיו של 32 סיביות, שמע של 192 קילו הרץ הוא משהו שיש לו שימוש מעשי, פשוט לא בכף היד שלך. התכונות הדיגיטליות הללו אכן מועילות כשאתה נמצא בסביבת אולפן, ומכאן הטענות להביא "אודיו באיכות אולפן לנייד", אך כללים אלה פשוט לא חלים כשאתה רוצה להכניס את המסלול המוגמר לכיס שלך.

ראשית, נתחיל בקצב הדגימה. היתרון המוצהר לעיתים קרובות של שמע ברזולוציה גבוהה יותר הוא שמירת נתונים אולטרה-קוליים שאינך יכול לשמוע אך משפיע על המוסיקה. זבל, רוב המכשירים נופלים הרבה לפני מגבלות התדרים של השמיעה שלנו, המיקרופון המשמש לתפיסת שטח מתרחש לכל היותר סביב 20 קילו הרץ, והאוזניות שלך בהן אתה משתמש בהחלט לא תתרחב עד כה. אפילו אם הם היו יכולים, האוזניים שלך פשוט לא יכולות לזהות את זה.

רגישות שמיעה אנושית אופיינית מגיעה לשיא במהירות של 3 קילוהרץ ומתחילה במהירות להתגלגל לאחר 16KHz.

עם זאת, דגימה של 192 קילו-הרץ שימושית למדי בהפחתת רעש (אותה מילת המפתח שוב) בעת דגימה של נתונים, מאפשרת בנייה פשוטה יותר של מסנני קלט חיוניים, והיא חשובה גם לאפקט דיגיטלי במהירות גבוהה. דגימת יתר מעל הספקטרום הנשמע מאפשרת לנו למצות את האות לדחיפת רצפת הרעש. אתה תגלה שרוב ה- ADC הטובים ביותר (ממירים דיגיטליים אנלוגיים) בימינו מגיעים עם דגימת יתר של 64 סיביות ומעלה.

כל ADC צריך גם להסיר תדרים מעל גבול ה- Nyquist שלו, או שתסיים עם כינוי נשמע נורא כאשר התדרים הגבוהים יותר "מתקפלים" לספקטרום הקולי. הפער הגדול יותר בין תדר פינת המסנן של 20 קילו הרץ לבין קצב הדגימה המקסימלי מתאים יותר למסננים בעולם האמיתי שפשוט לא יכולים להיות תלולים ויציבים כמו המסננים התיאורטיים הנדרשים. הדבר נכון גם בסוף DAC, אך כפי שדיברנו על אינטר-מודולציה יכול מאוד לדחוף רעש זה לתדרים גבוהים יותר לצורך סינון קל יותר.

ככל שהפילטר תלול וגדול יותר כך הוא רצועת הפס הגבוהה יותר. הגדלת קצב הדגימה מאפשרת שימוש בפילטרים "איטיים" יותר, המסייעים בשמירה על תגובה בתדר שטוח בפס הקול הנשמע.

בתחום הדיגיטלי, כללים דומים חלים על פילטרים המשמשים לעיתים קרובות בתהליך ערבוב הסטודיו. שיעורי מדגם גבוהים יותר מאפשרים מסננים פעילים ומהירים יותר הדורשים נתונים נוספים על מנת לתפקד כראוי. כל זה לא נדרש בכל הקשור להפעלה ו- DAC, מכיוון שאנחנו רק מעניינים את מה שאתה באמת יכול לשמוע.

במעבר ל- 32 סיביות, כל מי שניסה אי פעם לקוד כל מתמטיקה מורכבת מרחוק יבין את החשיבות של עומק הסיביות, הן עם נתונים שלמים ונתוני נקודה צפה. כפי שדיברנו, ככל שיותר פיסות פחות רעש וזה הופך להיות חשוב יותר כשאנחנו מתחילים לחלק או לחסר אותות בתחום הדיגיטלי בגלל שגיאות עיגול וכדי להימנע משגיאות גזירה בעת הכפלה או הוספה.

עומק סיביות נוסף חשוב לשמירה על שלמות האות בעת ביצוע פעולות מתמטיות, כגון תוכנת שמע לאולפן. אך אנו יכולים לזרוק את הנתונים הנוספים האלה לאחר השלמת המאסטרינג.

הנה דוגמה, נניח שאנחנו לוקחים מדגם של 4 סיביות והמדגם הנוכחי שלנו הוא 13, שהם 1101 בבינארי. כעת נסה לחלק את זה בארבע ונשאר עם 0011, או פשוט 3. הפסדנו את התוספת 0.25 וזה ייצג שגיאה אם ​​ננסה לעשות מתמטיקה נוספת או להחזיר את האות שלנו לצורת גל אנלוגית.

טעויות עיגול אלה מתבטאות בכמויות קטנות מאוד של עיוות או רעש, שיכולים להצטבר על פני מספר גדול של פונקציות מתמטיות. עם זאת, אם נרחיב את מדגם ה -4 סיביות הזה עם פיסות מידע נוספות שישמשו כסיעה או נקודה עשרונית, אנו יכולים להמשיך לחלק, להוסיף ולהכפיל הרבה יותר זמן בזכות נקודות הנתונים הנוספות. אז בעולם האמיתי, דגימה בקצב של 16 או 24 ביט ואז המרת נתונים אלה לפורמט 32 סיביות לעיבוד שוב עוזרת לחסוך ברעש ובעיוות. כפי שכבר ציינו, 32 סיביות זה הרבה נקודות דיוק.

מה שחשוב לא פחות להכיר הוא שאיננו זקוקים לחדר הכניסה הנוסף הזה כשאנחנו חוזרים לתחום האנלוגי. כפי שכבר דנו, סביב 20 סיביות נתונים (-120dB של רעש) המקסימום המוחלט שיכול לזהות, כך שנוכל להמיר בחזרה לגודל קובץ סביר יותר מבלי לפגוע באיכות השמע, למרות העובדה ש"האודיופילים "הם כנראה מקונן על הנתונים האבודים האלה.

עם זאת, בהכרח נכניס שגיאות עיגול בעת מעבר לעומק סיביות נמוך יותר כך שתמיד תהיה כמות קטנה מאוד של עיוות נוסף מכיוון ששגיאות אלה לא תמיד מתרחשות באופן אקראי. אמנם אין זו בעיה עם אודיו של 24 סיביות, מכיוון שהוא כבר משתרע הרבה מעבר לרצפת הרעש האנלוגית, אך טכניקה הנקראת "התמתנות" פותרת בצורה נאה את הבעיה עבור קבצי 16 סיביות.

דוגמא להשוואה של העיוות שהוצג באמצעות גיזום והתקרחות.

הדבר נעשה על ידי אקראיות של הקטע הפחות משמעותי של מדגם השמע, תוך ביטול שגיאות עיוות אך החדרת רעשי רקע אקראיים מאוד שקטים המפוזרים על פני תדרים. למרות שהחדרת רעש עשויה להראות נגדית אינטואיטיבית, זה למעשה מקטין את כמות העיוות הנשמע בגלל האקראיות. יתר על כן, באמצעות דפוסי dithering דמויי רעש מיוחדים שמשתמשים לרעה בתגובת התדר של האוזן האנושית, שמע של 16 סיביות מעורבב יכול למעשה לשמור על רצפת רעש נתפסת קרוב מאוד ל 120dB, ממש בגבולות התפיסה שלנו.

לנתוני 32 סיביות וקצב דגימה של 192kHz יש יתרונות בולטים באולפן, אך אותם כללים אינם חלים על השמעה.

במילים פשוטות, תנו לאולפנים לסתום את הכוננים הקשיחים שלהם עם תוכן ברזולוציה גבוהה זו, אנו פשוט לא צריכים את כל הנתונים המיותרים האלה בכל מה שקשור להפעלה באיכות גבוהה.

לעטוף

אם אתה עדיין איתי, אל תפרש את המאמר הזה כביטול מוחלט של המאמצים לשיפור רכיבי שמע של הטלפון החכם. למרות שמיתוג המספרים עשוי להיות חסר תועלת, רכיבים באיכות גבוהה יותר ועיצוב מעגלים טוב יותר הם עדיין פיתוח מצוין בשוק המובייל, אנחנו רק צריכים לוודא שהיצרנים ממקדים את תשומת ליבם בדברים הנכונים. ה- DAC של 32 סיביות ב- LG V10, למשל, נשמע מדהים, אבל אינך צריך לטרוח בגדלי קבצי שמע ענקיים כדי לנצל אותו.

היכולת לנהוג אוזניות עכבה נמוכות, לשמור על רצפת רעש נמוכה מה- DAC לשקע ולהציע עיוות מינימלי הן מאפיינים חשובים בהרבה עבור שמע של סמארטפון מאשר עומק הסיביות או קצב הדגימה הנתמך באופן תיאורטי, ונקווה שנוכל לצלול בנקודות אלה ביתר פירוט בעתיד.

Xiaomi פתחה לאחרונה תוכנית בטא סגורה לבדיקת תוכנת ה- beta Q אנדרואיד Q באמצעות הטלפון החכם Xiaomi Mi 9. רק 400 בודקים פעילים, אך הבנייה עדיין דלפה אליו מפתחי XDA, שפרסם כמה צילומי מסך והערות על התוכנה...

תוכל גם להשתמש בממשק ה- API לזיהוי טקסט כבסיס ליישומי תרגום, או לשירותי נגישות שבהם המשתמש יכול לכוון את המצלמה שלו על כל טקסט שהוא מתמודד איתו, ולגרום לו לקרוא אותו בקול רם....

תראה