مباني و اصول ضبط صداي ديجيتال (قسمت اول)
در اين مقاله دو قسمتي وبسايت ايران توشيبا مي خواهيم شما را با اصول ابتدايي ضبط صداي ديجيتال در دستگاه ضبط صدا آشنا كنيم. اگر براي شما نيز جذاب است كه بدانيد اين دستگاه هاي كوچك چگونه صداي محيط اطراف را ضبط مي كنند؛ با يان مقاله همراه باشيد.
تبديل اعداد به صوت و برعكس
در سيستمهاي ضبطكننده ديجيتال، صدا به عنوان موجي از اعداد ذخيره و دستكاري ميشود و هر عدد فشار هوا را در لحظهاي خاص نشان ميدهد. اعداد توسط ميكروفوني توليد ميشوند كه بر روي يك مدار به نام "تبديل كننده آنالوگ به ديجيتال" يا همان ADC قرار دارد. اعداد با نام نمونه (سمپل) شناخته ميشوند و تعداد اعداد گرفته شده به ازاي هر ثانيه نرخ نمونه برداري(Sample Rate) نام دارد. در نهايت، اعداد توسط "تبديل كننده ديجيتال به آنالوگ" يا DAC به صدا تبديل ميشوند؛ كه بر روي بلندگو قرار دارد.
شكل 1. زنجيره سيگنال ديجيتالي
شكل 1 اجزاء سيستم ديجيتال را نشان ميدهد. دقت كنيد كه خروجي ADC و ورودي DAC از مجموعهاي از سيمها تشكيل شده است. اين سيمها اعدادي را حمل ميكنند كه به عنوان نتيجه تبديل آنالوگ به ديجيتال شناخته ميشوند. اين اعداد در سيستم اعداد دوتايي قرار دارند كه تنها شامل دو عدد 0 و 1 ميشود. (مداربندي در حقيقت بر مبناي كليدهايي ساخته ميشود كه در دو حالت خاموش يا روشن قرار دارند.) ميزان هر علامت به جايگاه آن در عدد بستگي دارد. درست مانند چيزي كه در سيستمهاي اعشاري ميبينيم. در اينجا ميتوانيم چند نمونه از اين معادلات را ببينيم:
0=0
1=1
10=2
11=3
100=4
1111=15
1111111111111111=65535
هر كدام از اعداد با نام بيت شناخته ميشوند؛ بنابراين آخرين عدد برابر با 16 بيت است. اگر عدد دومي را 0000000000000001 مينوشتيم، در اين صورت برابر با 16 بيت و داراي ميزان 1 خواهد بود.
اندازه لغات
تعداد بيتهاي موجود در اعداد، با كيفيت سيگنال رابطه مستقيم دارد. شكل 2 نحوه كاركرد آن را نشان ميدهد. تعداد سطوح ولتاژ ممكن در خروجي برابر با تعداد نرخهايي است كه توسط بزرگترين عدد نشان داده ميشود. اگر در عدد مورد نظر تنها يك بيت وجود داشته باشد؛ خروجي نهايي تنها يك ريتم خالي با دامنه ثابت خواهد بود و حدودا در فركانس ورودي قرار خواهد داشت. اگر در عدد مورد نظر بيتهاي بيشتري وجود داشته باشند، موج صدا با دقت بيشتري پردازش ميشود؛ چرا كه هر بيت اضافه شده تعداد نرخها را دو برابر ميكند. تحريف صدا برابر با درصدي است كه كمترين بيت نشان ميدهد. با كاهش سطح سيگنال در سيستمهاي ديجيتالي تحريف صدا بيشتر ميشود، كه اين برخلاف سيستمهاي آنالوگ است.
شكل 2. تاثير اندازه لغات
تعداد بيتهاي موجود در اعداد همچنين دامنه ديناميك را تعيين ميكند. تكان دادن يك عدد دوتايي به سمت چپ كميت اعداد را دو برابر ميكند (همانطور كه تكان دادن اعداد اعشاري به سمت چپ كميت آنها را ده برابر ميكند). پس هر بيت باعث دو برابر شدن ولتاژي ميشود كه ممكن است نشان داده شود. دو برابر كردن ولتاژ نيروي موجود را تا 6 dB بيشتر ميكند، پس ميتوانيم به اين نتيجه برسيم كه دامنه ديناميك در دسترس تقريبا برابر با تعداد بيتها ضرب در 6 dB است.
نرخ نمونهبرداري
نرخي كه اعداد در بازه آن توليد ميشوند حتي از تعداد بيتها نيز مهمتر است. شكل 3 اين نكته را توضيح ميدهد. اگر نرخ نمونه برداري از فركانسي كمتر باشد كه در پي گرفتن آن هستيم، چرخههاي كامل ممكن است از دست بروند؛ و نتيجه رمزگشايي شده ممكن است فركانس بسيار كمي داشته باشد و اصلا شبيه موج درست نباشد. اين نوع اشتباه با نام بدنمايي (Aliasing) شناخته ميشود. اگر نرخ نمونهبرداري دقيقا با فركانس ورودي برابر باشد؛ نتيجه به شكل يك خط مستقيم خواهد بود، چرا كه هميشه همان نقطه از موج بررسي خواهد شد. اين اتفاق حتي ممكن است زماني رخ دهد كه نرخ نمونهبرداري دو برابر فركانس ورودي باشد. مخصوصا اگر فركانس به شكل سينوسي يا شبيه به هم باشد. نرخ نمونهبرداري بايد دو برابر فركانس اندازهگيري شده باشد تا نتايج دقيقي به دست آيند. (بيان رياضياتي اين امر برابر با قضيه نايكوئيست است.) اين يعني اگر ما با صدا سروكار داشته باشيم، بايد حداقل نمونهاي برابر با 40,000 بيت در ثانيه داشته باشيم.
شكل 3. تاثيرات نرخ نمونه برداري پايين
نرخ نايكوئيست (دو برابر فركانس مورد نظر) پايينترين حد نرخ نمونهبرداري است. براي به دست آوردن بهترين نتايج، نرخهاي نمونهبرداري مورد استفاده بايد دو يا چهار برابر اين باشند. شكل 4 ارتقاء موج را با افزايش نرخ نمونهبرداري نشان ميدهد.
شكل 4. تاثيرات افزايش نرخ نمونه برداري
حتي در نرخ نمونه برداري بالا، خروجي سيستم به شكل مجموعهاي از مراحل خواهد بود. تحليل فورير از اين مسئله نشان ميدهد كه همه چيزهاي متعلق به سيگنال را ميتوان در آن پيدا كرد و همچنين ميتوان دوز مناسبي از نرخ نمونهبرداري و هم آواهاي آن را نيز مشاهده كرد. چيزهاي به درد نخور ديگر را بايد با استفاده از يك فيلتر حذف كرد، كه كمي بالاتر از بيشترين فركانس مطلوب قرار دارد. (يك فيلتر مشابه اين را بايد قبل از ADC قرار داد تا از بدنمايي محتواي فراصوتي مانند فركانسهاي راديويي جلوگيري كنيم).
اگر نرخ نمونهبرداري دو برابر فركانس مورد نظر باشد؛ فيلترها بايد بسيار بالا باشند تا جواب فركانس به درستي به دست آيد. ساختن چنين فيلترهايي دشوار و پرهزينه است. بسياري از سيستمها در خروجي خود از نرخ نمونهبرداري بسيار بالايي استفاده ميكنند تا فيلترها را تقويت كنند. نمونههاي اضافي مورد نياز براي توليد يك نرخ بسيار بالا از نمونههاي ضبط شده گرفته ميشوند.
در همين حال، مدارهايي كه نرخ نمونهبرداري را توليد ميكنند بايد بسيار دقيق باشند. هر تفاوت ميان نرخ نمونهبرداري مورد استفاده براي ضبط صدا و نرخ مورد استفاده در پخش صدا باعث تغيير در زيروبمي صدا خواهد شد، درست مانند چيزي كه در نوارهاي آنالوگ ميبينيم. همچنين هرگونه بيثباتي يا لرزش در نرخها باعث تحريف سيگنالها خواهد شد؛ چراكه در حال تبديل از آنالوگ يا به سمت آن است.
در قسمت بعدي اين مقاله درباره ضبط صداي ديجيتال، تصحيح خطا در ضبط صداي ديجيتال و مزاياي ضبط صدا به شيوه ديجيتال در مقايسه با آنالوگ ميپردازيم.
برچسب: ،