تگ های مجموعه

پروژه دات کام
تحقیق های دانشجویی
دانلود تحقیق آماده در ورد
دانلود تحقیق word
مرکز دانلود پروژه
دانلود پروژه دانشگاهی
دانلود پروژه های دانشجویی
مقاله
پروژه شبیه سازی
مقاله دانشجویی
مقاله های دانشجویی
دانلود مقاله دانشجویی
بانك پايان نامه
دانلود پایان نامه ها
papers
شبیه سازی
پیاده سازی مقالات
دانلود پروژه
آسان دانلود
دانلود رایگان پروژه
دانلود پروژه کامپیوتر
دانلود پروژه رایگان
دانلود پروژه آماده
پروژه رایگان
دانلود پروژه
سایت دانلود پروژه

تحقیق ها و مقالات آماده تایپ شده آماده در مایکروسافت ورد - word

مقاله الگوریتم های فشرده سازی صدا و تصویر

برای سفارش پروژه بر روی دکمه خرید پروژه کلیک کنید

کد پروژه : 29242

قیمت قبلی : 39,900 تومان
قیمت : 29,400 تومان

توجه : هدف ما در این سایت کمک به دانشجویان و دانش پژوهان برای بالا بردن بار علمی آنها می باشد پس لطفا نگران نباشید و با اطمینان خاطر خرید کنید

توضیحات

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

مقاله الگوریتم های فشرده سازی صدا و تصویر دارای 176 صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است

فایل ورد مقاله الگوریتم های فشرده سازی صدا و تصویر کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه و مراکز دولتی می باشد.

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی مقاله الگوریتم های فشرده سازی صدا و تصویر،به هیچ وجه بهم ریختگی وجود ندارد

بخشی از متن مقاله الگوریتم های فشرده سازی صدا و تصویر :

چکیده
چند رسانه ای ترکیبی از متن، گرافیک، صوت، انیمیشن و ویدئو است. چند رسانه ای در تجارت، در مدرسه، در خانه و در مکانهای عمومی مورد استفاده قرار می گیرد.
تمام سیستم های فشرده سازی به دو الگوریتم نیاز دارد: یکی برای فشرده ساز ی داده ها در منبع و یکی برای تجزیه آنها در مقصد. این الگوریتم ها را الگوریتم های رمزگذاری و رمز گشایی می نامند. الگوریتم های رمز گذاری به دو دسته تقسیم می شوند: رمز گذاری آنتروپی و رمز گذاری منبع. رمزگذاری آنتروپی، رمزگذاری طول دنباله است و رمزگذاری منبع با استفاده از امتیازات خواص داده ها، فشرده سازی بیشتری را تولید می کند.

MIDI به معنای رابط دیجیتال تجهیزات موسیقی، استاندارد ارتباطات است که در اوایل دهه 1680 برای تجهیزات موسیقی الکترونیکی و کامپیوترها ارائه شد. سه فرکانس نمونه برداری که معمولا در سیستم های چند رسانه ای به کار می روند: KHz 4401 ، KHz 22 ، KHz 11025 با کیفیت .CD – quality اندازه نمونه ها نیز 8 بیتی یا 16 بیتی است.
ساختن فایلهای صوتی دیجیتال نسبتا ساده است. اطلاعات صوتی دیجیتال با کیفیت بالا فضای زیادی را روی دیسک اشغال می کنند.

Bitmap ماتریس ساده ای از اطلاعات است که نقاطی منحصر به فرد را تسریع می کند. تصاویر ( JPEG، اتصال گروه تخصصی عکاسی) برای فشرده سازی تصاویر ساکن یکنواخت ( مثل عکس ) توسط متخصصین عکس برداری که تحت حمایت آی تی یو، آی اس آ، آی ئی سی کار می کردند توسعه یافت.

در جهان امروزی از سه استاندارد ویدئویی استفاده می شود NTSC، PAL،SECAM این قابها و استاندارد ها به آسانی قابل تبدیل به یکدیگر نیستند.
MPEG توسط Moving Picture experts Group ایجاد شد. اینها الگوریتم های مهمی هستند که برای فشرده سازی تصویر به کار می روند و از سال 1993 به عنوان استاندارد بین المللی اند. ام پی ئی جی می تواند صوت و تصویر را فشرده کند.
DVI تکنولوژی فشرده سازی قابل برنامه ریزی است.

Quick Time طرحهای فشرده سازی دیگری از جمله Kodak photo CD، Super Mac Codec Compact Disc Vidio , Codec را شامل می شود.

مقدمه
چند رسانه ای، ستاره درخشنده ای در افلاک است. صوت و تصویر با استفاده از آن دیجیتال شده و به طور الکترونیکی منتقل می شوند تا نمایش داده شوند. اغلب پروژه های چند رسانه ای از استانداردهای ام پی ئی جی استفاده می کنند و داده ها را از طریق اتصال های ای تی ام عبور می دهند. ام بون، خدمات رادیو، تلویزیون دیجیتال جهانی تجربی در اینترنت است.

ابزارهای اصلی ساخت پروژه های چند رسانه ای، شامل یک یا چند نرم افزار تألیف در برنامه های ویراستار تصویر، صوت و فیلم است. علاوه بر این، تعدادی برنامه کاربردی دیگر نیز وجود دارند. که جهت capture کردن صفحه، تبدیل فرمت های مختلف فایل و انتقال فایل ها بین کامپیوتر های مختلف مورد استفاده قرار می گیرند. آنچه که در یک سیستم چند رسانه ای مشاهده می شود ترکیبی از متن، Icon و bitmap های شبکه، عکس، گرافیک های ترسیم شده برداری، نمایش های سه بعدی و پنجره های مربوط به تصاویر اشیاء متحرک می باشد.

عناصر گرافیکی در اندازه های مختلفی وجود دارند. رنگ یا طرح خاصی می پذیرند. مرئی یا نامرئی می شوند و; . چگونگی ترکیب این عناصر با یکدیگر، انتخاب رنگها و فونت ها، روشهای به کار گرفته شده برای جلب توجه بیننده، ;; دانش و خلاقیت طراح بستگی دارد در طول حیات بشر، از زمانی که اولین فیلم ثابت به وجود آمد. مردم شیفته ی تصاویر متحرک شدند. اکنون فیلم ویدئویی جزئی از سیستم های چند رسانه ای است در مجموع ویدئویی دیجیتال از مهمترین اجزای چند رسانه ای و ابزار نیرومندی در جهت نزدیکتر کردن

کاربران کامپیوتر به جهان واقعی محسوب می شود. از میان اجزای چند رسانه ای، ویدئو بیشترین حجم حافظه را اشغال می کند. تصاویر رنگی، حافظه زیادی در حد مگا بایت اشغال می نمایند. هنگامی که در تصاویر ویدئویی، حرکت ایجاد می شود، چند بار در ثانیه ( در حدود 30 بار ) جایگزین هم می شوند و بدین منظور 30 برابر حافظه مورد نیاز است.

( 1/8 گیگا بایت در دقیقه یا 108 گیگا بایت در ساعت ). امروزه تبدیل داده ویدئویی دیجیتال به جریان اطلاعات مغناطیسی، از مهمترین تکنولوژی ها و تحقیقات چند رسانه ای است. با بکارگیری برد فشرده ساز تصاویر ویدئویی، می توان از صدای quality – CD استفاده کرد. همچنین می توان با نصب تعدادی دیسک سریع، نرخ انتقال داده را افزایش داد و با استفاده از دستورات سیستم تألیف، داده های ویدئویی را سریعتر به RAM منتقل نمود.

CD – ROM ها وسیله توزیع بسیار خوبی، برای تصاویر ویدئویی کامپیوتری فراهم می کنند هر چند هزینه زیاد است اما دارای ظرفیت بالایی هستند.
ارسال و دریافت فیلم در شبکه
فیلمهای ویدئویی در خواستی فیلمهایی هستند که در منزل قابل انتخاب اند که به کمک کنترل راه دور تلویزیون صورت می گیرد.
کارگزارهای فیلم ویدئویی که همزمان، تعداد زیادی از فیلمها را ذخیره و پخش نماید.
شبکه توزیعی مجموعه ای از راه گزین ها و خطوط بین منبع و مقصد است.
ست تاپ باکس از این کار مستلزم خرید بردی است که حاوی تراشه های خاص و دو شاخه ای برای اتصال به شبکه توزیع محلی است.
ستون فقرات چند پخشی
جمعیت اینترنت در حال پیاده سازی سیستم چند رسانه دیجیتال ام بون را می توان به عنوان رادیو یا تلویزیون اینترنت تصور کرد.

فصل 1

در این فصل می خوانید :

• چند رسانه ای چیست ؟
• تعاریف
• فشرده سازی چیست ؟
• الگوریتم های فشرده سازی
• موارد استفاده از چند رسانه ای

چند رسانه ای چیست ؟
نمایشهای دیداری و شنیداری همواره یکی از روشهای مؤثر آموزش و تبلیغات بوده است. اگر کاربر هم ببیند وهم بشنود تأثیر بیشتری می پذیرد. اما اگر بتوان به طریقی با ارائه دیداری و شنیداری رابطه دو طرفه برقرار کرد به خاطرسپاری اطلاعات به مراتب بیشتر می شود. بنابراین باید کاربر را به دخالت در پروژه واداشت در جنبه تصویری، می توان تصاویری از نمودارهای آماری مناظر زیبا، گروه هایی از تصاویر مرتبط با هم و حتی تصاویر گرافیکی سه بعدی تخیلی داشت. قطعات ویدیویی ( که می توان به صورت دیجیتالی ساخت یا از دوربین فیلمبرداری یا

دستگاه ضبط و پخش ویدئویی وارد کرد ) و قطعات متحرک نیزچشمها را خیره می کنند. حتی می توان جلوه های صوتی، جملات ضبط شده، موسیقی و ورودی های صوتی را به همراه تصاویر به کار گرفت. با آنکه در چند رسانه ای کمتر به متن اشاره می شود، اما می توان گفت متن مهمترین بخش در ارائه ی چند رسانه ای است. کلمات و گفته ها و تصاویر همراه آنها، باید به دقت انتخاب شوند تا بر بیننده یا شنونده تأثیر بگذارند. اگر قلم حروف و اندازه ی آنها درست انتخاب شوند و در جای مناسب قرار گیرند، اثر بیشتری در ذهن بیننده خواهند داشت.
ایجاد ارتباط دو طرفه در تصاویر باعث می شود که کاربر مطالب ارائه شده را به خوبی درک کند.
کاربر باید بتواند بر تصاویر کنترل داشته باشد و از طریق یک تصویر به راحتی تصویر مرتبط با آن را پیدا کند.

تعریف چند رسانه ای
هر تعریفی از متن، گرافیک، صدا، انیمیشن و تصاویر ویدئویی که از طریق کامپیوتر یا سایر تجهیزات الکترونیکی که در اختیار کاربر قرار می گیرد ، چند رسانه ای نامیده می‌شود.
چند رسانه ای نمایش نیرومند احساسات است. برای عرضه خواسته های مردم به صورت الکتریکی باید اجزای چند رسانه ای ، مانند تصاویر ثابت و متحرک ، اصوات ، تصاویر ویدئویی و اطلاعات خام با هم ترکیب شوند. اگر افراد با کامپیوتر محاوره داشته باشند ، مجذوب می شوند. چند رسانه ای، چشمها ، گوشها ، انگشتان و بخصوص مغز را تحریک می کند. اجزای چند رسانه ای باید به گونه ای با هم ترکیب شوند، که بیشترین کارایی را داشته باشند. تولیدکنندگان نشر رومیزی ها و تصاویر ویدئویی که می خواهند روشهای قدیمی اطلاعات را تغییر دهند و عقاید خود را با تکنولوژی جدید پیاده کنند، از چند رسانه ای استفاده می کنند افراد با ذوقی که می خواهند آلبوم ها و تاریخچه زندگی خانوادگی خود را در شبکه ی

جهانی Web قرار دهند، نیز چند رسانه ای را به کار می گیرند. چند رسانه ای مورد استفاده بازرگانانی است که می خواهند مستندات واژه پردازها و نشر رومیزی ها همراه صدا ، تصاویر ویدئویی و تصاویر گرافیکی متحرک عرضه کنند ، یا سخنگوهای بزرگی که برای انتقال فکر و اطلاعات خود ، از صوت و نمایش تصاویر متحرک بر مانیتورهای بزرگ استفاده می کنند. چند رسانه ای های مورد استفاده، سیستم های اطلاعاتی است که تصاویر ، صدا ، ویدئویی و متن را سازمان دهی میکنند. اساتید و دبیران برای آموزش از نمایش اطلاعات استفاده می کنند.
چند رسانه ای برای شروع کار و سرمایه گذاری در سخت افزار و نرم افزار و فراگیری ابزارهای جدید بسیار مناسب است. در آغاز، اجزای چند رسانه ای را بشناسید. سپس یک یا چند ابزار را برای ایجاد و ویرایش هر کدام فراگیرید. باید بتوانید از متن و فونتها استفاده کنید، یک تصویر گرافیکی تمام رنگی ایجاد نموده ، آن را ویرایش نمایید با استفاده از تصاویر به فیلم ها روح بخشید و صداهای دیجیتال را ضبط و ویرایش کنید.

ایجاد یک پروژه چند رسانه ای نیاز به مهارت و تکنولوژی بالایی دارد ، همان اندازه که مهارت ها در ایجاد یک پروژه مؤثر است ، جدیت و سختگیری مدیر نیز اهمیت فراوان دارد.
تعاریف
همانطور که گفته شد ، چند رسانه ای ترکیبی از متن ، گرافیک ، صوت ، انیمیشن و ویدئو است.
هنگامی که به کاربر نهایی ( کسی که محصول نهایی را می بیند ) اجازه کنترل اجزای چند رسانه ای داده می شود ، این چند رسانه ای ، محاوره می باشد. هنگامی که در تمام مدت استفاده کاربر، ساختاری از اجزای متصل شده فراهم شود ، به چند رسانه ای محاوره‌ای ، ابر رسانه می گویند.
افرادی که نحوه استفاده هر یک از اجزا و تکنولوژی ترکیب آنها را بدانند ، توسعه دهندگان چند رسانه ای نامیده می شوند.

ابزارهای نرم افزاری ، متن ها و مطالب نمایش داده شده بر یک کامپیوتر یا صفحه تلویزیون با هم یک پروژه چند رسانه ای را تشکیل می دهند. هنگامی که پروژه به دست کاربران نهایی می رسد ، به این پروژه با ساختارهایش یا بدون آنها عنوان چند رسانه ای گویند. بعلاوه ممکن است پروژه ، صفحه ای در شبکه Web باشد که در این صورت باید اجزای چند رسانه ای در HTML ، ترکیب شوند.

پروژه چند رسانه ای که محاوره ای نباشد ، چند رسانه ای خطی نامیده می شود و هنگامی که اجرا می شود ، تا انتها پیش می رود. اگر کاربران بتوانند پروژه را کنترل کنند به این پروژه چند رسانه ای غیر خطی یا محاوره ای گویند. چند رسانه ای غیر خطی ، راهی برای دست یابی به اطلاعات است. برای این که کاربر بتواند از پروژه استفاده کند. باید در پیغام ها ، Scripting ، Storyboarding ، کارهای هنری و برنامه نویسی دقت بسیار داشت.
از ابزارهای تألیف برای ترکیب اجزای چند رسانه ای در یک پروژه استفاده می شود. این ابزارهای نرم افزاری، اجزای چند رسانه ای را مدیریت می کند و نحوه برخورد با کاربر را تعیین می نمایند.
ابزارهای تألیف ، به منظور ایجاد و ویرایش متن و تصویر، روشهای آسانی را پیشنهاد می کنند که روش برخورد کاربر با پروژه را تعیین می نماید. معمولا اصوات و فیلمها با ابزارهای ویرایشی که مختص این رسانه ها هستند، ایجاد شده و سپس برای پخش، به سیستم های تألیف وارد می شوند. به مجموعه آنچه گفته می شود و چگونگی نمایش آنها به بیننده، رابط کاربر گویند. در رابط کاربر ، این مورد اهمیت فراوان دارد : یکی این که چه اتفاقی برروی ورودیها ی کاربر می افتد و دیگر این که گرافیک نمایش داده شده بر صفحه ، چگونه باشد. به سخت افزار و نرم افزاری که این محدودیتها را تعیین می کند چند رسانه ای پایه یا محیطی گویند.
موارد استفاده چند رسانه ای
چند رسانه ای هنگامی مناسب است که رابط کاربر آن ، استفاده کنندگان را به اطلاعات الکترونیکی متصل کند. چند رسانه ای ، قابلیت حفظ و نگهداری اطلاعات را افزایش می دهد و در بازار یابی فروش ، آموزش و پایگاههای Web نیز کاربرد دارد. نمونه ای از این کاربردها در زیر شرح داده می شود.

چند رسانه ای در تجارت
نمایشها ، آموزش، داد و ستد ( در بازار فروش )، آهی ، تشکیل گروههای مردمی ، پایگاه داده ها ، کاتالوگها و ارتباطات شبکه ای از کاربردهای تجارت چند رسانه ای است. بر بسیاری از شبکه های محلی و گسترده ( LAN ها و WAN ها ) پست آوایی و کنفرانس ویدیویی وجود دارد.
اکنون زمان اسلایدهای 35 میلیمتری و نمایش بر پرده به پایان رسیده است. چند رسانه ای در امر آموزش ، گستره ی وسیعی پیدا کرده است. به عنوان مثال ، مراقبین پرواز می توانند در یک شبیه سازی ، اصول بین المللی را فرا می گیرد.

مانیتورهایی با تفکیک پذیری بالا ، همراه یک دوربین ویدئویی ، میکروفن و بلند گوهای استریو برای ساخت مشخصات کارمندی ، یادداشت های ویدئویی کنفرانسهای همزمان از راه دور استفاده می شوند. کامپیوترهای قابل حمل ، برای ارائه پروژه های چند رسانه ای ، مجهز به سریعترین پردازنده ها و گرداننده CD – ROM هستند.
چند رسانه ای در مدرسه

در طول چند سال آینده ، چند رسانه ای در فرایند آموزش تغییرات اساسی بوجود خواهد آورد.
به ویژه دانش آموزان مستعد ، از محدودیت های روش های آموزشی قدیمی ، فراتر می روند. در واقع معلمان راهنماهای مسیر تعلیم و دانش آموزان هسته اصلی فرایند آموزش و پرورش می باشند. این موضوع در امر تعلیم بسیار حساس است ، بنابراین ، نباید نرم افزارهای آموزشی ، جانشین ثابت روش های قدیمی باشند. بلکه تنها فرایند مؤثری در تکامل فرایند آموزشی خواهند بود.
دانشجویان و دانش پژوهان نیز درامر آموزش از چند رسانه ای استفاده می کنند. به عنوان مثال ، به منظور شناخت قلب ، ابزار آموزش الکترونیکی پیشرفته ای طراحی شود که بیش از صد حالت نمایشی برای پزشکان فراهم می کند و با استفاده از تصاویر قلب ، تکنیک طبی جدیدی را به دانشجویان کاردیولوژی ، رادیو لوژی و پزشکی می آموزد.
چند رسانه ای در خانه

سرانجام بیشتر پروژه های چند رسانه ای از طریق دستگاههای تلویزیونی و مانیتورها به خانه ها وارد می شوند و کاربران می توانند به صورت محاوره ای به آنها ارتباط برقرار کنند. امروزه ، مشتریان خانگی چند رسانه ای هم ، دارای یک دستگاه کامپیوتر و گرداننده ی CD – ROM هستند.
چند رسانه ای در مکانهای عمومی

در مکانهای عمومی ، مانند ایستگاههای قطار ، فروشگاهها ، موزه ها و مغازه ها و; برای اطلاع رسانی و راهنمایی از چند رسانه ای استفاده می کنند. نصب سیستم های چند رسانه ای ، نیاز به اتاقکهای قدیمی اطلاعات و پرسنل ها را کاهش می دهد.
فشرده سازی چیست ؟

تاکنون باید مشخص شده باشد که انتقال اطلاعات چند رسانه ای به صورت غیر فشرده کاملا از بحث خارج است. فشرده سازی با کیفیت بالایی امکان پذیر است. خوشبختانه ، در چند دهه گذشته ، محققین ، تکنیکها و الگوریتم های زیاد را برای فشرده سازی پیاده کردند که انتقال چند رسانه ای را امکان پذیر ساخت.
تمام سیستم های فشرده سازی به دو الگوریتم نیاز دارند : یکی فشرده سازی داده ها در منبع ، و یکی برای تجزیه آنها در مقصد. این الگوریتم ها را الگوریتم های رمز گذاری و رمز گشایی می نامند.

این الگوریتم ها دارای چندین حالت عدم تقارن اند که باید به آنها توجه شود. اول اینکه ، برای بسیاری از کاربرد ها ، سند چند رسانه ای مثل فیلم ، فقط یک بار رمز گذاری می شود ( وقتی کارگزار چند رسانه ای ذخیره می گردد ) ، اما هزاران بار رمز گشایی می شود ( وقتی که مشتریان آن را تماشا می کنند ). معنای این عدم تقارن این است که برای الگوریتم رمز گذاری قابل قبول است که کند بوده و نیازمند سخت افزار گرانی باشد ، به شرطی که الگوریتم رمز گشایی سریع بوده و نیاز به سخت افزار گران نداشته باشد امکان دارد کارگزار چند رسانه ای بخواهد سوپر کامپیوتر موازی ای را برای مدتی اجاره کند تا تمام کتابخانه های تصویری را رمز گذاری نماید ، اما اگر مشتریان به مدت دو ساعت سوپر کامپیوتر را اجاره نمایند تا تصویری را مشاهده کنند ، موفقیت آمیز نیست. بسیاری از سیستم های فشرده سازی عملی ، نیازمند زمان زیادی اند تا رمز گذاری را ساده و سریع انجام دهند ، حتی اگر به قیمت رمز گذاری تند و پیچیده تمام شود.

از طرف دیگر ، برای چند رسانه ای بلا درنگ، مثل کنفرانس ویدیویی، رمز گذاری کند مورد قبول نیست. رمز گذاری باید فوراً انجام شود. در نتیجه ، چند رسانه ای بلا درنگ، از الگوریتم یا پارامترهای متفاوت از الگوریتم های ذخیره سازی تصاویر بر روی دیسک ( اغلب با فشرده سازی کم ) استفاده می کند.
عدم تقارن این است که لازم نیست فرایند رمز گذاری/ رمز گشایی ، وارون پذیر باشد. یعنی ، هنگام فشرده سازی فایل ، انتقال آن ، و سپس تجزیه آن ، کاربر انتظار داشته باشد که به حالت اول برگردد ( دقیقا تا آخرین بیت ). این خواسته در چند رسانه ای وجود ندارد. اگر نتیجه رمز گشایی با متن اولیه تا حدودی متفاوت باشد. قابل قبول است وقتی خروجی رمز گشایی دقیقا با ورودی اولیه یکسان نباشد ، می گویند ، سیستم پر تلفات است.
اگر ورودی و خروجی یکسان باشد ، سیستم بدون تلفات است. سیستم های پر تلفات ، مهم هستند ، زیرا پذیرش تلفات اندکی از اطلاعات ، بسته به نسبت فشرده سازی ممکن منفعت زیادی دارد.

الگوریتم های فشرده سازی
رمز گذاری آنتروپی
الگوهای رمزگذاری به دو دسته تقسیم می شود: رمز گذاری آنتروپی و رمز گذاری منبع. هر کدام از این دو دسته را مورد مطالعه قرار می دهیم و تشریح می کنیم.
اولین مثال رمز گذاری آنتروپی ، رمز گذاری طول دنباله است. در بسیاری از انواع داده ها ، رشته ای از نمادهای تکراری ( بیتها , اعداد و غیره )، متداول است. اینها را می توان با علامت خاصی که در داده ها یافت نمی شود ، خود نما و تعداد دفعات تکرار آن مشخص کرد. اگر خود این علامت نیز در داده ها یافت شود ، تکراری است. به عنوان مثال ، رشته ای از ارقام دهی را که در زیر آمده است در نظر بگیرید

3500000000000084587111111111111635467400000000000000000000000065
اگر A را به عنوان نشانگر معرفی کنیم و از اعداد دو رقمی برای شمارش تکرار استفاده کنیم ، رشته فوق به صورت زیر رمز گذاری می شود :
315A01284587A113116354674A02265
در اینجا ، رمز گذاری طول دنباله، طول رشته را به نصف تقلیل داد.
دنباله ها در چند رسانه ای نیز متداول است. در صوت، سکوت معمولاً با دنباله های صفر نشان داده می شود. در تصویر، دنباله های یکرنگ، در آسمان، دیوار یا سطوح صاف دیگر اتفاق می افتد.

مثال دوم در مورد رمز گذاری آنتروپی ، رمز گذاری آماری است. در این روش از کد کوتاه برای نمایش نمادهای متداول و از کد بلند برای نمایش نمادهای غیر تکراری استفاده می شوند. کد مورث از این قاعده پیروی می کند ، به طوری که E با 0 شروع می شود و Q با – .- شروع می شود و ;.. . رمز گذاری هافمن و الگریتم زیو- لمپل که توسط برنامه فشرده سازی یونیکس به کار می رود نیز از رمز گذاری آماری استفاده می نماید.

مثال سوم در مورد رمز گذاری آنتروپی سی ال یو تی ( CLUT ، جستجوی رنگ جدول ) نام دارد. تصویری را در نظر بگیرید که از رمز گذاری آر جی بی با سه بایت در پیکسل استفاده می کند. از نظر تئوری ، این تصویر باید 2 بتوان 24 مقدار رنگ مختلف داشته باشد. فرض کنید فقط 256 رنگ مورد استفاده قرار می گیرد. فشرده سازی با ضریب 3 ، با ساختن جدول 768 بایتی که مقادیر آر جی بی مربوط به 256 رنگ به کار رفته را لیست می کند ، و سپس نمایش هر پیکسل توسط شاخصی از مقدار آر جی بی در جدول انجام می شود. در اینجا مثال ساده ای را می بینیم که در آن رمز گذاری کندتر از رمز گشایی است ، زیرا رمز گذاری مستلزم جستجو جدول است در حالی که رمز گشایی با یک عمل شاخص بندی انجام می گیرد.
رمز گذاری منبع

رمز گذاری منبع با استفاده از امتیاز خواص داده ها ، فشرده سازی بیشتری ( معمولا پر تلفات ) را تولید می کند. در این جا نیز با سه مثال به شرح آن می پردازیم. مثال اول ، رمز گذاری تفاضلی است که در شماره های تلفات تصادفی که توسط کامپیوتر تولید شده و بازار یاب راه دور برای اذیت کردن مردم هنگام صرف شام ، از آن استفاده می کند، فاقد این ویژگی است. تعداد بیت های لازم برای نمایش تفاضل های بین شماره های تلفن متوالی موجود در لیست ، برابر با تعداد بیت های لازم برای نمایش خود شماره ها است. مثال دوم راجع به رمز گذاری منبع ، تبدیلات است. با تبدیل سیگنال ها از دامنه ای به دامنه ای دیگر، فشرده سازی ساده تر می گردد. به عنوان مثال ، تبدیل فوریه شکل 1-1 را در نظر بگیرید. در این جا ، تابه ای از زمان به صورت لیستی از دامنه ها نمایش داده می شود. با تعیین دقیق مقادیر تمام دامنه ها ، تابع اولیه به طور کامل باز سازی می شود. به هر حال ، با معلوم بودن مقادیر ( مثلا ) 8 دامنه اول که با دو مرتبه اعشار گرد شده باشد ، امکان دارد سیگنال طوری بازسازی شود.

شكل (1-1) (b) مقادیر پیكسل مربوط به بخشی از تصویر

تبدیلی كه در آن عنصر بالای سمت چپ از تمام عناصر به جز خودش كسر می‌گردد

که شنونده نتواند تشخیص دهد که اطلاعاتی از بین رفته است. امتیازش این است که تعداد بیتهای لازم برای انتقال هشت دامنه ، کمتر از انتقال شکل موج نمونه سازی شده است.
تبدیلات در داده های تصویر دو بعدی نیز امکان پذیر است. فرض کنید، ماتریس 4×4 در شکل بالا ( a ) مقادیر مقیاس معمولی تصویر تک رنگ را نشان می دهد. این داده ها را می توان با کسر مقدار موجود در گوشه بالای سمت چپ از تمام عناصر ( به جز خودش ) ، تبدیل کرد (b). اگر از رمز گذاری با طول متغیر استفاده شود، این تبدیل می تواند مفید گردد. به عنوان مثال ، مقادیر بین 7- و 7+ را می توان با اعداد 4 بیتی رمز گذاری کرد و مقادیر بین 0 تا 255 را می توان به صورت کد 4 بیتی خاص ( 8- ) که به دنبالش ، عدد 8 بیتی می آید، رمز گذاری کرد.

گرچه این تبدیل ساده، بدون تلفات است ، بهتر از آن وجود ندارد. یک فضائی دو بعدی مهم دی تی سی ( DTC ، تبدیل کسینوسی مجزا ) نام دارد ( نیکو واینو گراد ، 1992 ). ویژگی این تبدیل این است که برای تصاویر فاقد انفصال دقیق ، بیشترین قدرت بینایی ، در چند عبارت اول است و موجب می شود تا از عبارت بعدی ، بدون از بین رفتن اطلاعات بیشتر، صرف نظر کرد.

سومین مثال رمز گذاری منبع ، کمّی کردن بردار است و در داده های تصویری قابل استفاده است. در اینجا، تصویر به مستطیلهایی با اندازه ثابت تقسیم می شود. علاوه بر خود تصویر ، نیاز به جدولی از مستطیلهای تصویر ( که احتمالا از تصویر ساخته شده اند ) دارد. این جدول، کتاب رمز نام دارد. برای انتقال هر مستطیل، در کتاب رمز جستجو می گردد و اندیس به جای مستطیل ارسال می شود. اگر کتاب رمز به طور پویا نیز ایجاد شود ( یعنی در تصویر ) ، باید منتقل گردد. بدیهی است که اگر تعداد اندکی از مستطیلها ، تصویر را تحت الشعاع خود قرار دهد ، در پهنای باند صرفه جویی می گردد. مثالی از کمّی بودن بردار در شکل 2-1 آمده است. در شکل ( a ) 2-1 مشبکی از مستطیلهایی با اندازه نامعلوم وجود دارد. در شکل ( b ) 2-1 کتاب روز نشان داده شده اشت. رشته خروجی لیستی از اعداد صحیح 001022032200400 است که در شکل ( c ) 2-1 آمده است هر کدام ، یک کتاب از عنصر رمز را نشان می دهد.

شكل 2-1 مثالی از كمی كردن بردار . (A) تصویر به چند مربع تقسیم شده است . (B) كتاب رمز تصویر .
© تصویر رمز گذاری شده .

در واقع ، کمّی کردن بردار ، عمومیت دادن سی ال یو تی دو بعدی است. تفاوت آنها در حالتی است که انطباقی صورت نگیرد. در این صورت سه استراتژی امکان دارد. استراتژی اول ، استفاده از بهترین انطباق است. استراتژی دوم استفاده از بهترین انطباق و افزودن اطلاعاتی راجع به چگونگی بهبود انطباق است ( مثل ، افزودن مقدار میانگین مناسب ). سومین استراتژی استفاده از بهترین انطباق و افزودن آنچه که منجر به باز سازی دقیق داده ها می شود ، است دو استراتژی اول ، پر تلفات است ولی فشردگی زیادی را ایجاد می کند. استراتژی سوم بدون تلفات است اما به عنوان الگوریتم فشرده سازی ، به خوبی عمل نمی کند. مشاهده می شود که رمز گذاری ( انطباق الگو ) بیش از رمز گشایی ( شاخص بندی در جدول ) ، وقت صرف می کند.

خلاصه فصل اول
چند رسانه ای مورد استفاده بازرگانانی است که می خواهند مستندات ، واژه پردازها ، همراه صدا ، تصویر و ویدیویی و تصاویر گرافیکی عرضه کنند.
چند رسانه ای برای شروع کار و سرمایه گذاری در سخت افزار و نرم افزار و فراگیری ابزارهای جدید بسیار مناسب است. چند رسانه ای ترکیبی از متن ، گرافیک ، صوت و انیمیشن و ویدیو است.
چند رسانه ای در تجارت ، مدرسه ، خانه و در مکانهای عمومی مورد استفاده قرار می گیرد.
فشرده سازی انتقال اطلاعات چند رسانه ای به صورت غیر فشرده کاملا از بحث خارج است. فشرده سازی با کیفیت بالایی امکان پذیر است. تمام سیستم های فشرده سازی به دو الگوریتم نیاز دارد: یکی برای فشرده سازی داده ها در منبع و یکی برای تجزیه آنها در مقصد که این الگوریتم ها را الگوریتم های رمز گذاری و رمز گشایی می نامند.
الگوریتم های رمز گذاری به دو دسته تقسیم می شود : رمزگذاری آنتروپی و رمز گذاری منبع هر کدام از این دو دسته را مورد مطالعه قرار دادیم.

فصل 2

در این فصل می خوانید :
• قدرت صوت
• فرمت فایل های صوت
• صوت در سیستم چند رسانه ای
• صداهای MIDI در مقایسه با صداهای دیجیتال
• صوت دیجیتال
• اندازه ی فایل در برابر کیفیت
• فضای ذخیره سازی

صوت
موج صوت ( صدا ) ، موج اکوستیک یک بعدی است. وقتی موج اکوستیک وارد گوش می شود، پرده گوش مرتعش می گردد و موجب می شود تا استخوان های کوچک گوش داخلی ارتعاش کند، و پالس های عصبی را به مغز ارسال نماید. در این پالس ها به صورت صدا تلقی می شود به همین روش وقتی موج آکوستیک به میکروفون برخورد می کند، میکروفون سیگنال الکتریکی تولید می نماید که دامنه صدا را به صورت تابعی از زمان نشان می دهد. نمایش، پردازش، ذخیره و انتقال این سیگنال های صوتی بخش عمده مطالعه سیستم های چند رسانه ای است.
دامنه فرکانس گوش انسان از 20Hz تا 20000Hz است؛ گرچه بعضی از حیوانات ، به خصوص سگها ، فرکانسهای بالا را می شنوند. گوش به طور لگاریتمی می شنود ، لذا نسبت دو صدا با دامنه های A وB بر حسب db ( دسیبل ) سنجیده می شوند؛ به صورت فرمول زیر :
Db = 20log210( A / B )

اگر حد پایین شنیداری ( فشاری در حدود 0/0003 dyne/cm ) را برای موج سینوسی 1-khz ، 0dB تعریف کنیم ، مکالمه معمولی برابر با 50dB و آستانه درد تقریبا 120dB است. ( دامنه پویایی از ضریب 1000000 ). برای رفع ابهام باید گفت که A وB که در بالا ذکر شد دامنه اند.

اگر از سطح توان که متناسب با مربع دامنه است استفاده شود ، ضریب لگاریتم برابر با 10 خواهد شد.
گوش، به تغییرات صدا بسیار حساس است پس از چند میلی ثانیه به آن پی میبرد و بالعکس، چشم، تغییرات در سطح نور را که فقط چند ثانیه طول بکشد درک نمی کند. نتیجه این مشاهده این است که تاخیر لرزش چند میلی ثانیه ای در اثنای انتقال چند رسانه ای، در کیفیت صدای دریافت شده بیشتر از تاخیر آن در کیفیت تصویر دریافتی است.
امواج صوتی را می توان با ای سی دی ( ACD ، مبدل دیجیتال به آنالوگ ) به شکل دیجیتال در آورد.

ای سی دی ولتاژ الکتریکی را به عنوان ورودی گرفته و عدد دو دو یی را به عنوان خروجی تولید می نماید.در شکل ( a ) 1-2 نمونه ای از موج سینوسی دیده می شود. برای نمایش دیجیتالی این سیگنال ، آنرا در هر دلتا ثانیه نمونه سازی می کنیم شکل ( b ) 1-2. اگر موج صدا، موج سینوسی خالص نباشد، اما استقرا خطی امواج سینوسی خالص نباشد، اما استقرا خطی امواج سینوسی ، که در آنجا بالاترین قطعه فرکانس وجود دارد. F باشد نظریه نایکویست می گوید که نمونه برداری در فرکانس 2f کافی خواهد بود.

نمونه برداری از هیچ مقدار صورت نمی گیرد، زیرا از فرکانس های بالاتری که چنین نمونه برداری بتواند تشخیص دهد ، وجود ندارد نمونه های دیجیتال دقیق نیست. نمونه های 3
بیتی شکل © 1-2 فقط هشت مقدار را نشان می دهد ، از جمله -1/00 تا +1/00و با گام 25/0 نمونه 8 بیتی ، 256 مقدار را نشان می دهد. نمونه 16 بیتی ، 65536 مقدار را نشان می دهد.

خطایی که در اثر تعداد بیتها در هر نمونه ایجاد می شود ، کمّی کردن اختلال نام دارد. اگر بسیار بزرگ باشد ، گوش آن را تشخیص میدهد.
دو مثال متداول از صدای نمونه سازی شده ، تلفن و دیسکهای فشرده صوتی است. مدوله کردن کد پالس که در سیم تلفن به کار می رود ، در هر ثانیه 800 بار از نمونه های 7 بیتی ( آمریکای شمالی و ژاپن ) یا 8 بیتی ( اروپا ) استفاده می کند. سرعت داده ها در این سیستم b 5600 یا b 6400 است. فقط با 8000 نمونه در ثانیه ، فرکانس های بالاتر از khz 4 مفقود می شود.

شكل 1-2 : (a) موج سینوسی . (b) نمونه سازی موج سینوسی . (c) كمی كردن 3 بیتی نمونه‌ها

سی دی های صوتی با نمونه سازی سرعت 44100 نمونه بر ثانیه ، دیجیتال شده است. این سرعت برای بدست آوردن فرکانسهای تا HZ 22050 کافی است ، این فرکانس برای انسان خوب نسیت ولی برای سگ خوب است. نمونه ها 16 بیتی اند و بازه دامنه به صورت خطی اند. باید توجه داشت که نمونه های 16 بیتی فقط 65536 مقدار را ممکن می سازد ، گرچه بازه پویای گوش ، در مقایسه با کوچکترین صوت قابل شنیدن ، تقریبا یک میلیون است لذا استفاده از 16 بیت در هر، کمی کردن اختلال را عرضه می کند ( گرچه کل بازه پویا تحت پوشش قرار نمی گیرد- فرض می شود که سی دی ها صدمه نمی بینند ). با 42 ، 100 نمونه 16 بیتی در هر ثانیه ، سی دی برای منو ( در مقابل استریو ) به پهنای باند kbps 6/705 و برای استریو به پهنای باند Mbps 411/1 نیاز دارد. با اینکه کمتر از نیاز تصویر است ، کانال تی 1 کاملی را برای انتقال صوت استریو با کیفیت سی دی غیر فشرده ، اشغال می کند.
صدای دیجیتال شده را نرم افزار کامپیوتر می تواند پردازش کند. چندین برنامه برای کامپیوترهای شخصی وجود دارد که کاربر می تواند با استفاده از آنها ، امواج صوتی را از منابع مختلفی ضبط کند،نمایش دهد،میکس کند و ذخیره نماید.امروزه ضبط کردن و تغییر صدا به صورت دیجیتال انجام می شود.

بسیاری از ابزار موسیقی دارای رابط دیجیتال هستند. وقتی تجهیزات دیجیتال کشف شد،هر کدام،رابط مخصوص به خودش را داشت،اما پس از چندی استاندارد ام آی دی آی(MIDI،رابط دیجیتال ابزار موسیقی ) ایجاد شد و تمام صنایع موسیقی آن را پذیرفتند.این استاندارد ، رابط کابل وقاب پیام را مشخص می کند . هر پیام ام آی دی آی متشکل از بایت وضعیت صفر و یا چند بایت اطلاعات است . هر پیام ام آی دی آی ، واقعه مهم موسیقی را حل می کند . معمولا وقایع ، فشار دادن کلید ، انتقال کلید کشویی، یا پدال پا است. بایت وضعیت، واقعه را مشخص می کند، و بایتهای داده شد و سرعت انتقال آن .

به هر وسیله موسیقی کد ام آی دی آی خاصی نسبت داده میشود . به عنوان مثال ، پیانوی بزرگ برابر با 0 ، ماریمبا برابر با 12 و ویولون برابر با 40 است ، این کار لازم است تا کنسرت فلوت مثل کنسرت شیپور نواخته نشود. تعداد 127 ابزار موسیقی تعریف شده است ، اما بعضی از اینها ابزار نیستند ، بلکه اثراتی مثل جیک جیک پرندگان ، هلیکوپتر ، و جنجالی که توسط برنامه های تلویزیونی ایجاد می شود، است.

قلب هر سیستم ام آی دی آی ، تلفیق کننده (اغلب یک کامپیوتر )است که پیام ها را می پذیرد . واز آنها موسیقی تولید می کند. تلفیق کننده هر 127 ابزار را می شناسد ، لذا طیف قدرت مختلفی را برای c میانی ، در شیپور ایجاد می نماید (به جای ایجاد این طیف در سنتور). امتیاز انتقال موسیقی به کمک ام آی دی آی در مقایسه با ارسال موج های دیجیتال شده ، کاهش پهنای باند است ، این کاهش گاهی با ضریب1000 خواهد بود. عیب ام آی دی آی این است که گیرنده برای مونتاژ مجدد موسیقی ،نیاز به تلفیق کننده دارد ، هر تلفیق کننده اجرای خاصی از موسیقی را ارائه می کند.

البته موسیقی ، حالت خاص و مهمی از صوت است ، حالت مهم دیگر گفتار است، گفتار انسان در بازه HZ 600 تا HZ 6000 است. گفتار از حروف صدا دار و صامت ایجاد می شود، که دارای خواص متفاوتی اند.اصوات وقتی ایجاد می شود که ناحیه صوتی مسدود نباشد، یعنی طنینی تولید شود که فرکانس اصلی آن به اندازه و شکل سیستم صوتی و وضعیت زبان و فک صحبت کننده بستگی دارد . این صداها تقریباً برای فاصله زمانی 30 میلی ثانیه ای به صورت دوره ای هستند . طنین وقتی ایجاد می شود که ناحیه صوتی نسبتا بسته باشد. این صداها نظم کمتری نسبت به حروف صدا دار دارند . فرمت فایلهای صوتی هنگام ایجاد سیستم چند رسانه ای ، با قابها و مترجم های متن ، صدا، تصویر، انیمیشن یا ویدئو کلیپهای دیجیتال ، سر و کار خواهیم داشت . فرمت یک فایل صوتی ، روش و متدولوژی شناخته شده ای جهت سازمان دادن بیتها و بایتها مربوط به داده های صوتی دیجیتایز شده در یک فایل داده ای است . البته برای آنکه داده های صوتی بتوانند در یک کامپیوتر ذخیره ، ویرایش یا پخش شوند باید ساختار فایل شناخته شود.

اصوات دیجیتایز شده در مکینتاش ، ممکن است به شکل فایل داده ای ( به عنوان مثال با پسوند ALF . یا SDII ) ذخیره شده باشند و یا به عنوان منابع در انشعاب System یا program application به شکل SND ذخیره شده باشند. مکینتاش یک ساختار فایل دو شاخه را بکار می برد و باید مشخص شود که فایل مورد نظر در یک انشعاب منبع قرار دارد یا به شکل فایل مجزا است.

در ویندوز اصوات دیجیتاز شده معمولاً به صورت Wave در فایل ها یی با پسوند WAV ذخیره می شوند. از آن جا که شرکت ها روش هایی برای به جریان انداختن و پخش صوت از روی WWW ارائه داده هستند، فرمت های جدیدی برای شبکه ی Internet پدید آمده است.

در نخستین روزهای internet ، فرمت متداول برای اصوات AU بود (فرمت بین المللی ارتباطات تلفنی (711GCCITT ) uLaw که به law-Mu یا فرمت TalkRadio یا Geek if the Week ملقب است و بدین شکل تلفظ می شود : (law-mew) در این فرمت سرعت نمونه برداری ،KHz8 و به روش 8 بیت مونو مب باشد. امروزه فرمت uLaw، سرعت 16 بیت KHz8 و با قدرت فشرده سازی 2:1 پشتیبانی می کند .aLaw معادل اروپایی uLaw ، می باشد. برای فایل های صوتی مکینتاش ، زمانی که داده های صوتی تماما” در انشعاب داده ها (fork data) قرار دارند ، فرمت AIFF ترجیح داده می شود. (این فرمت ها چنانچه طرحهای فشرده سازی MASE به شکل 3:1 و 6:1 را پشتیبانی کند ، AIFC خوانده می شود) فرمت wave با ابداع ویندوز ، توسط Microsoft وIBM مطرح و مرسوم شد.

روشهای زیادی برای ذخیره سازی بیتها و بایتها ، جهت تشریح شکل موجهای صوتی نمونه برداری شده وجود دارد . روشی که برای فایلهای دادهای صوتی Book Red روی CDهای موزیک به کار می رود
Liner pulde code Modulation است .فرمت I-CD
(که به عنوان نوعی دیگری از استاندارد Book Read توسط Philips توسعه داده شده است)،برای ارائه دو ساعت موزیک استریو با کیفیت بالا یا 20 ساعت صوت مونو با کیفیت صدای معمولی روی هر CD از روش ADPCM استفاده می کند چنانچه بخواهید داده های صوتی ADPCM را در لا بلای صفحات تصاویر گرافیکی یا ویدئویی بگنجانید ، فرمت I-CD امکان همزمان کردن صوت و تصویر را بدون نیاز به Buffering data فراهم می آورد در این صورت نیاز به یک ROM CD مخصوص با معماری پیشرفته (XA CDROM ) خواهد بود مکینتاش و ویندوز می تواند از فایل MIDI استفاده کنند . رابط MIDI روی PC ها به صورت برد های صدا ساخته می شود که برای کامپیوتر های MPC یک نیاز محسوب می شود. در مکینتاش برای ورودی و خروجی تجهیزات MIDI یک آداپتور لازم است در دو سیستم (مکینتاش و ویندوز ) اصوات DIDI معمولا در فایل هایی با پسوند MID ،ذخیره می شود.

قدرت صوت
هر گاه شی در هوا ، ارتعاش کند ، امواجی ایجاد می کند .این امواج مانند ، امواج آب ناشی از پرتاب سنگ در یک آبگیر آرام ، در هوا پخش می شود . و زمانی که به پرده گوش می رسند تغییرات فشار یا ارتعاشات به صورت صوت دریافت می شود . این امواج با سرعت 750 مایل در ساعت در هوا منتشر می شود. امواج صوتی ار نظر دامنه نوسانات ، فرکانس یا زیر و بمی صدا (یعنی تعداد ارتعاشات در ثانیه که با واحد هرتز یا HZ اندازه گیری می شود )با یکدیگر تفاوت دارند . بسیاری از امواج صوتی از امواج یک موسیقی موزون گرفته تا یک گفتار یا

یک طنین ساده ، می توانند با یکدیگر ترکیب شوند. آکوستیکس (Acoustics) ، علم صوت شناسی است سطوح فشار صوت (یعنی بلندی یا درجه صدا ، volume ) با واحد دسی بل (dB) ، اندازه گیری می شود .در واقع دسی بل ، نسبت بین یک نقطه مرجع انتخابی روی یک مقیاس لگاریتمی و سطحی است که واقعاً شنیده می شود . وقتی توان خروجی صوت 4 برابر شود میزان افزایش تنها dB6 است . زمانی که صوت 100 برابر تقویت می شود ، میزان افزایش ، تنها dB20 است.

صوت، انرژی است . صدای بلند، می تواند به اعضای حساس گیرنده صوت که پشت پرده گوش هستند ، آسیب وارد کند. درک تن صدا ، به فرکانس صدا وابسته است : در فرکانس های پایین ، برای اینکه همان بلندی که در اصوات با فرکانس های متوسط یا بالا تر درک می شود ، منتقل گردد ، نیاز به توان بالاتر است شاید بیش از آنکه صوت را بشنوید آن را احساس کنید.

علم صوت شناسی ، علاوه بر دزجه (volume) و دانگ (Pitch) صدا ، موارد دیگری را نیز در بر می گیرد اگر مطالعه بیشتری در این مورد انجام شود می توان به پرسش هایی از این قبیل پاسخ داد : چرا صدای نت در یک اکتاو روی یک ویلون سل بر روی یک قره نی متفاوت است؟ چرا یک کودک 5 ساله صدایی با فرکانس Hz 100 را که در dB 20 پخش می شود ، می شنود در حالی که فرد بالغ در اثر فقدان حساسیت شنوایی (که به سن انسان بستگی دارد ) نمی تواند این گونه اصوات را بشنود ؟ برای استفاده از صوت از پروژه های چند رسانه ای به دانش تخصصی در مورد هارمونی ها ، وقفه ها ، امواج سینوسی ، نت سازی اکتاو ها (نت های 7 گانه موسیقی) یا فیزیک صوت شناسی و ارتعاش ، نیازی نیست . ولی در موارد زیر

، آگاهی داشت :
• چگونگی ایجاد صدا
• چگونگی ضبط و تغییر و تنظیم صدا
• چگونگی پیوند دادن صدا به سیستم مورد نظر

صوت در سیستم چند رسانه ای
صوت روی کامپیوتر های شخصی چند رسانه ای با سیستم عامل ویندوز مکینتاش به خوبی اجرا می شود . زیرا بلافاصله پس از نصب سیستم عامل ، علائم صوتی هشدار دهنده سیستم ، نظیر بوق ها و سایر علائم دسترس خواهند بود.
در ویندوز ، صدا های سیستم به صورت فایلهایی با پسوند WAV ، وجود دارند . صدا ها در ویندوز 95 ، در زیر فهرست Media/Win قرار دارند . می توان این اصوات را به وقایع سیستم نظیر آغاز کار ویندور ،علائم اخطار ناشی از سایر برنامه های کاربردی یا فشردن دکمه ماوس خارج از پنجره گفتگو (که باعث تولید صدای بوق از پیش تعیین شده می گردد)نسبت داد . (شکل 2-2 ) طرحی از اصوات را می توان ایجاد کرد و طرحی خاص را مطابق وضعیت موجود ، انتخاب کرد . فایل های صوتی ایجاد شده با پسوند WAV در زیر فهرست Media/Win قرار می گیرند . به این ترتیب ، نصب و به سیستم اضافه خواهند شد و با panel control می توان آنها را وقایع سیستم اختصاص داد .

صدا های سیستم ، در پنجره ی محاوره ای صوت درpanel control ، تعیین شده و همان جا تست می گردند . راه اندازی صوت در ویندوز ، مستلزم وجود یک کارت صدا است که با راه اندازی های مناسب آن ، روی کامپیوتر PC نصب شده است . شکل ، panel control های صوت را در مکینتاش و ویندوز نمایش می دهد .
در برخی از مدل های مکینتاش ، با استفاده از7 system ، یک میکروفن و دستگاه دیجیتایز کننده صوت نظیر Macrecoreder می توان صدا های سیستمی جدیدی ضبط کرد دکمه Add در panel control صوت ،این نرم افزار ضبط ، در7 system ساخته می شود .

شكل 2-2 Cntrol Panel های در مكینتاش و ویندوز

صدا های MIDI در مقایسه با صداهای دیجیتال
MIDI به معنای رابط دیجیتال تجهیزات موسیقی ، استاندارد ارتباطات است که در اوایل دهه 1980 برای تجهیزات موسیقی الکترونیکی و کامپیوترها ارائه شد . این استاندارد ، Synthesizbr های صدا و موسیقیهای مختلف را با ارسال پیام از قبیل کابلهایی که به دستگاها متصل است ، به یکدیگر ارتباط می دهد . MIDI ، پروتکلی را برای پذیرش علامت های موسیقی ، نظیر نت ها و آلتی که این نت ها را می نوازد ، ارائه می کند . ولی داده MIDI ، صوت دیجیتایز شده نیست بلکه نمایش مختصر موسیقی است که به شکل عددی ذخیره شده است . صوت دیجیتال ، یک صدای ضبط شده و MIDI یک علامت است . صوت دیجیتال به قابلیتها و توانییهای سیستم صوتی بستگی دارد ، MIDI ، علاوه بر توانییهای سیستم صوتی به کیفیت تجهیزات موسیقی نیز وابسته است .

یک فایل MIDI ، لیستی از فرمانهای صوتی است ، که زمان اجرای هر یک از آنها مشخص است و هر یک نشان دهنده یکی از عملیات موسیقی می باشد ( برای نمونه ، فشردن یک کلید پیانو یا نگه داشتن پدال ) . نتیجه این فرمانها به دستگاه باز نواخت MIDI ، تولید صوت است . یک پیغام فشرده و مختصر MIDI می تواند باعث ایجاد یک صوت پیچیده یا مرکب یا ترتیب دادن اصوات برای نواخته شدن روی یک آلت موسیقی یا SYNTHESIZER شود . بنابر این ، فایلهای MIDI کوچکتر از فایلهای موجی شکل دیجیتایز شده معادل خود می باشد .

در مقابل داده های MIDI ، داده های صوتی قرار دارند که نمایش واقعی یک صدا هستند و به صورت هزاران عدد منحصربه فرد(که نمونه نامیده می شوند) ذخیره شده اند. داده های دیجیتال دامنه نوسان (بلندی) یک صدا را در برش های زمانی مجزا نشان می دهد. زیرا این مورد وابسته به دستگاه نمی باشد ، هر زمان که صوت دیجیتال نواخته شود ، به همین صورت صدا تولید می کند . ولی این حجم داده ها پر هزینه هستند . زیرا فایل های بزرگی برای ذخیره سازی داده ها لازم است . بنابراین صوت دیجیتال روی CD های موسیقی ذخیره می شود .

موقعیت داده های MIDI در برابر داده های صوتی دیجیتال ، مانند موقعیت طرح های گرافیکی برداری یا ترسیمی ، در مقابل طرح های گرافیکی BITMAP می باشد . بدین معنا که داده ها MIDI وابسته به دستگاه هستند و داده ها دیجیتال وابسته نیستند .
همانگونه که نمایش طرح های گرافیکی برداری ، بسته به دستگاه چاپگر یا صفحه نمایش ، با هم متفاوتند ، اصواتی که توسط فایلهای موسیقی MIDI تولید می شوند نیز به دستگاه MIDI مخصوصی که برای پخش به کار می رود ، بستگی دارند . از سوی دیگر ، داده های دیجیتال با انتطباق کم یا زیاد ، بدون توجه به سیستم پخش ، تولید صدا کرده و پخش می شوند . استاندارد MIDI ، مانند POSTSCRIPT است ، که به تجهیزات موسیقی اجازه می دهد با یک زبان قابل فهم با یکدیگر ارتباط برقرار کنند .

برای دریافت اینجا کلیک کنید