استفاده از فیلمها و تصاویری با قدرت تفکیکپذیری بالا، در اکثر کاربردهای الکترونیکی مورد نیاز است. تمایل برای استفاده از تصاویری با وضوح بالا از دو زمینه اصلی نشات میگیرد: بهبود اطلاعات تصویری برای تفسیر انسان؛ و کمک به درک دستگاههای خودکار. وضوح تصویر، جزئیات موجود در تصویر را توصیف میکند. در وضوح بالاتر، جزئیات تصویر بیشتر است. وضوح یک تصویر دیجیتال را میتوان در بسیاری از زمینه های مختلف طبقه بندی کرد: وضوح پیکسلی، وضوح فضایی، وضوح طیفی، وضوح زمانی و وضوح رادیومتری [1]. در این پایاننامه، مباحث در حوزهی وضوح فضایی مطرح میشود.
وضوح فضایی: یک تصویر دیجیتال از عناصر تصویر کوچکی به نام پیکسل ساخته شده است. وضوح فضایی، به تراکم پیکسلها در یک تصویر اشاره دارد و معیار سنجش آن پیکسل در واحد سطح است.
شکل 1-1 آزمون کلاسیک برای تعیین وضوح فضایی یک سیستم تصویربرداری را نشان میدهد. وضوح فضایی تصویر ابتدا توسط حسگرهای تصویربرداری و یا دستگاه اکتساب تصویر محدود میشود. در دوربین دیجیتال، تصویربرداری بر روی فیلم صورت نمیگیرد بلکه توسط یک حسگر حساس (دستگاه جفتکنندهی بار (CCD) [1] یا نیمرسانای اکسید فلزی مکمل (CMOS) [2] ) انجام میپذیرد. این حسگرها معمولاً در یک آرایه دو بعدی، برای گرفتن سیگنال تصویر دو بعدی مرتب شدهاند. در وهله اول، اندازه حسگر و یا به طور معادل تعداد عناصر حسگر به ازای هر واحد سطح، وضوح فضایی تصویر را تعیین میکند. حسگرها با تراکم بالاتر، وضوح فضایی بیشتری را برای سیستم تصویربرداری ممکن میسازد. سیستم تصویربرداری با آشکارسازهای ناکافی، تصاویری کم وضوح با اثرات بلوکی ایجاد میکند که ناشی از فرکانس پایین نمونه برداری فضایی است. تلاشهای بسیاری جهت افزایش وضوح تصاویر دیجیتالی صورت گرفته است، که به دو بخش کلی نرمافزاری و سختافزاری قابل تقسیم بندی میباشند.
در بخش سختافزاری با هرچه غنیتر نمودن تعداد پیکسلهای موجود بر روی حسگرهای دوربینهای دیجیتالی در واحد سطح، میتوان درجه تفکیک تصویر را افزایش داد. بعلاوه، با هرچه کوچکتر نمودن سلولهای حسگرهای دوربینهای دیجیتالی، مقدار نور مؤثر دریافت شده توسط هر سلول، کاهش مییابد؛ البته میتوان با ایجاد شبکهای از عدسیهای محدب بر روی لایه فوقانی سلولهای حسگر، مقدار نور مؤثر دریافتی توسط هر سلول حسگر را افرایش داد. لیکن به دلیل وجود تعداد بسیار زیاد سلولهای حسگر، نویز ضربه ای ناشی از قطع و وصل جریان در درون این شبکه سلولی، همچنان وجود داشته و عامل مؤثری جهت کاهش کیفیت تصویر نهایی میگردد[2].
در حالی که وضوح فضایی تصویر توسط حسگرهای تصویر محدود میشود، جزئیات تصویر (باندهای فرکانس بالا) نیز به دلیل تاری لنز (مرتبط با تابع نقطه گستر حسگر)، اثرات انحراف لنز، انکسار روزنه و تاری نوری با توجه به حرکت، محدود میشوند. بنابراین روش سختافزاری جهت رسیدن به تصاویری با کیفیت و وضوح بالاتر، بسیار پرهزینه و عملاً تا حدی غیر ممکن میباشد و معمولاً نمیتوان از حد معینی، بدلیل محدودیتهای تکنیکی موجود در تکنولوژی ساخت مدارات مجتمع، فراتر رفت. علاوه بر هزینه، وضوح یک دوربین نظارتی نیز به علت سرعت دوربین و سخت افزار ذخیره سازی محدود شده است. در بعضی موارد دیگر مانند تصاویر ماهوارهای، استفاده از حسگرهای وضوح بالا به دلیل محدودیتهای فیزیکی آن دشوار است.
استفاده از روش نرمافزاری، جهت پذیرش خرابیهای تصویر و استفاده از پردازش سیگنال در پس پردازش عکسهای گرفته شده، به منظور تعامل بین هزینههای محاسباتی با هزینههای سخت افزاری، مطرح میگردد. روشهای نرم افزاری از لحاظ اقتصادی مقرون به صرفه میباشد و امکان تولید تصویری با وضوح بالاتر توسط همان دوربینهای تصویربرداری دیجیتالی کم وضوح را فراهم میآورد.
یکی از تکنیکهای مطرح شده در بعد نرمافزاری، جهت افزایش کیفیت تصویر چه از لحاظ تعداد پیکسلها و چه از لحاظ کاهش مقدار نویز، تکنیک فراتفکیک پذیری (SR)میباشد. این تکنیک از لحاظ نامگذاری بدلیل آنکه قادر خواهیم بود از محدوده توانایی سیستم تصویر برداری فراتر رویم، فرا تفکیک پذیری نامیده میشود، و عمدتا به دو گروه روشهای مبتنی بر یادگیری و روشهای مبتنی بر بازسازی چند فریمی تقسیم میشوند [4]. در روشهای مبتنی بر یادگیری، تنها از یک تصویر کم وضوح (LR) برای ایجاد تصویری با وضوح بالا (HR) استفاده میشود. این رویکرد، زیر گروهی از روش های یادگیری ماشین است. برخی از روشهای پیشنهادی در این حوزه در [10-4] آورده شده است. گروه بعدی، روشهای مبتنی بر بازسازی چندفریمی است که تمرکز ما در این پایان نامه بر روی این دسته از تکنیکها میباشد.
در تکنیکهای فراتفکیکپذیری چند فریمی، تلفیق چندین تصویر با وضوح پائینتر باعث تولید تصویر نهایی با وضوح بالاتر میگردد. این فرآیند موجب بازسازی اجزای فرکانس بالا و حذف خرابیهایی که به علت تصویربرداری با دوربین کم وضوح ایجاد شده است، میشود. ایده اصلی در تکنیکهای فراتفکیک پذیری چند فریمی، ترکیب اطلاعات غیر زائد موجود در فریمهای کم وضوح برای تولید یک تصویر با وضوح بالا است [3]. روشی که به طور تنگاتنگ باSR مرتبط است رویکرد درونیابی تصویر میباشد، که میتواند برای افزایش اندازه تصویر مورد استفاده قرار گیرد. اما، از آنجا که هیچ اطلاعات اضافی ایجاد نمیشود، کیفیت درونیابی تک تصویر با توجه به ماهیت بدحالت[4] مسئله، بسیار محدود است، و اجزای فرکانسی از دست رفته را نمیتواند بازیابی کند. اما در زمینه SR، مشاهدات متعدد کم وضوح برای بازسازی در دسترس هستند. اطلاعات غیر زائد موجود در این تصاویرکم وضوح، به طور معمول توسط جابجاییهای در حد کسری از واحد پیکسل، که بین این تصاویر اتفاق میافتد، ایجاد میشود. این جابجاییهای در حد کسری از واحد پیکسل ممکن است به دلیل حرکات غیر کنترل شده بین سیستم تصویربرداری و صحنه رخ دهد، به عنوان مثال، حرکت شی؛ و یا بعلت حرکات کنترل شده، مانند سیستم تصویربرداری ماهواره ای در مدار زمین که با سرعت و مسیر از پیش تعریف شده در حال حرکت است.
هر فریم کم وضوح، مشاهده اعوجاجی از صحنه واقعی است. فراتفکیکپذیری تنها در صورتی که حرکت در حد کسری از واحد پیکسل بین این فریم وضوح پایین وجود داشته باشد، امکان پذیر است. شکل 1-2 نمودار سادهای از توصیف ایده اولیه بازسازی SR را نشان میدهد. در فرآیند تصویربرداری، دوربین چندین فریم LR را از صحنهHR ضبط میکند. این تصاویر LR، نسبت به یکدیگر شیفتهای حد کسری از واحد پیکسل دارند و همچنین با نرخ پایین نمونهبرداری شدهاند. ساخت و ساز تکنیکهای SR چند فریمی، معکوس این فرآیند است؛ همترازی مشاهدات LR در دقت کسری از پیکسل، و ترکیب آنها به یک شبکه تصویر HR (درونیابی) که حاصل آن غلبه بر محدودیتهای تصویربرداری دوربین است.
اصول اولیه الگوریتم فراتفکیکپذیری مبتنی بر حرکت را با آزمایش بسیار سادهای که در شکل 1-3 نشان داده شده، توضیح میدهیم. مطابق شکل 1-3(الف)، صحنه متشکل از چهار پیکسل با وضوح بالا است. دوربین خیالی با حرکت کسری از پیکسل کنترل شده، متشکل از تنها یک پیکسل، قطاری از تصاویر را از این صحنه را ایجاد میکند. شکلهای 1-3(ب)-(ه)، چگونگی ایجاد این تصاویر را نشان میدهد. البته هیچ کدام از این تصاویر با کیفیت پایین نمیتواند جزئیات تصویر زمینهای را نشان دهد. با فرض این که تابع نقطه گستر (PSF)[1] دوربین خیالی (که پدیدهی ماتی نوری در یک دوربین را مدل میکند) یک تابع خطی شناخته شده است، و سطح خاکستری تمام پیکسل های مرزی صفر است، معادلات زیر، تصاویر کم وضوح تار شده را با نوع وضوح بالا مربوط با میسازد.
که و ، تصاویر کم وضوح ، X مقادیر سطح خاکستری پیکسل در تصویر با وضوح بالا،H عناصرPSF مشخص و v نویز تصادفی اضافه شده ازCCD به فریمهای کیفیت پایین است. در مواردی که نویز اضافه شده کوچک باشد، با حل مجموعه معادلات خطی فوق، میتوان مقادیر پیکسل وضوح بالا را بدست آورد. متأسفانه، همانطور که در بخش بعد خواهیم دید، فرض ساده مطرح شده در بالا به ندرت در شرایط واقعی معتبر خواهد بود.
فراتفکیک پذیری در بسیاری از زمینهها مطرح میشود، مانند:
– ویدیو نظارتی [12،13] : بزرگ نمایی منطقه مورد نظر (ROI) در ویدئو برای درک انسان (به عنوان مثال دیدن پلاک خودرو در ویدئو)، افزایش وضوح تشخیص هدف اتوماتیک (به عنوان مثال سعی به تشخیص چهره جنایتکار) .
– سنجش از راه دور [14] : چند عکس از یک منطقه گرفته میشود، و یک تصویر با وضوح بهبود یافته را میتوان یافت.
– تصویربرداری پزشکی (CT، MRI، اولتراسوند و غیره) [18-15] : چند تصویر با وضوح محدود را میتوان به دست آورد، و روش SR میتواند به منظور افزایش وضوح استفاده شود.
– تبدیل استانداردهای ویدئویی، به عنوان مثال تبدیل سیگنال ویدیویی NTSC به سیگنال HDTV.
با این حال، خواهیم دید که فراتفکیکپذیری، مسئلهای با محاسبات پیچیده و بدحالت است. تمامی این موارد فراتفکیکپذیری را به یکی از جذابترین زمینه های تحقیقاتی در پردازش تصویر تبدیل کردهاست.
1-1- فراتفکیک پذیری به عنوان یک مسئله معکوس
الگوریتمهای فراتفکیک پذیری در تلاشند تا تصویری با وضوح بالا را که توسط محدودیتهای یک سیستم تصویربرداری نوری خراب شده است، بازسازی کنند. این نوع مسئله یک مثال از مسئله معکوسی است، که در آن منبع اطلاعات (تصویر با وضوح بالا) از دادههای مشاهده شده (وضوح تصویر کم و یا تصاویر) تخمین زده میشود. به طور کلی، در حل مسئلهی معکوس نیاز به ساخت یک مدل رو به جلو است. رایجترین مدل رو به جلو برای حل مسئله فراتفکیک پذیری، خطی و به صورت زیر فرموله میشود.
که در آن تصویر و یا مجموعه ای از تصاویر کم وضوح، تصویر مجهول با وضوح بالا و نویز تصادفی ذاتی در سیستم تصویربرداری است. در این رابطه تصاویر ورودی و خروجی سیستم را بصورت برداری در نظر گرفته و از نماد و برای تاکید بر برداری بودن تصویر خروجی و ورودی استفاده میکنیم. در این فرمول، تصاویر به صورت بردار از جاروب تصاویر دو بعدی در امتداد سطرها بدست آمدهاند. ماتریس M در مدل مستقیم فوق نشان دهنده سیستم تصویربرداری، متشکل از فرآیندهای متعددی است که بر کیفیت تصاویر تخمین زده شده اثر میگذارد. سادهترین شکل ماتریس M همانی است، که سادهترین نوع این مسئله و بعنوان یک مسئله حذف نویز ساده در نظر گرفته میشود. مسائل جالب توجه تر (و سختتر برای حل) را میتوان با توجه به مدلهای پیچیده تر برای M تعریف کرد. به عنوان مثال، برای تعریف مسئله فراتفکیکپذیری در مقیاس خاکستری، یک سیستم تصویربرداری که شامل ماتی، تاری، و نمونه برداری با نرخ پایین از دادهها است را در نظر گرفتیم (در فصل 2 و 3 تعریف شده است). علاوه بر این، اضافه کردن فرآیند فیلتر کردن رنگ به مدل قبل، ما را قادر به حل مسئله موزائیک زدایی[1] چند قابی که در فصل 4 تعریف شده، میسازد.
[1] Demosaic
[1] Point Spread Function
[1] Super-Resolution
[2] Low Resolution
[3] High Resolution
[4] یک مسئله زمانی بدحالت (ill-posed) است که، الف) بینهایت جواب داشته باشد. ب) جواب منحصر بفرد نداشته باشد. ج) تغییر مقدار اولیه روی جواب نهایی بیتاثیر باشد.
[1] Charge Coupled Device
[2] Complementary Metal-Oxide-Semiconductor
فرم در حال بارگذاری ...