正文 計算機視覺的圖像處理技術(1 / 3)

完整的數字圖像處理技術一般可分為圖像信息的獲取、圖像信息的存儲、圖像信息處理、圖像信息的輸出和顯示等幾個方麵。

一、圖像數字化

(一)圖像數字化輸入設備

圖像信息的數字化主要目的是把一幅圖像轉換成適合輸入計算機或數字設備的數字信號,這一過程包括光電轉換、圖像攝取及圖像數字化等幾個步驟。通常圖像獲取設備有如下幾種。

1.CCD攝像機

CCD攝像機是使用最廣泛的圖像獲取設備之一。該設備具有小巧、速度快、成本低、靈敏度高等特點,可進行動態實時的圖像處理。缺點是灰度層次較差、非線性失真較大、有黑斑效應,在使用中需要校正。目前,CCD攝像機在分辨率、靈敏度等方麵已做到較高水平,1920×1035或1024×1024的高分辨率的CCD攝像機已很成熟。

2.數碼相機

隨著數碼科技和PC電腦的發展,數碼相機已逐漸成為首選的快速捕獲圖像的工具和計算機圖像信息輸入的設備。數碼相機是典型的光、機、電一體化產品。其特點是攜帶方便、操作簡單、精度較高、圖像清晰。數碼圖像的分辨率一般在幾十萬到幾百萬像素,有的甚至達到幾千萬像素。適合於作為進行靜態圖像處理的圖像捕獲設備。

3.掃描鼓

這是一種高精度的滾桶式圖像攝取設備。特點是精度高、分辨率高,可以輸入也可以輸出;缺點是價錢昂貴、速度低、維護要求高。多用於靜止圖像的輸入輸出設備。

4.掃描儀

這種設備具有中等精度和分辨率,600DPI精度的掃描儀已常見。掃描儀的成本很低,近幾年降價尤其顯著,一般台式的已降至數百元,所以是當今應用最為廣泛的圖像信息獲取設備。缺點是速度較慢,非實時設備。

5.其他

除了前麵談到的圖像捕獲設備外,還有一些特殊的圖像捕獲設備,如顯微光密度計、微波輻射計、多光譜相機、多光譜掃描儀、紅外攝像儀、多通道紅外掃描儀、各種雷達等設備。

(二)圖像信息的存儲

圖像信息的突出特點是數據量巨大。一般作檔案存儲主要采用磁帶、磁盤或光盤。為解決海量存儲問題,需要研究數據壓縮、圖像格式及圖像數據庫技術等。

(三)圖像的輸出與顯示

圖像處理的最終目的是為人或機器提供一幅更便於解釋和識別的圖像。因此,圖像輸出也是圖像處理的重要內容之一。圖像的輸出有兩種:一種是硬拷貝,另一種是軟拷貝。其分辨率隨著科學技術的發展而提高,至今已有2048×2048的高分辨率顯示設備問世。通常的硬拷貝方法有照相、激光拷貝、彩色噴墨打印等多種方法;軟拷貝方法有CRT顯示、液晶顯示器、場致發光顯示器等幾種。

(四)計算機視覺係統

主機配以圖像采集卡及顯示設備就構成了最基本的微型計算機視覺係統。目前,國產的CA540、Vp32、FGCT11010N8、CA-CPE-1000、CA-CPE-3000等圖像采集卡已商品化。多媒體係統中常用的Video Blaster也是一種較普遍的圖像卡。

微型計算機視覺係統成本低、設備緊湊、應用靈活、便於推廣。特別是微型計算機的性能逐年提高,使得微型計算機視覺係統的性能也不斷升級,加之軟件配置豐富,使其更具實用意義。

二、數字圖像文件格式

數字圖像處理通常會產生大量含有數字的圖像文件,而且每個文件數據量相當大,它們必須被存檔,而且經常需要在不同的用戶及係統間交換。這就要求有一些用於數字文件存儲和傳送的標準格式。

有許多數字圖像文件格式已被定義和使用。其中一小部分獲得了足夠廣泛的應用,或多或少成了事實上的標準。大多數商業化的圖像處理程序可以讀寫幾種流行的圖像文件格式。其他簡單的程序隻是讀取和顯示在不同文件格式中的圖像及從一種格式轉換為另一種格式。這些程序自動地檢測指定輸入文件的格式,這可通過利用文件擴展名或文件自身包含的格式信息來做到。將一幅顯示的圖像存為文件時,用戶可以指定文件格式。

大多數圖像文件格式除圖像數據外還存儲標簽注釋信息。這可能包括關於圖像創建及格式的數據,以及用戶提供的注釋。

單色顯示設備通常使用8bit數模轉換器電路產生視頻信號,控製屏幕上所顯示像素的亮度,這就提供了256級灰度能力。彩色顯示設備使用三個8bit數模轉換器產生三個視頻信號,分別控製所顯示圖像的紅、綠和藍分量的亮度。因此,它們具有224即超過1600萬種不同顏色的能力。但考慮到顯示管的不完善及人眼的局限性,實際上可辨別的顏色要少得多。

數字圖像不僅有單色和彩色兩種格式,而且有不同的光度分辨率(顏色數或灰度級數)。對單色圖像,最常見的灰度級數是2,16或256,對應於每像素1,4或8bit。這些特殊的灰度分辨率易於打包到內存和磁盤文件的8bit字節中。在某些應用中也使用其他不同的灰度分辨率。

調色板是一個查找表,它使每個像素值與對應的顯示顏色聯係起來,因而一幅4bit圖像使用調色板後,可以從顯示器理想狀態下能顯示的1600萬種顏色中選擇16種特定顏色進行顯示。定義具體圖像映射方式的調色板通常包含在圖像數據文件中,並且控製著觀察圖像或打印圖像時所用的顯示設備。常用數字圖像文件格式有如下幾種。

(一)BMP文件格式

BMP文件格式是一種較為常用的文件格式,是所有圖像格式中較為簡單的一種,也是Windows操作係統的標準文件格式,在BMP的非壓縮格式和Windows內存中的圖像組織方式極為相似。雖然大部分BMP文件是不壓縮的形式,它本身還是支持圖像壓縮的,如rle格式和LZW壓縮格式等。

BMP文件可用每像素1、4、8、16或24位來編碼顏色信息,這個位數稱作圖像的顏色深度,它決定了圖像所含的最大顏色數。一幅1bpp(bitpixel,位每像素)的圖像隻能有兩種顏色,而一幅24bpp的圖像可以有超過16兆種不同的顏色。

BMP文件的結構分為位圖文件頭、位圖信息頭、色彩表和位圖數據等4個主要部分。

位圖文件頭包含關於這個文件的信息,如從哪裏開始是位圖數據的定位信息;位圖信息頭含有關於這幅圖像的信息,例如以像素為單位的寬度和高度;色彩表中有圖像顏色的RGB值。對顯示卡來說,如果它不能一次顯示超過256種顏色,讀取和顯示BMP文件的程序能夠把這RGB值轉換到顯示卡的調色板來產生準確的顏色。

BMP文件的位圖數據格式依賴於編碼每個像素顏色所用的位數。對於一個256色的圖像來說,每個像素占用文件中位圖數據部分的一個字節。像素的值不是RGB顏色值,而是文件中色彩表的一個索引。例如在色彩表中,如果第一個RGB值是25500,那麼像素值為0,表示它是鮮紅色,像素值按從左到右順序存儲,通常從最後一行開始。所以在一個256色的文件中,位圖數據中第一個字節就是圖像左下角的像素的顏色索引,第二個就是它右邊的那個像素的顏色索引。如果位圖數據中每行的字節數是奇數,就要在每行都加一個附加的字節來調整位圖數據邊界為16位的整數倍。

並不是所有的BMP文件結構都有調色板,例如16和24bpp文件就沒有調色板表,像素值直接表示RGB值,另外文件數據部分的內部存儲格式也是可以變化的。例如在16和256色BMP文件中的位圖數據采用rle算法來壓縮,這種算法用顏色加像素個數來取代一串顏色相同的序列,而且,Windows還支持OS2下的BMP文件,盡管它使用了不同的位圖信息頭和色彩表格式。

(二)GlF文件格式

GIF圖像文件是麵向數據流的文件格式,GIF圖像文件格式能存儲單色圖像,但最好是16色以上的彩色圖像,它帶有色彩表,大量的優美彩色圖像以GIF圖像文件而存在。GIF圖像文件以它采取的複雜的圖像壓縮算法LZW而著稱,利於圖像的存儲,存儲效率高。GIF的特點還在於它支持多幅圖像定序或覆蓋,交錯多屏幕繪圖以及文本覆蓋。

(三)JPEG文件格式

JPEG是靜止圖像壓縮的一種標準。JPEG圖像文件格式是指經過JPEG技術壓縮後的圖像格式,是一種有損圖像的壓縮格式,也就是說圖像在壓縮成JPEG格式時可能會丟失一些信息。

JPEG首先將圖像分割成8×8小方塊,然後對每一方塊計算它的DCT變換,接下去對DCT係數進行量化,如果量化級少,結果圖像質量可能比較粗糙,失真較大;而量化級多,則結果圖像質量比較精細,但所需存儲的數據量也比較大。為了取得一個折中的方法,可以對低頻信號賦予較多的量化級,對高頻成分賦予較粗糙量化級,因為人眼對低頻信號的誤差比較敏感。在JPEG中,對低頻分量采用DPCM編碼,對高頻分量采用遊程編碼,最後對這些量化後的係數進行Huffman編碼或算術編碼,將數據流寫入一個輸出文件(*.jpg)。

(四)TIFF文件格式

TIFF文件格式是用來在不同應用和不同計算機平台之間文件互換,不是專門用於某一個係統的,沒有依附於某種專用軟件。TIFF圖像格式支持任意大小的圖像,從單色的二值圖像到24位的真彩色圖像。TIPF和GIF圖像文件格式一樣支持LZW壓縮算法,不同之處是TIFF的LZW壓縮算法支持圖像文件類型,而不是調色表。