【俞振華觀點】選舉民調數字可信嗎?

圖片來源: freepik


選舉年一到,幾乎每週都會有不同類型的選舉民調數據出爐,讓人眼花撩亂。的確,針對候選人支持度的這些「賽馬式」民調數字,往往都能成為媒體報導的焦點。不過,這些數字究竟有多少可信度?有多少可被操作的空間?民調真的反應真實的選舉競爭態勢嗎?選民在看到這些數字前,應該要更瞭解這些數字究竟是如何產生出來的,才不致於受到民調數字的誤導,對選情產生誤判。

選舉民調當中,我們最常看到的調查方式,就屬電話民調了。近年來由於「唯手機族」(即只使用手機而不使用市話)的人口快速增加,很多全國性的調查都加入了手機樣本。但這種結合市話與手機樣本的調查方式,在今年地方選舉的調查中,卻不常見。主要還是因為手機調查沒有區域號碼,無法得知受訪者究竟是在哪個地區,必須要多增加一個題目來過濾受訪者的戶籍地。而這樣的過濾方式勢必大幅增加訪問成本,因此多數針對地方選舉的電話調查,仍是以傳統的市話調查為主,無法涵蓋唯手機族。

只用市話調查最顯著的問題,就是年輕受訪者的比例過低。以臺北市為例,20-29歲的民眾約佔全體市民的12-13%。但一般市話調查在沒有加權的情況下,所有受訪樣本當中,20-29歲受訪者的比例如果有6-7%就不錯了。於是,當我們透過加權,讓樣本的分佈比例和母體相當時,等於是將每個年輕受訪者意見當成兩個來用(即權重約為2)。雖然事後加權已是調查實務界普遍的作法,但這項作法是基於一個很強的假定:即受訪者的態度與未接受訪問的態度並沒有顯著的不同。如果接受市話調查的年輕族群與其他年輕族群(譬如唯手機族)的態度有很大不同時,加權兩倍等於讓樣本更加偏差。此外,由於市話調查中的年輕樣本數太少,我們在解讀年輕選民的態度時需要更注意,畢竟若存在少數幾個極端的樣本,則加總起來後,就有可能讓整群年輕選民的態度產生相當的偏誤,加權後甚至影響全體民眾的估計。總之,利用市話調查來解讀各年齡層對候選人的支持度時,對於年輕族群支持度的解讀要特別小心。

除了電話調查外,網路的普及性也使得近年網路調查蔚為風潮。此外,網路調查成本相對低廉,操作方便,在成本考量下,絕對比電話調查更容易產生數據。不過,網路調查最大的問題,就是缺乏科學性的隨機抽樣程序。就算某些網路調查號稱他們的樣本是從很大的資料庫中抽取,有「抽樣」的過程,但倘若資料庫不足以涵蓋絕大多數的選民,或加入資料庫的民眾都是自願參與者,則透過網路調查結果來推論所有選民時,仍然難以排除網路受訪者因「自我選擇參與」所造成的偏誤。換言之,除非這些自願參與網路調查的民眾能代表一般民眾,不然我們很難利用這樣的調查結果,來推論整體選民的投票意向。更有甚者,有些網路調查只是宣傳噱頭或單純為了衝網站流量,幾乎沒有參考價值。譬如一些新聞入口網站所做的調查,請網友點選支持哪位候選人,然後幾個小時後公佈結果。這種調查就只是有新聞性,我們甚至很難判斷是哪一類選民(甚至可能是「機器人」)會在網站上重覆點選某位特定候選人。總之,不論是哪種網路調查,我們都很難透過調查結果,精確地推論究竟哪位候選人真的領先。

民意調查雖然是以科學的方法探究民意,但不論採用何種調查方式,實際執行時都會存有諸多限制。民調數字更不等同於選舉預測。畢竟,支持者不見得最後一定會出來投票,因此調查時選民的投票意向與其最後的投票行為之間,肯定存在相當程度的落差。儘管如此,選前的民調數字仍然有助於我們瞭解,競選時候選人之間概括的競爭態勢。唯期許各民調機構本著誠信原則,忠實地呈現各項民調數字產出的經過,並清楚說明資料處理的步驟及方法。不然,如果民主會被「假訊息」所侵蝕,則選舉又何嘗不會被「假民調」所蒙蔽?