第2章 好樣本和壞樣本

怎樣可以取得爛樣本


取道爛樣本比取到好樣本來得容易。

有偏抽樣法

如果統計問題的設計使得結果總是往某個方向偏,我們就稱這個設計是有偏的。

從母體抽樣時,如果選最容易取得的,叫做方便抽樣(convenience sampling)。

自發性回應樣本(voluntary response sample)則是經由對某一訴求的回應而自然形成的。

寫應(write-in)或叩應(call-in)意見調查都是自發性回應樣本的例子。方便樣本及自發性回應樣本常常是有偏的。


寫應和叩應的意見調查,幾乎一定會導致有高度偏差的結果。事實上,只有 15﹪的人曾經叩應去回覆意見調查,而這些人可能也會打電話到廣播電台的叩應節目去。對於整個人口來說,這些人並不構成具代表性的樣本。

簡單隨機樣本


自發性回應樣本,是由人們自行決定要不要回應;而方便樣本則是由訪談決定的。在這兩種情形當中,都是由於人為因素而造成偏差。統計學家的補救方法,是利用不牽涉人為選擇的「機遇」(chance)來選取樣本。

用機遇選出的樣本,既不會受取樣者的偏好所影響,也不會有回應者的自行加入。用機遇選樣本,是藉由給每個個體有同樣的中選機會,來消除偏差。


◎簡單隨機樣本
大小為n的簡單隨機樣本(SRS,simple random sample)是有n個個體的樣本。其選取的方法,是使得母體中任一組n個個體,中選的機率都相同。


◎用兩個步驟選取SRS

步驟1:編代碼
對個體中每一個個體,指定一個數字代碼。要確定每個代碼都是同樣的位數。

步驟2:用表
利用隨機數字來隨機選取代碼。
抽樣調查是用電腦軟體來抽取SRS,但是所用的軟體,也就是把例3中的步驟「自動化」而已。電腦不用去查隨機數字表,因為它自己就可以隨時產生出隨機數字。

樣本可靠嗎?


對於任何一個樣本,要問的第一個問題就是:樣本是不是隨機抽取的?


網路尋奇


go to http://www.misterpoll.com

「網路民調沒有一個是很科學的,但是的確代表所有參與者的集體意見。」


go to http://www.randomizer.org