Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

民意調查的抽樣 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 抽樣原理 隨機抽樣 等距抽樣 分層分段抽樣 非隨機抽樣.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "民意調查的抽樣 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 抽樣原理 隨機抽樣 等距抽樣 分層分段抽樣 非隨機抽樣."— Μεταγράφημα παρουσίασης:

1 民意調查的抽樣 蔡佳泓 政大選舉研究中心 副研究員

2 課程大綱 抽樣原理 隨機抽樣 等距抽樣 分層分段抽樣 非隨機抽樣

3 抽樣原理 (1) 由於我們不可能訪問母體中所有的個體,所以 必須進行抽樣。 抽樣一定會有誤差,也就是根據樣本的調查結 果跟真實母體之間有一定的差距,稱為抽樣誤 差。 抽樣誤差代表一種區間,也就是樣本估計的結 果被包含在一定的上下限。

4 抽樣原理 (2) 抽樣誤差的估計為若干個樣本標準誤 σ /sqrt(n) 。 當我們做無數次抽樣之後,所得到的每一個樣 本平均值將形成一個常態分布。而這些樣本平 均值的離散程度就是樣本標準誤。 如果樣本抽的次數夠多,真正的母體平均值 μ 應該等於所有樣本平均值的平均值加減一定的 標準誤。 但是我們不可能抽無限次的樣本,只能假定單 一抽樣就代表無限次抽樣後的平均值。因此我 們對母體平均值的估計就是依照抽樣結果。

5 常態分布圖

6 抽樣原理 (3) 根據上圖,我們知道, 68% 的樣本平均 值會落在 μ 加減一個標準誤的範圍中。如 果是 μ 加減兩個標準誤的範圍,則會包含 95% 的樣本平均值。如果是 μ 加減三個標 準誤的範圍,則會包含 99% 的樣本平均 值。 換句話說, 68% 的樣本平均值加減一個 標準誤會包含 μ 。以此類推。

7 抽樣原理 (4) 而 σ 又是從樣本的資料估計得來: σ =sqrt(n/n-1)*s. s 為標準差, 計算方式為 sqrt[∑ (x i -x_bar) 2 /n-1] 。其中 x i 表示每一 個觀察值。 通常一個簡化的公式為設定 σ 等於 0.5 , 而抽樣誤差公式可以快速計算為 1/sqrt(n). 也就是樣本數的開根號的倒數。

8 信心水準與抽樣誤差 剛剛提到的 68% 或 95% 或 99% 通常稱為信心水 準。意思為抽 100 次樣本, 有多少比率的樣本 是我們確定會以一個特定區間包含母體平均數 μ 。 信心水準越高,所需要的區間也就越大, μ 的 上下限也就差距越大。所以信心水準跟抽樣誤 差之間必須取捨。通常我們是用 95% 信心水準, 對應兩個標準誤的抽樣誤差

9 信心水準與抽樣誤差試算 信心水準 68%95%99% 標準誤正負 1 正負 2 正負 3 抽樣誤差 0.5/sqrt(n)1/sqrt(n)1.5/sqrt(n) 試算抽樣 誤差 ( 假設 n=900) 正負 1.6% 正負 3.3% 正負 5%

10 信心水準與抽樣誤差例子

11 信心水準與抽樣誤差注意事項 上述的公式完全不考慮母體大小,只考 慮樣本數大小 。 根據上述的公式可以逆向推估需要的樣 本。 當母體非常小的時候, 例如低於 100 , 抽樣誤差已經沒有意義,可以考慮全查。

12 單純隨機抽樣 將每一個觀察值加以編號 依照亂數表選中一個號碼 每個觀察值應該有同樣的中選機率

13

14 等距抽樣 (1) 把全體總數 N 除以樣本數 n 得到 K ,起始為隨機 亂數抽出 R ,然後每隔 K 個抽出一個樣本, R , R+K , R+2K , R+3K ,一直到 R+(n-1)K 。 如果觀察值本身有分組, 則是依照各組人數從 小而大排列, 然後各組內再編號以方便抽出。 假如我們有 4800 個觀察值如下表,如何抽出 16 個樣本? 先抽一個亂數 6 ,然後每隔 300 就抽 一個。

15 等距抽樣 (2) 分組人數累積人數抽出樣本 , , ,1806, ,2706,3006, ,3906,4206,4506 總數

16 分層分段抽樣 (1) 主動將樣本分成若干層, 原則為層內同 質性越大越好, 層外同質性越小越好。 例如: 依照都市化程度分鄉鎮; 依照學 院特性分科系; 依照學校特色分學校 。 人數越多的層應該分到越多樣本;在各 層之下再分段以簡化抽樣。 每一人的中選機率仍然會相同。

17 分層分段抽樣 (2) 例如調查政大的學生對政大的認同感。 根據資料,博士班學生約 834 人,碩士班 約 4,570 人, 大學生約 9,404 人,總共 14,808 人。 若想抽出樣本 1,200 人,則博士班學生約 分配到 67 人,碩士班約 368 人, 大學生 約 765 人。

18 分層分段抽樣 (3) 學院個數累積 教育 233 國際事務 理 法 中選 傳播 文 中選 外語 1, 中選 社科 2, 中選 商 2, 總數 9,404765

19 分層分段抽樣 (4) 先決定要抽出五個學院, K 為 1880 。 然後抽出起始亂數為 1203 ,落在 法學院。 接下來為文學院,最後是 社科院, 有兩 個中選。 每個中選單位必須訪問 153 人, 共 765 人。 以傳播學院為例,中選機率公式為 (5*2556/9404)*(153/2556)=765/9404 。 而博士班以及碩士班中選機率皆同。

20 假設某一層涵蓋以下鄉鎮市 鄉鎮市 永和 * 新店 三重 * 中和 桃園 中壢 * 鳳山 板橋 新莊 *

21 分層分段抽樣應用 每個鄉鎮市抽出同樣數目的樣本 例如永和預計抽出 60 個樣本,便預計抽 出 3 個里, 每個里 20 個樣本,假設永和有 25 個里,假設每個里人口為 M ,每一人 的被抽取率為 [4*161139/ ]*[3*M/161139]*[20/M] =60/480874

22 加權 分層抽樣後,要對每一層做加權。加權 的權值為: W i = (N i /N) ╳ (n/n i ) 。因為: n i = (nN i )/N ,即每一層的樣本數等於全 部樣本數乘以每一層所佔的比例。 而每一層佔總樣本的比例為權值 n i /n , 乘以每一層的平均數( Σx i /n i ),相乘後 將得到 Σx i /n ,亦即全部樣本的平均數, 也就是對母體平均數的估計。

23 加權方式 通常我們如果有母體的交叉資料,例如 每一個縣市的教育程度或性別,我們可 以做「事後加權」。如果沒有的話,我 們做「反覆加權」,即先對一個類別做 加權,通過檢定後再做下一個加權,一 直到全部通過為止。

24 反覆加權 反覆加權的意思為先對某一變數加權, 若通過卡方檢驗,儲存資料後,再對另 一變數加權,然後再檢驗,然後再對另 一變數加權 通常加權的變數為性別、教育程度、年 齡、地區等

25 電話訪問之抽樣(一) 電話號碼簿抽樣 — 根據每個縣市之人口 比例決定樣本數,再根據電話號碼簿之 頁數決定平均每幾頁抽出一個樣本,在 那一頁以隨機方式決定那一欄第幾個號 碼為中選號碼 抽出中選號碼後可在尾數或後兩位尾數 加 1 或隨機處理,以找到未登記的號碼

26 電話訪問之抽樣(二) 電話號碼由局碼及後面幾位數字組合而 成,若已知所有局碼及後面有多少住宅 電號,則可進行兩階段抽樣,即先抽出 局碼再根據局碼後面的電話號碼數抽樣, 但是中華電信尚未開放此資料 目前台灣估計有 2600 個局碼,實際訪問 所得為 700 多個

27 非隨機抽樣 立意抽樣 配額抽樣 隨遇抽樣 雪球抽樣 非隨機抽樣無數學根據,無法據以推論 母體


Κατέβασμα ppt "民意調查的抽樣 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 抽樣原理 隨機抽樣 等距抽樣 分層分段抽樣 非隨機抽樣."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google