← 茶室 · 選樣偏誤與案例選取社研法 第 9 週
DSI ・ Geddes ・ Collier
第 9 週 ・ 4/21 ・ WEEK 9

選樣偏誤與案例選取

SELECTION BIAS AND CASE SELECTION

三篇文獻的對話:King, Keohane & Verba (1994, ch.4)Geddes (1990)Collier, Mahoney & Seawright (2004, ch.6)
從統計直觀,到質性反思,再到有限的辯護——一個方法論問題如何被三代學者反覆磨亮。

社會研究法 ・ 葉崇揚 東吳大學社會學系 2026 春學期

為什麼把三篇一起讀

WHY THESE THREE PAPERS 01 ・ 引入

選樣偏誤(selection bias)是質性比較研究最常被量化學者質疑的方法學問題。本週把三篇代表性文獻合讀,看同一個問題如何在不同立場下被提出、接收、修正。

1990

Geddes

"How the Cases You Choose..."

首次把「在依變項上選樣」寫成方法學通則,提出三種典型錯誤;對比較政治學影響深遠。

1994

King, Keohane & Verba

DSI, Chapter 4

把選樣偏誤放進統計推論的框架,主張無變異設計「甚麼都學不到」。

2004

Collier, Mahoney & Seawright

Rethinking Social Inquiry, ch.6

質性研究者的回應:DSO vs CPO,為「無變異設計」做有限但穩健的辯護。

為何對社會政策研究格外重要?我們研究的對象多是「已經發生政策改革」的國家、「已採行某制度」的地方政府。這正是 Geddes 口中最容易出問題的選樣方式。

什麼是「在依變項上選樣」

SELECTION ON DEPENDENT VARIABLE

DSI 所謂的選樣偏誤指的是:「依變項的取值影響了案例是否進入樣本」。常見三種樣態:

truncation

截尾

依變項某值以上或以下的觀察值全部被排除。

self-selection

自我選擇

研究對象自行決定是否被觀察到(如政策計畫的參與者)。

censoring

篩選

觀察到特定狀態才進入分析(如只看「已發生緊縮」的案例)。

三種樣態統計後果相似:X 與誤差項 ε 出現相關,因果係數被壓平。

在無變異設計(no-variance design)中,沒有任何因果槓桿。若不同時納入依變項取其他值的情形,就學不到任何關於依變項原因的事。 — King, Keohane & Verba (1994: 129–130)

截尾如何壓平斜率

INTERACTIVE: TRUNCATION DEMO ★ 互動

假設真實關係是 Y = α + βX + ε,β > 0。若僅保留 Y 高於某值的觀察值,樣本中 X 與 ε 出現負相關,迴歸係數被壓平、甚至反轉符號。

拖動黃色虛線體會斜率變化
↕ 上下拖曳下方黃色虛線(截尾線);空心圈為被排除案例
完整斜率 β̂ = 截尾後斜率 β̂ = 保留案例數 n =
真實迴歸線 截尾後迴歸線 截尾線(可拖拉) 保留案例 排除案例

觀察重點:把截尾線拉高,樣本數變少,紅線逐漸變平;極端時,紅線甚至可能呈現反符號的斜率。

樣本量也救不了

N CANNOT FIX TRUNCATION

DSI 最反直覺的結論:如果只「隨機地」從依變項高值區段抽樣,案例數再多偏誤也不會消失。截尾改變的不是代表性的機率,而是結構性的 X 與誤差相關

對質性研究者的警示:「我專挑已經轉型成功的國家,但我在其中隨機抽」並不構成有效辯護。 — DSI 對「隨機性」的限制

對社會政策研究的具體意涵:研究長照改革時多數只看「已建立制度的國家」;研究年金改革時只看「已發生緊縮」的個案;研究貧窮方案時只看「參與者」。若要談改革成敗的原因,這些樣本的設計本身就讓我們無法回答問題。

錯誤一 ・ 只研究成功案例

PITFALL #1: STUDYING ONLY SUCCESSES
PITFALL ・ 01

只研究成功的,歸納成功的原因

最常見的錯誤:只研究「成功轉型的國家」、「推動改革成功的政府」、「脫貧的家戶」,然後從中歸納「成功的原因」。這類研究不可能告訴我們「為什麼其他案例沒有成功」——因為那些案例根本沒被觀察到。

社會政策範例

東亞「發展型福利國家」的爭議

Holliday (2000) 與 Kwon (2005) 依台、日、韓案例提出「生產主義福利資本主義」。Peng & Wong (2008) 納入泰、馬、菲後發現,「生產主義」特徵在東亞內部的差異遠大於先前宣稱。這是典型的「只看成功工業化案例」所產生的選樣偏誤。

看案例 ・ 「成功者偏誤」在管理學的經典版本
《從 A 到 A+》與倖存者偏差

Jim Collins《Good to Great》(2001)研究 11 家「從平庸躍升卓越」的美國公司,歸納 7 個成功要素(如「第五級領導」「飛輪效應」)。書賣四百萬本、影響全世界 MBA。

但 Phil Rosenzweig《The Halo Effect》(2007)指出致命漏洞:Collins 只挑「事後看起來成功」的公司——這正是 Geddes 講的在依變項上選樣。如果同時也有失敗的公司具備那 7 項特質呢?這個書根本沒查。

更難堪的:Collins 書出版後 5 年,11 家「卓越」公司中有 5 家股價跌破市場、2 家瀕臨破產。「成功學」的方法論破綻是同一回事——看不到反例的研究,學不到因果

看案例 ・ 台灣本土:「為什麼台灣的健保成功?」
少了「為什麼別的國家沒成功」這個對照

台灣健保研究汗牛充棟,多數結論:1995 上路的成功歸功於「強單一保險人+政府議價力+家戶共擔」。看起來一切合理。

但這類研究幾乎沒有納入同時期未成功建立全民健保的國家(如菲律賓 1995、印尼 1990s)。如果這些國家也試過類似制度卻失敗,台灣的「成功要素」就需要被重新審視。

Wong (2004) 的 Healthy Democracies 才認真做了這個比較——納入韓國(成功)、台灣(成功)、泰國(部分成功)、菲律賓(失敗),結果發現「民主競爭強度」才是關鍵變項,而非單一保險人設計。這是把樣本拉開後才看得到的因果。

看案例 ・ 醫學裡的「倖存者偏差」
二戰返航戰機的彈痕分析

美軍二戰時要決定戰機應該加強裝甲哪些部位。工程師統計「返航戰機」的彈痕分布:機翼、機尾彈痕最多,於是建議加強這些地方。

數學家 Abraham Wald 推翻:你看到的是能飛回來的戰機。彈痕集中在機翼機尾,正說明這些位置就算被打中也能飛回——真正應該加強的,是「沒有彈痕」的位置(引擎、駕駛艙),因為打中那裡的飛機根本飛不回來、沒進你的樣本。

同樣的邏輯:研究「成功的福利改革」時,沒被研究的失敗案例,可能正是真正的因果關鍵。

錯誤二 ・ 在依變項上的極端值選樣

PITFALL #2: EXTREME-VALUE SELECTION
PITFALL ・ 02

選極端案例對照常模

第二種錯誤:選「極端案例」對照常模。譬如研究「福利國家慷慨程度的成因」,卻只選瑞典、挪威、丹麥與美英對照。這種對比雖有啟發,但容易把地理相近、語言相近、歷史相近等額外變項也同時固定,造成自變項與誤差項共變。

社會政策範例

「北歐 vs. 美英」的方法論陷阱

常見的福利國家文獻:以北歐三國對照美英兩國,得出「左派執政→慷慨福利」的結論。但這五國同時也共享了完全不同的歷史路徑、語言文化、人口規模——這些都是潛在的混淆變項,被研究設計直接忽略。

看案例 ・ Pierson 1994 與「兩極比較」的限制
福利緊縮研究的開山之作

Paul Pierson《Dismantling the Welfare State?》(1994)只比較柴契爾的英國雷根的美國——兩個都是新右派政府上台、都試圖砍福利的案例。結論:「責難規避」(blame avoidance)是緊縮政治的核心策略。這個命題影響了後續 30 年的福利國家研究。

方法學批評:英美兩國同時是「自由主義福利體制」「多數決選舉制度」「盎格魯薩克遜文化」。Pierson 看到的「責難規避」可能來自任何一個共同變項,不見得是新右派意識型態。

Green-Pedersen (2002) 與 Starke (2006) 補上北歐(丹麥、瑞典)的緊縮案例後發現:責難規避只是策略之一,社會民主國家的緊縮反而走「協商共識」路線。Pierson 沒錯,但他的命題範圍被高估了。

看案例 ・ 教育政策研究中的「明星國家偏誤」
芬蘭奇蹟與北歐崇拜

2000 年代 PISA 評比後,芬蘭成為全球教育研究的「聖杯」。教育學者紛紛取經:「為什麼芬蘭能?」答案總是繞回「教師地位高」「不分流」「不考試」。

但 Pasi Sahlberg 自己(芬蘭教育學者)指出方法學陷阱:芬蘭跟它鄰近的瑞典、挪威其實在制度上很像,但 PISA 表現差距很大。如果只研究芬蘭,看不到「同樣的制度為什麼在不同國家結果不同」。

更慘的是:2015 年後芬蘭 PISA 排名一路下滑。如果當年的「成功要素」是真的,為什麼 10 年後就不靈了?這提醒我們:抓著明星案例做歸納,是一種反覆會被打臉的研究設計

看案例 ・ 台灣本土:「台灣經驗」研究的陷阱
當「台灣特殊論」遇上方法學審查

台灣社會科學常出現「以台灣對照美國(或瑞典、或日本)」的研究——這幾乎全部踩在 Geddes 第二類錯誤上。

典型例子:「台灣健保 vs. 美國醫療」的比較研究,得出「台灣勝在政府介入」。但這兩國同時還差人口規模、政治制度、移民構成、種族異質性、地理範圍——任何一個都可能是真正的因。要做有效比較,至少需要納入「同樣有國家健保」的韓國、日本,與「同樣是市場主導」的瑞士、德國,才能把「政府介入」這個變項真正分離出來。

建議:碩論若要做「台灣 vs. 某國」,務必在文獻回顧明確處理混淆變項,並把命題範圍寫死。

錯誤三 ・ 把時間序列端點當變化

PITFALL #3: TIME-ENDPOINT SELECTION
PITFALL ・ 03

從一個高峰寫到另一個谷底

第三種錯誤:從一個「高峰」寫到另一個「谷底」。事件本身的高峰與谷底是被選擇出來的。若起點與終點都是研究者刻意挑選,因果趨勢很可能是看圖說故事

社會政策範例

Universal Credit 的貧窮效應評估

僅以 2008–2015 年為觀察區間,貧窮率下降的證據看似強;但這段期間跨過 2010 年緊縮與 2013 年稅改,起點與終點都是研究者刻意挑選。若擴展到 2020 年疫情加碼與 2022 年通膨侵蝕,同一工具的「效果」會呈現完全不同的面貌。

GEDDES 的警語

不是所有問題都能用小樣本比較研究回答。有些問題必須擴大樣本、甚至借用量化資料,才能避免把極端值當成通則。
看案例 ・ 「健保不破產論」與「健保即將破產論」
同一個資料、不同時間端點,得到完全相反的結論

2010–2018:台灣健保安全準備金穩定、年年小幅盈餘。當時很多研究結論:「健保財務穩健、無立即破產風險」(行政院 2017 報告)。

2020–2024:疫情後醫療使用量激增、人口老化加速、新藥納入支出爆增。研究風向轉為:「健保財務岌岌可危、需大幅調漲費率」。

同一個健保、同一批資料庫,選不同時間端點,得到相反結論。這就是 Geddes 警告的時間端點選樣陷阱——做政策研究的學者要常自問:「為什麼我選這段時間?換成另一段呢?

看案例 ・ 美國犯罪率下降的「眾說紛紜」
「破窗理論」、「墮胎合法化」、「鉛汞污染」——誰是真因?

美國犯罪率從 1990s 中期到 2014 年大幅下降。各派學者爭功:

  • 朱利安尼派:紐約「破窗執法」(1994 起)有效
  • Levitt & Donohue:1973 墮胎合法化,20 年後犯罪人口減少
  • Reyes:1970s 鉛汽油被禁,鉛中毒兒童減少 → 成年後犯罪傾向降低
  • 還有人說:人口結構變化、警力增加、毒品市場轉型⋯⋯

每個解釋都有「對的時間端點」可以支持自己。但 2014 年之後犯罪率又回升——上述任何單一理論都解釋不了這個轉折。這顯示:選對時段可以講通任何因果故事,跨越時段就破功

DSO vs CPO ・ 兩種證據

TWO TYPES OF EVIDENCE

Collier, Mahoney & Seawright (2004) 的核心貢獻:引入「資料集觀察」(DSO)與「因果過程觀察」(CPO)的區別。

DSO ・ data-set observation

資料集觀察

填入資料表格的「列列欄欄」。每個觀察值都是同質的、可加總的——這是迴歸分析的標準資料形式。

例:18 個 OECD 國家、2000–2020 年、每國每年的工會密度與社會支出。

CPO ・ causal-process observation

因果過程觀察

研究者對特定案例「內部機制」的深入理解:關鍵人物的動機、制度轉折點上的非慣例文件、行動者當時的認知。

例:1995 年台灣全民健保立法時,李登輝政府如何擺平醫師公會反對、勞委會內部關於費率的攻防文件。

關鍵:CPO 無法化約成表格列,但對假說檢驗的貢獻可能非常大。一篇關鍵的會議紀錄、一個轉折點的見證敘述,可以推翻整個理論。

看案例 ・ Skocpol 1979:三場社會革命的 CPO 拆解
用「機制」抵抗「樣本太小」的批評

Theda Skocpol《States and Social Revolutions》(1979)只比較三個案例:法國(1789)、俄國(1917)、中國(1949)。N=3,量化標準下這是「不能做推論」的研究。

但 Skocpol 用大量 CPO 證據建立因果機制:每個案例都有「國家危機 + 農民起義 + 國際軍事壓力」三個條件同時出現。她拿出來的是:

  • 路易十六召開三級會議的具體決策記錄
  • 俄國 1905 革命後農民暴動的省級資料
  • 清末新政期間地方官員的奏摺

這些不是「資料表的一列」,而是「機制如何運作」的厚實證據。對於 N=3 的研究,CPO 的厚度可以彌補案例數的薄弱——這就是 Collier 等人的核心辯護。

看案例 ・ 台灣健保立法的 CPO:勞委會內部攻防
沒有 CPO 就看不到的因果機制

1995 年 3 月健保上路前 6 個月,勞委會(今勞動部)和衛生署(今衛福部)為「保費由誰負擔」打了一場硬仗。DSO 看不到這個過程——資料表上只有「1995 年 3 月健保上路、保費分擔比例 6:3:1」這一列。

但 CPO 可以看到:

  • 勞委會內部 1994 年 11 月會議紀錄:強烈反對「雇主負擔 6 成」
  • 立法院厚生會 1995 年 1 月攻防:王金平協調的關鍵會議
  • 產業界遊說書信(中華民國工商協進會、工總、商總提交的意見書)
  • 行政院政務委員蕭慶倫的折衷方案(最終版本)

有了這些 CPO,研究者可以說:「健保的成功,不是因為李登輝有遠見,而是 1994–95 年的政商博弈裡,哪些行動者的什麼算計讓特定方案勝出」。這種因果機制的厚實,是純跨國迴歸永遠看不到的。

看案例 ・ 怎麼用 CPO 證明「不存在」?
「銀器測試」與「鐵牙測試」

Stephen Van Evera 把 CPO 證據分強弱:

  • 稻草人測試(straw-in-the-wind):證據出現有點意義,沒出現也不算反證
  • 箍環測試(hoop test):證據必須出現,否則理論被推翻;但出現也不充分證明
  • 銀器測試(smoking gun):證據出現就足以證明,但沒出現也不算反證
  • 鐵牙測試(doubly-decisive):必須出現且充分——最強的 CPO,但很罕見

例:研究「健保立法是因為李登輝個人意志」這個假說。箍環測試:李登輝 1994 年的講稿、日記、與幕僚會議紀錄裡,必須有他主動推動健保的具體證據;如果完全沒有,這個假說就被推翻。CPO 的強度,決定了一個案例研究能不能取代多案例迴歸。

為「無變異設計」辯護

DEFENDING NO-VARIANCE DESIGN

DSI 主張無變異設計「甚麼都學不到」。Collier 等人則主張:在某些情境下,單看一組依變項同值的案例仍可以做機制檢驗

關鍵在於:研究者不是想估計平均因果效果,而是檢驗一個特定機制是否在案例內存在。Skocpol (1979) 對法、俄、中三場革命的機制拆解便是經典例子——三個案例的依變項都是「成功的社會革命」,但她要回答的是「這個機制是否運作」,而非「這個自變項的平均效果」。

如果研究問題真的是「為什麼成功/失敗」這類比較式問題,那麼在依變項上選樣確實會讓推論失效。但如果研究問題是「這個機制是否在此處運作」,那麼這類批評就不完全適用。選樣偏誤的診斷,不能跳過研究問題本身是甚麼。 — Collier, Mahoney & Seawright (2004) 的有限辯護

DSI vs Collier 對照

DSI VS. COLLIER ET AL. 總整理
議題 DSI (1994) Collier et al. (2004)
無變異設計 沒有因果槓桿,甚麼都學不到。 可做機制檢驗,但不能做平均效果估計。
在依變項上選樣 幾乎總是偏誤;擴大樣本再說。 視研究問題而定;若問機制,仍可接受。
資料型態 以 DSO 為主,CPO 僅是軼事。 DSO 與 CPO 並列,都能對假說做出貢獻。
方法策略 增加觀察、隨機化、控制變項。 過程追蹤、關鍵見證、文獻交叉比對。
對台灣研究的意義 研究「為何台灣建健保」,要納入未建健保的國家做對照。 研究「健保立法時,政策企業家的動員機制」,可單看台灣,但要厚描證據。

四個社會政策案例

FOUR CASES 點選分頁切換

案例一 ・ 福利體制的分類擴張

Esping-Andersen (1990) 以 OECD 18 個高所得國家為對象,提出自由主義、保守主義、社會民主三種體制類型。這是比較社會政策最具影響力的分類。然而後續研究發現:當分析擴展到東亞、拉美、後共時,三分類即不再完整。

  • Castles & Mitchell (1993):補上「激進主義」(antipodean)類型。
  • Ferrera (1996):提出南歐類型。
  • Gough (2004):在低所得國家中應改談「非正式保障」。
方法學教訓:Esping-Andersen 的原始設計其實是在依變項(福利國家成熟度)上篩選樣本。隨著樣本擴展,類型邊界必須被重新劃定。這正是 Geddes 所警告的「成功案例選樣」的後果。

案例二 ・ Pierson 的責難規避理論與樣本範圍

Pierson (1994, 1996) 以英、美兩案例提出福利國家緊縮時期的「責難規避」(blame avoidance)理論,主張緊縮政治下決策者的動機與擴張時期截然不同。這個命題影響力極大。

但批評者(Green-Pedersen 2002;Starke 2006)指出:Pierson 的兩個案例恰好是「改革艱難、政黨競爭激烈」的情境。若納入北歐(丹麥、瑞典)的大型退休金改革,責難規避只是眾多策略之一。

折衷解讀:Geddes 第二類錯誤(極端值選樣)與 Collier 等人的區分同時出現。Pierson 談的是機制(CPO 很豐富),擴展樣本不一定否定其洞見,但絕對應該限制命題的推論範圍

案例三 ・ 活化政策是否拉低貧窮?

歐洲自 1990 年代後期大量採行活化政策(activation policies),Bonoli (2010) 稱之為社會投資轉向。

許多早期研究僅以成功案例(丹麥、瑞典)為證,主張活化能降低貧窮;然而後續將樣本擴及德國 Hartz IV 改革與英國 New Deal,發現活化若搭配低保給付的削減,反而可能加深工作貧窮(Jessoula et al. 2010;Knotz 2020)。

方法學教訓:這是 DSI 所提醒的截尾偏誤——只看「已加強活化的國家」並觀察貧窮變化,我們無法估計活化的純粹效果,因為同一時期北歐的勞動市場制度、工會密度、集體協商範圍也都是高水準,形成混淆。

案例四 ・ 台、德、日、韓四國的長照改革推動條件

比較長照改革常見的問題:我們傾向只研究「已建立長照保險或長照體系」的國家。台灣長照 2.0、日本介護保險、德國 Pflegeversicherung、韓國老人長期療養保險看似走了相似的路,但「為什麼這四國先走」與「為什麼其他國家沒走」這個問題,幾乎沒有被處理過。

Campbell, Ikegami & Gibson (2010) 指出:若要回答後者,就必須納入未建立長照保險的國家(如義大利、西班牙)作為對照。

台灣本地啟示:多數研究聚焦於已接受服務者的滿意度與使用模式,忽略「符合資格但未進入服務」的群體。若要回答「為何該接受卻未接受」,必須重新設計樣本(從資格界定、名冊比對、非使用者訪談切入)。
選樣偏誤不是量化研究的專有病灶——它就在我們日常的文獻生產中。差別在於:量化研究可以用模型寫出偏誤大小,質性研究則必須依賴研究者自己對案例結構的警覺。 — 跨案例共同教訓

研究設計階段

DESIGN PHASE 建議 1/3
STAGE 01 ・ DESIGN

先想清楚「依變項是什麼」

  • 明確寫下依變項,自問:「這個依變項的哪些值沒有進入我的樣本?」
  • 若樣本只保留「已採行某政策」的單位,必須在研究問題上限縮,改問「機制如何運作」而非「為何採行」。
  • 若要問「為何採行」,至少納入一個「類似處境但未採行」的對照案例(Geddes 的最低限度建議)。
  • 對照案例的選擇:相似條件、相反結果(最相似系統設計,MSSD)。

資料蒐集階段

DATA COLLECTION 建議 2/3
STAGE 02 ・ COLLECT

建立完整的母體清單

  • 建立完整母體清單,標示納入/不納入的案例及其排除理由。
  • 善用 Collier 等人的 CPO 觀念:關鍵文件、見證敘述、非慣例事件,可大幅強化推論。
  • 若研究台灣,國史館檔案、立法院公報、行政院記錄、媒體口述史都是 CPO 的潛在來源。
  • 將「未進入樣本的案例為什麼不在」也記錄在研究筆記中——這是論文寫作時的辯護彈藥。

論文寫作階段

WRITING PHASE 建議 3/3
STAGE 03 ・ WRITE

把選樣邏輯寫進方法章節

  • 把「研究範圍條件」(scope conditions)明確寫進命題,避免過度延伸。
  • 在方法章節以一小節討論選樣偏誤的可能性與因應策略;這幾乎是歐洲社會政策期刊(JESP、JSP、SP&A)審查人的標準提問。
  • 若評審質疑,引用 Collier et al. (2004) 的 CPO 論點做限定辯護,而非主張「自己沒有偏誤」——後者幾乎一定失敗。
  • 避免把「資料可得性」當成案例選擇的理由——這是審查人最容易抓的弱點。

互動 ・ 診斷你的研究設計

DIAGNOSTIC TOOL ★ 三題快測

想像你有一份研究計畫想送出去。回答下面三個問題,看看你的設計會不會被審查人挑出選樣偏誤。三題只需 30 秒

問題 1 / 你的依變項是什麼樣的「事件/結果」?
想想你的研究目標——你在解釋什麼?
問題 2 / 你的研究問題是哪一型?
這個問題決定了選樣偏誤是否會傷到你。
問題 3 / 你的對照案例設計?
「沒發生事件」的案例你納入了嗎?

自我測驗 Q1

CONCEPT 1/5
概念辨識

下列哪一項最準確描述 DSI 對「選樣偏誤」的核心批評?

正解:B。DSI 的核心批評是統計推論層面的:選樣機率與依變項相關,會導致 X 與誤差項相關,迴歸係數被壓平(甚至反符號)。重點不在樣本大小,而在結構性的相關。樣本量再大也不能解決這個問題。

自我測驗 Q2

METHODOLOGY 2/5
方法論辯

Collier、Mahoney & Seawright (2004) 對「無變異設計」最主要的辯護是?

正解:C。Collier 等人的核心辯護建立在「研究問題的不同」之上。當問題是「機制是否在此處運作」(mechanism check),而非「X 對 Y 的平均效果為何」(effect estimation),就可以透過 CPO(深度的案例內部證據)來檢驗,無變異設計仍有意義。Skocpol 對三場社會革命的研究是經典例子。

自我測驗 Q3

APPLICATION 3/5
社會政策應用

台灣長照 2.0 研究若只分析「已接受服務者」,最直接犯了哪個 Geddes 警告的錯誤?

正解:A。「已接受服務」本身就是依變項上的篩選——只看「進入了服務」的人,等於忽略「符合資格但未進入服務」的群體。要回答「誰在使用、誰在被排除」這類問題,必須重新設計樣本,從資格界定、名冊比對、非使用者訪談切入。

自我測驗 Q4

DSO vs CPO 4/5
證據型態

下列哪一個是 Collier 等人所說的「因果過程觀察 (CPO)」的典型例子?

正解:C。CPO 是研究者對特定案例內部機制的深入理解——關鍵會議紀錄、轉折點上的非慣例文件、行動者當時認知。這類證據無法化約為資料表的列列欄欄,但對假說檢驗的貢獻可能很大。A、B、D 都是 DSO(資料集觀察)。

自我測驗 Q5

PRACTICAL DEFENSE 5/5
論文辯護

如果評審質疑你的論文有選樣偏誤,下列哪種回應最有可能成功

正解:B。當評審指出選樣偏誤時,最務實的回應是「限縮研究問題引用 Collier 的 CPO 辯護」。把命題從「為什麼這四國建長照」收斂為「在這四國裡,這個機制如何運作」,並用厚實的案例內部證據(會議紀錄、政策文件、訪談)支撐——這是 Pierson、Skocpol 等人實際採用的策略。主張「自己沒有偏誤」幾乎一定失敗。

課堂討論

CLASS DISCUSSION 點選展開提示
問題一
台灣的長照 2.0 研究幾乎都在分析已接受服務者。若要研究「為何該接受卻未接受」,你會如何重新設計樣本?
提示:從資格界定、名冊比對、非使用者訪談切入。可參考衛福部的 ADL/IADL 評估資料、長照需求調查與實際使用率的差距。
問題二
東亞福利國家文獻的選樣,能否用 Collier 等人的「無變異設計+CPO」來辯護?這樣的辯護在此是否成立?
提示:比較 Haggard & Kaufman (2008) 與 Peng (2011)。前者偏「比較式問題」(為何成功),後者偏「機制檢驗」(社會投資的政治條件)。
問題三
你手上正在寫的論文,選案例的理由是什麼?如果今天由 Geddes 審你,她會挑出哪個偏誤?
提示:誠實列出你排除的案例排除的原因。「資料可得性」常常是真實理由,但很少被寫進論文——而它正是審查人最容易抓的點。

本講小結

KEY TAKEAWAYS 收束
選樣偏誤是跨典範的共同議題:DSI 講成統計問題,Geddes 擴展為質性方法學反思,Collier 等人為質性做法提供有限但穩健的辯護。
對社會政策研究者,最關鍵的自覺是「哪些案例不在我的樣本裡」,以及「它們的不在場是否改變了我的結論」。
研究設計與寫作階段都應明確處理樣本邏輯:把範圍條件寫進命題,並用 CPO 補強因果推論

延伸閱讀

FURTHER READING

每筆連結到 Google Scholar 搜尋結果(可查證、找全文、找後續引用)

切換頁面 Esc 目次 F 全螢幕

目次 ・ Table of Contents

點選任一條目跳到該頁