研第 9 週・ 4/21 ・ WEEK 9

選樣偏誤與案例選取

SELECTION BIAS AND CASE SELECTION

三篇文獻的對話：King, Keohane & Verba (1994, ch.4)、Geddes (1990)、Collier, Mahoney & Seawright (2004, ch.6)。
從統計直觀，到質性反思，再到有限的辯護——一個方法論問題如何被三代學者反覆磨亮。

社會研究法・葉崇揚東吳大學社會學系 2026 春學期

為什麼把三篇一起讀

WHY THESE THREE PAPERS 01 ・引入

選樣偏誤（selection bias）是質性比較研究最常被量化學者質疑的方法學問題。本週把三篇代表性文獻合讀，看同一個問題如何在不同立場下被提出、接收、修正。

1990

Geddes

"How the Cases You Choose..."

首次把「在依變項上選樣」寫成方法學通則，提出三種典型錯誤；對比較政治學影響深遠。

1994

King, Keohane & Verba

DSI, Chapter 4

把選樣偏誤放進統計推論的框架，主張無變異設計「甚麼都學不到」。

2004

Collier, Mahoney & Seawright

Rethinking Social Inquiry, ch.6

質性研究者的回應：DSO vs CPO，為「無變異設計」做有限但穩健的辯護。

為何對社會政策研究格外重要？我們研究的對象多是「已經發生政策改革」的國家、「已採行某制度」的地方政府。這正是 Geddes 口中最容易出問題的選樣方式。

什麼是「在依變項上選樣」

SELECTION ON DEPENDENT VARIABLE

DSI 所謂的選樣偏誤指的是：「依變項的取值影響了案例是否進入樣本」。常見三種樣態：

truncation

截尾

依變項某值以上或以下的觀察值全部被排除。

self-selection

自我選擇

研究對象自行決定是否被觀察到（如政策計畫的參與者）。

censoring

篩選

觀察到特定狀態才進入分析（如只看「已發生緊縮」的案例）。

三種樣態統計後果相似：X 與誤差項 ε 出現相關，因果係數被壓平。

在無變異設計（no-variance design）中，沒有任何因果槓桿。若不同時納入依變項取其他值的情形，就學不到任何關於依變項原因的事。 — King, Keohane & Verba (1994: 129–130)

截尾如何壓平斜率

INTERACTIVE: TRUNCATION DEMO ★ 互動

假設真實關係是 Y = α + βX + ε，β > 0。若僅保留 Y 高於某值的觀察值，樣本中 X 與 ε 出現負相關，迴歸係數被壓平、甚至反轉符號。

拖動黃色虛線體會斜率變化

↕ 上下拖曳下方黃色虛線（截尾線）；空心圈為被排除案例

完整斜率 β̂ = — 截尾後斜率 β̂ = — 保留案例數 n = —

真實迴歸線截尾後迴歸線截尾線（可拖拉）保留案例排除案例

觀察重點：把截尾線拉高，樣本數變少，紅線逐漸變平；極端時，紅線甚至可能呈現反符號的斜率。

樣本量也救不了

N CANNOT FIX TRUNCATION

DSI 最反直覺的結論：如果只「隨機地」從依變項高值區段抽樣，案例數再多偏誤也不會消失。截尾改變的不是代表性的機率，而是結構性的 X 與誤差相關。

對質性研究者的警示：「我專挑已經轉型成功的國家，但我在其中隨機抽」並不構成有效辯護。 — DSI 對「隨機性」的限制

對社會政策研究的具體意涵：研究長照改革時多數只看「已建立制度的國家」；研究年金改革時只看「已發生緊縮」的個案；研究貧窮方案時只看「參與者」。若要談改革成敗的原因，這些樣本的設計本身就讓我們無法回答問題。

錯誤一・只研究成功案例

PITFALL #1: STUDYING ONLY SUCCESSES

PITFALL ・ 01

只研究成功的，歸納成功的原因

最常見的錯誤：只研究「成功轉型的國家」、「推動改革成功的政府」、「脫貧的家戶」，然後從中歸納「成功的原因」。這類研究不可能告訴我們「為什麼其他案例沒有成功」——因為那些案例根本沒被觀察到。

社會政策範例

東亞「發展型福利國家」的爭議

Holliday (2000) 與 Kwon (2005) 依台、日、韓案例提出「生產主義福利資本主義」。Peng & Wong (2008) 納入泰、馬、菲後發現，「生產主義」特徵在東亞內部的差異遠大於先前宣稱。這是典型的「只看成功工業化案例」所產生的選樣偏誤。

看案例・「成功者偏誤」在管理學的經典版本

《從 A 到 A+》與倖存者偏差

Jim Collins《Good to Great》（2001）研究 11 家「從平庸躍升卓越」的美國公司，歸納 7 個成功要素（如「第五級領導」「飛輪效應」）。書賣四百萬本、影響全世界 MBA。

但 Phil Rosenzweig《The Halo Effect》（2007）指出致命漏洞：Collins 只挑「事後看起來成功」的公司——這正是 Geddes 講的在依變項上選樣。如果同時也有失敗的公司具備那 7 項特質呢？這個書根本沒查。

更難堪的：Collins 書出版後 5 年，11 家「卓越」公司中有 5 家股價跌破市場、2 家瀕臨破產。「成功學」的方法論破綻是同一回事——看不到反例的研究，學不到因果。

看案例・台灣本土：「為什麼台灣的健保成功？」

少了「為什麼別的國家沒成功」這個對照

台灣健保研究汗牛充棟，多數結論：1995 上路的成功歸功於「強單一保險人＋政府議價力＋家戶共擔」。看起來一切合理。

但這類研究幾乎沒有納入同時期未成功建立全民健保的國家（如菲律賓 1995、印尼 1990s）。如果這些國家也試過類似制度卻失敗，台灣的「成功要素」就需要被重新審視。

Wong (2004) 的 Healthy Democracies 才認真做了這個比較——納入韓國（成功）、台灣（成功）、泰國（部分成功）、菲律賓（失敗），結果發現「民主競爭強度」才是關鍵變項，而非單一保險人設計。這是把樣本拉開後才看得到的因果。

看案例・醫學裡的「倖存者偏差」

二戰返航戰機的彈痕分析

美軍二戰時要決定戰機應該加強裝甲哪些部位。工程師統計「返航戰機」的彈痕分布：機翼、機尾彈痕最多，於是建議加強這些地方。

數學家 Abraham Wald 推翻：你看到的是能飛回來的戰機。彈痕集中在機翼機尾，正說明這些位置就算被打中也能飛回——真正應該加強的，是「沒有彈痕」的位置（引擎、駕駛艙），因為打中那裡的飛機根本飛不回來、沒進你的樣本。

同樣的邏輯：研究「成功的福利改革」時，沒被研究的失敗案例，可能正是真正的因果關鍵。

錯誤二・在依變項上的極端值選樣

PITFALL #2: EXTREME-VALUE SELECTION

PITFALL ・ 02

選極端案例對照常模

第二種錯誤：選「極端案例」對照常模。譬如研究「福利國家慷慨程度的成因」，卻只選瑞典、挪威、丹麥與美英對照。這種對比雖有啟發，但容易把地理相近、語言相近、歷史相近等額外變項也同時固定，造成自變項與誤差項共變。

社會政策範例

「北歐 vs. 美英」的方法論陷阱

常見的福利國家文獻：以北歐三國對照美英兩國，得出「左派執政→慷慨福利」的結論。但這五國同時也共享了完全不同的歷史路徑、語言文化、人口規模——這些都是潛在的混淆變項，被研究設計直接忽略。

看案例・ Pierson 1994 與「兩極比較」的限制

福利緊縮研究的開山之作

Paul Pierson《Dismantling the Welfare State?》（1994）只比較柴契爾的英國與雷根的美國——兩個都是新右派政府上台、都試圖砍福利的案例。結論：「責難規避」（blame avoidance）是緊縮政治的核心策略。這個命題影響了後續 30 年的福利國家研究。

方法學批評：英美兩國同時是「自由主義福利體制」「多數決選舉制度」「盎格魯薩克遜文化」。Pierson 看到的「責難規避」可能來自任何一個共同變項，不見得是新右派意識型態。

Green-Pedersen (2002) 與 Starke (2006) 補上北歐（丹麥、瑞典）的緊縮案例後發現：責難規避只是策略之一，社會民主國家的緊縮反而走「協商共識」路線。Pierson 沒錯，但他的命題範圍被高估了。

看案例・教育政策研究中的「明星國家偏誤」

芬蘭奇蹟與北歐崇拜

2000 年代 PISA 評比後，芬蘭成為全球教育研究的「聖杯」。教育學者紛紛取經：「為什麼芬蘭能？」答案總是繞回「教師地位高」「不分流」「不考試」。

但 Pasi Sahlberg 自己（芬蘭教育學者）指出方法學陷阱：芬蘭跟它鄰近的瑞典、挪威其實在制度上很像，但 PISA 表現差距很大。如果只研究芬蘭，看不到「同樣的制度為什麼在不同國家結果不同」。

更慘的是：2015 年後芬蘭 PISA 排名一路下滑。如果當年的「成功要素」是真的，為什麼 10 年後就不靈了？這提醒我們：抓著明星案例做歸納，是一種反覆會被打臉的研究設計。

看案例・台灣本土：「台灣經驗」研究的陷阱

當「台灣特殊論」遇上方法學審查

台灣社會科學常出現「以台灣對照美國（或瑞典、或日本）」的研究——這幾乎全部踩在 Geddes 第二類錯誤上。

典型例子：「台灣健保 vs. 美國醫療」的比較研究，得出「台灣勝在政府介入」。但這兩國同時還差人口規模、政治制度、移民構成、種族異質性、地理範圍——任何一個都可能是真正的因。要做有效比較，至少需要納入「同樣有國家健保」的韓國、日本，與「同樣是市場主導」的瑞士、德國，才能把「政府介入」這個變項真正分離出來。

建議：碩論若要做「台灣 vs. 某國」，務必在文獻回顧明確處理混淆變項，並把命題範圍寫死。

錯誤三・把時間序列端點當變化

PITFALL #3: TIME-ENDPOINT SELECTION

PITFALL ・ 03

從一個高峰寫到另一個谷底

第三種錯誤：從一個「高峰」寫到另一個「谷底」。事件本身的高峰與谷底是被選擇出來的。若起點與終點都是研究者刻意挑選，因果趨勢很可能是看圖說故事。

社會政策範例

Universal Credit 的貧窮效應評估

僅以 2008–2015 年為觀察區間，貧窮率下降的證據看似強；但這段期間跨過 2010 年緊縮與 2013 年稅改，起點與終點都是研究者刻意挑選。若擴展到 2020 年疫情加碼與 2022 年通膨侵蝕，同一工具的「效果」會呈現完全不同的面貌。

GEDDES 的警語

不是所有問題都能用小樣本比較研究回答。有些問題必須擴大樣本、甚至借用量化資料，才能避免把極端值當成通則。

看案例・「健保不破產論」與「健保即將破產論」

同一個資料、不同時間端點，得到完全相反的結論

2010–2018：台灣健保安全準備金穩定、年年小幅盈餘。當時很多研究結論：「健保財務穩健、無立即破產風險」（行政院 2017 報告）。

2020–2024：疫情後醫療使用量激增、人口老化加速、新藥納入支出爆增。研究風向轉為：「健保財務岌岌可危、需大幅調漲費率」。

同一個健保、同一批資料庫，選不同時間端點，得到相反結論。這就是 Geddes 警告的時間端點選樣陷阱——做政策研究的學者要常自問：「為什麼我選這段時間？換成另一段呢？」

看案例・美國犯罪率下降的「眾說紛紜」

「破窗理論」、「墮胎合法化」、「鉛汞污染」——誰是真因？

美國犯罪率從 1990s 中期到 2014 年大幅下降。各派學者爭功：

朱利安尼派：紐約「破窗執法」（1994 起）有效
Levitt & Donohue：1973 墮胎合法化，20 年後犯罪人口減少
Reyes：1970s 鉛汽油被禁，鉛中毒兒童減少 → 成年後犯罪傾向降低
還有人說：人口結構變化、警力增加、毒品市場轉型⋯⋯

每個解釋都有「對的時間端點」可以支持自己。但 2014 年之後犯罪率又回升——上述任何單一理論都解釋不了這個轉折。這顯示：選對時段可以講通任何因果故事，跨越時段就破功。

DSO vs CPO ・兩種證據

TWO TYPES OF EVIDENCE

Collier, Mahoney & Seawright (2004) 的核心貢獻：引入「資料集觀察」（DSO）與「因果過程觀察」（CPO）的區別。

DSO ・ data-set observation

資料集觀察

填入資料表格的「列列欄欄」。每個觀察值都是同質的、可加總的——這是迴歸分析的標準資料形式。

例：18 個 OECD 國家、2000–2020 年、每國每年的工會密度與社會支出。

CPO ・ causal-process observation

因果過程觀察

研究者對特定案例「內部機制」的深入理解：關鍵人物的動機、制度轉折點上的非慣例文件、行動者當時的認知。

例：1995 年台灣全民健保立法時，李登輝政府如何擺平醫師公會反對、勞委會內部關於費率的攻防文件。

關鍵：CPO 無法化約成表格列，但對假說檢驗的貢獻可能非常大。一篇關鍵的會議紀錄、一個轉折點的見證敘述，可以推翻整個理論。

看案例・ Skocpol 1979：三場社會革命的 CPO 拆解

用「機制」抵抗「樣本太小」的批評

Theda Skocpol《States and Social Revolutions》（1979）只比較三個案例：法國（1789）、俄國（1917）、中國（1949）。N=3，量化標準下這是「不能做推論」的研究。

但 Skocpol 用大量 CPO 證據建立因果機制：每個案例都有「國家危機 + 農民起義 + 國際軍事壓力」三個條件同時出現。她拿出來的是：

路易十六召開三級會議的具體決策記錄
俄國 1905 革命後農民暴動的省級資料
清末新政期間地方官員的奏摺

這些不是「資料表的一列」，而是「機制如何運作」的厚實證據。對於 N=3 的研究，CPO 的厚度可以彌補案例數的薄弱——這就是 Collier 等人的核心辯護。

看案例・台灣健保立法的 CPO：勞委會內部攻防

沒有 CPO 就看不到的因果機制

1995 年 3 月健保上路前 6 個月，勞委會（今勞動部）和衛生署（今衛福部）為「保費由誰負擔」打了一場硬仗。DSO 看不到這個過程——資料表上只有「1995 年 3 月健保上路、保費分擔比例 6:3:1」這一列。

但 CPO 可以看到：

勞委會內部 1994 年 11 月會議紀錄：強烈反對「雇主負擔 6 成」
立法院厚生會 1995 年 1 月攻防：王金平協調的關鍵會議
產業界遊說書信（中華民國工商協進會、工總、商總提交的意見書）
行政院政務委員蕭慶倫的折衷方案（最終版本）

有了這些 CPO，研究者可以說：「健保的成功，不是因為李登輝有遠見，而是 1994–95 年的政商博弈裡，哪些行動者的什麼算計讓特定方案勝出」。這種因果機制的厚實，是純跨國迴歸永遠看不到的。

看案例・怎麼用 CPO 證明「不存在」？

「銀器測試」與「鐵牙測試」

Stephen Van Evera 把 CPO 證據分強弱：

稻草人測試（straw-in-the-wind）：證據出現有點意義，沒出現也不算反證
箍環測試（hoop test）：證據必須出現，否則理論被推翻；但出現也不充分證明
銀器測試（smoking gun）：證據出現就足以證明，但沒出現也不算反證
鐵牙測試（doubly-decisive）：必須出現且充分——最強的 CPO，但很罕見

例：研究「健保立法是因為李登輝個人意志」這個假說。箍環測試：李登輝 1994 年的講稿、日記、與幕僚會議紀錄裡，必須有他主動推動健保的具體證據；如果完全沒有，這個假說就被推翻。CPO 的強度，決定了一個案例研究能不能取代多案例迴歸。

為「無變異設計」辯護

DEFENDING NO-VARIANCE DESIGN

DSI 主張無變異設計「甚麼都學不到」。Collier 等人則主張：在某些情境下，單看一組依變項同值的案例仍可以做機制檢驗。

關鍵在於：研究者不是想估計平均因果效果，而是檢驗一個特定機制是否在案例內存在。Skocpol (1979) 對法、俄、中三場革命的機制拆解便是經典例子——三個案例的依變項都是「成功的社會革命」，但她要回答的是「這個機制是否運作」，而非「這個自變項的平均效果」。

如果研究問題真的是「為什麼成功／失敗」這類比較式問題，那麼在依變項上選樣確實會讓推論失效。但如果研究問題是「這個機制是否在此處運作」，那麼這類批評就不完全適用。選樣偏誤的診斷，不能跳過研究問題本身是甚麼。 — Collier, Mahoney & Seawright (2004) 的有限辯護

DSI vs Collier 對照

DSI VS. COLLIER ET AL. 總整理

議題	DSI (1994)	Collier et al. (2004)
無變異設計	沒有因果槓桿，甚麼都學不到。	可做機制檢驗，但不能做平均效果估計。
在依變項上選樣	幾乎總是偏誤；擴大樣本再說。	視研究問題而定；若問機制，仍可接受。
資料型態	以 DSO 為主，CPO 僅是軼事。	DSO 與 CPO 並列，都能對假說做出貢獻。
方法策略	增加觀察、隨機化、控制變項。	過程追蹤、關鍵見證、文獻交叉比對。
對台灣研究的意義	研究「為何台灣建健保」，要納入未建健保的國家做對照。	研究「健保立法時，政策企業家的動員機制」，可單看台灣，但要厚描證據。

四個社會政策案例

FOUR CASES 點選分頁切換

案例一・福利體制的分類擴張

Esping-Andersen (1990) 以 OECD 18 個高所得國家為對象，提出自由主義、保守主義、社會民主三種體制類型。這是比較社會政策最具影響力的分類。然而後續研究發現：當分析擴展到東亞、拉美、後共時，三分類即不再完整。

Castles & Mitchell (1993)：補上「激進主義」（antipodean）類型。
Ferrera (1996)：提出南歐類型。
Gough (2004)：在低所得國家中應改談「非正式保障」。

方法學教訓：Esping-Andersen 的原始設計其實是在依變項（福利國家成熟度）上篩選樣本。隨著樣本擴展，類型邊界必須被重新劃定。這正是 Geddes 所警告的「成功案例選樣」的後果。

案例二・ Pierson 的責難規避理論與樣本範圍

Pierson (1994, 1996) 以英、美兩案例提出福利國家緊縮時期的「責難規避」（blame avoidance）理論，主張緊縮政治下決策者的動機與擴張時期截然不同。這個命題影響力極大。

但批評者（Green-Pedersen 2002；Starke 2006）指出：Pierson 的兩個案例恰好是「改革艱難、政黨競爭激烈」的情境。若納入北歐（丹麥、瑞典）的大型退休金改革，責難規避只是眾多策略之一。

折衷解讀：Geddes 第二類錯誤（極端值選樣）與 Collier 等人的區分同時出現。Pierson 談的是機制（CPO 很豐富），擴展樣本不一定否定其洞見，但絕對應該限制命題的推論範圍。

案例三・活化政策是否拉低貧窮？

歐洲自 1990 年代後期大量採行活化政策（activation policies），Bonoli (2010) 稱之為社會投資轉向。

許多早期研究僅以成功案例（丹麥、瑞典）為證，主張活化能降低貧窮；然而後續將樣本擴及德國 Hartz IV 改革與英國 New Deal，發現活化若搭配低保給付的削減，反而可能加深工作貧窮（Jessoula et al. 2010；Knotz 2020）。

方法學教訓：這是 DSI 所提醒的截尾偏誤——只看「已加強活化的國家」並觀察貧窮變化，我們無法估計活化的純粹效果，因為同一時期北歐的勞動市場制度、工會密度、集體協商範圍也都是高水準，形成混淆。

案例四・台、德、日、韓四國的長照改革推動條件

比較長照改革常見的問題：我們傾向只研究「已建立長照保險或長照體系」的國家。台灣長照 2.0、日本介護保險、德國 Pflegeversicherung、韓國老人長期療養保險看似走了相似的路，但「為什麼這四國先走」與「為什麼其他國家沒走」這個問題，幾乎沒有被處理過。

Campbell, Ikegami & Gibson (2010) 指出：若要回答後者，就必須納入未建立長照保險的國家（如義大利、西班牙）作為對照。

台灣本地啟示：多數研究聚焦於已接受服務者的滿意度與使用模式，忽略「符合資格但未進入服務」的群體。若要回答「為何該接受卻未接受」，必須重新設計樣本（從資格界定、名冊比對、非使用者訪談切入）。

選樣偏誤不是量化研究的專有病灶——它就在我們日常的文獻生產中。差別在於：量化研究可以用模型寫出偏誤大小，質性研究則必須依賴研究者自己對案例結構的警覺。 — 跨案例共同教訓

研究設計階段

DESIGN PHASE 建議 1/3

STAGE 01 ・ DESIGN

先想清楚「依變項是什麼」

先明確寫下依變項，自問：「這個依變項的哪些值沒有進入我的樣本？」
若樣本只保留「已採行某政策」的單位，必須在研究問題上限縮，改問「機制如何運作」而非「為何採行」。
若要問「為何採行」，至少納入一個「類似處境但未採行」的對照案例（Geddes 的最低限度建議）。
對照案例的選擇：相似條件、相反結果（最相似系統設計，MSSD）。

資料蒐集階段

DATA COLLECTION 建議 2/3

STAGE 02 ・ COLLECT

建立完整的母體清單

建立完整母體清單，標示納入／不納入的案例及其排除理由。
善用 Collier 等人的 CPO 觀念：關鍵文件、見證敘述、非慣例事件，可大幅強化推論。
若研究台灣，國史館檔案、立法院公報、行政院記錄、媒體口述史都是 CPO 的潛在來源。
將「未進入樣本的案例為什麼不在」也記錄在研究筆記中——這是論文寫作時的辯護彈藥。

論文寫作階段

WRITING PHASE 建議 3/3

STAGE 03 ・ WRITE

把選樣邏輯寫進方法章節

把「研究範圍條件」（scope conditions）明確寫進命題，避免過度延伸。
在方法章節以一小節討論選樣偏誤的可能性與因應策略；這幾乎是歐洲社會政策期刊（JESP、JSP、SP&A）審查人的標準提問。
若評審質疑，引用 Collier et al. (2004) 的 CPO 論點做限定辯護，而非主張「自己沒有偏誤」——後者幾乎一定失敗。
避免把「資料可得性」當成案例選擇的理由——這是審查人最容易抓的弱點。

互動・診斷你的研究設計

DIAGNOSTIC TOOL ★ 三題快測

想像你有一份研究計畫想送出去。回答下面三個問題，看看你的設計會不會被審查人挑出選樣偏誤。三題只需 30 秒。

問題 1 ／你的依變項是什麼樣的「事件／結果」？

想想你的研究目標——你在解釋什麼？

問題 2 ／你的研究問題是哪一型？

這個問題決定了選樣偏誤是否會傷到你。

問題 3 ／你的對照案例設計？

「沒發生事件」的案例你納入了嗎？

—

自我測驗 Q1

CONCEPT 1/5

概念辨識

下列哪一項最準確描述 DSI 對「選樣偏誤」的核心批評？

正解：B。DSI 的核心批評是統計推論層面的：選樣機率與依變項相關，會導致 X 與誤差項相關，迴歸係數被壓平（甚至反符號）。重點不在樣本大小，而在結構性的相關。樣本量再大也不能解決這個問題。

自我測驗 Q2

METHODOLOGY 2/5

方法論辯

Collier、Mahoney & Seawright (2004) 對「無變異設計」最主要的辯護是？

正解：C。Collier 等人的核心辯護建立在「研究問題的不同」之上。當問題是「機制是否在此處運作」（mechanism check），而非「X 對 Y 的平均效果為何」（effect estimation），就可以透過 CPO（深度的案例內部證據）來檢驗，無變異設計仍有意義。Skocpol 對三場社會革命的研究是經典例子。

自我測驗 Q3

APPLICATION 3/5

社會政策應用

台灣長照 2.0 研究若只分析「已接受服務者」，最直接犯了哪個 Geddes 警告的錯誤？

正解：A。「已接受服務」本身就是依變項上的篩選——只看「進入了服務」的人，等於忽略「符合資格但未進入服務」的群體。要回答「誰在使用、誰在被排除」這類問題，必須重新設計樣本，從資格界定、名冊比對、非使用者訪談切入。

自我測驗 Q4

DSO vs CPO 4/5

證據型態

下列哪一個是 Collier 等人所說的「因果過程觀察 (CPO)」的典型例子？

正解：C。CPO 是研究者對特定案例內部機制的深入理解——關鍵會議紀錄、轉折點上的非慣例文件、行動者當時認知。這類證據無法化約為資料表的列列欄欄，但對假說檢驗的貢獻可能很大。A、B、D 都是 DSO（資料集觀察）。

自我測驗 Q5

PRACTICAL DEFENSE 5/5

論文辯護

如果評審質疑你的論文有選樣偏誤，下列哪種回應最有可能成功？

正解：B。當評審指出選樣偏誤時，最務實的回應是「限縮研究問題＋引用 Collier 的 CPO 辯護」。把命題從「為什麼這四國建長照」收斂為「在這四國裡，這個機制如何運作」，並用厚實的案例內部證據（會議紀錄、政策文件、訪談）支撐——這是 Pierson、Skocpol 等人實際採用的策略。主張「自己沒有偏誤」幾乎一定失敗。

課堂討論

CLASS DISCUSSION 點選展開提示

問題一

台灣的長照 2.0 研究幾乎都在分析已接受服務者。若要研究「為何該接受卻未接受」，你會如何重新設計樣本？

提示：從資格界定、名冊比對、非使用者訪談切入。可參考衛福部的 ADL/IADL 評估資料、長照需求調查與實際使用率的差距。

問題二

東亞福利國家文獻的選樣，能否用 Collier 等人的「無變異設計＋CPO」來辯護？這樣的辯護在此是否成立？

提示：比較 Haggard & Kaufman (2008) 與 Peng (2011)。前者偏「比較式問題」（為何成功），後者偏「機制檢驗」（社會投資的政治條件）。

問題三

你手上正在寫的論文，選案例的理由是什麼？如果今天由 Geddes 審你，她會挑出哪個偏誤？

提示：誠實列出你排除的案例與排除的原因。「資料可得性」常常是真實理由，但很少被寫進論文——而它正是審查人最容易抓的點。

本講小結

KEY TAKEAWAYS 收束

壹

選樣偏誤是跨典範的共同議題：DSI 講成統計問題，Geddes 擴展為質性方法學反思，Collier 等人為質性做法提供有限但穩健的辯護。

貳

對社會政策研究者，最關鍵的自覺是「哪些案例不在我的樣本裡」，以及「它們的不在場是否改變了我的結論」。

參

研究設計與寫作階段都應明確處理樣本邏輯：把範圍條件寫進命題，並用 CPO 補強因果推論。

延伸閱讀

選樣偏誤與案例選取

為什麼把三篇一起讀

Geddes

King, Keohane & Verba

Collier, Mahoney & Seawright

什麼是「在依變項上選樣」

截尾

自我選擇

篩選

截尾如何壓平斜率

樣本量也救不了

錯誤一 ・ 只研究成功案例

只研究成功的，歸納成功的原因

東亞「發展型福利國家」的爭議

《從 A 到 A+》與倖存者偏差

少了「為什麼別的國家沒成功」這個對照

二戰返航戰機的彈痕分析

錯誤二 ・ 在依變項上的極端值選樣

選極端案例對照常模

「北歐 vs. 美英」的方法論陷阱

福利緊縮研究的開山之作

芬蘭奇蹟與北歐崇拜

當「台灣特殊論」遇上方法學審查

錯誤三 ・ 把時間序列端點當變化

從一個高峰寫到另一個谷底

Universal Credit 的貧窮效應評估

同一個資料、不同時間端點，得到完全相反的結論

「破窗理論」、「墮胎合法化」、「鉛汞污染」——誰是真因？

DSO vs CPO ・ 兩種證據

資料集觀察

因果過程觀察

用「機制」抵抗「樣本太小」的批評

沒有 CPO 就看不到的因果機制

「銀器測試」與「鐵牙測試」

為「無變異設計」辯護

DSI vs Collier 對照

四個社會政策案例

案例一 ・ 福利體制的分類擴張

案例二 ・ Pierson 的責難規避理論與樣本範圍

案例三 ・ 活化政策是否拉低貧窮？

案例四 ・ 台、德、日、韓四國的長照改革推動條件

研究設計階段

先想清楚「依變項是什麼」

資料蒐集階段

建立完整的母體清單

論文寫作階段

把選樣邏輯寫進方法章節

互動 ・ 診斷你的研究設計

自我測驗 Q1

下列哪一項最準確描述 DSI 對「選樣偏誤」的核心批評？

自我測驗 Q2

Collier、Mahoney & Seawright (2004) 對「無變異設計」最主要的辯護是？

自我測驗 Q3

台灣長照 2.0 研究若只分析「已接受服務者」，最直接犯了哪個 Geddes 警告的錯誤？

自我測驗 Q4

下列哪一個是 Collier 等人所說的「因果過程觀察 (CPO)」的典型例子？

自我測驗 Q5

如果評審質疑你的論文有選樣偏誤，下列哪種回應最有可能成功？

課堂討論

本講小結

延伸閱讀

核心三篇

方法學延伸

社會政策應用

東亞與台灣

目次 ・ Table of Contents

錯誤一・只研究成功案例

錯誤二・在依變項上的極端值選樣

錯誤三・把時間序列端點當變化

DSO vs CPO ・兩種證據

案例一・福利體制的分類擴張

案例二・ Pierson 的責難規避理論與樣本範圍

案例三・活化政策是否拉低貧窮？

案例四・台、德、日、韓四國的長照改革推動條件

互動・診斷你的研究設計

目次・ Table of Contents