원본 마크다운: wiki/대표성과-표본추출.md

대표성과 표본추출 (Representativeness & Sampling)

학습 takeaway: “몇 명을 조사하느냐”보다 “누구를 조사하느냐”가 결정적이다. 표본이 모집단을 닮지 않으면 아무리 정교한 통계를 돌려도 결론은 모집단으로 확장될 수 없다. 대표성은 양적 연구가 “일반화”를 주장할 수 있는 유일한 근거이며, 분석단위를 잘못 잡거나 표본을 잘못 뽑으면 그 위에 쌓는 모든 분석이 무너진다.

정의 / 개요

표본을 통해 모집단의 특성을 추론하려면, 표본이 모집단을 “축소판”처럼 닮아야 한다.

핵심 내용

전수조사 vs 표본조사

구분 의미 예시 한계
전수조사 모집단 전체를 대상으로 조사 인구주택 총조사 비용·시간이 막대함 → 현실적으로 어려움
표본조사 모집단의 일부(표본)만 조사 서울 중학교에서 일부 학급 추출 대표성 확보가 어려움

인구주택 총조사조차 실제로는 전 가구를 전수조사하지 않고 일부 가구를 추출하는 방식을 병행한다. 모집단 전체 조사는 대부분의 연구에서 사실상 불가능하므로, 거의 모든 사회과학 연구는 표본조사에 의존한다.

대표성 확보의 실제 — 비율 맞추기

표본의 분포를 모집단의 분포에 맞추는 것이 대표성 확보의 출발점이다. 모든 변수를 맞추기는 불가능하므로, 대표적 인구통계 변수부터 모집단 비율과 일치시킨다.

모집단을 좁히는 전략

대표성 확보가 어려울 때는, 연구 대상 자체를 좁혀 모집단을 명시적으로 한정할 수 있다.

분석단위와의 관계

표본추출 이전에 무엇을(누구를) 단위로 분석할지 정해야 한다 — 개인(개별 사람)인가, 집단(조직·지역·학교·국가)인가.

분석단위 선택과 표본 설계가 어긋나면 분석단위의 3대 오류(생태학적·개인주의적·환원주의적)에 빠진다. 자세한 내용은 해당 페이지 참고.

의외의 연결점

관련 개념

출처

메타