원본 마크다운: wiki/서베이-연구와-자료수집.md
서베이 연구와 자료수집
학습 takeaway: 모든 양적 범죄 연구는 “어떤 자료를 어떻게 모으는가”에서 출발한다. 자료의 출처(1차/2차), 시간 구조(횡단/종단), 수집 방법(우편·면접·전화·온라인)은 서로 독립된 선택이 아니라 연구가 답할 수 있는 질문의 범위 — 특히 인과관계를 주장할 수 있는지 — 를 결정한다. 횡단자료로는 상관만, 종단자료라야 선후관계를 통한 인과 추론이 가능하다는 점이 이 페이지의 핵심 축이며, 인과관계·대표성과-표본추출·범죄-연구방법을 자료수집 단계에서 묶어 이해하는 토대가 된다.
정의 / 개요
자료(data)는 연구자가 가설의 진위를 판별하거나 연구 결과를 도출하기 위해 통계 분석에 사용하려고 수집한, 가공되지 않은 상태의 재료다. 예를 들어 “당신의 성별은? 1. 남성”이라는 문항에 응답자가 표시한 ‘1’이라는 값 자체가 자료다.
모집단 전체를 조사하기는 비효율적이므로, 모집단의 특성이 잘 반영되어 대표성을 확보한 표본을 통한 표본조사가 효율적이다(→ 대표성과-표본추출, 표집방법).
자료는 세 가지 축으로 구분한다.
- 출처: 1차 자료 vs 2차 자료
- 시간 구조: 횡단연구 자료 vs 종단연구 자료
- 수집 방법: 우편·면접·전화·온라인 서베이
핵심 내용
1. 1차 자료 vs 2차 자료
| 구분 | 정의 | 장점 | 단점 |
|---|---|---|---|
| 1차 자료 | 연구목적을 위해 연구자가 직접 조사를 실시하여 수집한 자료 | 연구목적에 부합하는 자료를 구하기 쉬움; 원하는 시기에 발생·응답한 것에서 자료 확보 가능 | 시간과 비용이 많이 듦 |
| 2차 자료 | 직접 수집하지 않고, 자신의 연구에 적합하다고 판단해 이미 존재하던 것에서 구한 자료 | 시간·비용 절약; 공공 연구기관 자료는 신뢰성이 높음; 주제별 제공 자료 활용 가능 | 연구모형에 적합한 자료를 구하기 어려움; 시기적 적합성 문제 |
강의 부연 — 대규모 조사는 사실상 2차 자료가 답이다: 1차 자료로 표본오차 ±1% 수준을 확보하려면 1만 명 이상을 직접 조사해야 하는데, 펀딩 없이 개인이 감당하기 어렵다. 그래서 석·박사 단계에서도 2차 자료를 활용하는 경우가 대부분이다. 다만 2차 자료는 “이미 만들어진 문항”에 자신의 연구모형을 맞춰 수정해야 한다는 근본적 제약이 따른다(1차 자료는 원하는 문항을 다 넣을 수 있는 반면).
2차 자료를 어디서 구하나 — MDIS(마이크로데이터 통합서비스) 교수는 대표적 2차 자료 창구로 MDIS(MicroData Integrated Service, 통계청 마이크로데이터 통합서비스)를 든다. ‘주제별 제공 자료’에서 분야별로 정리되어 있어, 실제 조사표(설문지 원본)와 응답 데이터를 함께 내려받아 곧바로 분석에 쓸 수 있다.
- 범죄·안전: 가정폭력 실태조사(3년 주기, 65세 미만/이상 구분), 여성폭력·사이버폭력 실태조사, 산업안전·국민안전 실태조사, 국민 법의식 실태조사(법에 대한 인식·법률용어 인식·공권력 인식 등 — 사적제재·법 불신 관련 연구에 활용 가능, 2년 주기), 재난안전·산업재해·해양사고 현황 등
- 교육·사회일반: 아동종합실태조사(아동 문제행동), 국민 다문화수용성조사(차별 경험), 위기청소년, 청소년 매체·유해환경 실태조사(사이버폭력 피해 경험), 아동·청소년 인권, 청소년 도박 실태조사 등 교수의 실전 조언: 학부 졸업논문은 직접 설문(30~100명 수준, 표본추출이 불완전해 의미가 약함)보다 이런 2차 자료로 빈도분석·교차분석 정도만 해도 충분하다. 고급 통계는 대학원에서 배운다.
2. 횡단연구 자료 (Cross-sectional data)
개념: 특정한 한 시점에서 연구대상의 경험·인식·태도·행동 등을 단면적으로 조사하는 연구자료. 동일 대상자를 반복 추적하지 않고 한 번의 조사로 수집한다. 주요 목적: 변수 간 관련성, 집단 간 차이, 특정 현상의 실태 파악. 예시: 청소년 사이버폭력 경험 조사, 경찰 신뢰도 조사, 범죄피해조사 등.
장점
- 시간·비용이 적게 듦 (조사 기간 짧음)
- 연구대상 확보가 비교적 쉬움 (참여자 이탈 문제 적고 큰 표본 확보 용이)
- 현황 파악에 유용
- 집단 간 비교 가능 (성별·연령·학년·직업·지역 등)
- 다양한 변수 간 관계 분석 가능 (상관·회귀·집단 차이 분석)
단점
- 시간적 변화 파악이 어려움
- 인과관계 설명에 한계 — 변수 간 관련성은 확인하나 무엇이 원인이고 결과인지 밝히기 어려움
- 선후관계 판단이 어려움 (예: 낮은 경찰 신뢰가 인권침해 경험 때문인지, 원래 신뢰가 낮은 사람이 침해를 더 민감하게 인식한 것인지 구분 불가)
- 조사 시점의 사회적 사건·언론 보도·정책 변화 등 일시적 상황의 영향을 받을 수 있음
→ 횡단자료의 인과 추론 한계는 인과관계의 시간적 선행성(원인이 결과보다 먼저) 조건을 충족하기 어렵다는 점에서 비롯된다.
강의 부연 — 2차 자료의 “시기 지연” 문제: 공공 데이터는 기관·연구원이 먼저 분석·활용한 뒤 외부에 공개하므로 보통 2~3년, 피해자조사 등 일부는 5년까지 시차가 생긴다. 따라서 특정 시기에 발생한 사건을 그 시점에 맞춰 분석해야 하는 연구에는 2차 자료가 부적합할 수 있다(연구 주제가 시의성을 강하게 탈수록 1차 자료가 필요).
강의 부연 — 통계 해석의 윤리: 단정적 표현을 피하라: 횡단자료(나아가 모든 표본 기반 통계)는 모집단을 추론한 결과이므로, 결과를 해석할 때 “반드시 ~이다(must)” 같은 단정 표현이 아니라 “~일 가능성이 높다 / 관련성이 높다(may)”로 써야 한다. 예컨대 중학생 가해율 30%·고등학생 40%라는 횡단 결과를 두고 “나이가 들면 가해가 증가한다”고 유추·확장 해석하면 안 된다(서로 다른 집단을 한 시점에 비교한 것일 뿐). 통계는 나온 결과 자체만 진술해야 한다.
횡단연구 자료의 활용 유형
횡단자료라도 설계에 따라 시간성을 어느 정도 보완할 수 있다.
- 다양한 집단 비교: 한 시점에 중학생·고등학생을 조사해 사이버폭력 가해 경험 차이를 비교. 단, 같은 학생을 추적한 것이 아니라 서로 다른 두 집단을 비교한 것이므로 “고등학생이 되면 가해가 증가한다”고 단정 불가.
- 시간변수를 고려한 활용
- (2-1) 변수의 시간 순서 추정: “LSD 사용자는 모두 대마초 사용 경험이 있었다”는 분포에서 대마초 사용이 선행했을 가능성을 조심스럽게 추론. 단, 실제 시점을 추적한 것이 아니므로 인과 단정 불가, 응답자 기억 오류·누락 가능성 있음.
- (2-2) 시간 순서가 명확한 변수 활용: 졸업 고등학교 유형(대학 입학 이전 결정) → 대학 성적(이후 결과)처럼 논리적으로 선후가 명확한 변수를 질문지에 배치. 단, 가정환경·입학성적·부모 SES 등 다른 요인이 함께 작용할 수 있어 통제변수를 고려한 분석 필요.
- (2-3) 다양한 연령집단 비교: 10·20·30·40대의 범죄두려움을 한 시점에 조사해 연령별 차이 추정. 단, 그 차이가 나이 증가에 따른 변화인지 세대(코호트) 차이인지 구분하기 어려움.
3. 종단연구 자료 (Longitudinal data)
개념: 동일한 연구대상이나 동일한 현상을 일정 기간에 걸쳐 반복적으로 조사하여 수집한 자료. 시간 흐름에 따른 변화 과정과 변수 간 선후관계 파악에 초점.
특징: 시간의 흐름 반영, 변화 과정 분석 가능, 변수 간 선후관계 파악 가능, 인과관계 추론에 유리(원인-결과의 시간적 순서 확인 가능), 단 탈락 문제 발생 가능.
종단연구 자료의 4종류
| 유형 | 의미 | 핵심 질문 | 데이터 예시 |
|---|---|---|---|
| 패널 연구 | 동일한 개인·가구를 여러 시점에서 반복 조사 | 같은 사람이 시간이 지나며 어떻게 변하는가? | 한국아동·청소년패널조사, 한국청소년패널조사, 한국복지패널, 다문화청소년패널조사 |
| 코호트 연구 | 특정 시기·경험을 공유하는 집단을 장기 추적 | 같은 출생·입학·경험 집단은 어떻게 변하는가? | 한국아동·청소년패널조사 2018 초4 코호트, 중1 코호트 |
| 추세 연구 | 동일 주제를 여러 시점에서 반복 조사하되 매번 다른 표본 | 사회 전체의 경향은 어떻게 변하는가? | 청소년건강행태조사, 사회조사, 국민안전실태조사 |
| 사건 전후 / 생애사·회고적 | 특정 정책·사건·제도 시행 전후를 비교 / 현재 시점에서 과거 경험의 시점·순서를 회고 조사 | 정책·사건 이후 변화가 있었는가? / 과거 경험이 현재 결과와 어떻게 연결되는가? | 스토킹처벌법 시행 전후 신고율 비교, 학교폭력예방법 개정 전후 / 아동기 학대경험과 성인기 IPV 피해, 과거 범죄피해와 현재 범죄두려움 |
장점: 시간적 변화 파악, 변수 간 선후관계 확인, 인과관계 설명에 유리, 발달 과정 분석, 정책 효과 분석에 적합, 개인 내(within-person) 변화 분석 가능.
단점: 시간·비용이 많이 듦, 연구대상자 탈락 문제, 조사 관리가 복잡함, 반복조사 효과(같은 질문 반복으로 응답 변화), 사회적 환경 변화의 영향, 즉각적 연구결과 도출이 어려움.
강의 부연 — 한국 패널은 아직 “어리다”: 한국아동·청소년패널 등 국내 패널은 시작한 지 약 20년 안팎이다. 반면 외국은 아동기부터 60·70대까지 추적한 장기 패널이 있어 “아동기 문제행동·학대 경험이 노년까지 이어진다”, “인구의 10% 미만이 전체 범죄의 약 90%를 저지른다(만성적 소수 범죄자)” 같은 생애과정 명제를 실증할 수 있다. 한국은 데이터가 더 축적되어야 이런 분석이 가능해진다. → 종단자료의 진짜 힘은 누적 기간에서 나온다.
강의 부연 — 회고적 질문의 한계와 종단자료의 우위: 횡단·종단 모두 “아동기에 학대당한 적 있느냐” 같은 회고적(retrospective) 질문을 넣을 수 있으나, 응답자가 아동기를 잘 기억하지 못해 정확도가 떨어진다. 반면 패널은 아동기 시점에 직접 물어 기록해 두므로(예: 2018년 측정한 학대 경험을 수년 뒤 가정폭력 가해와 연결), 경험의 시점·순서가 확실하다는 점이 종단자료의 결정적 강점이다.
강의 부연 — 사건 효과의 해석(코로나19 예시): 패널을 쭉 추적하다 보면 특정 시점에 발달·사회성 지표가 급변하는 경우가 있는데, 그것이 조사 기간 중 발생한 거대 사건(예: 코로나19 비대면 세대) 때문일 수 있다. 따라서 결과 해석 시 그 사회적 사건을 명시적으로 언급해야 정확한 해석이 된다. 반대로 사건 효과를 연구 목적으로 직접 보려면 사건 전후를 비교(사건 전후 설계)한다.
4. 서베이 자료수집 방법
서베이 자료수집의 큰 분류는 자기기입식 조사(응답자가 직접 응답을 기입 — 우편·전화·인터넷이 대표적)와 면접조사(조사원이 매개)다. 아래 4가지 방법은 1차 자료 수집에 활용되며, 2차 자료는 이미 만들어진 데이터를 활용한다.
| 방법 | 절차 | 장점 | 단점 |
|---|---|---|---|
| 우편 조사 | 질문지 인쇄 → 회수용 봉투·안내지 준비 → 우편 발송 후 회수 대기 | 민감·사적 정보도 응답 가능성 높음; 면접원·매개체 개입 문제 감소 | 낮은 회수율(50%면 적절); 관심 있는 사람만 적극 응답해 응답 왜곡(예: 동성결혼 의견조사) |
| 면접 조사 | 질문지 준비 → 조사원 모집·사전 교육(목적·과정·표본 안내) → 조사원 파견·실시 | 회수율 높음; 문항 의미를 정확히 전달; 문맹자도 조사 가능(노인 대상에 특히 유용) | 비용(조사원 인건비·교육); 드러내기 싫은 내용은 정확한 답 회피; 조사원 실수로 내용 왜곡 가능 |
| 전화 조사 | 질문 문항 작성 → 녹음하여 전화 조사 실시 | 비용·시간 절약; 응답 내용이 바로 입력되어 편리 | 낮은 응답률(끊김); 응답 왜곡 가능성(번호 잘못 입력 등) |
| 온라인 조사 | 전자메일 조사 / 인터넷 전문 조사 사이트(구글폼·네이버폼 등) 활용 | 조사 기간·비용 단축; 편한 자료 관리; 타 방법보다 그나마 응답률 높음 | 조사 대상 한계(인터넷 사용 가능자만 — 노인·문맹자 등 소외); 낮은 응답률 |
강의 부연 — 면접조사원 사전 교육은 필수다: 조사원이 연구 목적·과정·표본을 모르면, 응답자가 문항 의미를 물어볼 때 엉뚱한 답을 해 자료가 왜곡된다. 따라서 면접조사는 조사원 교육이라는 추가 절차·비용이 반드시 따른다. 한편 면접조사는 노인 대상 조사에서 여전히 널리 쓰인다(인터넷·우편 조사가 어렵고, 문항을 읽어 줄 수 있으므로).
강의 부연 — 전화조사의 고전적 표본왜곡 사례: 전화 보급 초기 미국 대통령 선거 예측 조사에서, 당시 전화(또는 자동차)를 소유한 부유층만 표본에 포함되어 응답이 크게 왜곡된 일이 있었다. 특정 도구를 소유한 사람의 특성 때문에 표본 대표성이 깨진 사례로, 표본추출의 대표성(대표성과-표본추출)이 수집 방법 선택과 직결됨을 보여 준다. 현재는 전화가 보편화되어 이 문제는 줄었으나, 낮은 응답률·정치 관심층 편중은 여전히 남아 있다.
5. 2차 자료 활용의 장단점
| 구분 | 장점 | 단점 |
|---|---|---|
| 자료수집 | 직접 조사 불필요 → 시간·비용 절약 | 수집 과정·조사설계를 연구자가 통제하기 어려움 |
| 표본 | 대규모·대표성 있는 자료 활용 가능 | 연구주제에 꼭 맞는 표본이 아닐 수 있음 |
| 변수 | 다양한 변수가 이미 포함되어 있을 수 있음 | 필요한 변수가 없거나 문항 구성이 연구목적과 다를 수 있음 |
| 윤리 | 비식별 자료는 연구윤리 부담이 상대적으로 적음 | 개인정보·민감정보·재식별 가능성 있으면 윤리적 주의 필요 |
| 분석 | 기존 자료로 다양한 통계분석 가능 | 결측값·측정수준·표본 제한으로 분석방법이 제한될 수 있음 |
| 연구효율성 | 짧은 기간에 논문·보고서 작성 가능 | 기존 자료의 한계에 맞춰 연구문제를 조정해야 할 수 있음 |
→ 공식통계는 대표적인 2차 자료원으로, 위 장단점이 그대로 적용된다.
관련 개념
- 대표성과-표본추출 — 자료의 가치는 표본의 대표성에서 나온다; 어떤 자료든 표본이 모집단을 대표해야 일반화 가능
- 표집방법 — 1차 자료 수집 시 표본을 뽑는 구체적 기법
- 범죄피해조사 — 횡단 서베이 자료수집의 대표적 적용 사례이자 1차 자료 생산
- 질문지-설계-원칙 — 서베이 자료의 질은 질문지 설계에서 결정됨; 수집 방법 선택과 직결
- 범죄-연구방법 — 서베이는 범죄 연구방법의 한 갈래; 자료수집은 전체 방법론의 한 단계
- 인과관계 — 횡단자료의 인과 추론 한계와 종단자료의 인과 추론 우위를 이해하는 핵심 연결고리
- 연구-설계와-절차 — 자료수집 방법 선택은 전체 연구 설계 절차의 하위 단계
- 공식통계 — 대표적 2차 자료원; 2차 자료 활용 장단점이 그대로 적용
- 연구계획서 — 여기서 선택한 자료수집 방식(1차/2차·횡단/종단)이 연구계획서의 연구방법 장에 기술됨
- 아동학대 — 종단 패널의 결정적 강점 사례: 아동기 학대→성인기 IPV 전이는 회고적 질문(횡단)으로는 입증이 어렵고 패널 추적이라야 시점·순서를 확정
출처
raw/범죄학연구방법론중간/제10장 서베이 연구에서 자료수집/— 2026-05-31, PDF 강의자료 (제10장 서베이 연구에서 자료수집)raw/범죄학연구방법론중간/제10장 서베이 연구에서 자료수집/1 녹음 중.m4a— 2026-05-31, 강의 녹음 음성 (cl-whisper 전사)raw/범죄학연구방법론중간/제10장 서베이 연구에서 자료수집/1 녹음 중.txt— 2026-05-31, 위 음성의 전사 텍스트raw/범죄학연구방법론중간/서베이1.mp4— 2026-06-07, 서베이 자료수집(1차/2차·횡단자료·시간성 보완) 강의 동영상raw/범죄학연구방법론중간/서베이1.txt— 2026-06-07, 위 동영상의 전사 텍스트raw/범죄학연구방법론중간/서베이2.mp4— 2026-06-07, 종단연구 자료(횡단 vs 종단·패널/코호트/추세·자료수집 방법) 강의 동영상raw/범죄학연구방법론중간/서베이2.txt— 2026-06-07, 위 동영상의 전사 텍스트
메타
- 생성: 2026-05-31
- 최근 업데이트: 2026-06-07 (서베이1·2 동영상·전사 출처 추가; 자기기입식/면접 분류, 면접조사원 사전교육·전화조사 표본왜곡 사례, 다문화청소년패널, 연구계획서 역링크 보강)
- 카테고리: 통계·연구방법