04. 연구 설계

통계학

변동성(Variability) : 어떤 것이 얼마나 정확한가
        -> 통계에서는 데이터 값이 서로에게서 얼마나 떨어져 있거나 다른가
데이터를 어떻게 변동성을 표현할 것인가는 가장 큰 문제중의 하나

통계학 적인 질문
모든 데이터를 구할 수 있고 변동성이 있는 질문이어야 한다. + 데이터가 하나이면 안된다
ex1) 하루에 벽돌을 몇개나 먹는지 -> 데이터를 구할 수 있으나 변동성이 없음
ex2) 얼마나 배고픈가 -> 데이터를 구할 수 없음 

상관관계와 인과관계

ex_ 아침을 먹으면 비만에 걸릴 확률이 증가한다 
-> 인과관계
상관관계 : ex) A와 B가 동시에 관측된다 

군집표본 추출

전체의 데이터에서 랜덤으로 추출하는것이 아닌 
A,B 군집에서 100개를 랜덤 추출한다면
A에서 50개 B에서 50개를 랜덤하게 추출하는 방법

올바른 표본조사법

    - 단순임의추출
모든 구성원 및 구성원 집합은 표본으로 선택될 확률이 같아야 합니다. 단순임의추출을 하기 위해서는 기술, 임의의 수 생성기 등 어떠한 임의성을 만드는 과정이 필요합니다.
예제—선생님은 모자에 학생들의 이름을 적어 넣고, 이름을 보지 않은 채 표본을 추출합니다.
단순임의추출은 모든 구성원들이 표본으로 선택될 확률이 같기 때문에 좋습니다.
    - 층화추출
먼저 모집단을 여러 집단으로 나눕니다. 전체 표본을 각 집단에서 조금씩 임의로 뽑습니다.
예제—학생 위원회는 1학년, 2학년, 3학년, 4학년 학생 중 각각 252525명씩 임의의 표본을 뽑아 총 100100100명을 조사합니다.
층화추출은 각 표본이 해당 집단을 대표하기 때문에 선호됩니다. 이 방법은 모든 집단으로부터 표본을 얻고 싶을 때 많이 사용됩니다.
     - 군집추출
먼저 모집단을 여러 집단으로 나눕니다. 전체 표본은 각 집단의 모든 구성원들로 이루어져 있습니다. 집단은 임의로 선택됩니다.
예제—어느날 항공사는 고객들에 대해 설문을 하고 싶어 합니다. 임의로 555개의 비행기를 골라 해당 비행기에 탑승한 고객들에게 모두 설문을 실시합니다.
군집표집은 특정 집단의 모든 구성원들을 표본으로 뽑기 때문에, 특정 집단이 모집단을 대표할 때 많이 사용됩니다.
    - 계통추출
모집단의 구성원이 특정 순서로 정렬되어 있고, 시작점은 임의로 지정됩니다. 매 n^{\text{}}n 
 n, start superscript, start text, end text, end superscript번째 구성원이 표본으로 뽑힙니다.
예제—교장 선생님은 학생 이름을 알파벳 순으로 정렬한 뒤, 시작점을 임의로 선택합니다. 매 20^{\text{}}20 
 20, start superscript, start text, end text, end superscript번째 학생은 설문에 참여하게 됩니다.

실험 연구 와 관측 연구

    - 관측 연구
표본에 영향을 미치지 않으면서 표본의 개체들을 측정하거나 조사합니다.
    - 대조 실험 (실험 연구)
사람이나 사물을 두 집단으로 나누고 한 집단에만 실험군을 적용하고, 다른 집단에는 적용하지 않습니다

실험에서의 용어

설명 변수 : 다른 변수에서의 변화를 설명
반응 변수 : 실험 결과를 측정
실험군 : 실험에서 개개인에게 주어진 설명변수의 특정 수준이다. 
        설명변수가 많다면, 실험군은 각 설명변수의 특정 수준의 조합
실험단위 : 실험군에게 주어진 것
대조군 : 실험군이 주어지지 않은 집단