설문 조사 오류를 줄이기 위해 좋은 설문 조사 디자인
신뢰 구간이란 무엇입니까?
신뢰 구간 은 조사 대상자 의 모든 구성원에 대해 특정한 연구 질문 을하고 샘플 구성원 이 설문 조사에서 준 것과 동일한 대답을받을 수있는 경우 연구자가 경험하게 될 오류의 한계입니다.
예를 들어, 연구자가 4의 신뢰 구간을 사용하고 설문 샘플 참가자의 60 %가 "친구에게 권하겠습니까?"라고 답하면 전체 대상 인구의 54 %에서 64 % 사이에서 똑같은 질문을 할 때 "친구에게 추천하겠습니까?"라고 말합니다. 이 경우 신뢰 구간은 +/- 4입니다.
신뢰 수준이란 무엇입니까?
신뢰 수준 은 샘플에서 얻은 데이터에 대해 연구원 이 얼마나 확신 할 수 있는지 표현한 것입니다. 신뢰 수준은 백분율로 표시되며 대상 인구의 해당 백분율이 신뢰 구간 내에있는 대답을 얼마나 자주 제공할지 나타냅니다. 가장 일반적으로 사용되는 신뢰도는 95 %입니다. 관련 개념을 통계적 유의성이라고합니다.
그의 표본이 실제로 표적 집단을 대표 할 확률에 대한 연구원의 확신 은 여러 가지 요인에 의해 영향을받습니다.
연구 설계 및 구현에 대한 연구원의 확신과 한계에 대한 인식은 크게 표본 크기, 응답 빈도 및 인구 규모와 같은 세 가지 중요한 변수를 기반으로합니다. 연구자들은 연구 계획 단계에서 이러한 변수를 신중하게 고려해야한다는 것에 오랫동안 동의 해 왔습니다.
- 표본 크기 일반적으로 말하면 표본 집단이 실제로 반영된 데이터가 더 큰 표본을 제공합니다. 넓은 신뢰 구간 은 오류에 더 큰 마진 이 있기 때문에 데이터의 신뢰도가 낮다는 것을 나타냅니다. 넓은 신뢰 구간은 내기를 헤지하는 것과 같습니다. 신뢰 구간과 표본 크기 사이에는 관계가 있지만 선형 관계 는 아닙니다. 연구원은 표본 크기를 두 배로하여 자신감 수준을 절반으로 줄일 수 없습니다.
- 응답 빈도 샘플 데이터가 대상 인구를 반영하는 정확도 는 특정 답변을 하거나 특정 방식 으로 응답 한 응답자 의 비율에 따라 다릅니다. 특정 답변을 한 응답자의 수가 많을수록 "매우 행복하다"고 말하면서 연구원은 그 응답 일 수 있습니다. 정상 곡선의 중간 영역에서 백분율에는 약간의 가변성이있을 것입니다. 즉, 연구자가 표본 집단의 구성원이 표본 집단의 구성원과 같은 (신뢰 구간 내에서) 응답 할 것이라는 확신이 50 %라면 그 50 % 수준에서 약간의 편차가있을 수 있습니다.
이상치 (정상 곡선의 끝이나 꼬리에있는 데이터) 는 표본에서와 마찬가지로 인구 통계에서 거의 동일한 비율로 발생할 가능성이 더 높다는 것을 기억하는 것이 좋습니다. 여기서는 변동성이 적습니다 왜냐하면 주파수 가 더 낮기 때문입니다. (Galton Box의 볼이 Pacific Science Center 전시회 중간에 쌓이는 경향을 생각해보십시오. 단지 몇 개의 볼만 꼬리로 튀어 오릅니다.) 이러한 이유 때문에 극단적 인 답변 의 빈도를 확신하는 것이 더 쉽습니다 .
- 인구 규모 는 연구자가 매우 작고 알 만한 인구 (예 : 인구의 모든 구성원이 연구원에 의해 식별 될 수있을만큼 충분히 작음)로 작업하지 않는 한 표본 크기 에서 중요한 요소가 아닙니다.
Creative Research Systems는 다음과 같이 지적합니다.
확률의 수학은 표본의 크기가 검사중인 전체 인구의 몇 퍼센트를 초과하지 않는 한 인구의 크기가 부적합 함을 증명합니다. 이것은 500 명의 사람들이 100,000 명의 도시인 15,000,000 명의 시민들 의 의견 을 조사하는 데 똑같이 유용하다는 것을 의미합니다.
대표 샘플을 생성하는 것은 많은 비용과 시간이 소요될 수 있습니다. 연구원은 항상 얻고 자하는 자신감 수준 또는 달성해야 할 정확성 정도와 그들이 감당할 수있는 자신감 수준 간의 균형을 맞 춥니 다.
질적 조사 연구의 표본 크기
질적 연구는 본질적으로 탐구 적이거나 묘사 적이거나 숫자 나 측정에 초점을 두지 않습니다. 그러나 질적 조사 연구에서 샘플링 오류에 대한 우려는 여전히 유효합니다. 일반적으로 표본이 표적 우주를 대표하는 경우 연구에서 나오는 주제 나 패턴은 연구자가 관심이있는 더 큰 인구를 반영합니다. 표본이 대표적이며 대상 인구의 많은 비율로 구성된 경우 해당 표본에서 파생 된 데이터의 정확성에 대한 신뢰도가 높아지는 경향이 있습니다.
설문 조사에서 표본 크기 결정
표본 크기를 결정할 때 양적 연구와 질적 연구에는 다른 규칙이 적용됩니다. 일반적으로 질적 조사 연구에 의해 생성 된 데이터에 확신을 가지려면 연구원은 데이터가 어떻게 사용될 것인지 명확하게 알 필요가 있습니다. 자료는 서술적인 서술 (사례 연구 또는 일부 민족 지학 연구에서와 같이)을위한 기초를 형성하거나 나중에 정량적 연구에서 상관 관계를 테스트 할 수있는 관련 변수를 확인하기위한 탐색 적 방식으로 사용될 수있다.
양적 조사 연구의 표본 크기
양적 연구는 종종 대상 시장의 시장 부문 또는 하위 집단 간의 비교를 포함합니다. 양적 연구는 숫자 중심적이므로 안락한 표본 크기를 결정하는 것은 상당히 쉽습니다. 연구의 중요한 그룹이나 세그먼트별로 연구원은 100 명의 참가자를 조사하기를 원할 것입니다. 이 숫자는 절대적인 것이 아니라 권장 사항입니다. 시장 조사자는 조사 연구에서 표본의 크기를 결정하기 위해 여러 가지 관련 변수를 고려합니다.
조사 시장 조사를 수행 할 때, 목표는 표적 우주에 대해 사실 일 가능성이있는 표본으로부터 추론 하는 것입니다. 샘플은 관찰 되거나 알려질 수있는 데이터를 제공합니다. 이 관찰 또는 알려진 데이터로부터 연구원은 표적 집단에서 알려지지 않은 값 또는 매개 변수 가 발견 될 수있는 정도를 추정 할 수 있습니다.
양적 조사 연구는 연구자의 마음에 연구자가 실제로 매개 변수를 알기 보다는 추정해야하는 인구 인 표적 우주를 나타내는 정상 적이고 대칭적인 곡선의 개념을 기반으로합니다. 대표적인 표본은 연구자가 표본 데이터로부터 미지의 가치 또는 관심있는 매개 변수를 포함 할 것으로 예상되는 값의 범위 를 계산할 수있게 해줍니다. 이 추정 된 값 범위는 정규 곡선의 면적을 나타내며 일반적으로 십진수 또는 백분율로 표시됩니다.
정규 곡선과 확률
정상적인 대칭 곡선은 확률의 시각적 표현입니다. 간단한 휴리스틱을 살펴 보겠습니다. 과학 센터의 활동으로 한 번에 하나씩 2 개의 아크릴 시트 사이에 많은 수의 볼을 떨어 뜨릴 수 있습니다. 모든 볼은 디스플레이의 상단에있는 동일한 개구부를 통과 한 다음 볼이 떨어지면 볼 스택을 분리하는 수직, 평행 분할기 사이에 떨어집니다. 몇 시간이 지난 후에, 볼은 정상 커브의 모양을 형성합니다. 새롭게 도입 된 볼이 처음 도착한 볼의 덩어리를 때리면 커브가 조금씩 바뀝니다. 그러나 전반적으로 대칭 곡선은 분명하며 과학 센터 관찰자 또는 직원이 수행 한 작업과는 독립적으로 자연스럽게 발생합니다. 볼이 형성하는 구부러진 모양은 대부분의 볼이 중앙에 떨어져서 거기에 머무를 확률을 나타냅니다. 공이 적을수록 커브의 맨 끝 부분에 도달하게됩니다. 필연적으로 그렇지만 일부는 적습니다.
이 정규 곡선은 샘플 개념과 유사합니다. 디스플레이가 비게되고 공이 다시 Galton 박스에 떨어질 때마다, 공 스택의 구성은 약간 다를 것입니다. 그러나 시간이 지남에 따라 커브의 모양은 많이 변하지 않을 것이고 패턴은 사실로 유지 될 것입니다.