소셜 미디어 샘플의 품질을 높이는 방법
이러한 차이는 연령, 성별, 결혼 상태, 사회 경제적 지위, 건강 상태 및 자녀 수에서 나타났습니다.
응답률
연구 종료 시점의 데이터가 표본의 모든 구성원을 포함하는 정도를 응답률 이라고합니다. 이 개념은 구조화 된 설문 조사 또는 일련의 인터뷰에서 분명하지만 소셜 미디어 연구에서는 더 모호합니다. 그러나 소셜 미디어 연구에서는 다른 유형의 질적 연구 보다 중요하지 않습니다. 응답률은 조사를 완료하거나 인터뷰에 동의 한 참가자 수를 원래 샘플링 노력을 한 사람의 수로 나눈 값입니다. 총 숫자에는 성공적으로 연락하지 않았거나 연구 참여를 거부 한 사람들이 포함되어야합니다.
일반화 문제
데이터를 수집하는 방법에 관계없이 높은 응답 속도의 중요성은 충분히 강조 할 수 없습니다.
표본의 응답률이 낮 으면 더 많은 인구를 현실적으로 생성 할 수 없습니다. 응답 속도가 떨어지면 샘플 바이어스가 증가합니다. 미디어 기반 설문 조사에서 수익률이 표본의 20 ~ 30 %로 떨어지면 해당 표본 집단은 전체 표본 집단과 거의 유사하지 않습니다.
사람들이 우편으로 설문 조사를 반환하거나 전화 설문 조사에 참여하는 것과 같은 경향은 소셜 미디어 네트워크에 종사하는 사람들, 즉 해당 주제 (또는 제품 또는 서비스에 대한 특정 관심사가 있다).
표본의 크기
작은 샘플은 큰 샘플보다 큰 샘플링 오류가 있습니다. 표본 데이터가 더 많은 인구의 속성을 추정한다고 가정합니다. 샘플링 프레임 에서 추출한 각 샘플은 더 큰 모집단에 대한 별도의 추정치를 제공합니다. 이론적으로 질문 된 각 질문에 대해 취한 각 표본에 대해 별도의 응답 패턴이있을 수 있습니다. 시간이 지남에 따라 샘플링 프레임에서 추출 된 충분한 샘플을 사용하면 실제 패턴은 더 큰 모집단의 실제 (실제) 패턴을 중심으로 수렴됩니다.
오류의 여유
표본 오차는 더 큰 집단에서 취한 모든 표본의 추정 정확도를 나타냅니다. 표본 오차는 통계적 척도 인 신뢰 수준과 관련된 오차 범위로 표현됩니다. 예를 들어, 대통령 선거 투표에서, 현직 위원은 유권자의 64 %가 선호하는 것으로 나타납니다. 오류의 마진은 95 % 신뢰 수준의 플러스 마이너스 3 포인트입니다.
즉 100 명의 유권자 100 명을 대상으로 설문 조사를 실시한 결과, 유권자 100 명 중 95 명은 유권자가 61 %에서 67 %의 유권자를 선호한다는 것을 나타냅니다. 즉 유권자의 61 % + 3 % 또는 -3 %입니다.
샘플 크기에 관한 결정
표본 크기가 올라감에 따라 표본 추출과 관련된 오차 범위는 줄어들지 만 특정 지점까지가됩니다. 표본 크기 가 1000 명에서 2000 명에 이르면 오차 범위가 충분히 작아서 비용이 많이 드는 표본을 고려하지 않아도됩니다. 하위 집단이 더 큰 집단의 일부일 때, 더 큰 표본 크기는 오류의 마진이 하위 집단의 사람들의 수에 따라 각 하위 집단마다 다르므로 정당화 될 수있다. 예를 들어, 소셜 미디어 네트워크의 1000 명의 회원과 95 % 신뢰 구간을 가진 1 ~ 3 % 포인트의 오차 범위에서, 소셜 미디어 네트워크의 소그룹 분석 (예 : 집에서 머물러 라. 약 100 개의 엄마는 4-10 점 정도의 오차가 더 큽니다.
샘플 충분도 측정
샘플은 전형적으로 최종 크기 또는 조성보다는 사용 된 선택 절차에 따라 평가됩니다. 이것은 대부분의 상황 에서 샘플이 더 큰 모집단의 대표성 을 정확하게 측정하는 것이 불가능하기 때문에 기본적입니다. 통계적 절차는 편리하고 근본적으로 신뢰할 수있는 추정을 허용하기 때문에 사용됩니다. 합리적인 신뢰 구간과 오류 마진을 초기에 설정하면 연구자는 응답률 및 적절한 샘플링 프레임과 같은 변수에 집중할 수 있습니다.