04. 통계
04. 통계
논문을 쓰게된다면 통계라는 난관에 부딪치게 된다.
특히 실험연구에서 모집단에서 표본 데이터가 있는 경우 데이터의 타당성을 검증하기 위해서는 통계를 통한 검증이 필요하다.
통계에서 많이 쓰이는 T- 검증을 예를 들어 설명하자면
집단간 의 평균 데이터 비교를 통해서 유의확률 범위 (사회과학 분야에서 5% 범위, 예를 들어 100번 실험해서 5번 틀릴 확율) 에서 영가설이 기각되고 유의미한 결과치가 있음을 나타내고자 한다.
앞서서 설명한 귀무가설(영가설), 대립가설을 떠올리면 귀무가설로 두 집단간의 차이가 없다. 대립가설은 두 집단간의 차이가 있다이다.
과거에는 통계 데이터를 엑셀이나 수식을 이용해서 분석 하였지만. 지금은 통계 분석 프로그램이 있다.
대표적으로 많이 쓰이는 프로그램이 SPSS 이다.
아래 사이트에서 14일 무료기간 동안 체험판을 설치해서 사용해 볼 수 있다.
https://www.ibm.com/analytics/kr/ko/technology/spss/spss-trials.html
SPSS 방법은 블로그, 책이나 동영상을 통해서 많은 정보를 얻을 수 있다.
만약 세집단간의 비교를 원한다면 또 다른 통계 프로그램인 ANOVA 를 사용하면 된다.
추가로 통계에서 많이 다루는 몇가지 개념을 이해하고자 한다.
N: 모집단 추출 갯수
:평균, 전체를 갯수로 나눈 값
:중앙값, n개의 값을 크기 순으로 늘어놓았을 때 가장 가운데에 있는 숫자
:편차, 관측값에서 평균, 중앙값을 뺸 것 ( 평균과의 차이값 )
:표준 편차, 분산의 제곱근
:분산, 관측값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구함.
분산과 표준편차를 통해서 데이터 격차의 차이를 쉽게 알아 본다라고 생각하면 된다.
상관계수, 회계계수
두 변인간의 연결정도 크기(강한지, 약한지)를 상관계수라하고 종속변인에 따른 독립변인의 관계를 그래프(가까운지, 먼지)로 표시한계 회계계수 이다.
독립변인이 여러개면 다중회계계수라 한다.
복잡한 수식을 써서 설명을 할 수도 있지만은
기본정도 개념을 이해하고 자기가 설정한 논문의 자료에 맞추어서 통계 자료에서 찾아서 분석하여 기술한다고 보면 된다.
성태제 교수님의 알기쉬운 통계분석 책을 추천한다. 정말 통계를 처음 접하는 사람도 쉽게 따라하면서 통계의 원리를 배울 수 있다.
통계라는 것이 처음에는 어렵게 느껴지지만 어느정도 기본 개념이 잡히고 어떤 통계를 활용해서 나의 데이터의 유의미함을 증명하면 된다.
어느 일정수준이 시간이 흐르면 개념이 잡힐 것이다.
논문 주제가 어느정도 가닥히 잡혔다면 선행연구를 찾아보아도 좋다. 선행연구에서 비슷한 통계를 가지고 분석해논 자료가 많이 있을 것이다. 연구분석된 데이터를 가지고 공부하며 모르는 것을 물어보며 배우는 것도 한 방법이다.
논문 통계에 대한 강의도 많이 열린다. 학원이나 수강을 통해서 배우는 것도 빠른 방법이나 가격이 좀 비싸다. 대학교 계절학기강의가 정기적으로 열리는 편이니 학교 게시판을 통해서 통계 수업을 듣는 것을 추천한다. 비재학생이면 비용이 조금 더 있지만 큰 가격차이가 나지는 않아 부담이 크지가 않다.
참고로 상경계열 경영이나 회계에서 통계 수업이 많이 이루어진다.
통계를 배울 수 있는 기회는 많은 편이니 처음부터 너무 조급하게 생각하지 않아도 될 것 같다.^^