본문 바로가기
방법론 및 논문 쓰기

자료/데이터(Data)의 종류

by Keep Learner 2023. 11. 14.

 

자료/데이터(Data)의 종류

 

양적연구를 직접 수행하기 위해서는 데이터를 다룰 줄 알아야 합니다!

연구질문을 떠올리고, 필요한 데이터를 구상하고, 이를 수집해서 정리하는 과정이 필수적이요.

이러한 과정을 자연스럽게 하기 위해서는 데이터의 종류를 이해하는 것이 중요합니다.

어떤 종류의 데이터냐에 따라서 기술통계나 추론통계에서 사용하는 기법들이 달라지기 때문이죠.

그래서 오늘은 데이터의 종류를 설명해보려 합니다.

 

*참고

본론에 들어가기 전에 변수(variable)와 값(value) 개념에 익숙치 않은 분들을 위해 잠깐 설명하고 넘어가겠습니다.

변수(variable)은 "값이 변하는 문자/공간/특성"이라고 생각할 수 있습니다.

그리고 값(value)는 변수가 가질 수 있는 여러 형태라고 보면 됩니다.

1. 질적 변수와 양적 변수의 구분

  • 질적 변수(Qualitative variable): 분류를 목적으롷 하는 변수
  • 양적 변수(Quantitative variable): 수치화할 수 있는 변수

가장 먼저 변수는 질적 변수(Qualitative variable)양적 변수(Quantitative variable)로 구분할 수 있습니다.

양적연구인데 질적변수가 있나요?!! 라고 의문이 생기실 수도 있습니다.

질적 변수도 양적 변수도 모두 정량화(quantification)이 이루어진 데이터인데요.

질적 변수는 분류를 목적으로 하는 변수이며, 양적 변수는 수치로 나타낼 수 있는 변수를 의미합니다.

 

2. 질적 변수의 구분: 명목형 변수와 순서형 변수

  • 명목형 변수(nominal variable): 분류를 하지만 유형 간 순서/서열은 없는 변수
  • 순서형/서열형 변수(ordinal variable): 분류된 유형 간에 순서 또는 서열이 있는 변수

분류를 목적으로 하는 질적 변수에는 명목형 변수(nominal variable) 순서형/서열형 변수(ordinal variable)가 있이요.

명목형 변수는 분류를 하지만 분류된 유형 간에 서열 관계가 없지만, 순서형 변수는 유형 간에 서열 관계가 있습니다.

 

명목형 변수의 예에는 혈액형이나, 거주지 등이 있는데요. 혈액형에는 유형 간에 우열이 없기 때문에 명목형 변수이죠.

순서형 변수의 예에는 학점, 선호도, 석차 등이 있어요.

만약 거주지 역시 서울과 가까운 지역으로 등급을 부여한다면 순서형 변수 형태로 표현할 수도 있을 것입니다.

 

3. 양적 변수의 구분: 이산형 변수와 연속형 변수

  • 이산형 변수(discrete variable): 셀 수 있는 변수(영과 양의 정수)
  • 연속형 변수(continuous variable): 연속적인 값을 취하는 변수(유리수)

이번에는 양적 변수에 관해 알아보도록 하겠습니다.

양적 변수는 이산형 변수(discrete variable)연속형 변수(continuous variable)로 구분할 수 있어요.

이산적(discrete)라는 의미는 숫자를 셀 수 있다는 의미입니다. 그래서 이산형 변수는 셀 수 있는 변수를 뜻하죠.

수강과목의 수, 전쟁의 사상자 수, 형제자매의 수와 같이 숫자를 세는 변수가 이산형 변수입니다.

달리 표현하자면 영(0)과 양의 정수만으로 구성된 변수라고 생각할 수 있죠.

 

연속적(continuous)이라는 의미는 변수의 값이 연속적으로 표현된다는 의미인데요.

이산형 변수를 생각해보면 0, 1, 2, 3...이렇게 진행되기 때문에 0가 1, 1과 2, 2와 3 사이 등이 뚝 끊어져 있다고 생각할 수 있습니다! 징검다리라고 표현할 수도 있겠네요. 정수의 특징이죠.

 

연속형 변수는 그 사이가 끊어져 있지 않고 연속해서 이어져 있다는 의미입니다.

마치 아스팔트 도로처럼 숫자가 쭉 이어져 있다는 뜻이죠. 그래서 "유리수"가 변수의 값이 될 수 있습니다.

따라서 이산형 변수의 예에는 키, 몸무게, 각종 비율 등이 포함될 수 있습니다.

 

 

오늘은 변수의 가장 기본적인 구분 형태인 질적 변수와 양적 변수의 구분, 그리고 명목형, 순서형, 이산형, 연속형 자료의 구분에 관해 알아보았습니다. 다음 포스팅에서는 한 걸음 더 나아가 비율 변수와 구간 변수 그리고 이항 변수에 관해 살펴보겠습니다!! 감사합니다~!

 

 

*구간변수, 비율변수, 더비변수에 관한 설명은 다음을 참고하세요.

2023.11.15 - 구간 변수, 비율 변수, 이항변수/더미변수

 

구간 변수, 비율 변수, 이항변수/더미변수

구간변수 & 비율변수, 그리고 이항변수/더미변수 지난 포스팅에서는 질적변수와 양적변수를 구분하고, 또 각각을 명목변수와 순서변수, 이산변수와 연속변수로 구분해보았습니다. 그런데 변수

international-relations.tistory.com

 

 

 

댓글