자격증

빅데이터분석기사 실기 공부(7) - 1 유형 문제풀이

studyoung 2024. 6. 9. 19:54
반응형

※ 해당 글은 '빅데이터분석기사' 자격증 취득을 위해 개인 공부기록 용도로 작성된 내용입니다.

(출처 :유튜브 메타코드M)


시험유형

 

1. 데이터 타입(object, int, float, bool 등)

2. 기초통계량(평균, 중앙값, 사분위수, IQR, 표준편차 등)

3. 데이터 인덱싱, 필터링, 정렬, 변경 등

4. 결측치, 이상치, 중복값 처리(제거 or 대체)

5. 데이터 Scaling(데이터 표준화(z), 데이터정규화(min-max))

6. 데이터 합치기

7. 날짜/시간 데이터, index 다루기

 


# 1. mpg 제1사분위수 정수값
q1 = df['mpg'].quantile(0.25)
print(round(q1))
# 2. mpg 19이상 21이하 데이터 수
cnt = df[['mpg']][df['mpg'].between(19,21)]
print(len(cnt))
# 3. hp 변수의 iqr 값
q1 = df['hp'].quantile(0.25)
q3 = df['hp'].quantile(0.75)
iqr = q3-q1
print(iqr)
# 4. wt 변수의 상위 10개 값의 총합(소수점 버린 정수)
sum = df[['wt']].sort_values(by='wt', ascending=False).head(10).sum()
print(int(sum))
# 5. 전체 자동차에서 cyl가 6인 비율이 얼마인지 소수점 첫째자리
total = len(df[['cyl']])
cyl6 = len(df[['cyl']][df['cyl']==6])
print(round(cyl6/total,1))
# 6. 순서대로 10개 뽑은 후 mpg 열의 평균값 반올림 정수
top10 = df[['mpg']].head(10)
mean = top10.mean()
print(int(round(mean)))
반응형