작업형 1유형에 대한 예상, 연습문제를 간단하게 만들어 보았습니다. 예시로 나온 1유형문제와, 실기 2회 복원 문제를 임의로 만들어 보았습니다. 복원문제라고 적어둔것도 저도 무슨 문제인지 몰라서 대충 어떻게 했다는 것만보고 적어보았습니다.
1. 1유형 예시문제
데이터와 풀이는 위 게시글을 참고해주시길 바랍니다.
2. 데이터 다루기 복원문제 1
부동산데이터에서 LotArea의 가장 큰 10개의 값을 가장 작은 값으로 대치한 다음 PoolArea이 100보다 큰 것들을 가져와서 LotArea의 평균을 구해보기
데이터와 풀이는 위 게시글을 참고해주시길 바랍니다.
3. 데이터 다루기 복원문제 2
훈련 데이터 80%추출 후 결측치 중앙값으로 보정. 보정 전후의 표준편차 차이 구하기
LotFrontage의 데이터 결측치를 중앙값으로 보정을 하고 보정 전후의 표준편차를 구해봅시다.
데이터와 풀이는 위 게시글을 참고해주시길 바랍니다.
4. 데이터 다루기 복원문제 3
조건에 맞는 이상값의 총 합 구하기 IQR을 기준으로 이상치를 구하고 이상치의 합을 계산해보자 이번 데이터는 예시로 나온 작업형 1유형의 [‘qsec’]열을 사용하는 것으로 하겠습니다.
작업형 1유형의 경우 이상치를 어떻게 처리하는가 데이터의 중위값, 평균값, 결측값 전처리를 간단하게 해볼 수 있는가 정도 볼 수 있습니다. print문으로 정답이 나와야 하기 때문에 Groupby문제도 나올거 같지도 않고 Pandas를 어느정도 잘 사용하시고 자주 사용하시는 명령어 몇가지 익혀가시면 무난하게 풀 수 있을 것으로 예상합니다.
개인적인 생각으로는 빅데이터분석기사 실기를 준비하실때 시간이 넉넉하신 분들이라면 Pandas를 다루는 책한권을 쭉 보시면서 데이터프레임을 어떻게 다루는지 감을 익히신 다음에 Scikit-learn을 다루는 책을 기반으로 캐글 문제를 몇 개 풀어보는 식으로 대비를 하면 충분할거 같습니다. 오히려 조금만 깊게 들어가도 캐글 문제 난이도가 더 높기 때문에 빅분기 실기는 쉽게 하실거라 생각됩니다. 시중에 나와 있는 책은 저도 한권 사서 봤지만 아무래도 방향도 못잡고 엉망인거 같더라고요
그리고 영어라서 좀 이해하기 힘들수 있을지도 모르겠는데 저는 시간 나면 캐글의 무료강좌를 쭉 봅니다. 초보자를 위해 제작되었기도 하고 별 의미는 없지만 완료 증서도 줍니다 ㅋㅋ. 마찬가지로 영어에 거부감이 없으시고 여유가 있으시다면 필요한 강좌를 찾아보시는 것도 도움이 되실겁니다. 저도 캐글 대회 말고 강의를 보면서 도움을 많이 받았습니다.
Comments powered by Disqus.