데이터 분석 전문가 자격증의 마지막 관문, ADP 실기 시험을 준비하는 여러분 안녕하세요, 슬기로운 통계생활 입니다. 오늘은 ADP 실기 기출 문제 포스팅입니다. ADP 실기반 수강생들에게 전해들은 것을 참고로 비슷한 통계 문제들을 만들었으니 준비하시는데 참고 바랍니다. 🙂

블로그 글을 작성함에 있어서 최대한 정확한 정보를 제공하고자 노력하고 있습니다만, 간혹 오류가 있을 수 있습니다. 발견시 댓글 달아주시면 정정하겠습니다. 블로그의 링크들을 통하여 구매하시면 소정의 커미션이 슬통에 들어옵니다.

들어가며

본 문서는 지난 2년 동안 슬기로운 통계생활 데이터분석 전문가 (ADP) 실기반을 운영하면서 학생들의 후기들을 참고하여 제작되었습니다. ADP 실기 시험에서 물어보고자 하는 것을 최대한 반영하여, 비슷하게 만들어낸 가상의 문제집이니 이점 유의하시기 바랍니다. 그럼에도 불구하고, ADP 실기 시험의 난이도나, 어떠한 내용들을 중점적으로 물어보는지, 현재 나의 시험 준비 상태는 어떠한지 판단하는데에는 아주 유용한 자료가 될 것이라 생각합니다.

  • 문제에 사용된 데이터 역시 캐글이나 R, Python에서 제공하는 비슷한 구조 데이터를 차용하거나 시뮬레이션을 통하여 만들었습니다. 실제 기출 문제가 아님을 유의하세요! 따라서, 여러분이 문제 푸실 때 매끄럽지 않을 수 있습니다.
  • 각 회차별 문제에는 일부러 토픽은 적지 않았습니다. 문제를 보고 어떤 토픽에 관련한 문제인지 판단하는 것도 문제 푸는데 중요한 능력이죠?
  • 시계열 기출의 경우 머신러닝 문제.Zip에서 다룹니다.

자료는 계속해서 업데이트 될 예정입니다. 문제 오류나 오타 발견시 네이버 카페로 제보주세요! 자료가 여러분의 공부에 도움이 되시길 바랍니다. 아울러 저희 ADP 실기 파이썬 반R반 역시 많은 관심 부탁드립니다. 데이터 분석 공부는 슬기로운 통계생활! 🙂

역대 데이터 분석 전문가 ADP 실기 기출 모음

제 30회 ADP 실기 기출

문제 5

아래 데이터는 3개의 철강 제조공장(공장A,공장B,공장C)에서 생산된 제품을3개의 지역(지역1, 지역2, 지역3)으로 배송할 때 발생하는 운송비용과 공장별 총 생산량, 지역별 총 수요량이다.

이 데이터를 활용하여 총 운송비를 최소로 하는 운송계획을 수립하시오. (단, 각 공장에서는 3개 지역으로만 운송되고, 공장간 또는 지역 간 운송은 없다고 가정한다.)

구분지역1지역2지역3총생산량
공장 A12만원5만원34만원70개
공장 B22만원2만원21만원55개
공장 C3만원23만원15만원25개
총 수요량30개50개70개

문제 6

아래 데이터를 이용하여 헤드셋에 대한 연령대별 선호도 차이가 있는지를 유의수준5%로 검정하시오. (단,반올림하여 소수점 셋째 자리까지 표시하시오.)

  • 데이터: headset.csv
  • 데이터는 ID, 헤드셋 종류, 연령대로 구성
  1. 연구가설(H1)과 귀무가설(H0)을 설정하시오.
  2. 유의확률을 계산하고 가설의 채택 여부를 결정하시오.

문제 7

각각 6명의 자녀를 가진 다섯 가족이 있다. 각각의 자녀가 아들 또는 딸일 확률은 0.5일 때 아래 질문에 답하시오. (단, 반올림하여 소수점 셋째 자리까지 표시하시오.)

  1. 4명 이상의 딸을 가진 가족이 세 가족 이상일 확률을 0에서 1 사이 숫자로 구하시오.
  2. 다섯 가족 중 몇 가족이 4명 이상의 딸을 가질 것으로 기대되는지 계산하시오.

제 29회 ADP 실기 기출

문제 5

제품 A의 불량률은 0.03이다. 25개의 제품을 뽑았을 때 3개가 불량일 확률을 구하시오. (소수점 다섯 째 자리에서 반올림)

문제 6

C사 생산 제품 1000개 중 양품이 600개, D사 생산 제품 500개 중 양품이 200개 이다. 두 회사의 양품률에 차이가 있는지 검정하여라.

문제 7

아래 데이터는 a,b,c,d 네 차종 각각 5회 실험 시 범퍼 파손 정도 이다. (단, 각 모집단은 정규분포를 따르며 모집단 간 등분산성을 가정한다.)

  1. 각 차종 별 범퍼 파손의 정도에 차이가 유의한지 검정하라.
  2. 귀무가설을 채택한다면 그 의미를 해석하고, 귀무가설을 기각하였다면 사후분석을 시행하라.

문제 8

L1, L2, L3 세 개의 생산라인에서 각각 13%, 37%, 50%를 생산하며 각각 1.1% , 2.1%, 3.3% 불량률을 갖는다. 불량 제품이 나왔을 때 L1 라인에서 생산되었을 확률을 구하시오. (소수점 둘째자리에서 반올림)

제 28회 ADP 실기 기출

문제 4

다음의 질문에 답하시오.

  1. Geartool 데이터 셋을 이용하여 시간별, 제조사별 불량률 데이터로 생존분석을 시행한 후 25, 30, 35개월 후의 불량률을 계산하시오.
  2. 로그 순위법으로 제조사별 불량률이 차이가 있는지 검정하시오.

문제 5

다음 표는 슬통 Food의 신제품 홍보 설문 조사 결과이다. 시식 행사에 참여한 고객들의 시식 후 구매 의사의 변화가 있는지 없는지 검정하시오.

구분시식전있음없음
시식전있음237
없음1812

문제 6

school_exam.csv 파일에는 2개의 고등학교 시험 표준 점수가 들어있습니다. 두 학교 표준 점수의 분포 차이가 있는지 검정하시오. (단, 각 학생들의 성적은 독립이라고 가정)

문제 7

몸무게를 제어했을 때, 나이와 콜레스테롤 상관계수 및 유의확률 구하라.

제 27회 ADP 실기 기출

문제 5

슬통 전자는 과거 수년간 전통적인 제조 방식을 사용하여 전자제품을 생산해 왔습니다. 2년 전, 회사의 연간 생산량은 10만 개였습니다. 그러나 기술의 발전과 시장의 변화를 감지하고, 회사는 생산 효율을 향상 방법을 모색했습니다. 그 결과, 1년 전에는 생산량을 15만 개로 늘렸습니다. 최근 회사는 스마트 팩토리 도입의 결정으로 연간 생산량은 무려 25만 개로 증가하였습니다. 이러한 변화를 통해 연평균 몇 배의 증가가 이루어졌는지 계산하시오. (단, 반올림하여 소수점 셋째 자리까지 표시하시오.)

문제 6

엘리베이터에 설치된 미디어 보드에서 8개의 광고 영상의 평균 광고시간 (단위: 초)을 조사하였다.

19.26,17.09,16.71,19.76,17.25,18.88,20.12,16.4619.26,17.09,16.71,19.76,17.25,18.88,20.12,16.46

이 데이터가 정규분포를 따른다고 할 때, 광고시간의 90% 신뢰구간을 소수점 둘째 자리까지 구하시오.

문제 7

streams.csv 파일에는 16개 강의 상류와 하류에서의 생물 다양성 데이터가 포함되어 있습니다. 강물은 상류에서 하류로 흐르며, 같은 강의 상류와 하류 생물 다양성은 서로 종속적인 관계에 있습니다. 상류와 하류의 생물 다양성 점수 평균에 차이가 있는지 유의수준 0.05로 검증하시오.

  1. 귀무가설과 연구가설을 제시하시오.
  2. 검정 통계량 및 유의확률을 산출하고, 연구가설 채택 여부를 판단하시오.

문제 8

부산시에서 교통 관리 담당자 슬통이는 교통량이 기상 조건에 어떻게 영향을 받는지 알아보고자 한다. 특히, 비나 눈, 바람과 같은 기상 조건이 도로의 교통량에 어떤 영향을 미치는지 궁금해한다. 지난 1년 동안의 교통량과 기상정보 데이터 traffic.csv 파일을 사용하여 다음에 답하시오.

  1. 분위수 회귀(quantile regression)를 이용하여 회귀 계수를 구하십시오. (단, 여기서 분위수는 50백분위수를 사용합니다.)
  2. 기온이 15.5℃, 강수량이 16.5mm, 풍속이 1.6m/s일 때의 교통량은 어떻게 되는지 예측하십시오.

문제 9

subway.csv 파일에는 최근 서울시에서 서울역의 지하철 승차 인원수를 조사하며, 1월과 2월의 출근시간(7시~9시) 동안의 승차 인원을 관찰한 데이터가 들어있습니다. 서울시의 데이터 분석 팀은 다양한 호선과 월별 승차 인원의 차이를 알고 싶어합니다. 호선과 월의 상호작용에 따라 승차 인원수에 차이가 있는지 유의수준 0.05에서 검정하시오. (단, 제곱합 계산에는 제3종 Type Ⅲ을 이용하시오.)

  1. 귀무가설과 대립가설을 제시하라.
  2. 검정통계량 및 유의확률을 계산하고, 연구가설 채택 여부에 대하여 서술하시오.

제 26회 ADP 실기 기출

문제 4

슬통 전구회사는 자사의 제품 생산 라인에서 최근 불량률이 급증했다는 내부 보고서를 받았습니다. 초기 보고서에 따르면 불량률이 약 90%에 달한다고 합니다. 회사의 경영진은 이를 확인하기 위해 독립적인 품질 검사팀에 조사를 의뢰하였습니다. 검사팀은 신뢰도 95%로 불량률을 확인하기 위해 필요한 표본 크기를 계산하려고 합니다. 오차한계가 3% 내외로 허용된다면, 검사팀은 최소 몇 개의 제품을 표본으로 선택해야 하는지 계산하시오.

문제 5

어느 도시에 있는 3개의 선거구에서 특정후보 A를 지지하는 유권자의 비율을 비교하기 위해 각 선거구에서 300명을 무작위를 추출하여 조사한 데이터이다. 주어진 데이터를 대상으로 후보A를 지지하는 비율이 3개 선거구 간에 차이가 있는지를 5% 유의수준에서 검정하라.

구분선거구 1선거구 2선거구 3
지지함176193159
지지하지 않음124107141
  1. 연구가설과 귀무가설을 설정하시오.
  2. 가설 검증에 대한 검정통계량을 계산하시오. (단, 반올림하여 소수점 셋째 자리까지 표시하시오.) 연구가설의 채택여부를 결정하시오.

문제 6

슬통 초등학교에서는 학생들의 건강 관리를 위해 일부 학생들의 혈압을 측정하였습니다. 총 25명의 학생 중 남학생은 16명, 여학생은 9명이었습니다. 학교 건강 관리팀은 남학생과 여학생 사이에 평균 혈압에 차이가 있는지 궁금해하였고, 이를 확인하기 위해 5%의 유의수준에서 검정하려 합니다. (단, 남녀 학생의 혈압이 정규분포를 따르며, 두 집단의 분산이 동일하다고 가정합니다.)

No.남학생여학생
1124.97114.87
2118.62128.14
3126.48115.92
4135.23110.88
5117.66139.66
6117.66122.74
7135.79125.68
8127.67110.75
9115.31119.56
10125.43
11115.37
12115.34
13122.42
14100.87
15102.75
16114.38
  1. 연구가설과 귀무가설 작성하시오.
  2. 가설검증에 대한 검정통계량를 계산하고, 연구가설의 채택여부를 설명하시오.
  3. 가설검정에 대한 신뢰구간을 계산하고, 계산된 신뢰구간이 어떻게 2의 결과를 지지하는지 설명하시오. (단, 신뢰구간 계산시 다음의 값을 사용하시오.)
t_{23, 0.025} = 2.069

문제 7

다음은 슬통시의 20대 남성 411명을 대상으로 키(height)와 몸무게(weight), 그리고 허리둘레(waist)를 측정한 데이터이다. 20대 남성의 키와 허리둘레가 체중과 어떠한 관계에 있는지 베이지안 회귀분석을 사용하여 분석하시오.

  • 데이터: height_weight_waist.csv
순번컬럼명의미타입
1height키 (cm)number
2weight몸무게 (kg)number
3waist허리둘레 (cm)number
  1. 아래 조건들을 참고하여 회귀계수를 구하라.
  • 베이지안 회귀를 이용한다.
  • 시뮬레이션의 시드넘버는 2023로 지정한다.
  • 1000번의 burn-in 과정 후, 10,000번의 MCMC 수행한다.
  • 사전분포 정보
    • 회귀계수: 부적절한 균일분포(improper uniform prior distribution)를 가정한다.
    • 오차항의 분산의 사전분포: 역감마분포 형상(shape) 모수와 척도(scale) 모수는 각각 0.0005로 지정한다.
  1. 도출된 결과에 근거하여 키 180cm, 허리둘레 80cm인 20대 남성 체중의 추정값을 구하시오.

제 25회 ADP 실기 기출

문제 3

  1. 어떤 사람이 갈 때는 시속 4km로 이동하고, 돌아올 때는 시속 5km로 이동하였다. 이 사람의 왕복 여정에서의 평균 속도를 계산하시오.
  2. 슬통 회사의 연매출이 연속적으로 2천만원, 3천5백만원, 7천만원으로 증가하였다. 이 기간 동안 매년 연매출은 평균적으로 몇 배로 증가하였는지 계산하시오.
  3. 슬통 화장품에서 개발한 신제품 향수 12개의 지속시간을 측정 한 후 표본 표준편차를 계산했더니 9.74분이 나왔다. 신제품의 지속시간 분포의 모분산 추정을 위한 95% 신뢰 구간을 구하시오.

문제 4

슬통 제약회사에서 혈압약을 개발하여 20명을 대상으로 약의 효능을 검사한 결과 혈압이 평균 25mmHG 내려갔으며, 표준편차 9.1mmHG으로 계산되었다. 유의수준 5%하에서 가설 검정하여라.

  1. 연구가설과 귀무가설을 설정하시오
  2. 약이 혈압을 실제로 낮추는 것인지 검정통계량과 가설 채택여부에 대하여 작성하시오.

문제 5

슬통 대학교 남학생과 여학생 각각의 축구와 배구에 대한 스포츠 선호도를 조사하였습니다. 아래 제시된 교차표를 참고하여, 여학생 중에서 배구를 선호하는 확률을 구하시오.

성별축구배구
남성4555
여성3565

문제 6

슬통 제조회사에서 다음 X, Y, Z공장에서 생산되는 제품 무게의 중앙값이 동일한지 95% 신뢰수준에서 가설 검정을 시행하려고 한다.

ABC
52.4847.6872.33
49.3147.6763.87
53.2451.2165.34
57.6240.4357.88
48.8341.3862.28
48.8347.1965.55
57.9044.9459.25
53.8451.5766.88
57.6257.6262.00
57.9057.90
  1. 주어진 측정결과의 혼합표본 순위를 계산하시오. (단, 동점이 있는 경우 평균순위를 사용하시오.)
  2. 연구가설과 귀무가설을 설정하시오.
  3. 설정한 가설을 크러스칼-월리스 검정을 사용하여 검정하고, 검정 통계량값, 가설채택 여부 설명하시오.

문제 7

슬통이는 순수 현재가치 (Net Present Value; NPV)를 최대화하는 투자 계획을 세우려고 한다. 정해진 예산은 1년차 50억, 2년차 60억, 3년차 80억을 넘지 않는 선에서 포트폴리오를 운영하려고 할 때, 다음의 조건을 만족하면서 현재 가능한 최대 NPV를 달성할 수 있는 최적의 투자안을 구하시오.

  • 단, 각 자산은 1개까지만 투자 할 수 있으며, 공매도는 허용하지 않는다.
  • 한 번 결정한 투자 포트폴리오는 3년 동안 변하지 않는다.
자산 \ 투자 비용1년차2년차3년차NPV
자산 123231530
자산 215151220
자산 317251231
자산 416121342
자산 524231744

제 24회 ADP 실기 기출

문제 1

아래는 슬통 회사의 2023년 10개월 간 광고비, 연구 개발비 및 해당 기간의 판매액 정보에 대한 데이터입니다. 주어진 데이터를 기반으로 다음의 작업을 수행하시오.

광고비연구개발비판매액
낮음521322.53
낮음63824.10
낮음741492.06
낮음811566.05
높음961422.84
높음1121887.65
높음1271221.44
높음135877.59
높음1431570.82
높음1531402.99
  1. 광고비를 가변수화하여 다중 선형 회귀방정식을 구성하시오.
  2. 회귀 모형을 검정하시오.

문제 2

A 생산라인에서 샘플링된 100개의 제품의 평균 크기는 5.7mm이며, 해당 제품의 표준편차는 0.03입니다. 반면, B 생산라인에서 샘플링된 120개의 제품의 평균 크기는 5.6mm이며, 해당 제품의 표준편차는 0.04입니다.

두 생산라인에서 샘플링된 제품의 평균 크기에 차이가 있는지를 검정하시오.

문제 3

Covid-19의 발병률은 1%라고 한다. 다음은 이번 코로나 사태로 인하여 코로나 의심 환자들 1,085명을 대상으로 슬통 회사의 “다잡아” 키트를 사용하여 양성 반응을 체크한 결과이다.

키트 \ 실제양성음성
양성37010
음성15690
  1. 다잡아 키트가 코로나 바이러스에 걸린 사람을 양성으로 잡아낼 확률을 계산하세요.
  2. 슬통 회사에서 다잡아 키트를 사용해 양성으로 나온 사람이 실제로는 코로나 바이러스에 걸려있을 확률을 97%라며, 키트의 우수성을 주장했다. 이 주장이 옳지 않은 이유를 서술하세요.
  3. Covid-19 발병률을 사용하여, 키트의 결과값이 양성으로 나온 사람이 실제로 코로나 바이러스에 걸려있을 확률을 구하세요.

문제 4

다음은 슬통 고등학교의 3학년 학생들 중 16명을 무작위로 선별하여 몸무게를 측정한 데이터이다. 이 데이터를 이용하여 해당 고등학교 3학년 전체 남학생들의 몸무게 평균을 예측하고자 한다.

71.2, 62.2, 53.2, 70.1, 65.7, 82.9, 62.9, 82, 68, 67.3, 75.3, 67.9, 77.6, 78.6, 66, 79

단, 슬통 고등학교 3학년 남학생들의 몸무게 분포는 정규분포를 따른다고 가정한다. 또한, 신뢰구간 계산시 아래 값들을 사용하여 계산하시오.

Z_{0.05}=1.65, Z_{0.025}=1.96, \\
t_{0.05, 16} = 1.745, t_{0.025, 16} = 2.119, \\
t_{0.05, 15} = 1.753, t_{0.025, 16} = 2.131
  1. 모평균에 대한 95% 신뢰구간을 구하시오.
  2. 작년 남학생 3학년 전체 분포의 표준편차는 6kg 이었다고 합니다. 이 정보를 이번 년도 남학생 분포의 표준편차로 대체하여 모평균에 대한 95% 신뢰구간을 구하시오.

제 23회 ADP 실기 기출

문제 1

슬통 회사는 자신들이 만든 진공관 제품의 수명이 1만 시간이라는 광고를 하고 있다. 이에 슬통 회사의 품질 관리팀에서 12개 샘플을 뽑아서 수명을 측정 한 데이터이다. 유의수준 5% 하에서 부호 검정하시오.

  1. 연구가설과 귀무가설 작성하시오.
  2. 유효한 샘플의 수를 계산하시오.
  3. 검정 통계량을 계산하고, 연구가설 채택 여부를 작성하시오.

문제 3

학과별 학생들의 평점 분포에 관한 연구 – 사회과학, 자연과학, 공학의 각 학과별 학생들의 입학 성적 분포를 조사하였습니다. 아래 제시된 표는 각 학과의 학생들이 어떤 평점 구간에 속하는지를 나타냅니다. 평점 구간은 50-66, 67-83, 84-100로 나누어져 있으며, 각 셀에는 해당 구간에 속하는 학생의 수가 기록되어 있습니다. 학과와 평점 분포 간의 관계를 검정하여 주세요.

점수ABCDEF
50-66 점903545405060
67-83 점505555504540
84-100 점207060706560
  1. 연구의 귀무가설과 대립가설을 명확하게 작성하시오.
  2. 학과와 평점이 서로 독립적일 때, 각 셀의 기대 빈도를 계산하시오.
  3. 검정 통계량을 계산하고, 연구의 귀무 가설을 기각 할 지 여부를 결정하시오.

제 22회 ADP 실기 기출

문제 1

제품에 금속 재질 함유량의 분산이 1.3을 넘으면 불량이라고 보고 있는데, 제조사별로 차이가 난다고 제보를 받았다. 주어진 회사 제품의 분산에 대해 검정을 수행하시오. (유의수준 5%)

10.67, 9.92, 9.62, 9.53, 9.14, 9.74, 8.45, 12.65, 11.47, 8.62

문제 2

슬통 전자는 매일 무작위로 완제품을 선택하여 불량품 유무를 조사한 자료이다. 다음은 지난 20일 동안의 불량품 갯수를 나타낸 데이터이다.

날짜검사갯수불량갯수
1614
2853
3752
4864
5642
6964
7875
8933
9676
10977
11776
12885
13908
14845
15655
16713
17693
18664
19985
20728

위의 데이터를 사용하여 p(불량률) 관리도에 따라 관리중심선, 관리 상한선 및 하한선을 구하시오.

문제 3

슬통이는 두 가지 종류의 빵을 판매하는데, 초코빵을 만들기 위해서는 밀가루 100g과 초콜릿 10g이 필요하고 밀빵을 만들기 위해서는 밀가루 50g이 필요하다. 재료비를 제하고 초코빵을 팔면 100원이 남고 밀빵를 팔면 40원이 남는다. 오늘 슬통이는 밀가루 3000g과 초콜릿 100g을 재료로 갖고 있다. 만든 빵을 전부 팔 수 있고 더 이상 재료 공급을 받지 않는다고 가정한다면, 슬통이는 이익을 극대화 하기 위해서 어떤 종류의 빵을 얼마나 만들어야 하는가?1

문제 4

구매하는 패턴으로 봐서 두 상품이 연관이 있는지 가설을 세우고 검정하시오.

A, A, A, B, B, A, A, A, A, B, A, B, B, B, A, A, A, A, B, B, A, A, A, B, B,

제 21회 이전 ADP 실기 기출

문제 2

boston.csv 파일에는 미국 보스턴의 주택 가격과 관련된 다양한 환경 정보가 기록되어 있습니다.

1) Boston 데이터를 8:2의 비율로 분할한 후, 선형 회귀 모델을 학습시키고 결정계수와 RMSE 값을 계산하시오.

2) 같은 데이터 분할 비율을 사용하여 릿지 회귀 모델을 적용하고, 그 성능을 결정계수와 RMSE로 평가하시오.

3) 데이터를 동일하게 8:2로 나눈 후, 라쏘 회귀 모델로 학습을 진행하고 결과의 결정계수와 RMSE 값을 구하시오.

문제 3

주어진 데이터를 이용해서 아래에 해당하는 그림을 그리시오. 단, 파란색 직선은 데이터를 가장 잘 표현하는 1차, 2차, 3차 다항 회귀식을 나타낸다.

  • 데이터: data-visualization.csv
adp 실기 기출 문제 복원
adp 실기 기출 문제 복원
adp 실기 기출 문제 복원

문제 4

toothgrowth.csv 데이터를 사용하여 기니피그의 치아 길이의 성장이 비타민 투여량과 투약 방법에 따라 차이가 있는지 이원배치 분산분석을 수행하시오.

  • 데이터 변수 설명
VariableDescription
len기니피그의 치아길이
dose비타민 C 투여량(mg/day)
supOrange Juice(OJ), Ascorbic Acid(VC)
  • 데이터 HEAD
lensuppdose
4.2VC0.5
11.5VC0.5
7.3VC0.5
5.8VC0.5
6.4VC0.5
10.0VC0.5

Similar Posts