Adp 필기 기출문제 pdf - adp pilgi gichulmunje pdf

ADP 필기 복기문제 정리

문제가 돌아다니는 것만 추려보겠습니다.

군집과 분류의 차이?
다중공선성 - 상관계수 일정함 상관없다 ? 
wage 
Mape - 0.45 vs 0.1  (정답은 0.45 ?)

비행기, 쿠폰할인 문제 - 기출에 할인쿠폰 관련 문제가 있었는데, 유의깊게 봐주세요.

다음중 기법 활용분야가 나머지와 다른 하나는 찾아보세요.

1. 로지스틱회귀분석.인공신경망.의사결정나무

2. SOM - 비지도학습

다중회귀분석에서는, 보통 자료수 구할 때 df+1로 하는데, 다중회귀는 df+1+k도 해야합니다.4+8+1

서술형은, 부스팅이나 k-fold 설명하거나, 회귀분석 관련된 문제들이 나옵니다.

1. 다음과 같은 추출 방식을 보고 어떤 방식인지 명칭을 쓰고 설명하라.

1-가)

(a) 명칭: 홀드아웃

(b) 설명: 데이터를 랜덤하게 두 분류로 분리하여 실험데이터와 평가데이터로 설정, 검정을 실시하는 모형 평가 방법

Adp 필기 기출문제 pdf - adp pilgi gichulmunje pdf

(나)

(a) 명칭: k-fold cross validation

(b) 설명: 데이터를 k개의 집단으로 나눈 뒤 k-1개의 집단으로 분류기를 학습시키고, 나머지 1개의 집단으로 분류기의 성능을 테스트하는 방법. 위 과정을 k번 반복한다.

문제의 그림에서는 데이터를 10개의 집단으로 나누고 9개의 집단으로 학습시키고 나머지 1개의 집단으로 성능을 테스트 하는 과정을 10번 반복한다.

Adp 필기 기출문제 pdf - adp pilgi gichulmunje pdf

(다)---3점

(a) 명칭: 붓스트랩

(b) 설명: 동일한 크기의 표본을 랜전 복원추출로 뽑은 자료를 의미.이 과정을 반복할 떄 하나의 관측치가 선정되지 않아 검증용 자료로 사용되는 비율은 38.6%이다.

Adp 필기 기출문제 pdf - adp pilgi gichulmunje pdf

2. 로지스틱 회귀 검정 결과를 보고 다음에 답하시오.

이런 결과 였는데 문제에 조건이 더 있었던것 같아요.virginocla=1. ------=0일때 다음과 같은 결과..아래 결과는 제가 임의로 찾은거에요.

(1) Sepa.Length 계수가 유의한지?--(위 분석결과로 해석하자면..)

z- 통계량은 000이며 p-value값이 3.28e-01이므로 귀무가설의 기각역인 0.05보다 작게 나타남에 따라 유의수준 5%하에서 대립가설을 채택하게 된다. 설명변수 Sepa.Length는 통계적으로 유의하다.

(2) 로지스틱회귀 회귀식을 구하여라.

회귀식=

$\frac{1}{1+\combi{e}^{-\left(-27.831+5.140Sepal.Length\right)}}$11+e(27.831+5.140Sepal.Length)

Adp 필기 기출문제 pdf - adp pilgi gichulmunje pdf

1. 데이터 이해_ 총 -10문제가 나왔습니다.

1) 데이터의 이해

- 암묵지와 형식지의 상호작용 관련문제 2개가 나왔습니다.

- DIKW 피라미드 관련 문제 2개가 나왔습니다.

d i k지식 w지혜

2) 데이터의 가치와 미래

- 빅데이터가 만들어내는 본질적인 변화들이 있는데, 관련 문제가 2개 나왔어요.

빅데이터 활용 기본 테크닉 관련문제도 공부해야 합니다.

그리고 빅데이터 사회의 위기요소에 대해서도 준비해야 합니다.

3) 가치 창조를 위한 데이터 사이언스와 전략 인사이트

- 데이터 사이언스의 의미와 역할에 대해 정리해야 합니다.

2. 데이터 처리 기술 이해 _ 총 10문제가 나왔습니다.

1) 데이터 처리 프로세스

- CDC란 무엇인가요.

EAI의 주 목적은 무엇일까요.

아파치 플럼(Flume)의 동작 단계를 정리해야합니다.

하둡 Echo 시스템에 대해 정리해야 합니다.

Sqoop의 기능 관련 문제도 출제되었습니다.

2) 데이터 처리 기술

- 데이터 분산 저장 기술에 대해 정리하고, Map Reduce절차도 정리해야 합니다.

하둡에 관한 설명도 출제되었고, Map의 결과물도 알아놓아야 합니다.

3. 데이터 분석 기획 _ 총 10문제가 나옵니다.

1) 데이터 분석 기획의 이해

CRISP-DM 분석 방법론에 대해 정리하고, 프로토타입 또는 프로토타이핑 방법론에 대해 정리해야 합니다.

2) 분석 마스터 플랜

- 분석과제 도출 및 우선순위 정리하고, 분석 준비도와 분석 성숙도 출제 되었습니다.

그리고 분석 성숙도 모델도 출제되었습니다.

4. 데이터 분석 - 총 40문항이 나왔습니다.

1) R의 기초와 데이터 마트

- R의 데이터 구조데이터 타입에 대해 정리해야 합니다.

- 그리고 R의 상자그림도 알아야 합니다.

2) 통계분석

- 확률에 대한 설명조건부 확률, 확률변수에 대한 설명을 해야 합니다.

가설검정에서는 3문제가 나왔고, 정규성 검정에 1문제가 나왔습니다.

회귀분석에서 3문제가 나왔고, 상관계수상관행렬표를 각각 설명 및 해석하는 문제가 있었습니다.

- 다차원 척도주성분 분석 설명 ( 주성분 분석 결과표 해석)을 할 줄 알아야 합니다.

3) 정형 데이터 마이닝

- 데이터 마이닝 단계와 로지스틱 회귀분석 결과 해석을 해야합니다.

신경망 모형 그림 해석 1문제, 의사결정나무 결과 해석에서 2문제가 나왔습니다.

앙상블 모형에 대한 설명을 할 줄 알아야 합니다

모형평가 기준에서 2문제, 모형평가방법에서 2문제가 나왔습니다.

k-fold 교차 검증에 대한 설명을 할 줄 알아야 합니다.

그리고 군집분석 거리에 대한 설명에서 2문제가 나왔습니다

연관분석, 연관규칙에 대한 설명을 할 줄 알아야하고, 향상도에 대해서도 알아야 합니다.

4) 비정형 데이터 마이닝

사회 연결망 분석에 대해 설명해야 합니다.

5) 복합 & 미수록

- welch t-test 검정 해석을 할 줄 알아야 합니다.

명목형 변수가 포함된 회귀분석 그래프 R소스로 나타내야 합니다.

배깅 , 그리고 부스팅 알고리즘 문제가 나왔습니다.

5. 데이터 시각화_ 총 10문제가 나왔습니다.

1) 시각화 인사이트 프로세스

- 객체지향 관점에서의 접근에 대한 설명을 해야 합니다.

데이터 탐색에 대한 설명을 할 줄 알아야 합니다.

데이터 시각화 인사이트에 대한 설명을 할 줄 알아야 합니다.

2) 시각화 디자인

- 인포그래픽에 대한 설명을 할 줄 알아야 합니다.

정보 디자인 프로세스 단계 1문제와, 정보 시각화 방법 2문제가 나왔습니다.

자크 배르탱의 그래픽 7요소에 대해 공부해야 합니다.

시각화를 위한 그래픽 디자인 기본 원리빅데이터 시각화에 대한 설명 문제가 출제되었습니다.

3) 시각화 구현

이 주제는 출제되지 않았습니다.

6. 서술형 문제 _ 1개 큰문항에 2문제가 나왔습니다.

군집분석에 대해 서술형 문제가 나왔고, 계층형 + 비계층형에 관련된 문제가 나왔습니다.