본문 바로가기

ADP실기8

[ADP 실기 준비] R 통계분석 / 선형회귀분석 / 변수선택법 [ADP 실기 준비] R 통계분석 / 선형 회귀분석 / 변수 선택법 통계분석은 ADP 실기 시험에서 꾸준히 출제되고 있는 문제 유형으로서 가장 기본적인 스타일의 문제부터 최근 출제된 경향까지 단계적으로 학습해보려 한다. 이번 포스팅에서는 통계분석 중 선형 회귀분석과 변수 선택법에 관해 알아보자. Contents 1. 각 설명변수들과 종속변수 간의 상관관계 분석 2. 상관분석 시각화 3. 변수 선택법을 활용한 회귀모형 생성 1. 각 설명변수들과 종속변수 간 상관관계 분석 우선 학습할 데이터는 R 프로그램의 ISLR 패키지에 있는 Carseats 데이터를 사용한다. 이 데이터는 자동차 좌석에 대한 판매정보이며, 변수의 설명은 아래와 같다. 변수 데이터 형태 설명 Sales 수치형 각 지역의 매출 (단위 : .. 2020. 11. 16.
[ADP 실기 준비] R 기계 학습 - 인공신경망 [ADP 실기 기출 공략] R 프로그래밍 기계 학습 / 모델 설계 및 학습 / 인공신경망 지난 포스팅에서 R을 통한 분류 분석 모델 중 의사결정 나무와 랜덤 포레스트에 대하여 알아보았다. 오늘은 이어서 신경망 모델에 대하여 알아보자. 신경망(Neural Network)은 인간의 뇌를 본 따서 만든 모델이다. 신경망에는 뉴런을 흉내 낸 노드들이 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 구분되어 나열된다. 입력층에 주어진 값은 입력층, 은닉층, 출력층 순서로 전달된다. 신경망은 예측 성능이 우수하고, 특히 은닉층에서 입력 값이 조합되므로 비선형적인 문제를 해결할 수 있는 특징이 있다. 그러나, 의사결정 나무 등의 모델과 비교해보면 만들어진 모델을 .. 2020. 11. 11.
[ADP 실기 준비] R 기계 학습 - 분류분석 모델링 및 성과 분석 [ADP 실기 기출 공략] R 프로그래밍 기계 학습 / 파생 변수 추가 /모델 설계 및 학습 / 의사결정 나무 / 랜덤 포레스트 이번에는 데이터 탐색 및 시각화에 이어 파생변수 추가와 모델 설계 및 학습 과정에 대하여 알아볼 것이다. 데이터 분석 시, 주어진 데이터를 그대로 사용하지 않고 분석 목적에 맞게 데이터 형태를 변환하여 사용하는 경우가 많다. 이렇게 파생변수를 추가한 후, 최종적으로 모델을 설계하고 기계 학습시키는 방법에 대하여 살펴보자. 예제 데이터는 지난번에 사용하던 titanic 데이터를 그대로 사용한다. 2020/10/28 - [데이터분석 with R/ADP] - [ADP 실기 준비] R프로그래밍 기계 학습 - 탐색적 자료분석(EDA) [ADP 실기 준비] R프로그래밍 기계 학습 - 탐색.. 2020. 10. 30.
[ADP 실기 준비] R프로그래밍 기계 학습 - 탐색적 자료분석(EDA) [ADP 실기 기출 공략] R 프로그래밍 기계 학습 / 탐색적 자료 분석(EDA) / 데이터 시각화 지난 포스팅에서 기계 학습을 위한 데이터 전처리 과정 중, 데이터 타입 변환, 결측치 확인 및 처리에 대해서 알아보았다. 아래에 지난 시간에 진행한 코딩을 간단하게 요약하였다. titanic 2020. 10. 28.
[ADP 실기 준비] R 프로그래밍 기계 학습 - 데이터 전처리 [ADP 실기 기출 공략] R 프로그래밍 기계 학습 - 데이터 전처리새벽녘 바람이 어느덧 제법 쌀쌀해졌다.따뜻한 봄에 데이터분석 준전문가 ADsP 공부를 시작했는데, 벌써 가을이 성큼 와버렸다. 다가오는 12월 13일 데이터분석 전문가 ADP 실기를 대비하기 위해, 기존 데이터분석 전문가 ADP 실기시험 기출문제를 찾아서 간단한 데이터 예제로 학습해보려 한다. 참고로, 데이터분석 데이터분석 전문가(ADP) 시험을 접수하는 데이터 자격시험 사이트에 가보면 https://www.dataq.or.kr/ www.dataq.or.kr상단의 커뮤니티 > 공지사항에 매 회 데이터분석 전문가(ADP) 실기 시험 평가 문항을 사전 공지하고 있다.(문제는 시험 5일 전에 공지한다;;)18회차 ADP 실기 시험은 텍스트마이.. 2020. 10. 21.