본문 바로가기

R프로그래밍8

[ADP 실기 준비] R 통계분석 / 선형회귀분석 / 변수선택법 [ADP 실기 준비] R 통계분석 / 선형 회귀분석 / 변수 선택법 통계분석은 ADP 실기 시험에서 꾸준히 출제되고 있는 문제 유형으로서 가장 기본적인 스타일의 문제부터 최근 출제된 경향까지 단계적으로 학습해보려 한다. 이번 포스팅에서는 통계분석 중 선형 회귀분석과 변수 선택법에 관해 알아보자. Contents 1. 각 설명변수들과 종속변수 간의 상관관계 분석 2. 상관분석 시각화 3. 변수 선택법을 활용한 회귀모형 생성 1. 각 설명변수들과 종속변수 간 상관관계 분석 우선 학습할 데이터는 R 프로그램의 ISLR 패키지에 있는 Carseats 데이터를 사용한다. 이 데이터는 자동차 좌석에 대한 판매정보이며, 변수의 설명은 아래와 같다. 변수 데이터 형태 설명 Sales 수치형 각 지역의 매출 (단위 : .. 2020. 11. 16.
[ADP 실기 준비] R 기계 학습 - 인공신경망 [ADP 실기 기출 공략] R 프로그래밍 기계 학습 / 모델 설계 및 학습 / 인공신경망 지난 포스팅에서 R을 통한 분류 분석 모델 중 의사결정 나무와 랜덤 포레스트에 대하여 알아보았다. 오늘은 이어서 신경망 모델에 대하여 알아보자. 신경망(Neural Network)은 인간의 뇌를 본 따서 만든 모델이다. 신경망에는 뉴런을 흉내 낸 노드들이 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 구분되어 나열된다. 입력층에 주어진 값은 입력층, 은닉층, 출력층 순서로 전달된다. 신경망은 예측 성능이 우수하고, 특히 은닉층에서 입력 값이 조합되므로 비선형적인 문제를 해결할 수 있는 특징이 있다. 그러나, 의사결정 나무 등의 모델과 비교해보면 만들어진 모델을 .. 2020. 11. 11.
[ADP 실기 준비] R 기계 학습 - 분류분석 모델링 및 성과 분석 [ADP 실기 기출 공략] R 프로그래밍 기계 학습 / 파생 변수 추가 /모델 설계 및 학습 / 의사결정 나무 / 랜덤 포레스트 이번에는 데이터 탐색 및 시각화에 이어 파생변수 추가와 모델 설계 및 학습 과정에 대하여 알아볼 것이다. 데이터 분석 시, 주어진 데이터를 그대로 사용하지 않고 분석 목적에 맞게 데이터 형태를 변환하여 사용하는 경우가 많다. 이렇게 파생변수를 추가한 후, 최종적으로 모델을 설계하고 기계 학습시키는 방법에 대하여 살펴보자. 예제 데이터는 지난번에 사용하던 titanic 데이터를 그대로 사용한다. 2020/10/28 - [데이터분석 with R/ADP] - [ADP 실기 준비] R프로그래밍 기계 학습 - 탐색적 자료분석(EDA) [ADP 실기 준비] R프로그래밍 기계 학습 - 탐색.. 2020. 10. 30.
[ADP 실기 준비] R프로그래밍 기계 학습 - 탐색적 자료분석(EDA) [ADP 실기 기출 공략] R 프로그래밍 기계 학습 / 탐색적 자료 분석(EDA) / 데이터 시각화 지난 포스팅에서 기계 학습을 위한 데이터 전처리 과정 중, 데이터 타입 변환, 결측치 확인 및 처리에 대해서 알아보았다. 아래에 지난 시간에 진행한 코딩을 간단하게 요약하였다. titanic 2020. 10. 28.
[R 기초] R 프로그래밍 변수 함수 기본 명령어 [R 기초] R 프로그래밍 / 변수 / 함수 / 기본 명령어 이번 포스팅에서는 R 언어의 변수와 함수, 기본 명령어에 대해 알아보겠다. 변수와 주석문 변수란 데이터를 저장할 수 있는 객체 또는 공간이다. 1. 변수명 - 알파벳, 숫자, 마침표(.), underscore(_) 등을 조합해서 만든다. - 알파벳 또는 마침표(.)로 시작한다. - 알파벳 대소문자를 구분한다. 2. 변수명 생성시 주의사항 - 함수명과 같은 변수(if, mean, sum 등)는 사용 불가(underscore 혹은 숫자 붙여서 사용가능) - 하이픈(-) 사용 불가 - 마침표(.)로 시작하는 경우 바로 뒤에 숫자가 올 수 없음 3. 변수의 할당 변수에는 단일값, 복수개의 값, 문자, 문자열, 배열, 데이터 프레임이나 흔히 사용하는 엑.. 2020. 10. 24.