안녕하세요!!
베키입니다!!!
데이터 전처리 시리즈!!
그 위대한 1탄!!! 데이터 결합하기를 실습해보겠습니다!!!
((((참고)))) 이번 실습 내용은 Brightics AI 홈페이지에서 튜토리얼 과정으로 공개된 자료를 참고했습니다!!
Tutorial | Brightics Studio
데이터 결합 Studio 1.1 Studio 1.0 Join 함수를 이용한 데이터 결합 분석 프로세스 Pre-processing 산업군 etc 난이도 Intermediate 시나리오 주원이는 과목별로 정리된 학생들의 시험점수 데이터를 하나의 파일로 정리하고자 한다. 파일로 정리하는 기준은 수학, 영어 시험을 모두 치른 학생들을 대상으로 역사 점수를 추가하여 정리하고자 한다. 목표 Join 함수의 Inner Join을 이용하여 수학, 영어 시험을 모두 치른 학생들을 정리한다. Join 함수의 Left Join을 이용하여 이전에 정리한...
www.brightics.ai
오늘의 실습내용은??
첫 번째, 영어와 수학 시험을 모두 본 학생의 점수 명단 만들기
두 번째, 위의 명단에 역사 점수만 추가하기
일단 아래처럼 빈 프로젝트를 하나 만들어줍니다!!
저는 데이터 전처리 시리즈 안에 ‘1탄 : 데이터 결합’ 모델을 생성했습니다!
들어가면 아래와 같이 빈 화면 이 뜨게 됩니다
저는 이미의 위의 ((((참고))))링크에서 데이터 결합 실습으로
사용할 영어, 수학, 역사 시험에 대한 점수 데이터를 다운받아
Add 기능을 사용해 Brightics 저장소에 넣었습니다.
일단 load 함수를 사용해 수학 점수 데이터를 업로드 시키고,
그리고 load 함수를 사용해 영어 점수 데이터를 업로드 시키고,
마지막으로 load 함수를 사용해 역사 점수 데이터를 업로드 시켰습니다.
이렇게 총 3가지의 데이터가 업로드 된 것을 볼 수 있습니다.
이제 Join함수를 사용해 데이터 결합을 하겠습니다!
일단 첫 번째로, 영어와 수학 시험을 모두 본 학생의 점수 명단 만들기입니다!
Join 함수를 클릭!
그리고 Load(math)블록과 Load(english)블록을 모두 Join함수과 연결해줍니다!
수학과 영어 과목을 모두 응시한 학생을 구하기 위하여
수학 점수 테이블과 영어 점수 테이블의 id를 기준으로 Inner Join 으로 데이터 결합 하는 것인데요.
Inputs 의 left_table : Load(math), right_table : Load(english) 로 설정된 상태에서,
Join Type : Inner 선택(교집합모양)하고, Left Keys 와 Right Keys 는 모두 id로 설정하고 Run를 누르면!!
위처럼 영어와 수학 시험을 모두 본 학생의 점수 명단이 만들어 졌습니다!!
이제 두 번째, 위의 명단에 역사 점수만 추가하기를 해보겠습니다.
똑같이 Join 함수를 추가해주고, 이전 Join 결과 테이블에 역사 점수를 추가하기 위하여
id 를 기준으로 Left Join 하면 되는데요!
Inputs의 Left_table : Join (Inner Join) ,right_table : Load (history)으로 설정된 상태에서
(위의 그림처럼 연결했을 경우 이미 설정 됨)
Join Type 은 Left 선택로 선택하고, 위와 같이 Left Keys 와 Right Keys는 모두 id로 설정!
Run~!!하면 오른쪽 테이블처럼 첫번째 실습의 명단에 역사 점수만 추가 된 것을 알 수 있습니다!
오늘 실습으로 Inner Join 을 이용하여 수학과 영어 시험을 모두 치른 학생들의 명단을 파악하였고,
Left Join을 이용하여 역사 시험 점수를 추가 하여 하나의 테이블로 정리하였습니다!
데이터 결합은??
Join 함수!!!
다음 실습에서 봐여~~
#Join #Pre-Process #데이터 결합 #성적 #점수 #Brightics #studio #데이터전처리시리즈 #1탄 #데이터결합 #데이터 #전처리 #시리즈 #pre-enginerring #데이터 #결합 #노코딩 #브라이틱스 #서포터즈 #실습 #튜토리얼 #시험 #점수 #데이터 #Join #함수 #조인함수 #대학생 #코딩 #없이 #쉬운 #데이터 #핸들링 #AI #다음 #실습
'Brightics' 카테고리의 다른 글
[삼성 SDS Brighitics] 【데이터 전처리 시리즈-③】데이터 변경 - 성적 데이터를 조건에 따라 데이터 변경 (0) | 2020.08.04 |
---|---|
[삼성 SDS Brighitics] 【데이터 전처리 시리즈-②】 파생변수 생성과 데이터 저장 ▶날짜 변수에서 월과 요일 변수 생성 (0) | 2020.08.04 |
[삼성 SDS Brighitics] Script 모델 사용해보기 (SQL과 Pyhton 사용) (0) | 2020.08.04 |
[삼성 SDS Brighitics] sensor 데이터 업로드 해보기 (0) | 2020.08.04 |
[삼성 SDS Brighitics] 브라이틱스로 Report, 보고서 작성하기! : 네이버 블로그 (0) | 2020.08.04 |