전체 글 썸네일형 리스트형 [삼성SDS Brightics] ☆SuperFun☆ 1조! UCC 제작 【Behind the Scene (BTS)+TopSecret】공개 안녕하세요!! 베키입니다!!! 요즘 너무나 더운 날들이 지속되고 있는데요 ㅠㅠㅠ Covid-19 도 Social Distance Lv.2로 격상되면서ㅠㅠㅠ 집에서 보내는 시간들이 점점 많아지는 것 같습니다ㅠㅠㅠ 오늘은 저희 팀 1조를 소개하면서, UCC 제작 BEHIND를 살짝 공개하려고 합니다!! SUPER FUN 1조를 소개합니다!!!! 사회적 거리두기 2단계로 격상되기 전에 오프라인 만남을 가진 사진입니다!! 나머지 분들은 코로나로 마스크를 다 쓰고 있는데 ㅠㅠㅠ 저는 사진 생각하고 잠깐 벗었는데 ㅠㅠㅠ 이건 제 실수입니다!! (목 뒤에 마스크 스트랩 있어요 ㅠㅠㅠㅠ) 여러분!! 꼭 !!! 마스크는 필!!수!! 모두 소개를 하고, 즐겁게 웃으면서!! 우리가 앞으로 어떤 Hip한 B.. 더보기 [삼성 SDS Brighitics] 20대인 당신!! 포도당 수치 체크해봐~(feat. 피마 인디언 당뇨병 데이터의 상관관계 분석과 20대 당뇨병 환자의 주 영향 요인 알아보기!) 안녕하세요!! 베키입니다!! 오늘은 요즘에 부쩍 늘고 있다는,,,,ㅠㅠ 당뇨병에 관한 얘기를 해볼까 합니다!! 오늘의 주제는!!! 피마 인디언 당뇨병 자료로 본 BMI지수(체질량 지수)와 여러 신체 수치들의 상관관계 분석과 이로 분류분석한 20대 당뇨병의 주 영향요인 찾기입니다!! Brightics를 사용한 상관관계 분석을 위해 아래의 링크를 참고하여 공부했습니다~~ 참고해주세요~~(피마 인디언 데이터도 탑재됨!) https://www.brightics.ai/kr/docs/ai/s1.0/tutorials/71_py_bp_bmi?type=insight 피마 인디언 데이터는 사실,,, 위의 링크에도 있지만 ML, DL 하시는 분들은 한 번쯤은 사용해봤을 텐데요! 바로 Kaggle의 유명한 데이터 .. 더보기 [삼성 SDS Brighitics] 【데이터 전처리 시리즈-⑦】 R과 Brightics studio로 커피 판매량 데이터의 이상값 탐지 안녕하세요!! 베키입니다!! 오늘은 R과 Brightics를 사용하여 ranicafe 의 커피 판매량 데이터를 로드하여, 커피 판매량 데이터의 이상치를 찾고, 제거해보도록 하겠습니다!! 이상값 탐지 및 제거에 대한 내용은 아래 링크 튜토리얼에서 참고하였습니다!! https://www.brightics.ai/kr/docs/ai/s1.0/tutorials/11_py_outlier_detection?type=insight 오늘은 R과 Brightics를 모두 사용해서 이상값을 찾고 제거 해보도록 하겠습니다! 이상값 탐지에 사용한 커피 판매량 데이터는 제가 따로 만든 데이터 입니다!! 여기서 잠깐! 이상값?? 상한 사분위수(75%)를 기준으로 1.5 사분위 범위보다 크거나 하한 사분위수(25%)를 기준으.. 더보기 [삼성 SDS Brighitics] 【데이터 전처리 시리즈-⑥】 데이터 속 결측값처리(2) 안녕하세요!! 베키입니다!! 오늘은 저번 실습에 이어서 결측값 처리 2단계를 진행해보겠습니다!!! 앞의 실습(결측값 처리 2단계)을 같이 했다면 필요없겠지만, 필요한 분드은 데이터 셋을 다운 받아 주세요!! ▼데이터와 자세한 튜토리얼 내용은 아래 링크를 참고해주세엽!!▼ https://www.brightics.ai/docs/ai/s1.0/tutorials/09_2_py_Missing_Number_Imputation?type=insight 앞에서 마지막에 unload로 저장까지 해둔 데이터 파일을 다시 불러와 줍니다!! 이번에는 double형의 숫자값으로 구성된 칼럼의 결측값을 처리할 것이기에, Statistic Summary 함수를 사용해 요약통계량을 알아보겠습니다!! 오른쪽 화면 처럼 group by를.. 더보기 [삼성 SDS Brighitics] 【데이터 전처리 시리즈-⑤】 데이터 속 결측값처리(1) 안녕하세요!! 베키입니다!! 오늘은 데이터 전처리의 가장 중요하다고 볼 수 있는 결측값, NA값을 처리하는 실습을 해보겠습니다!! 학생들의 BMI 데이터 속 결측값을 처리해보도록 하겠습니다!! ▼▼오늘 실습에 쓴 BMI 데이터와 자세한 실습 설명 튜토리얼은 아래의 링크로 ㄱㄱ ▼▼ https://www.brightics.ai/docs/ai/s1.0/tutorials/09_1_py_Missing_String_Imputation?type=insight 이제 본격적으로 시작해보겠습니다!! 프로젝트 '데이터 전처리 시리즈'에 '5탄 결측값 처리'라는 모델을 생성합니당! 학생들의 BMI 데이터를 모델 안에 load해줍니다!! 대충 데이터를 봐도,,,, null이 많은데요.......ㅎ... 이런게 은근 귀찮은.. 더보기 [삼성 SDS Brighitics] 【데이터 전처리 시리즈-④】데이터 샘플링-다양한 샘플링 기법 활용 안녕하세요!! 베키입니다!! 오늘은 데이터를 모델링했다면 실제로 성능 측정을 위해 꼭 필요한 테스트 데이터를 만들어보는 실습을 해보겠습니다!! 데이터 샘플링 실습으로 바로 ㄱㄱ~~ ▼오늘 실습에 사용한 데이터셋과 튜토리얼은 모두 아래 링크를 들어가면 지원받을 수 있습니다!▼ https://www.brightics.ai/docs/ai/s1.0/tutorials/10_py_sampling?type=insight 일단 브라이틱스를 모두 실행시켜주세여~~ 프로젝트 '데이터 전처리 시리즈' 안에 '4탄 : 데이터 샘플링'이라는 모델을 생성했습니다!! Row가 1000개 나 되는 데이터를 load시켰습니다! 이제 데이터를 train data와 test data로 나누는 것을 쉬운 일입니다!! Split Data.. 더보기 [삼성 SDS Brighitics] 【데이터 전처리 시리즈-③】데이터 변경 - 성적 데이터를 조건에 따라 데이터 변경 안녕하세요!! 베키입니다!! 오늘은!!! 데이터 변경하는 실습을 해보도록 하겠습니다!! 오늘 데이터 변경 실습은 아래의 링크에 들어가시면 더 자세히 배울 수 있습니다!! 참고로 사용한 데이터셋도 아래의 사이트에서 다운받았습니다!! Tutorial | Brightics Studio Data Modification Studio 1.1 Studio 1.0 Change score data according to a condition Analysis process Pre-processing Industry group etc Difficulty Intermediate Scenario Joo-Won wants to assign grades to students’ scores according to the condit.. 더보기 [삼성 SDS Brighitics] 【데이터 전처리 시리즈-②】 파생변수 생성과 데이터 저장 ▶날짜 변수에서 월과 요일 변수 생성 안녕하세요!! 베키입니다!!! 데이터 전처리 시리즈!! 그 2탄!!! 파생변수 생성과 데이터 저장을 실습해보겠습니다!!! ((((참고)))) 이번 실습 내용은 Brightics AI 홈페이지에서 튜토리얼 과정으로 공개된 자료를 참고했습니다!! Tutorial | Brightics Studio 파생변수 생성과 데이터 저장 Studio 1.1 Studio 1.0 날짜 변수에서 월과 요일 변수 생성 분석 프로세스 Pre-processing 산업군 Travel & hospitality 난이도 Intermediate 시나리오 지도서비스를 제공하는 모바일앱 개발사의 민준이는 교통량이 갑자기 증가할 경우, 서버에 부하가 될 수 있어 늘 모니터링 하고 있다. 분석에 앞서, 월별 추세와 요일별 추세를 확인하기 위.. 더보기 이전 1 2 3 4 다음