안녕하세요!
베키입니다!
중간고사가 4주 남은 이번주,,,,,
저번주 금요일에 삼성카드 데이터 분석 공모전을 내고,,,
극심한 현타를 겪고,,,,,
아.... 맞다 나 Brightics 유튜브 데이터 분석해야된다.....
이 생각이 주말에 들어
월요일, 화요일 이렇게 2일 동안 뭔가 해보려했는데,,,,
쉽지 않네요.....
오늘은 4주차 진행상황 보고 포스팅을 하려고 합니다!
오~ 유튜브 데이터!! 하니까 뭔가 많이 기대해주실 수도 있고,
쓸만 한 게 나오려나?? 하는 생각을 가진 분들도 많으실 것 같아요!!!
안타깝게도,,, 뭔가 한 거는 없어요......
어제 오늘 텍스트 마이닝, 날짜 전처리 공부했어요....
자!
일단 아직 크롤링을 마무리 짓지 못했습니다....
운동 유튜브 데이터를 불러오는 것까지는 간신히 저번에 성공시켰지만...
일요일에 API를 사용해서 뷰티 유튜브 채널을 돌려보는데,,,,
이상하게 안 돌아가요,,,,,,,,,,,,,,
그래서 알아보니,,,,,,,,
API 사용 트래킹 양을 초과하서 유료 버전을 써야한다고 하더라고요,,,,
결국 유료버전을 사용해보기로 하고,,,,,,,,,,,
브라이틱스 서포터즈 활동비로 거하게 유료 버전을 쓸려고욥 ㅎㅎㅎㅎ
늘 프로젝트 할 때마다 이번에 유료 써볼까? 말까? 하는데
이번엔 확실하게 유.료를 써보겠어요 ㅎㅎ
일단 가지고 있는 운동 유튜브 데이터를 분석에 필요하게 다듬는 과정을 거쳤습니다.
1) 업로드 날짜 간의 차이 계산 - 날짜 데이터 연산
영상을 어느 정도 주기에 업로드해야지,
조회수와 구독자 증가에 영향을 미칠지??
이 궁금증을 해결하려면 날짜 데이터 연산을 해야겠죠??
Brightics에선 Datetime 연산을 사용하면 가능하고,
(제가 노트북을 새로 샀더니,,,,,제대로 깔려 있는게 없네요 ㅠㅠㅠ)
일단 저는 급한대로 JupyterNotebook로 해본 결과를 이런식으로 한다는 것을 보여드리자면,
이렇게 몇 일 마다 영상을 업로드 했는지 알 수 있습니다.
2) '좋아요'와 '싫어요'의 상대지수 계산 -> 상대적인 값을 사용
'좋아요'수/'싫어요수' = 상대지수
이렇게 계산해서 싫어요수 대비 좋아요수를 계산!!
여기에, 'like_ratio'에 좋아요상대지수를 계산해보았습니다!
'좋아요'와 '싫어요'데이터를 둘다 사용하지 않고,
대표할 수 있는 상대지수를 사용해서 시각화에 사용할 수 있겠죠??
3) 현재 구독자 수 추가!!!
구독자 수 만큼 유튜브 데이터에 중요한 게 없을 것 같아요,
모든 데이터에 데이터 획득 당시의 구독자 수를 칼럼을 넣어보았습니다.
Thankyou bubu 유튜브 채널의 구독자 수는 252만명이네욯ㅎ
이렇게 추가되었습니다!!
모든 운동 유튜브 채널 20개를 위와 같이 전처리해서 만들면 완성!!
노트북을 급하게 주말에 바꾸느라고,,,,,,
Brightics 를 사용해서 하는 것까지는 못했는데요,,,,,,,,,,,,
추석 연휴 동안 모든 API 문제, Brightics 사용 방법까지 제대로 익히고,
텍스트 분석까지 공부를 좀 더 해봐서
다음주에는 EDA 공개까지 해보겠습니다!!