본문 바로가기
부트캠프 프로젝트

S4 PJT - DAY 5 - 발표스크립트, 촬영

by Atypical 2023. 2. 7.

지난 프로젝트의 주제는 좋았지만 완성도가 낮았고, 발표 퀄리티도 낮아서 아쉬웠다. (피드백도 아직 안 본)

이번 프로젝트도 난이도가 평이했으나 기본기능 완성은 되었으니 포장을 잘 해서 전달과 마무리가 되어야 겠다.

 

<할것>

데이터EDA(감정별 다수 토큰, 연령별, 성별 분석) X
정확도 외 Precision, recall, loss 등 다중분류 평가지표 분석
(어떤 감정이 주로 분류가 안될까?)
X
발표자료(배경, 가설, 이론설명, 한계점, 개선점) O
발표대본 만들기 X
시간남을시 : 노트의 다른 모델과 비교 X

정말 그냥 어지러울 뿐이다..

어찌저찌 다른 발표자료와 블로그들을 참고해서 겨우 냈다...하하..참... 씁쓸하다..


프로젝트 주제 및 동기에 대해 잘 설명해주셨습니다.
특히 인류 발전을 위한 과제와 프로젝트를 연관지어 동기를 풀어내주신 점이 인상 깊었습니다.
데이터셋에 대한 설명과 모델 학습 결과까지 적절히 설명해주셨습니다.

다만 BERT가 영어 말뭉치를 통해 학습이 되었기 때문에 koBERT를 사용하셨다는 이유는 타당하지만
다소 모델 선택 이유에는 부족할 수 있다고 생각됩니다.
BERT 모델의 특징을 같이 설명하였다면 더욱 설득력이 있었을 것으로 생각됩니다.

한계 및 발전 방향에 대해서도 잘 설명해주셨습니다.
감성 분류의 기준이 모호한 점은 감성 사전(Lexicon)을 이용해 극성 점수를 직접 부여하여
기준을 더욱 명확히 잡아보는 방법도 생각해볼 수 있겠습니다.

추가로 KoBERT의 경우 정형 데이터(위키피디아, 뉴스 기사 등)의 데이터로 학습된 모델이기 때문에 댓글이나 구어체로 구성된 데이터셋에 대해서는 성능이 다소 좋지 못할 수 있습니다. kcBERT와 같은 비정형 데이터(댓글, 사용자 리뷰 등)을 이용해 학습한 모델이 해당 데이터셋에는 더 잘 어울린다고 생각됩니다.

향후 비정형 데이터 학습 모델과 성능을 비교해보며 프로젝트를 발전시킬 수 있을 것으로 보입니다.
대단히 고생 많으셨습니다.

'부트캠프 프로젝트' 카테고리의 다른 글

CP1 day3 : Data 선정, 전처리  (0) 2023.03.14
CP1 Day1  (0) 2023.03.10
S4 PJT - Day(4)  (0) 2023.02.06
S4 PJT - Day(3)  (0) 2023.02.04
S4 PJT - Day(2-2)  (0) 2023.02.03

댓글