발표 내용
- ask - it이 무엇인가
- 그래서 뭐 하려고 했는데
- 개발 기능
- 질문 개선
- 문제점
- 대답을 뱉음
- 정중하지 못함(feat) 정상수)
- 해결방안
- 답변 개선
- 공통의 문제
- 500자 넘어간다 + 조금 원하는 방향대로 안감
- 공통의 해결책
- 사용자의 추가 입력을 받음
- history DB에 적재하여 튜닝을 위한 데이터 확보
- 비속어 필터링
- 문제점
- 채팅 특성 상 비속어가 발생할 확률이 높음
- 그러나 이곳까지 토큰을 사용하기엔 비용이 부담됨
- 해결방안
- BERT 모델을 fine tuning을 진행하여 공격적인 문장과 그렇지 않은 문장들을 분류할 수 있는 모델로 학습
- 배치를 통해 채팅을 필터링하도록 함
- 사용자 경험
https://docs.google.com/presentation/d/1Zn1Th9uAuW9C9Um5D5fJHbJykoACMuqGVE_0DitE_Jc/edit#slide=id.p1