You are viewing a single comment's thread from:

RE: 2017년 6월 27일 kr-newbie 보안관 봇 개발일지 + 큐레이션 문제

in #kr7 years ago

허허 어느정도 개발 방향이 수정 되었네요

단순히 "저평가 되었다" 라는 기준은 모호합니다 이부분은 완전히 큐레이터의 재량입니다. 그런데 만약 적절한 수치와 통계를 이용하여 정량적인 가치평가를 해본다면 어떨까요. 예를 들면 글자수, 이미지수, 보팅수 대비 현재 가치,해당 태그에 1일간 작성된 모든 게시글의 평균 가치, 비속어 포함여부 등이 있을 수 있겠군요.

제글의 일부를 발췌 했습니다. 저는 일단 이런 수치를 svm이나 랜덤포레스트 간단히는 ANN 에 적용해서 학습시켜볼 요량입니다. 최종적으로는 저품질/평균/고품질 를 분류하는게 목적입니다.

Sort:  

으잌, 고수분이 오셔버렸군요 ㅋㅋ 포스팅이 기대됩니다. 학습용 데이터는 어떻게 마련하실 생각이신가요?