허허 어느정도 개발 방향이 수정 되었네요
단순히 "저평가 되었다" 라는 기준은 모호합니다 이부분은 완전히 큐레이터의 재량입니다. 그런데 만약 적절한 수치와 통계를 이용하여 정량적인 가치평가를 해본다면 어떨까요. 예를 들면 글자수, 이미지수, 보팅수 대비 현재 가치,해당 태그에 1일간 작성된 모든 게시글의 평균 가치, 비속어 포함여부 등이 있을 수 있겠군요.
제글의 일부를 발췌 했습니다. 저는 일단 이런 수치를 svm이나 랜덤포레스트 간단히는 ANN 에 적용해서 학습시켜볼 요량입니다. 최종적으로는 저품질/평균/고품질 를 분류하는게 목적입니다.
으잌, 고수분이 오셔버렸군요 ㅋㅋ 포스팅이 기대됩니다. 학습용 데이터는 어떻게 마련하실 생각이신가요?