페이지랭크도 기본 알고리듬만 공개되었지, 세부적인 로직들과 파라미터들은 절대공개를 하지 않습니다. 사실 이게 다 공개되면, 스팸공격에 쉽게 당하겠지요. 그러고 보면, 내부 알고리듬을 공개하지 않는 것은 그렇게 강력한 알고리듬이 아니라는 반증이 되겠네요. 시스템이 게이밍당한다는 전제하에서 모든 로직을 다 오픈해서도 스팸을 방어할 수 있는 균형(equilibrium)을 확보할 수 있는 모델이 되어야 그나마 불투명성으로 인해 생기는 불공평함과 조작 가능성은 없앨 수 있겠네요.
You are viewing a single comment's thread from:
그런 알고리즘이 진정 ideal한 알고리즘이겠죠.
그것이 가능한가는 또 어려운 문제라고 봅니다.
스팸 공격도 있겠지만,
로직 뿐만 아니라 파라미터도 일종의 '노하우'가 되기 때문에 공개를 하지 않는 것 같습니다. 맛집의 비법소스죠.
Data 자체의 공정성 문제도 있을겁니다.
Data 선별 과정에서 이미 인간의 생각이 반영되고,
Data 를 입력하기 전 preprocessing 하는 과정도 임의적인 것이고요.