기본적인 개념이지만 자꾸 해깔리기에 이곳에 정리해 둔다.
precision 과 recall 은 정확도를 측정하는데 자주 사용되는 2가지 기본 지표이다.
precision = 찾은 문서 중 연관된 문서 개수 / 찾은 문서 총 개수
recall = 찾은 문서 중 연관된 문서 개수 / 연관된 문서 총 개수
presicion -> 예측 -> 찾은것 중에 얼마나 관련된걸 찾았냐?
recall -> 기억 -> 실제 연관된 것 중에 얼마나 기억하는가? ( 두번째 것은 좀 억지인가? ㅎ ) 재현율 (Po깜소wer)
-
precision이야 정확도라는 의미가 확실해서 외우기 쉬운 단어죠.
하지만 recall 인 경우 한글로 바꿔 쓰면 재현률로 보통 쓰는데, "재현", 즉 "얼마나 많은 정답들을 안 틀리고 재현했느냐"라고 저는 머리속에 넣어 놨어요^^;;
여기 말로 바꿔 쓰면, A란 연관된 문서 셋을 얼마나 가깝게 재현했는가 정도? -