본문 바로가기
Data Science/Information Retrieval

[용어정리] Maximum likelihood estimation & Corpus smoothing

by leanu 2010. 10. 28.

Maximum likelihood estimation : 

   - likelihood :  A가 true B가 true일 확률.    p( A | B ) 로 나타낸다. 보통 어떤 결과가 있고, 결과를 이끌어낸 여러가지 가설이 있을때 각 가설이 결과를 도출해 낼 확률을 likelihood 라고 한다.
        (예) 배고플때 라면을 먹을 확률.  p ( 배고름 | 라면먹기 )

   - Maximum likelihood estimation : B가 정해저있을때 여러가지 A중에 확률을 높이는 것을 찾는것.
        (예) 난 지금 라면을 먹을꺼야. 그런데 내 상태는 어떨때 만족할 확률이 높을까?
                  p ( 배고픔 | 라면먹기 )  >>> p ( 배부름 | 라면먹기 )

     간단하게 2개의 인자들로만 확률값의 maximum likelihood를 측정했지만, 여러상황을 고려해야 하므로 실제로 쓰이는 계산은 복잡하다. (참고 : http://en.wikipedia.org/wiki/Maximum_likelihood_method )


Corpus smoothing : 특정 확률 계산 모델을 이용하여 한 문서의 확률값을 계산하는경우 그 값이 0이 나오는 경우가 있다. 그런경우 0 이 아닌 다른수치로 보정하는 작업을 smoothing 기법이라 한다.

'Data Science > Information Retrieval' 카테고리의 다른 글

ROUGE - Automated text summarization tool  (0) 2010.11.05
Wikimedia Downloads  (1) 2009.06.29
Linear Algebra  (2) 2009.05.12
Stop words (English) - from Wikipedia  (0) 2008.01.16
[e-book] Introduction to Information retrieval  (0) 2008.01.10

댓글