본문 바로가기

Data Science/Information Retrieval7

ROUGE - Automated text summarization tool Link : http://berouge.com 자신이 구현한 텍스트 요약 알고리즘의 정확도를 측정하기 위해 제공되는 툴. 역시나 사람 손을 타야 하는 데이터들을 정답셋으로 이용하고 있다. 그래도 측정해 주는게 어디랴... 좋다 좋아. 2010. 11. 5.
[용어정리] Maximum likelihood estimation & Corpus smoothing Maximum likelihood estimation : - likelihood : A가 true B가 true일 확률. p( A | B ) 로 나타낸다. 보통 어떤 결과가 있고, 결과를 이끌어낸 여러가지 가설이 있을때 각 가설이 결과를 도출해 낼 확률을 likelihood 라고 한다. (예) 배고플때 라면을 먹을 확률. p ( 배고름 | 라면먹기 ) - Maximum likelihood estimation : B가 정해저있을때 여러가지 A중에 확률을 높이는 것을 찾는것. (예) 난 지금 라면을 먹을꺼야. 그런데 내 상태는 어떨때 만족할 확률이 높을까? p ( 배고픔 | 라면먹기 ) >>> p ( 배부름 | 라면먹기 ) 간단하게 2개의 인자들로만 확률값의 maximum likelihood를 측정했지만, .. 2010. 10. 28.
Wikimedia Downloads Wiki 에 있는 문서들을 download 받을수 있다는 사실을 이제야 알게 되었다. ㅎㅎ corpus 만들때 사용하면 유용할듯~! 주소 : http://download.wikipedia.com/ 2009. 6. 29.
Linear Algebra 고감자님 블로그 글을 읽다가 선형 대수에 대한 좋은 강의가 있다길래 눈도장겸 기록해 놓는다. http://ocw.snu.ac.kr/course/lecturenotes.php?clgidx=5&deptidx=4&cosidx=23 서울대학교 심형보 교수님의 강의를 학생들이 녹화해서 올린 모양이다. 이 과목을 대학교서 처음 배울때 특정 형태로 만드는 공식만을 외울뿐 변환했을때 이녀석의 특징에 대해서는 제대로 설명을 못들은거 같아 멍하게 시간을 때우다 만 것 같다. 이 강의를 들으면 의문점들이 채워질수 있을까? ㅎㅎ 한번 달려보자. 2009. 5. 12.