본문 바로가기

Data Science26

Stop words (English) - from Wikipedia Stop words, or stopwords, is the name given to words which are filtered out prior to, or after, processing of natural language data (text). Hans Peter Luhn, one of the pioneers in information retrieval, is credited with coining the phrase and using the concept in his design. It is controlled by human input and not automated. This is sometimes seen as a negative approach to the natural articles o.. 2008. 1. 16.
[e-book] Introduction to Information retrieval 검색 관련 공부 최고의 서적이라 생각됩니다. 인쇄하려면 print 버전을 온라인상에서 읽으려면 onlinereading 버전을 받으세요. 2008. 1. 10.
[Paper] Information Retrieval 관련 논문 --------------------------------------------------------------------------------- 2008. 1. 3.
SVD : singular value decomposition ( 특이값 분해 ) - 출처 : 보리님 블로그 모든 m×n 행렬 A은 다음과 같이 분해할 수 있다.A = UΣVTU는 m×m 직교 행렬(orthogonal matrix)이고, V는 n×n 직교 행렬이다. m×n 행렬인 Σ는 대각선에만 그 값이 있는데, 0 또는 양수이다. 이 값을 특이값(singular value)이라고 한다. 고유값-고유벡터 분해(eigenvalue-eigenvector decomposition)A = QΛQT는 대칭 행렬(symmetric matrix)에 대해서 먹히는 반면에 (사실 충분 조건이다. 필요충분조건을 말하려면 너무 길어지니깐...) , SVD는 모든 행렬에 대해 (정방행렬이 아니더라도) 써 먹을 수 있는 만능이다.행렬 A를 벡터 공간(vector space) 간 선형 사상(linear mapping)으로 보면 (엮인 .. 2008. 1. 2.