Document가 들어오면 DocumentWriter Class의 addDocument 함수에서
invertDocument(doc) 함수를 Call하고 sortPostingTable()함수에서 소팅처리한후 writePostings에서 저장한다.
루씬에서 Term Posting 리스트를 보고 싶다면 DocumentWriter Class에서 이 부분을 주석을 풀면 된다.
/*
for (int i = 0; i < postings.length; i++) {
Posting posting = postings[i];
System.out.print(posting.term);
System.out.print(" freq=" + posting.freq);
System.out.print(" pos=");
System.out.print(posting.positions[0]);
for (int j = 1; j < posting.freq; j++)
System.out.print("," + posting.positions[j]);
System.out.println("");
}
*/
'IT-Consultant' 카테고리의 다른 글
벡터가 가물가물하면 이 문서를 보자. (0) | 2008.10.29 |
---|---|
루씬 색인 프로세스 정리 (0) | 2008.10.29 |
Posting List 소팅시 quickSort 사용 (0) | 2008.10.29 |
Posting List 소팅시 quickSort 사용 (0) | 2008.10.29 |
invertDocument(Tokenizes the fields of a document into Postings) (0) | 2008.10.29 |