본문 바로가기

IT-Consultant

루씬 색인 프로세스 정리

Document가 들어오면  DocumentWriter Class의 addDocument 함수에서
invertDocument(doc) 함수를 Call하고 sortPostingTable()함수에서 소팅처리한후 writePostings에서 저장한다.  


루씬에서 Term Posting 리스트를 보고 싶다면 DocumentWriter Class에서 이 부분을 주석을 풀면 된다.
    /*
    for (int i = 0; i < postings.length; i++) {
      Posting posting = postings[i];
      System.out.print(posting.term);
      System.out.print(" freq=" + posting.freq);
      System.out.print(" pos=");
      System.out.print(posting.positions[0]);
      for (int j = 1; j < posting.freq; j++)
 System.out.print("," + posting.positions[j]);
      System.out.println("");
    }
    */