A2.

우선 "PDF본문검색" 은 두 단어 이상을 포함하는 기사를 찾아낼 수 있습니다. 만약 '영화' 와 '감독' 이 함께 들어간 기사를 찾고자 하는 경우에는 "PDF본문검색" 창에 각 단어를 띄어서 '영화 감독' 이라고 쓰시고 엔터를 누르면 됩니다.

 

"PDF본문검색" 은 네이버의 블로그에 올려진 포스트를 바탕으로 검색이 이루어집니다. 검색 결과는 '네이버' 기준에 의한 '유사도순' 으로 정렬되어 나타납니다. 우리가 일반적으로 포털 검색엔진에 검색어를 넣었을 때 나타나는 순으로 보시면 됩니다.

 

각 포스트들은 해당기사의 original index, edited index, nkino의 PDF주소, 그리고 해당하는 PDF에서 추출한 텍스트, 이렇게 네 가지로 구성되어 하나의 포스트를 이루고 있습니다. 현재 키노의 모든 기사를 PDF로 제공하고 있지 않기 때문에 여기서 말하는 "PDF본문검색" 이란 nkino에서 제공하고 있는 PDF 안에서만의 검색입니다. 제가 분류한 키노의 기사는 총 5,465개이며 이 중 2,948개만이 PDF가 걸려있습니다. 그러므로 키노의 전체 기사 중 본문 검색은 키노의 모든 기사 중 대략 54% 안에서 이루어진다고 보시면 됩니다.