
안녕하세요. 개발개입니다. 숭실대학교 정보검색연구실의 중 다음 4가지 항목에 대하여 4부작으로 요약 및 정리한 내용을 기술합니다. 정보검색 시스템의 구조 검색 효과 평가 척도 영어 색인어 추출 한글 색인어 추출 이번 글에서는 영어 색인어 추출에 대해 알아보도록 하겠습니다. 오타, 오류 혹은 기타 의견은 언제든지 환영합니다. 영어에서 색인어를 추출하는 3단계 과정은 다음과 같습니다. 어휘 분석 불용어 제거 스테밍 1. 어휘 분석 어휘 분석은 입력된 문자열을 토큰들로 변환하는 과정을 말합니다. 여기서 이 토큰들을의 형태를 정의 하기 위해서는 숫자, 하이픈, 구두점 등이 고려되어야 합니다. 숫자 대체적으로 연속된 숫자는 검색 주제와 무관한 경우가 많습니다. 하지만 특정 문서에서는 주용한 의미를 가질 수도 있습..

안녕하세요. 개발개입니다. 숭실대학교 정보검색연구실의 중 다음 4가지 항목에 대하여 4부작으로 요약 및 정리한 내용을 기술합니다. 정보검색 시스템의 구조 검색 효과 평가 척도 영어 색인어 추출 한글 색인어 추출 이번 글에서는 검색 효과 평가 척도에 대해 알아보도록 하겠습니다. 오타, 오류 혹은 기타 의견은 언제든지 환영합니다. 일반적으로 정보 검색 시스템의 검색 효과를 평가하기 위한 척도는 두 가지 입니다. 1. 재현율(recall) 전체 적합 문서에 대한 검색된 적합 문서의 비율 문서 집합에서 사용자가 원하는 문서를 어느 정도 검색하였는가 2. 정확률(precision) 전체 검색 문서에 대한 검색된 적합 문서의 비율 검색된 문서들 중에서 사용자가 원하는 문서가 얼마나 포함되어 있는가 재현율과 정확률 ..

안녕하세요. 개발개입니다. 숭실대학교 정보검색연구실의 중 다음 4가지 항목에 대하여 4부작으로 요약 및 정리한 내용을 기술합니다. 정보검색 시스템의 구조 검색 효과 평가 척도 영어 색인어 추출 한글 색인어 추출 이번 글에서는 정보 검색 시스템의 구조에 대해 알아보도록 하겠습니다. 오타, 오류 혹은 기타 의견은 언제든지 환영합니다. 정보 시스템의 구조는 다음과 같습니다. 언뜻 복잡해 보이는 이 도표는 5가지로 부분으로 나눌 수 있습니다. 색인 질의 형식화 검색 적합성 피드백 검색 효과 평가 1. 색인 색인 모듈에 입력된 문서들은 색인어 추출 과정을 거쳐 문서 베이스에 저장됩니다. 과거의 색인 작업은 사서나 전문가에 의해 수작업으로 수행되었으나, 수작업 색인의 경우 시간과 비용면에서 효과적이지 못하며 작업자..