딥러닝기반 웹페이지 본문영역 추출기 - 알파버전
개요 : 데이타 학습을 통해 웹페이지의 본문영역을 추정하고 기본정보와 추정된 본문영역 정보를 JSON형식으로 출력합니다
설명 : 페이지 내에서 "제목", "본문", "날짜" 등을 모두 포함하는 하나의 영역을 추정합니다.
활용 : 인터넷 수집기로 수집한 HTML데이타의 텍스트를 정제하여 고품질의 분석을 수행할 수 있도록 합니다.
분석 & 추출된 페이지의 내용에 대한 저작권은 해당 사이트에 있으며
저작권 침해가 되지 않는 범위내에서 사용해 주시기 바랍니다.
본 테스트는 오직 테스트 용도이며 테스트 이외의 목적으로 이용하는 사항은 허가되지 않습니다.
분석한 페이지의 내용이 적절하지 않은 경우에는 "학습데이타 전송"을 통해 본문영역의 XPath를 넣어주시면 학습데이타를 갱신하여 반영합니다(하루에 한번 수행예정)