소개

딥러닝기반 웹페이지 본문영역 추출기 - 알파버전

개요 : 데이타 학습을 통해 웹페이지의 본문영역을 추정하고 기본정보와 추정된 본문영역 정보를 JSON형식으로 출력합니다
설명 : 페이지 내에서 "제목", "본문", "날짜" 등을 모두 포함하는 하나의 영역을 추정합니다.
활용 : 인터넷 수집기로 수집한 HTML데이타의 텍스트를 정제하여 고품질의 분석을 수행할 수 있도록 합니다.

분석 & 추출된 페이지의 내용에 대한 저작권은 해당 사이트에 있으며 저작권 침해가 되지 않는 범위내에서 사용해 주시기 바랍니다.
본 테스트는 오직 테스트 용도이며 테스트 이외의 목적으로 이용하는 사항은 허가되지 않습니다.

본문영역 추출 테스트

분석한 페이지의 내용이 적절하지 않은 경우에는 "학습데이타 전송"을 통해 본문영역의 XPath를 넣어주시면 학습데이타를 갱신하여 반영합니다(하루에 한번 수행예정)