어니컴, 웹 기반 문서 수집기 '앵커스 크롤러' 공개

ⓒ게티이미지
<ⓒ게티이미지>

어니컴(대표 지영만)은 '앵커스 크롤러(ankus Crawler)'를 아파치 라이선스로 공개했다고 10일 밝혔다.

앵커스 크롤러는 아파치 Http 컴포넌츠 프로젝트 'Http 클라이언트 v4.5'를 기반으로 개발한 웹 기반 문서 수집기다. 웹 크롤러에 대한 기본 지식 없이도 간단한 정의수준 자바 프로그래밍과 HTML 해독능력만 있으면 웹 문서 수집이 가능하다.

장점은 스크립트 파일을 이용해 HTML 문서에서 정보추출과 수집대상 HTTP 웹 주소정의가 가능하는 점이다. 그래픽이용자환경(GUI) 적용 시 손쉽게 활용 가능하다.

앵커스 크롤러는 오픈소스 전문사이트 깃허브에서 내려받기 가능하다.

[전자신문 CIOBIZ] 김지선기자 river@etnews.com

위방향 화살표