[ 크롤링 ]

인터넷에 존재하는 데이터를 컴퓨터 프로그램을 통해서 자동화된 방법을 사용해 수집하는 작업 // 스크랩핑
+
"분류"

= "크롤링"

웹 데이터를 자동으로 수집, 분류, 저장
프로그램 언어를 문법에 맞게 분석하는 것 == 웹페이지의 코드를 사용자가 원하는 형식으로 추출하여 정보를 생성 == "가공"
 = [ 파싱 ] -> 파서가 수행

[ Jsoup ]
자바로 만들어진 HTML Parser
HTML(마크업 요소)을 분석할수 있음
크롤링 가능여부, 설정사항을 ~~~(페이지주소)/robots.txt 로 볼 수 있음


[ HTML ]
~ML : 마크업 언어 -> <> 사용한다!
<>여는태그 </>닫는태그 쌍을이룸
<> 요소 element

'Project' 카테고리의 다른 글

설계 예시  (0) 2021.09.01
Model 정리  (0) 2021.07.29

+ Recent posts