(추가) 사이트별 크롤링 허용 확인각 웹사이트에서 /robots.txt를 입력하면 각 사이트별 허용하는 범위가 나옵니다. (예시: 구글, 네이버 등)Web Crawling vs Web Scraping○ Wep Scraping : 웹 사이트 상에서 원하는 정보를 추출하는 방법○ Wep Crawling : 웹 크롤러가 정해진 규칙에 따라 복수 개의 웹 페이지를 탐색하는 행위(= 웹 스파이더링)크롤링스크래핑웹에서 페이지 및 링크 다운로드(웹 기반으로 작동)웹을 포함한 다양한 소스에서 데이터 추출(반드시 웹과 관련된 것은 아님)동일 콘텐츠가 여러 페이지에 업로드 된 것을 인식 못하므로중복 제거는 필수적특정 데이터를 추출하는 것이므로중복 제거가 반드시 필요하지는 않음웹 크롤링 주요 용도○ 현재 다양한 분야에서 활..