본문 바로가기
인공지능

1장. 크롤링과 스크레이핑

by 카리3 2019. 11. 24.

0. 머신러닝을 위한 데이터 처리

크롤링, 스크레이핑, 머신러닝

1) 스크레이핑 이란? 웹 사이트에 있는 특정 정보를 추출하는 기술을 의미한다. 웹에서 데이터를 추출하는 것뿐만 아니라 구조를 분석하는 것도 포함된다.

2) 크롤링이란? 프로그램이 웹 사이트를 정기적으로 돌며 정보를 추출하는 기술. 크롤링 하는 프로그램을 "크롤러", "스파이더" 라고 합니다

1. 데이터 다운로드 하기

1.1. 웹에서 데이터 추출하기 (urlretrieve, urlopen)

1.2. IP 확인 및 파라메터 인코딩해서 넘기기

 

1.3. BeauifulSoup 사용 (tag, find(), find_all())

1.4. BeautifulSoup 사용 (select(), select_one() )

'인공지능' 카테고리의 다른 글

4장 머신러닝  (0) 2019.11.25
2장. 고급스크레이핑  (0) 2019.11.24
파이썬 문법 간단정리  (1) 2019.11.24
머신러닝/딥러닝 개발을 위한 환경설정  (1) 2019.11.24
인공지능 발전의 역사  (0) 2019.06.11