먹고 기도하고 코딩하라

Python3 + BeautifulSoup4 와 함께하는 즐거운 웹크롤링 본문

Python

Python3 + BeautifulSoup4 와 함께하는 즐거운 웹크롤링

사과먹는사람 2020. 8. 28. 13:21
728x90
728x90
개요 : Python3 + BeautifulSoup4로 하는 웹크롤링
하는 것 : Python3 문법 톺아보기 + BeautifulSoup4 초간단 익히기 + 멜론 TOP100 크롤링 실습
소요 시간 : 1시간~1시간 30분

 

작년 2학기에 난 휴학하고 토플 공부를 하고 있었다. 코로나 없는 평행세계의 나는 지금쯤 미국 뉴욕주의 어느 학교에서 새학기 적응을 하고 있겠으나... 난 코로나로 파견이 불발되고 그냥 복학을 하기로 했다. 

글을 시작하자마자 샛길로 빠졌는데 휴학생도 학교의 공동 자율학습(?) 프로그램에 참여할 수 있어서 친구들과 함께 주제를 정해서 자기가 잘 아는 걸 발표하기로 했다. 내가 아는 것 중에 친구들이 제일 관심있게 공부할 만한 게 뭐가 있을까 곰곰이 생각하다가 우리 모두 파이썬은 기본 정도는 하니까 bs4 모듈로 크롤링하는 걸 해보면 재밌겠다는 생각이 들어 발표 자료를 만들고 준비했다.

그래서 오늘 그 ppt 자료를 공유할까 한다.

 

python-webcrawling-example.pdf
1.90MB

 

깃허브 미리보기로 볼 수 있는 pdf 내용의 일부이다.

자습서로 쓰기에는 다소 불친절하다. 왜냐하면 내가 ppt에는 별 내용 안 적고 원래 말로 설명을 많이 하는 타입이라...

하지만 예제 코드도 몇 개 끼워뒀으니 혼자 보고 학습하기에 큰 무리는 없을 거라는 생각이 든다.

 

아래 링크는 깃허브 repo 주소이다. 여기서 예제 코드까지 한 번에 볼 수 있다.

 

dev-dain/python-crawling-example

python3 + beautifulsoup4로 하는 쉽고 재미난 웹크롤링 예제! Contribute to dev-dain/python-crawling-example development by creating an account on GitHub.

github.com

 

누군가에게는 도움이 되길!!

 

 

728x90
반응형
Comments