일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 프로그래머스
- 파이썬
- 리프2기
- 노드JS
- IOS
- 파이썬중급강의
- swift
- Python3
- 파이썬중급
- 인프런파이썬강의
- 스위프트
- 유학토플
- 인프런오리지널
- IOS프로그래밍
- JS
- 토플공부수기
- 카카오톡채팅봇
- 우리를위한프로그래밍
- rxswift
- 인프런파이썬
- 인프런강의
- 교환학생토플
- 토플
- 인프런
- 파이썬웹크롤링
- uikit
- SwiftUI
- 웹크롤링
- nodeJS
- 자바스크립트
- Today
- Total
목록크롤링 (2)
먹고 기도하고 코딩하라
개요 : Python3 + BeautifulSoup4로 하는 웹크롤링 하는 것 : Python3 문법 톺아보기 + BeautifulSoup4 초간단 익히기 + 멜론 TOP100 크롤링 실습 소요 시간 : 1시간~1시간 30분 작년 2학기에 난 휴학하고 토플 공부를 하고 있었다. 코로나 없는 평행세계의 나는 지금쯤 미국 뉴욕주의 어느 학교에서 새학기 적응을 하고 있겠으나... 난 코로나로 파견이 불발되고 그냥 복학을 하기로 했다. 글을 시작하자마자 샛길로 빠졌는데 휴학생도 학교의 공동 자율학습(?) 프로그램에 참여할 수 있어서 친구들과 함께 주제를 정해서 자기가 잘 아는 걸 발표하기로 했다. 내가 아는 것 중에 친구들이 제일 관심있게 공부할 만한 게 뭐가 있을까 곰곰이 생각하다가 우리 모두 파이썬은 기본 ..
이 포스팅은 beautifulsoup4 에서 가장 잘 쓰이고 간단하게 쓸 수 있는 핵심 문법들을 정리하기 위해 쓰였습니다. 여기서는 웹페이지의 소스 코드에서 우리가 원하는 부분을 골라내는 방법과 beautifulsoup4 로 원하는 정보만 쏙 뽑아내는 것에 주안점을 두겠습니다. 주의하실 점은 동적 웹페이지에서는 이 방법이 먹히지 않을 수 있다는 것입니다. 브라우저 엔진으로 스크립트를 해석해야 하는 경우 selenium 과 웹 드라이버를 설치해야 할 수 있습니다. 이 방법에 대해서는 저의 다른 포스팅에서 더 자세하게 다루고 있으니 참고하시기 바랍니다. 기본적으로 정적 웹페이지를 크롤링하는 방법을 다룹니다. 시작해보겠습니다. 일단 저는 우리 학교 소스 코드에서 날짜와 요일, 그리고 학생식과 교직원식을 뽑아내..