📚직장인을 위한 데이터 분석 실무 with 파이썬

페이지 60~

from bs4 import BeautifulSoup

soup=BeautifulSoup(html, 'html.parser')

HTML 정보 찾기

BeautifulSoup 명령어인 select(’조건’)을 이용하면 HTML 내에서 입력한 조건을 만족하는 태그를 모두 선택할 수 있음.

조건 부분에는 해당 태그의 태그명이나 속성값을 지정하거나 태그 간의 구조를 지정할 수도 있음 (두 방법 모두 활용 가능)

1. 태그 속성 활용

🌵태그명으로 태그 찾기

tags_span=soup.select('span')
tags_p=soup.select('p')

첫 번째 줄에서는 soup에 담긴 HTML 페이지에서 태그명이 ‘span’인 태그를 모두 찾아 tags_span 변수에 저장

두 번째 줄에서는 ‘p’ 인 태그를 모두 찾아 tags_p 변수에 저장

🌵id와 class로 태그 찾기

ids_fruits1=soup.select('#fruits1')
class_price=soup.select('.price')
tags_span_class_price=soup.select('span.price')