본문 바로가기
Python/라이브러리

[Python/라이브러리] BeautifulSoup 패키지

by 기록하는_사람 2022. 10. 5.

BeautifulSoup 패키지 

📌 BeautifulSoup 패키지

: HTML, XML 문서들의 구문을 분석하기 위한 파이썬 패키지.

 

BeautifulSoup 패키지 설치

📌 BeautifulSoup 패키지 설치

cmd창에 다음을 입력해 설치.

pip install beautifulsoup4

 

BeautifulSoup 패키지 사용

📌 BeautifulSoup( [문자열], [parser] )

: 문자열을 parser를 통해 해석.


💡 HTML 태그, id, class 지칭하는 방법

soup.select( [selector] ) 

:  tag class 인스터스들의 리스트.
② soup.select_one( [selector] )

: 첫번째 태그 1개만 가져옴.

  tag class 인스턴스.

태그 태그 이름
id #
class .
하위 태그, id, class >


💡 ctrl + f : selector 검색

 

📌 .text

: text 부분 검출.

 

📌 get( [속성명] )

: 속성값 검출.

 

BeautifulSoup 패키지 사용 예시

❓ 음원 차트 순위 top10 출력하는 프로그램.

import requests
from bs4 import BeautifulSoup

res = requests.get("https://search.naver.com/search.naver?sm=tab_hty.top&where=nexearch&query=%EC%9D%8C%EC%9B%90+%EC%B0%A8%ED%8A%B8&oquery=%EC%9D%8C%EC%9B%90+%EC%88%9C%EC%9C%84&tqi=hz1lIsp0J1ssssRd6z0ssssstkh-111341") # 음원사이트 HTML 소스 가져옴.
soup = BeautifulSoup(res.text, "html.parser") # HTML 소스 해석.

songs = soup.select(".link_tit > span > a") # 노래 제목만 가져옴.

for i in range(10):
    print(songs[i].text) # top 10 노래 제목 출력.

 

댓글