BeautifulSoup 패키지
📌 BeautifulSoup 패키지
: HTML, XML 문서들의 구문을 분석하기 위한 파이썬 패키지.
BeautifulSoup 패키지 설치
📌 BeautifulSoup 패키지 설치
cmd창에 다음을 입력해 설치.
pip install beautifulsoup4
BeautifulSoup 패키지 사용
📌 BeautifulSoup( [문자열], [parser] )
: 문자열을 parser를 통해 해석.
💡 HTML 태그, id, class 지칭하는 방법
① soup.select( [selector] )
: tag class 인스터스들의 리스트.
② soup.select_one( [selector] )
: 첫번째 태그 1개만 가져옴.
tag class 인스턴스.
태그 | 태그 이름 |
id | # |
class | . |
하위 태그, id, class | > |
💡 ctrl + f : selector 검색
📌 .text
: text 부분 검출.
📌 get( [속성명] )
: 속성값 검출.
BeautifulSoup 패키지 사용 예시
❓ 음원 차트 순위 top10 출력하는 프로그램.
import requests
from bs4 import BeautifulSoup
res = requests.get("https://search.naver.com/search.naver?sm=tab_hty.top&where=nexearch&query=%EC%9D%8C%EC%9B%90+%EC%B0%A8%ED%8A%B8&oquery=%EC%9D%8C%EC%9B%90+%EC%88%9C%EC%9C%84&tqi=hz1lIsp0J1ssssRd6z0ssssstkh-111341") # 음원사이트 HTML 소스 가져옴.
soup = BeautifulSoup(res.text, "html.parser") # HTML 소스 해석.
songs = soup.select(".link_tit > span > a") # 노래 제목만 가져옴.
for i in range(10):
print(songs[i].text) # top 10 노래 제목 출력.
'Python > 라이브러리' 카테고리의 다른 글
[Python/라이브러리] os 모듈 (0) | 2022.10.11 |
---|---|
[Python/라이브러리] pillow 라이브러리 (0) | 2022.10.05 |
[Python/라이브러리] tqdm 라이브러리 (0) | 2022.10.05 |
[Python/라이브러리] requests 라이브러리 (0) | 2022.10.05 |
[Python/라이브러리] import (0) | 2022.09.27 |
댓글