◾ requests 모듈을 통해 요청을 보내고 결과 값을 받아오는 형태의 라이브러리
◾ HTML , XML 파일로 데이터를 파싱해주는 라이브러리
◾ 원하는 데이터를 특정 패턴이나 방법 또는 순서로 탐색, 검색, 수정 등 기능 수행
pip 이용시,
Copy pip install beautifulsoup4
conda를 사용한다면,
Copy conda install beautifulsoup4
◾ HTML 예제
Copy from bs4 import BeautifulSoup soup = BeautifulSoup("<p>Some<b>bad<i>HTML", features="html.parser") print(soup.prettify())
◾ 실행 결과
Copy <p> Some <b> bad <i> HTML </i> </b> </p>
◾ XML 예제
Copy from bs4 import BeautifulSoup soup = BeautifulSoup("<tag1>Some<tag2/>bad<tag3>XML") print(soup.prettify())
Copy <tag1> Some <tag2> </tag2> bad <tag3> XML </tag3> </tag1>
Prettify()
find(), findall()
find_parent(), find_parents()
※ 이 글이 도움이 되었다면 "👆🏻구독"과 "🤍공감" 버튼을 클릭해주세요. 클릭 한번이 글 쓰는데 큰 힘이 됩니다.
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.