🖥️ IT, 컴퓨터/🐍 Python
[Python] HTML에서 특정 클래스 뒤에 있는 텍스트만 추출하기 (BeautifulSoup)
김 홍시
2024. 4. 25. 02:03
반응형
문제 상황
웹에서 제공하는 표의 특정 열 부분만 복사하고 싶은데, 전체 복사만 가능함
문제 해결
개발자도구 > 표 전체를 감싸는 부분 html 코드 찾기
해당 부분 우클릭 > copy하기
파이썬에서 아래의 코드 입력, 가정한 HTML 예시에 자신의 코드를 넣기
from bs4 import BeautifulSoup
# 가정한 HTML 예시
html_content = """
<div class="review-section">
<div class="originalReviewContent">This is an original review.</div>
<div class="TranslatedReviewContent">This is a translated review.</div>
</div>
"""
# HTML 파싱
soup = BeautifulSoup(html_content, 'html.parser')
# TranslatedReviewContent 클래스를 가진 div 태그 찾기
translated_reviews = soup.find_all(class_="TranslatedReviewContent")
# 각 번역된 리뷰 내용 출력
for review in translated_reviews:
print(review.text)
이렇게 해당 class에 해당하는 것들만 출력됨
반응형