🖥️ IT, 컴퓨터/🐍 Python

[Python] HTML에서 특정 클래스 뒤에 있는 텍스트만 추출하기 (BeautifulSoup)

김 홍시 2024. 4. 25. 02:03
반응형

 

문제 상황

 

웹에서 제공하는 표의 특정 열 부분만 복사하고 싶은데, 전체 복사만 가능함

 

문제 해결

 

개발자도구 > 표 전체를 감싸는 부분 html 코드 찾기

해당 부분 우클릭 > copy하기

 

파이썬에서 아래의 코드 입력, 가정한 HTML 예시에 자신의 코드를 넣기

 

from bs4 import BeautifulSoup

# 가정한 HTML 예시
html_content = """
<div class="review-section">
    <div class="originalReviewContent">This is an original review.</div>
    <div class="TranslatedReviewContent">This is a translated review.</div>
</div>
"""

# HTML 파싱
soup = BeautifulSoup(html_content, 'html.parser')

# TranslatedReviewContent 클래스를 가진 div 태그 찾기
translated_reviews = soup.find_all(class_="TranslatedReviewContent")

# 각 번역된 리뷰 내용 출력
for review in translated_reviews:
    print(review.text)

 

 

 

이렇게 해당 class에 해당하는 것들만 출력됨

 

반응형