
이 코드는 DART 시스템에서 제공하는 보고서 HTML에서 BeautifulSoup과 정규표현식을 활용하여 회사명, 사업연도, 보고서 종류를 추출하는 간단한 파서입니다. 이전에는 XPath로 위치를 하드코딩했지만, 텍스트 기반 정제로 전환함으로써 더 유연하게 동작할 수 있게 되었습니다. import requestsfrom bs4 import BeautifulSoupimport redef parse_report_info(url): html = requests.get(url).text soup = BeautifulSoup(html, "html.parser") text = soup.get_text() # 공백 제거 + 줄 정리 lines = text.splitlines() cl..