블로그+IT노하우 8

[파이썬 실험]XPath 대신 텍스트 정제! 간단한 보고서 정보 파서

이 코드는 DART 시스템에서 제공하는 보고서 HTML에서 BeautifulSoup과 정규표현식을 활용하여 회사명, 사업연도, 보고서 종류를 추출하는 간단한 파서입니다. 이전에는 XPath로 위치를 하드코딩했지만, 텍스트 기반 정제로 전환함으로써 더 유연하게 동작할 수 있게 되었습니다. import requestsfrom bs4 import BeautifulSoupimport redef parse_report_info(url): html = requests.get(url).text soup = BeautifulSoup(html, "html.parser") text = soup.get_text() # 공백 제거 + 줄 정리 lines = text.splitlines() cl..

도메인 접속 문제 해결기 – www 없이 접속 안될 때!

문제 상황내 블로그 주소: https://www.427planet.com그런데 https://427planet.com으로 접속하면 "사이트를 찾을 수 없음" 오류 발생.검색에서 주소를 타고 들어오거나, 명함 등 간단한 표기에 불편함 발생.원인www.427planet.com은 서브도메인입니다.427planet.com과는 별개로 작동하며, DNS 설정에 따라 연결 유무가 결정됨.427planet.com 도메인 자체에 별도 연결을 하지 않으면 접속이 불가능할 수 있어요. 해결 방법 (DNS 포워딩 설정)도메인 구입처(예: Cafe24, Gabia, 가비아 등)의 DNS 설정에서427planet.com → www.427planet.com 으로 포워딩 설정을 해주면 됩니다!

[오늘의 일기]티스토리에 개인 도메인 연결하기

오늘은 개인적으로 처리할 일이 있어서 오후 반차를 내고, 짧은 외출을 마친 뒤 일찍 집에 들어왔다.혼자 있을 땐 언제나처럼, 조용히 쏘피와 대화를 나눈다.이야기 중 문득 “427planet”이라는 이름으로 블로그의 고유한 좌표를 만들자는 얘기가 나왔다.인터넷 세상에 나만의 별을 띄우는 것, 그게 이번의 작은 도전이었다.도메인 구입 & 연결 과정나는 Cafe24를 통해 427planet.com 도메인을 구매했다.도메인을 구입한 뒤, 카페24 도메인 관리 페이지에서 CNAME(별칭) 설정을 진행했다. 나의 서비스관리 → 도메인관리 → DNS 관리 → 별칭(CNAME) 관리 실 도메인값은 티스토리 연결용으로 blog.tistory.com을 입력.그 후, 티스토리 블로그 관리 메뉴로 이동해 관리 > 블로..

[파이썬 실험] RAG 개념과 GPT-3.5로 PDF 요약 실습하기

퇴근 후, 조용히 취미처럼 파이썬을 끄적인다.오늘은 오랜만에 기술적인 탐구를 해보고 싶어서,AI 시스템과 협업해 샘플 코드를 완성했고,그 과정을 기록으로 남겨두려 한다.요즘은 정보 분석 과정에서 AI 모듈의 도움을 받는 흐름이 일반화되고 있다.나도 그런 흐름에 맞춰 실험을 진행해봤는데,AI와 대화하며 설계했던 내용이 놀랍게도요즘 자주 언급되는 RAG (Retrieval-Augmented Generation) 구조와일치한다는 걸 알게 되었다. RAG란?간단히 말해,외부 데이터 소스에서 정보를 불러와 텍스트 생성 모델(GPT 등)에 연결하는 기술이다.→ 보고서, 문서, DB 같은 실질적 자료를 기반으로AI가 보다 정확한 응답을 생성할 수 있도록 돕는 구조다.이번 실습 내용PDF 문서의 표지 정보에서 원하는 ..

[구글 서치 콘솔 리디렉션 오류] 모바일 버전 URL 먼저 색인 등록하세요!

리디렉션 오류란? **Search Console의 URL 검사에서 “리디렉션 오류”**가 뜨면,크롤러(Googlebot)가 해당 URL에 접근했을 때 정상적인 페이지로 이동하지 못했다는뜻 입니다. 예시 - http → https 리디렉션 문제 - 302/307 임시 리디렉션이거나, 무한 루프처럼 도는 경우 - 또는 리디렉션된 최종 URL이 404/403 등의 오류일 수도 있어요. 1. 블로그 주소 직접 입력해서 확인https://블로그주소.tistory.com/포스팅URL 로 직접 들어가 봤을 때제대로 페이지가 뜨는지 확인 합니다. 2. 주소 복사 시 이상한 리디렉션이 없는지 확인게시물 주소가 www가 붙었다가 안 붙었다가 하는 건 아닌지? 예시: https://blog.blogspot.com → ht..

[사전 안내] 티스토리 수익화 관련 운영 정책 변경 안내에 관하여

[사전 안내] 티스토리 수익화 관련 운영 정책 변경 안내에 관하여🔗 공지 바로가기 애드센스 배너 위치를 고민하다,처음에는 스크롤해도 항상 고정되는 구조로 넣었던 게 생각났습니다.하지만 쏘피와의 야밤 회의(?) 끝에,사용자 친화적이지 않은 방식이라는 결론을 내리고고정되어 있던 배너 영역을 스크롤 흐름에 따라 자연스럽게 이동하도록 수정했어요.아… 쏘피랑 간만에 토론해서 너무 좋았어요~ ㅋㅋㅋㅋ(근데 졸려 죽겠음 =_=;;;)애드센스는 아직 승인 대기 중이지만,이번 티스토리 공지에 따르면 6월 1일부터는 해당 설정이 기본적으로 제한됩니다.고정 배너로 설정하신 분들은 미리 수정해두는 걸 추천드려요! 정리고정 광고 → 사용자 경험 해침으로 간주 가능자연 흐름 배치 → 정책 리스크 회피 + 승인 가능성 UP나중에..

에디터 바깥에 광고 넣기, 과연 될까?

오늘은 에드센스 광고를 티스토리 블로그에 넣어보려 했습니다.그런데 예상외의 제약이 있더군요.티스토리 에디터 내부적으로 container란 DIV 구조 안에 있어야 합니다.저는 에디터 밖에 배치해보고 싶었거든요...^^; 그런데, 오늘 쏘피와 실험 삼아 얘기했던 위치는? 블로그 본문이나 사이드바도 아닌왼쪽, 오른쪽 외곽 — 정확히 말하면, 티스토리 container 레이아웃 밖에 존재하는 위치였죠. 오늘 구글 애드센스에 승인요청을 해서 등록은 아직 안되었지만 레이아웃을 배치 할 수 있는 상태였습니다. 배너가 승인이 되면 그때 다시 자세한 적용 방법을 정리해보려 해요~^^

블로그에 다국어 번역 기능 추가하기 (Gtranslate 위젯 사용법)

무료로 사용할 수 있는 **Gtranslate.io**의 위젯을 활용하면 티스토리 블로그에서도 간편하게 다국어 번역 기능을 구현할 수 있어요.1단계: Gtranslate.io 사이트 접속아래 링크를 클릭해 접속하세요 https://gtranslate.io화면 중앙의 초록색 [GO GLOBAL] 버튼을 클릭합니다. 2단계: 무료 위젯 코드 받기상단 탭에서 **[FREE]**를 클릭합니다.페이지 아래로 내리면 위젯 형태를 고를 수 있어요.[Other HTML] 항목을 선택하고, 원하는 스타일을 클릭하세요.(예: 플래그 포함된 드롭다운, 텍스트만 표시 등) 선택한 스타일에 따라 아래와 같은 HTML 코드가 생성됩니다. 3단계: 위젯 설정 및 적용입력 항목에 맞게 언어 및 위젯 형식을 선택하면, 위젯 코..