Data Anaylsis/python basic
rss 크롤링
난리브루스!
2020. 1. 21. 09:06
Rss 스크래이핑
뉴스나 블로그 사이트에서 주로 사용하는 콘텐츠 표현 방식
업데이트 된 정보를 쉽게 사용자에게 제공하는 데이터 형식
xml은 rss형식으로 제공된다.
html보다 간단하게 파싱할 수 있음.
http://www.aladin.co.kr/rss/new_all/351
피드 정보를 담은 feed 속성과 개별적인 항목을 담은 entries 속성을 가짐.
url = 'http://www.aladin.co.kr/rss/new_all/351'
d = feedparser.parse(url)
for i in range(len(d.entries)):
print('제목:',d.entries[i].title)
print('링크:',d.entries[i].link)
알라딘 서점의 제목, 링크 추출하기