Rss 스크래이핑
뉴스나 블로그 사이트에서 주로 사용하는 콘텐츠 표현 방식
업데이트 된 정보를 쉽게 사용자에게 제공하는 데이터 형식
xml은 rss형식으로 제공된다.
html보다 간단하게 파싱할 수 있음.
http://www.aladin.co.kr/rss/new_all/351
피드 정보를 담은 feed 속성과 개별적인 항목을 담은 entries 속성을 가짐.
url = 'http://www.aladin.co.kr/rss/new_all/351'
d = feedparser.parse(url)
for i in range(len(d.entries)):
print('제목:',d.entries[i].title)
print('링크:',d.entries[i].link)
알라딘 서점의 제목, 링크 추출하기
'Data Anaylsis > python basic' 카테고리의 다른 글
영화 평점 크롤링 (0) | 2020.01.21 |
---|---|
데이터베이스 기초 (0) | 2020.01.21 |
웹툰 크롤링 (1) | 2020.01.21 |
정규표현식 (0) | 2020.01.09 |
클래스 (0) | 2020.01.06 |