Rss 스크래이핑

뉴스나 블로그 사이트에서 주로 사용하는 콘텐츠 표현 방식

업데이트 된 정보를 쉽게 사용자에게 제공하는 데이터 형식

xml은 rss형식으로 제공된다.

html보다 간단하게 파싱할 수 있음.

 

http://www.aladin.co.kr/rss/new_all/351

 

 

 

피드 정보를 담은 feed 속성과 개별적인 항목을 담은 entries 속성을 가짐.

url = 'http://www.aladin.co.kr/rss/new_all/351'
d = feedparser.parse(url)
for i in range(len(d.entries)):
    print('제목:',d.entries[i].title)
    print('링크:',d.entries[i].link)

알라딘 서점의 제목, 링크 추출하기

'Data Anaylsis > python basic' 카테고리의 다른 글

영화 평점 크롤링  (0) 2020.01.21
데이터베이스 기초  (0) 2020.01.21
웹툰 크롤링  (1) 2020.01.21
정규표현식  (0) 2020.01.09
클래스  (0) 2020.01.06

+ Recent posts