항해99/사전 스터디
웹개발 종합반 - 4주차 - 10. [스파르타피디아] - 조각 기능 구현해보기
루딘
2022. 10. 12. 14:11
조각기능 구현이란?
프로젝트에 필요한 기술들을 먼저 구현해보는 것이다!
고로 사전 테스트? 정도라고 생각해보면 될 것 같다.
https://movie.naver.com/movie/bi/mi/basic.naver?code=191597
그럼 크롤링부터 시작해보자
위 페이지에서 meta 태그를 크롤링해보자!
그 전에 <meta> 태그란?
<head> 태그 안에 들어가는, 눈으로 보이는 것(body) 외에 사이트의 속성을 설명해주는 태그
ex) 구글 검색 시 표시 될 설명문, 사이트 제목, 카톡 공유 시 표시 될 이미지 등
자 나는 보스베이스2 영화페이지의 메타태그 안에 있는 이미지와 영화이름, 줄거리설명들을 크롤링해볼 것이다.
이런 식으로 만든다면
import requests
from bs4 import BeautifulSoup
url = 'https://movie.naver.com/movie/bi/mi/basic.naver?code=191597'
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(url,headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
image = soup.select_one('meta[property="og:image"]')['content'] #메타태그안에 property가 og:image인 meta태그안에 content 추출
title = soup.select_one('meta[property="og:title"]')['content'] #메타태그안에 property가 og:title인 meta태그안에 content 추출
description = soup.select_one('meta[property="og:description"]')['content'] #메타태그안에 property가 og:descrition인 meta태그안에 content 추출
print(image,title,description)
이렇게 잘 나오는 것을 확인할 수 있다!
추후에 프로젝트 진행시 이 코드만 가져오면 끝 ㅎㅎ