항해99/사전 스터디

웹개발 종합반 - 4주차 - 10. [스파르타피디아] - 조각 기능 구현해보기

루딘 2022. 10. 12. 14:11

조각기능 구현이란?

프로젝트에 필요한 기술들을 먼저 구현해보는 것이다!

고로 사전 테스트? 정도라고 생각해보면 될 것 같다.

 

https://movie.naver.com/movie/bi/mi/basic.naver?code=191597 

그럼 크롤링부터 시작해보자

위 페이지에서 meta 태그를 크롤링해보자!

 

그 전에 <meta> 태그란?

<head> 태그 안에 들어가는, 눈으로 보이는 것(body) 외에 사이트의 속성을 설명해주는 태그

ex) 구글 검색 시 표시 될 설명문, 사이트 제목, 카톡 공유 시 표시 될 이미지 등


자 나는 보스베이스2 영화페이지의 메타태그 안에 있는 이미지와 영화이름, 줄거리설명들을 크롤링해볼 것이다.

이런 식으로 만든다면 

import requests
from bs4 import BeautifulSoup

url = 'https://movie.naver.com/movie/bi/mi/basic.naver?code=191597'

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(url,headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

image = soup.select_one('meta[property="og:image"]')['content']  #메타태그안에 property가 og:image인 meta태그안에 content 추출
title = soup.select_one('meta[property="og:title"]')['content']  #메타태그안에 property가 og:title인 meta태그안에 content 추출
description = soup.select_one('meta[property="og:description"]')['content'] #메타태그안에 property가 og:descrition인 meta태그안에 content 추출

print(image,title,description)

이렇게 잘 나오는 것을 확인할 수 있다!

 

추후에 프로젝트 진행시 이 코드만 가져오면 끝 ㅎㅎ