본문 바로가기
Engineering/Python

[Python] 크롤링을 위한 chrome driver 다운로드

by SPICA910 2022. 5. 21.
반응형

파이썬을 이용하여 많이 하는 작업중 하나는 웹사이트의 내용을 가져오는 크롤링입니다. 

selenium을 이용하여 크롤링을 진행할때 web brower에서 동작하는 것처럼 인식시키기 위해서 

Chrome driver를 이용합니다. 

 

* selenium : 웹 테스트 자동화 프레임워크 

           개발한 웹 어플리케이션이 잘 동작하는지 확인하는 툴이며 

           selenium을 이용하여 완전한 형태의 웹페이지 소스를 볼수 있고, 동적(Dynamic) 웹페이지 크롤링시 유용합니다.

 

우선 자신의 PC에 설치된 Chrome의 버전을 확인합니다.

(설치된 크롬과 다운로드 받을 driver의 버전이 동일해야 합니다.)

 

chrome 브라우저에 아래 주소를 넣어봅니다. 

chrome://version

제 PC의 chrmoe은 101.0.4951.67 버전을 사용중입니다 

따라서 드라이버도 101 버전으로 다운로드 받겠습니다.

 

https://sites.google.com/chromium.org/driver/downloads?authuser=0 

 

ChromeDriver - WebDriver for Chrome - Downloads

Current Releases If you are using Chrome version 102, please download ChromeDriver 102.0.5005.27 If you are using Chrome version 101, please download ChromeDriver 101.0.4951.41 If you are using Chrome version 100, please download ChromeDriver 100.0.4896.60

sites.google.com

 

위의 주소로 들어가면 chrome버전에 따른 추천 드라이버 버전이 표기되어 있습니다. 

필요한 드라이버를 선택하여 들어가서 자신이 사용하는 운영체제에 맞는 버전을 다운로드 합니다. 

본인의 프로젝트에 적절한 위치에 파일을 다운로드 하고 사용하시면 됩니다. 

 

즐거운 코딩 생활하세요!!! 

 

 

***************************** 2024. 03. 18 추가 ****************************************

 

크롤링을 위한 크롬 드라이버를 위와같이 받았다면 한가지 문제가 발생합니다. 

PC의 크롬브라우저는 자동적으로 update를 하는데, python으로 만든 프로그램과 버전이 달라져 버리게됩니다. 

따라서 크롬 브라우저의 업데이트를 막거나, 만든 프로그램이 크롬 드라이버를 자동으로 업데이트 하도록 해줘야 합니다 .

직접해보니 크롬 부라우저의 업데이트 막기가 쉽지 않더군요. 

마음 편하게 프로그램이 크롬 드라이버를 업데이트 하도록 해주는게 편합니다.

 

아래 링크 참조하세요.

 

https://spica910.tistory.com/298

 

[Python] chrome-driver 업데이트 문제 해결하기

열심히 크롤링 프로그램을 만들었습니다. 근데... 그런데.... 자꾸 동작을 안하고 종료가 됩니다. 뭐...뭐지??? 내용을 읽어보면 The ChromeDriver Version cannot be discovered. 로 표시되고 프로그램은 exception

spica910.tistory.com

 

반응형

댓글