로그인

  • 목록
  • 아래로
  • 위로
  • 쓰기
  • 검색

정보&강의 playwright python의 몇 가지 기술문서 정리


웹 크롤링 자동화를 위한 도구 중 playwright 를 사용해보려고 하는데, 한글로 정리된 자료가 부족하여 정리차원에서 기록을 남깁니다.

 

알아두어야 할 점.

 

playwright는 스크립트의 시작과 종료와 함께 브라우저 인스턴드를 종료합니다.

따라서 스크립트가 종료되면, 브라우저가 종료되기 때문에 브라우저를 계속 모니터링 하고 싶다면 스크립트에서 잠시 멈춤 명령어를 마지막에 넣어주면됩니다.

page.pause()

 

 

선택자를 xpath로 사용할 때는 접두사를 추가해주어야 합니다.

 

예를 들어 아래와 같은 xpath 경로가 있다면,

'/html/body/div[7]/div/div/div/div[3]/button[1]'

 

 

'xpath='를 추가해주어야 합니다.

'xpath=/html/body/div[7]/div/div/div/div[3]/button[1]'

 

 

변수로 담기 위해서는 이렇게 하면 됩니다.

xpath_conform = 'xpath=/html/body/div[7]/div/div/div/div[3]/button[1]'

 

 

 

엘리먼트의 상태를 체크하기 위해서 때로는 엘리먼트의 text value 값을 체크해야 할 경우가 있습니다.

 

이때는 text_content 메써드를 사용하는 방법이 있습니다.

 

xpath_follow = 'xpath=/html/body/div[6]/div[3]/div/article/div/div[2]/div/div/div[1]/div/header/div[2]/div[1]/div[2]/button'

val = page.text_content(xpath_follow)

print(val)

 

 

xpath로 엘리먼트 요소를 선택하여 엘리먼트의 text content를 가져오는 것입니다.

 

 


이런 글도 찾아보세요!

공유

facebooktwitterpinterestbandkakao story
퍼머링크

댓글 0

권한이 없습니다. 로그인

신고

"님의 댓글"

이 댓글을 신고 하시겠습니까?

삭제

"님의 댓글"

이 댓글을 삭제하시겠습니까?