웹크롤링 2

틱톡(Tiktok) 채널페이지 크롤링 사례

최대규모의 OTT player인 틱톡의 채널페이지를 크롤링하는 프로젝트입니다.비교적 난이도가 높아 인터넷에 레퍼런스가 부족한 것이 현실입니다. 어떤 속성자로 시작해야 할지에 대한 연구가 선행되어야만 비교적 깔끔한 구현이 가능한 것 같습니다. 틱톡 크롤링 시도하시는 분들 화이팅!요구사항채널페이지 정보 크롤링세부사항 : 제목, 작성자, 조회수, 링크코드 구현def scrape_channel_videos(url): driver.get(url) time.sleep(5) # 페일지 로딩 기다림 videos = [] scroll_pause_time = 2 # 스크롤 기다림 howmanyvideo = 50 while len(videos) = howmanyvideo: ..

웹크롤링 2024.10.25

캐스모(다음카페) 검색 자동화 구현

캐나다 교민들이 사용하는 최애 카페인 '캐스모'를 특정키워드로 크롤링해 주는 프로젝트를 구현합니다. 요구사항구인/구직 코너에서 특정 검색어를 크롤링하여 엑셀로 저장한다.읽어야 할 페이지수는 변경가능하다단독 실행 가능한 프로그램으로 제공한다.코드 구현import requestsfrom bs4 import BeautifulSoup# 입력변수를 정의함(검색어, 읽고자 하는 페이지수)keyword = 'windsor'pageno = 10# type은 검색해야할 세부카테고리를 정의함(구인구직, 룸렌트 등등)class CasmoSearch: def __init__(self,keyword,pageno,type): self.keyword = keyword self.totalpage = p..

웹크롤링 2024.10.18