데이터 포맷 설명 및 비교🔽
- 크롤링(Crawling): 프로그램이 웹 사이트를 정기적으로 돌며 정보를 추출하는 기술로, 검색 엔진을 구현할 때 사용하는 크롤러는 웹 사이트의 링크를 타고 돌며 웹 사이트를 돌아다닌다
- 스크레이핑(Scraping): 웹 사이트에 있는 특정 정보를 추출하는 기술을 의미한다
BeautifulSoup로 스크레이핑하기🔽
쿠키(Cookie)는 사용자 식별 및 세션 유지를 통해 클라이언트와 서버 상태를 관리하는, 현재 가장 많이 사용되고 있는 인증 방식이다. 지속 쿠키와 세션 쿠키가 있으며 일반적으로 말하는 쿠키는 지속 쿠키이고 세션은 세션 쿠키이다
로그인이 필요한 사이트에서 스크레이핑🔽
Selenium으로 크롤링하기🔽
정규 표현식🔽
'Computer Science > Data Science' 카테고리의 다른 글
[HUFS/빅데이터] #5 데이터베이스 (0) | 2022.11.07 |
---|---|
[HUFS/빅데이터] #3 탐색적 데이터 분석, 데이터 시각화 (0) | 2022.09.26 |
[HUFS/빅데이터] #2 데이터 분석 라이브러리 소개 (0) | 2022.09.19 |
[HUFS/빅데이터] #1 빅데이터 개론 (0) | 2022.09.05 |
[데이터사이언스] #11 잠재 디리클레 할당 (0) | 2022.05.17 |