일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- dag
- Django
- 데이터 웨어하우스
- 데이터레이크
- selenium
- dag 작성
- Django Rest Framework(DRF)
- snowflake
- Serializer
- ETL
- airflow.cfg
- docker
- 웹 스크래핑
- 컨테이너 삭제
- AWS
- 데이터마트
- 웹 크롤링
- yarn
- redshift
- ELT
- docker hub
- 알고리즘
- truncate
- SQL
- 데이터파이프라인
- airflow
- spark
- docker-compose
- Hive
- Kafka
Archives
- Today
- Total
목록동적 웹 페이지 (1)
개발 기록장

학습 주제: BeautifulSoup, 웹 크롤링, 동적 웹 페이지HTML을 분석해주는 BeautifulSoup: HTML 분석기 BeautifulSoup4 설치%pip install bs4 BeautifulSoup 객체 만들기#모듈 불러오기#www.example.com 사이트 요청한 후 응답 받아보기import requestsres = requests.get("http://www.example.com")res.text Html Parser# 첫번째 인자: response의 body를 텍스트로 전달.# 두번째 인자: "html"로 분석한다는 것 명시.from bs4 import BeautifulSoupsoup = BeautifulSoup(res.text,"html.parser")print(soup..
데브코스(DE)/파이썬으로 웹 크롤링 및 분석
2024. 4. 3. 15:49