
요약 URL에서 도메인, 서브도메인을 가져올 때 패턴화하기 어려운 부분은 public suffix list 기반인 tldextract를 사용하자! 내용 URL을 파싱하는 것은 손이 많이 가는 일이다. 특히 그 중에서도 도메인, 서브도메인과 관련되면 더더욱 고려할게 많아진다. 만약에 URL이 주어지고, 그의 도메인을 파악해야하는 상황이라고 가정해보자. maps.naver.com, docs.github.com 를 예로 들어보자면, 당연히 도메인이 naver, github임을 파악할 수 있다. 하지만 이들을 직접 구현해야 하는 상황이라면 약간 복잡해진다. 대부분의 URL 라이브러리들은 간단한 것들(도메인 + path 형태) 를 정확하게 찾는다. (furl 의 host라던가 urllib라던가) 혹은 약간 귀찮지..
연습
2021. 5. 7. 17:57
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 스택
- vscode
- 최대한 간략화하기
- django test
- django testcase
- docker-compose update
- Javascript
- 힙
- 그리디
- 불필요한 값 무시하기
- 코딩테스트
- SQL
- 삽질
- BOJ
- 프로그래머스
- factory_pattern
- SSL
- requests
- endl을절대쓰지마
- Til
- 백준
- Python
- 위상정렬
- cipher suite
- Remote
- 파이썬
- 우선순위큐
- jwt
- Event Sourcing
- 이것도모르면바보
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함