엑셀 URL에서 도메인 이름 추출하는 5가지 효과적인 함수 활용법

엑셀 URL에서 도메인 이름 추출하는 5가지 효과적인 함수 활용법
엑셀 URL에서 도메인 이름 추출하는 5가지 효과적인 함수 활용법

웹사이트 분석이나 SEO 작업을 할 때 URL 목록에서 도메인 이름만 깔끔하게 추출해야 하는 경우가 자주 있습니다. 엑셀에서는 TEXTAFTER, TEXTBEFORE 같은 최신 텍스트 함수와 기존 MID, SEARCH, LEFT 함수 조합을 통해 복잡한 URL 구조에서도 정확한 도메인 이름을 추출할 수 있습니다. 이 가이드에서는 다양한 URL 형태에 대응할 수 있는 실무적인 방법들을 단계별로 알아보겠습니다.

TEXTAFTER와 TEXTBEFORE 함수로 간단한 도메인 추출

엑셀 365의 최신 버전에서 사용할 수 있는 TEXTAFTER와 TEXTBEFORE 함수는 URL에서 도메인을 추출하는 가장 직관적인 방법입니다. 기본 구문은 =TEXTBEFORE(TEXTAFTER(B5,”//”),”/”)로 작성되며, 이는 먼저 “//” 이후의 텍스트를 추출한 후 첫 번째 “/” 이전의 텍스트를 가져와 깔끔한 도메인 이름을 얻습니다. 이 방법은 http, https, ftp 등 다양한 프로토콜과 www 포함 여부에 관계없이 일관된 결과를 제공합니다. TEXTAFTER와 TEXTBEFORE 함수에 대한 자세한 사용법은 여기서 확인하세요. 특히 복잡한 URL 구조에서도 안정적으로 작동하므로 대량의 웹 데이터 처리에 매우 유용합니다.

기존 버전용 MID와 SEARCH 함수 조합 활용

엑셀 2019 이하 버전이나 호환성을 고려해야 할 때는 MID, SEARCH, LEFT 함수를 조합해서 사용합니다. 가장 널리 사용되는 공식은 =LEFT(MID(B3,SEARCH(“:”,B3)+3,200),SEARCH(“/”,(MID(B3,SEARCH(“:”,B3)+3,200)))-1) 형태입니다.

  • SEARCH(“:”,B3)+3으로 “://” 다음 위치를 찾아 프로토콜 부분을 제거합니다
  • MID 함수로 해당 위치부터 충분한 길이만큼 문자열을 추출합니다
  • 다시 SEARCH 함수로 첫 번째 “/”의 위치를 찾습니다
  • LEFT 함수로 해당 위치 이전까지의 문자만 가져와 도메인을 완성합니다

www 제거와 서브도메인 처리 방법

많은 경우 www를 제거한 순수한 도메인 이름이 필요합니다. 이때는 SUBSTITUTE 함수를 추가로 활용하여 =MID(SUBSTITUTE(A2,”www.”,””),SEARCH(“://”,A2)+3,SEARCH(“/”,SUBSTITUTE(A2,”www.”,””),9)-SEARCH(“://”,A2)-3) 같은 공식을 사용합니다. SEO 작업을 위한 고급 URL 처리 기법들을 자세히 살펴보세요. 이 방법은 www 서브도메인뿐만 아니라 다른 서브도메인도 효과적으로 처리할 수 있어 웹사이트 분석 작업에서 매우 유용합니다.

URL 유형 적용 공식 결과
기본 URL =TEXTBEFORE(TEXTAFTER(A1,”//”),”/”) 도메인명.com
www 포함 URL =SUBSTITUTE(기본공식,”www.”,””) 도메인명.com
복잡한 경로 URL =LEFT(MID(A1,SEARCH(“:”,A1)+3,200),SEARCH(“/”,MID(A1,SEARCH(“:”,A1)+3,200))-1) 도메인명.com
이메일 도메인 =TEXTAFTER(A1,”@”) 도메인명.com

VBA 사용자 정의 함수로 자동화하기

반복적인 도메인 추출 작업이 많다면 VBA로 사용자 정의 함수를 만드는 것이 효율적입니다. Function ExtractDomain(ByVal URL As String) As String 형태로 시작하여 InStr과 Mid 함수를 활용해 프로토콜과 경로를 제거하는 로직을 구현합니다. 이렇게 만든 함수는 =ExtractDomain(A1) 같은 간단한 형태로 어디서든 사용할 수 있어 작업 효율성이 크게 향상됩니다. VBA를 이용한 도메인 추출 함수 작성법을 상세히 알아보세요. 특히 대용량 데이터 처리나 정기적인 보고서 작성 시 매우 유용한 접근 방법입니다.

사용자 정의 함수의 장점은 복잡한 URL 패턴에 대한 예외 처리를 미리 구현해둘 수 있다는 점입니다. 국제 도메인(.co.uk, .com.au 등)이나 특수한 프로토콜, 비표준 URL 구조도 함수 내에서 일괄 처리할 수 있어 일관성 있는 결과를 보장합니다.

실무에서 자주 발생하는 문제와 해결책

도메인 추출 작업에서 가장 흔한 문제는 국제 도메인(.co.uk, .co.kr 등)과 특수 문자가 포함된 URL 처리입니다. 이런 경우 단순한 공식으로는 정확한 결과를 얻기 어려우므로 더 정교한 접근이 필요합니다. 예를 들어 .co.uk 도메인의 경우 www가 없으면 제대로 작동하지 않을 수 있으므로 사전에 URL 형태를 정규화하는 과정이 중요합니다.

또한 trailing slash 유무, 포트번호 포함, 특수 프로토콜 사용 등 다양한 변수를 고려해야 합니다. 복잡한 URL 패턴들을 처리하는 고급 기법들을 확인해보세요. 이런 예외 상황들을 미리 파악하고 대응책을 준비해두면 실무에서 훨씬 안정적이고 정확한 결과를 얻을 수 있습니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤