REGEXEXTRACT 함수를 사용하면 제공된 정규식을 기반으로 문자열에서 텍스트를 추출할 수 있습니다. 첫 번째 일치 항목, 모든 일치 항목 또는 첫 번째 일치 항목에서 그룹 캡처를 추출할 수 있습니다.
통사론
REGEXEXTRACT 함수는 패턴과 일치하는 제공된 텍스트 내에서 문자열을 추출합니다.
REGEXEXTRACT 함수의 구문은 다음과 같습니다.
REGEXEXTRACT(text, pattern, [return_mode], [case_sensitivity])
논쟁 |
설명 |
---|---|
text (필수) |
문자열을 추출할 텍스트가 포함된 셀에 대한 텍스트 또는 참조입니다. |
패턴 (필수) |
추출하려는 텍스트 패턴을 설명하는 정규식("regex")입니다. |
return_mode |
추출할 문자열을 지정하는 숫자입니다. 기본적으로 반환 모드는 0입니다. 가능한 값은 다음과 같습니다. 0: 패턴과 일치하는 첫 번째 문자열을 반환합니다. 1: 패턴과 일치하는 모든 문자열을 배열로 반환합니다. 2: 첫 번째 일치 항목에서 캡처 그룹을 배열로 반환합니다. 참고:캡처 그룹은 "(...)" 괄호로 둘러싸인 정규식 패턴의 부분입니다. 단일 일치 항목의 개별 부분을 개별적으로 반환할 수 있습니다. |
case_sensitivity |
일치 항목이 대/소문자를 구분하는지 여부를 결정합니다. 기본적으로 일치 항목은 대/소문자를 구분합니다. 다음 중 하나를 입력합니다. 0: 대 / 소문자 1: 대/소문자를 구분하지 않습니다. |
참고 사항:
-
정규식 패턴을 작성할 때 다양한 문자와 일치하는 '토큰'이라는 기호를 사용할 수 있습니다. 다음은 참조를 위한 몇 가지 간단한 토큰입니다.
-
"[0-9]": 모든 숫자 숫자
-
"[a-z]": 의 범위에서 z까지의 문자
-
".": 모든 문자
-
"a": "a" 문자
-
"a*": 0개 이상의 "a"
-
"a+": 하나 이상의 "a"
-
REGEXTEST 및 REGEXREPLACE뿐만 아니라 이 함수에 대한 모든 정규식은 regex의 PCRE2 'flavor'를 사용합니다.
-
REGEXEXTRACT는 항상 텍스트 값을 반환합니다. 이러한 결과를 VALUE 함수를 사용하여 숫자로 다시 변환할 수 있습니다.
예
예제 데이터를 복사하여 새 Excel 워크시트의 A1 셀에 붙여넣습니다. 필요한 경우 열 너비를 조정하여 모든 데이터를 볼 수 있습니다.
"[A-Z][a-z]+" 패턴의 대문자를 기반으로 이름 추출
데이터 |
딜런윌리엄스 |
수식 |
=REGEXEXTRACT(A2,"[A-Z][a-z]+") |
=REGEXEXTRACT(A2,"[A-Z][a-z]+",1) |
다음 그림에서는 결과를 보여 줍니다.
"[0-9()]+ [0-9-]+" 패턴을 사용하여 구조에 따라 전화 번호를 추출합니다.
데이터 |
소니아 리스 (378) 555-4195 엔젤 브라운 (878) 555-8622 블레이크 마틴 (437) 555-8987 윌리엄 커비 (619) 555-4212 에이버리 스미스 (579) 555-5658 파커 존스 (346) 555-0925 리암 스몰 (405) 555-0887 홀리 리스 (666) 555-1872 |
수식 |
=REGEXEXTRACT(A2,"[0-9()]+ [0-9-]+",1) |
다음 그림에서는 결과를 보여 줍니다.