본문 바로가기

경험

[JavaScript 정규식] 태그, 태그 안 내용까지 지우기

특정 태그를 지우는 정규식은 많이 포스팅되는데, 특정 태그 안의 내용까지 지우는 정규식은 보이지 않아 작업한 겸 포스팅해본다.

(나의 경우에는 이미지 캡션의 내용을 지워야한다는 요구사항을 받아 작업하게 되었다. 여러분은 어떤 이유로 요기 들어오게 되었는지요..?)

 

정규식에 대해 이해가 부족하다면 ?

아주 잘 정리해놓으신 분이 있으니 참고하길..! 😁

https://inpa.tistory.com/entry/JS-%F0%9F%93%9A-%EC%A0%95%EA%B7%9C%EC%8B%9D-RegExp-%EB%88%84%EA%B5%AC%EB%82%98-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-%EC%89%BD%EA%B2%8C-%EC%A0%95%EB%A6%AC

 

📚 JavaScript 정규 표현식 문법 총정리 + 응용 예제

정규 표현식(Regular Expression) 정규식(Regular Expression)은 문자열에서 특정 내용을 찾거나 대체 또는 발췌하는데 사용된다. 대표적으로 입력칸에 전화번호나 이메일을 입력하라고 했을때 옳지 않은

inpa.tistory.com

 

.replace() with 정규식

나의 경우는 이미지 캡션을 지우는 것이라고 했다.

  • 이 경우엔 여러 개가 필터링되어야 하기 때문에 g 플래그를 사용한다.
  • 또한, HTML 태그는 대소문자를 구분하지 않기 때문에 i 플래그를 사용한다.
  • <figcaption>은 캡션을 표기하는 HTML 태그이다
  • 여는 태그와 닫는 태그 사이에 닫는 태그가 없다면 최소로 묶인 태그라고 할 수 있다. (설명이 애매해서 죄송.. 🙏)
.replace(/<figcaption>((?!<\/figcaption>).)*<\/figcaption>/gi, '')

 

아, 만약 태그만 지우고 싶다면?

  • 여는 꺽쇠와 닫는 꺽쇠 사이에 글자가 있다면 태그를 표현하는 문자열로 판단한다.
  • 꺽쇠를 포함한 문자열을 공백으로 교체한다.
.replace(/(<([^>]+)>)/gi, '')

 

이렇게 해서, 태그와 그 안 내용까지 제거하는 정규식 구문을 만들어 보았다.

 

모두 요긴하게 사용하기를~!