728x90
sed 편집기를 이용하면, html 태그들을 손쉽게 제거할 수 있다.
기본적으로 html 태그들은 아래와 형식을 가지고 있다.
(1) <tag>
(2) </tag>
따라서, html 태그만 제거하는 sed 편집기의 명령어는 아래와 같다.
$ sed 's/<[^>]*>//g' html_file
- 태그의 부등호 <>와 부등호 내부의 값(태그)를 빈칸으로 대체한다.
만일 빈 줄까지 제거하는 경우에는 아래와 같이 sed 편집기를 이용하면 된다.
$ sed 's/<[^>]*>//g ; /^$/d' html_file
728x90
'컴퓨터 & IT (Computer & IT) > Linux' 카테고리의 다른 글
[Linux] 리눅스 히스토리 시간 출력 포멧 (0) | 2023.07.01 |
---|---|
[Linux/sed] 빈 줄 제거하기 (1) | 2021.07.02 |
[Linux] 리눅스 파일 권한 이해하기 (0) | 2021.06.26 |
[Linux] 모니터링과 관련된 명령어 (du, df) (0) | 2021.06.26 |
[Linux] 런레벨 확인 및 변경 (0) | 2021.06.12 |
댓글