본문 바로가기
728x90

프로그래밍 언어/Python 311

[Python/웹크롤링] 크롤링 정리 - 1 (Update: 2023/11/19) 현재 기본적인 내용들만 웹상에서 정리를 하고 있는 중.. 크롤링이란? 1) 웹 크롤러란? "A Web crawler, sometimes called a spider or spider bot and often shortened to crawler, is an Internet bot that systematically browses the World Wide Web, typically for Web indexing (web spidering)" 2) 크롤링이란? - 인터넷 상에서 우리가 원하는 데이터 (메타데이터 등)을 추출하는 것 - WWW를 탐색해나가는 행위 웹 파싱 (Parsing): 웹 상의 자연어, 컴퓨터 언어 등의 일련의 문자열을 분석하는 프로세스 (1) "P.. 2023. 11. 19.
[Python 3] 중복 문자 세기 특정한 문자열에 중복된 문자들이 몇 개 있는지 확인하는 문제를 푼다고 가정하자. 이런 경우, 아래와 같이 크게 2가지의 방법이 있다 [1, 2]. 개인적으로 시간이 된다면, [2]의 "kyrill"의 코멘트를 읽어보면 좋을 것 같다. 1) count 메소드 이용하기 2) collection 모듈의 Counter 사용하기 1. count 메소드 이용하기 - count 메소드는 python의 내장함수 - syntax: .count() - returnn: 혹은 이 에 중복되어 있는 횟수 - NOTE: 리스트의 크기가 크면 클수록, count를 사용하는 방법이 비효율적이 된다 [2]. >>> List = ["b", "a", "a", "c", "b", "a", "c",'a'] >>> counter_b=List.c.. 2021. 12. 20.
[Python] 파일 처리 관련 명령어 1. 파일 및 디렉토리의 존재 여부를 확인할 때 import os.path os.path.exists(fname) - 리턴값: 1) 파일 또는 디렉토리가 존재하는 경우: True 2) 파일 또는 디렉토리가 존재하지 않을 경우: False 2. 파일의 존재 여부를 확인할 때 (디렉토리 x) import os.path os.path.isfile(fname) - 러턴값: 1) True (파일이 존재할 경우) 2) False (파일이 존재하지 않을 경우) 2021. 6. 22.
[Python3] Matplotlib - contour plot 문제: z = f(x,y)란 함수 z의 contour plot을 그린다고 가정하자. 1. Contour() vs Contourf() (1) Contour() : 등고선만 표시 (2) Contourf() : 색상 표시 위 함수의 차이는 아래의 그림을 보면 확실히 알 수 있다. 2. Documents for contour() and contourf() function - website : matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.contour.html 3. contour() 함수 이용방법 Matplotlib의 contour plot을 그리는 함수인 contour() 함수를 사용하기 위해선 몇가지 단계가 있다. 1) plotting하고자 하는 영역에 대해 x.. 2021. 5. 4.
[Python] 리스트 내에 element가 있는지 확인 Python 내에서 간단한 명령어를 통해서 List 내의 원소의 존재 유무를 확인하는 방법은 아래와 같이 2가지 방법이 있다. (1) "in" command를 사용하는 것 (2) count() 함수를 사용하는 것 1. in 1) Syntex: elem in LIST - 만약 LIST 내에 elem이 존재한다면, True를 반환한다. 그렇지 않을 경우 False를 반환한다. - 만약 LIST 내에 elem이 없는 것을 확인하고자 한다면, not을 다음과 같이 써준다: elem not in LIST - "in"을 사용하는 경우, 굉장히 큰 리스트에서는 다른 방법과 비교할 때, 매우 느리다고 한다 [2] 2) example: LIST = ["Korea", "Japan", "China"] if "Korea" i.. 2021. 3. 22.
[Python] set 자료형 정리 1. Python – Set/fronzenset • set 자료형은 파이썬 2.3부터 지원을 시작한 자료형으로, 집합에 관련된 것을 쉽게 처리하기 위해 만든 자료형이다. • 파이썬에서는 set과 fronzenset이란 두 가지 형태로 집합 자료형을 제공한다. - set: 변경이 가능한 집합 - fronzenset: 변경이 불가능한 집합 ※ fronzenset은 변경이 불가능한 집합이기 때문에, 요소를 추가하거나 삭제하는 연산 및 Method를 사용할 수 없다. • Set 자료형을 사용하는 이유: 집합 내의 요소들의 교집합, 합집합, 차집합을 구할 때, 유용하게 사용될 수 있음 2. Set의 특징 • 순서가 없음 - 집합에서는 순서가 없기 때문에, 어떤 값이 먼저 나올지 알 수 없음 - Set에서는 순서가.. 2021. 1. 1.
[Python] 리스트 중복 제거 (순서 유지 X, 순서 유지 O) Python에서 리스트의 중복을 제거하는 경우, 크게 두 가지 경우를 생각해볼 수 있다. • 리스트의 중복만을 제거하는 경우 ( 기존 리스트의 순서는 고려 x) • 리스트의 중복을 제거하되 기존 리스트의 순서는 유지 문제의 예시로써, 아래와 같이 중복이 있는 데이터가 존재한다고 가정하자. >>> dup_list = ['1','3','6','5','5','3','4','4','3','2','2','2','1'] 1. 리스트의 중복만을 제거하는 경우 기존 리스트의 순서는 고려하지 않고 중복만을 제거하는 경우에는 Python의 set 자료형을 이용하면 된다. ※ Python의 set 자료형의 특징은 아래와 같다. 1) 중복을 허용하지 않음 (Removing Duplicated) 2) Set 내부에 있는 값들은.. 2020. 12. 29.
[Python 3] dictionary list sorting 문제 상황: 다음과 같은 성적 데이터가 있다고 가정을 하자. name age English Math Science Alice 20 60 35 63 Cathy 21 70 59 43 Duke 19 80 44 98 Tommy 17 65 80 56 Joy 20 40 50 34 Kate 22 50 100 80 위 데이터를 python 내에서 dictionary의 형태로 표현을 하면 아래와 같다. • key: name, age, English, Math, Science score_data = [ {'name':'Alice', 'age':20, 'English':60, 'Math':35 , 'Science':63}, {'name':'Cathy', 'age':21, 'English':70, 'Math':59 , 'Sc.. 2020. 12. 20.
[Python] Dictionary sorting by key or value 문제상황: 딕셔너리에 입력된 Key 또는 value 값으로 sort를 해야하는 경우 ■ 예제에서 사용할 딕셔너리 ※ Dictionary의 구조: {key:Value} example = {"tommy": 95, "Timmy": 60, "Aimee": 58, "Carmen": 20, "Sam": 77} 1. Key 을 통한 sorting 딕셔너리의 key값과 value값들을 정렬할 때 모두 sorted() 메소드를 이용한다. • sorted() 내부에 별도로 key값을 설정하지 않을 경우, 기본적으로 key값을 기준으로 정렬함 • key 값을 오름차순 순서로 sorting 한다. >>> sorted(example.items()) [('Aimee', 58), ('Carmen', 20), ('Sam', 77),.. 2020. 12. 19.
728x90