데이터 분석&시각화
numpy
numpy는 행렬(다차원 배열)을 다루는 패키지입니다. 데이터 분석이나 머신 러닝을 할 때는 데이터가 행렬 형식인 경우가 많습니다.
pandas
pandas는 데이터를 우리가 쉽게 다룰 수 있는 테이블 형식으로 만들어줍니다. 결국 데이터 분석이나 머신 러닝을 하려면 데이터를 다뤄야 하기 때문에 pandas는 데이터 분석의 가장 핵심적인 패키지라고 할 수 있습니다. 거의 모든 데이터 사이언스 패키지들을 pandas 와 연동됩니다.
matplotlib
matplotlib은 파이썬에서 가장 많이 쓰이는 데이터 시각화 라이브러리입니다. 일반적인 그래프들은 거의 다 matplotlib으로 그릴 수 있습니다.
seaborn
seaborn은 matplotlib를 기반으로 한 시각화 라이브러리입니다. matplotlib보다 간단한 문법을 사용해서 더 예쁜 그래프들을 그릴 수 있습니다.
머신 러닝
sklearn
sklearn은 가장 대중적인 머신 러닝 라이브러리입니다. 기본적인 머신 러닝 알고리즘은 모두 지원합니다. 데이터 가공, 모델 평가 기능도 제공합니다.
tensorflow, pytorch, keras
모두 딥러닝에 최적화된 라이브러리들입니다. 컴퓨터 비전에 많이 사용되는 CNN (Convolutional Neural Network), 자연어 처리에 많이 사용되는 RNN (Recurrent Neural Network) 모델 등을 구현할 수 있습니다.
nltk
nltk는 텍스트 데이터 가공, 시각화 등을 지원하는 자연어 처리 라이브러리입니다.
웹 개발
django
django는 파이썬에서 많이 쓰이는 웹 프레임워크입니다.
일반적으로 프레임워크는 어떤 소프트웨어의 뼈대 같은 역할을 합니다. 웹 프레임워크는 웹 애플리케이션을 만들기 위한 뼈대입니다. 우리는 뼈대를 제외한 나머지 디테일을 채워 넣기만 하면 됩니다.
flask
flask는 파이썬에서 많이 쓰이는 또 다른 웹 프레임워크입니다. django웹 개발에 필요한 모든 기능을 제공하지만 비교적 복잡하고 flask는 기본적인 기능만 제공하지만 비교적 간단합니다.
기타
beautifulsoup4
beautifulsoup4는 html 또는 xml 문서를 파싱(원하는 데이터를 특정 패턴이나 순서로 추출해 가공하는 것) 해) 주는 라이브러리입니다. 보통 웹에서 원하는 데이터를 긁어 오는 작업인 웹 스크레이핑 (web scraping)에 많이 사용됩니다.
selenium
selenium은 웹 브라우저 동작을 자동화해 주는 패키지입니다. selenium을 사용하면 클릭, 로그인, 검색, 스크롤링 등을 자동화할 수 있습니다. 웹 애플리케이션 테스팅 자동화와 웹 스크레이핑에 많이 사용됩니다.
requests
requests는 파이썬의 간편한 http 라이브러리입니다. requests라이브러리를 통해 쉽게 http 요청을 보낼 수 있습니다.
opencv
(설치: opencv-python임포트: import cv2)
opencv는 컴퓨터 비전에 많이 사용되는 라이브러리입니다. 이미지 프로세싱, 얼굴 인식, 문자 인식 등 많은 기능을 제공합니다.
'파이썬 > 파이썬 기본' 카테고리의 다른 글
Pycharm으로 외부 패키지 설치하기(windows) (0) | 2021.07.17 |
---|---|
외부 패키지 및 PyPI (0) | 2021.07.17 |
패키지 (0) | 2021.07.17 |
__name__ 특수 변수 (0) | 2021.07.16 |
스크립트와 모듈 (0) | 2021.07.16 |