Python 및 R에서 데이터 시각화를위한 상위 9 개 라이브러리

다음 프로젝트에 적합한 데이터 시각화 라이브러리 선택 ...

Unsplash에 Clay Banks의 사진

빠르게 성장하는 오늘날의 세계에서 기술이 이전과는 다른 속도로 확장되고있는 가운데 빅 데이터가 사람들의 삶에 빠르게 침투하고 있습니다. 사람들은 데이터를 얻을 수있는 방법이있을 수 있지만, 그로 인사이트 나 결론을 도출 할 때 데이터가 너무 많아서 머리에 긁힌 자국이 있습니다.

사진이 천 단어보다 낫다고 말했듯이 경영진과 비 기술적 의사 결정권자는 시각화 및 인포 그래픽에 크게 의존하고 선호하여 기본 비즈니스 통찰력을 이해하고 이해 관계자에게 전달 / 피치합니다. 데이터 기반 의사 결정이 정상에 오르고 있으며 우리는 예술을위한 도구를 사용하여 긍정적 인 태도를 유지해야합니다.

하지만 이번 주에는 훌륭한 데이터 시각화와 보너스를 위해 제가 사용하거나 발견하거나들은 최고의 라이브러리를 모았습니다! 특별한 순서없이 이러한 라이브러리를 바로 알아 봅시다 .

1. matplotlib

데이터로 스토리를 생성하기위한 OG Python 라이브러리. SciPy Stack의 또 다른 라이브러리 인 Matplotlib는 주로 2D 그림을 표시합니다.

언제 사용합니까?
Matplotlib는 프로젝트 파일 또는 응용 프로그램에 플롯을 포함하기위한 객체 지향 API를 제공하는 Python 용 전형적인 플로팅 라이브러리입니다. Python 프로그래밍 언어에 포함 된 MATLAB과 매우 유사한 Matplotlib를 발견했습니다.

Matplotlib로 무엇을 할 수 있습니까?

히스토그램, 막대 플롯, 산점도, 영역 플롯에서 파이 플롯으로, Matplotlib는 광범위한 2D 시각화를 묘사 할 수 있습니다. Matplotlib를 사용하면 약간의 노력과 색조의 시각화 기능을 사용하여 모든 시각화를 만들 수 있습니다.

  1. 라인 플롯
  2. 산점도
  3. 면적 플롯
  4. 막대 차트 및 히스토그램
  5. 파이 차트
  6. 줄기 플롯
  7. 등고선 플롯
  8. 퀴버 플롯
  9. 스펙트로 그램

작성자 : John D. Hunter
자세한 정보 : matplotlib.org

2. 씨본

Seaborn의 공식 문서를 읽으면 매력적이고 유익한 통계 그래픽을 그리기위한 고급 인터페이스를 제공하는 Matplotlib 기반의 데이터 시각화 라이브러리로 정의됩니다. 간단히 말해서 seaborn 은 고급 기능을 갖춘 Matplotlib의 확장입니다.

그렇다면 Matplotlib와 Seaborn의 차이점은 무엇입니까?
Matplotlib 는 기본 플로팅에 사용됩니다. 막대, 파이, 선, 산점도 등이있는 반면, seaborn 은 덜 복잡하고 구문이 적은 다양한 고급 시각화 패턴을 제공합니다.

Seaborn으로 무엇을 할 수 있습니까?

  1. 여러 변수 간의 관계 결정 (상관)
  2. 집계 통계에 대한 범주 형 변수 관찰
  3. 일 변량 또는 이변 량 분포를 분석하고 서로 다른 데이터 하위 집합간에 비교
  4. 종속 변수에 대한 선형 회귀 모델 플로팅
  5. 높은 수준의 추상화, 다중 플롯 그리드 제공

3. 줄거리

Plotly는 Python 용 그래프 플로팅 라이브러리입니다. 사용자는 분석 및 시각화 할 데이터를 가져 오거나 복사하거나 붙여 넣거나 스트리밍 할 수 있습니다.

Python의 각 데이터 시각화 라이브러리는 서로 다르지만 일부 기능에서 겹칩니다. Plotly는 사용 가능한 비주얼리 제이션 의 범위와 고급 기능에 대한 seaborn 의 측면에서 matplotlib 와 겹치는 부분이 많습니다 .

Plotly를 언제 사용합니까?
그림을 만들고 표시하고, 그림을 업데이트하고, 자세한 내용을 위해 텍스트 위로 마우스를 가져 가려면 Plotly를 사용할 수 있습니다. Plotly에는 데이터를 클라우드 서버로 보내는 추가 기능도 있습니다. 그 흥미 롭군요!

Plotly로 무엇을 할 수 있습니까?

Plotly 그래프 라이브러리에는 플로팅 할 수있는 다양한 그래프가 있습니다.

  1. 기본 차트 : 선, 원형, 분산 형, 거품 형, 점, 간트, 선 버스트, 트리 맵, 채워진 영역 차트
  2. 통계 및 Seaborn 스타일 : 오류, 상자, 히스토그램, 패싯 및 격자 플롯, 트리 플롯, 바이올린 플롯, 추세선
  3. 과학 차트 : Contour, Ternary, Log, Quiver, Carpet, Radar, Heat Map Windrose 및 Polar Plots
  4. 재무 차트
  5. 지도
  6. 서브 플롯
  7. 변형
  8. Jupyter 위젯 상호 작용

작성자 : Plotly , 모드 에서 사용 가능
자세한 정보 :https://plot.ly/python/

4. 보케

대화 형 데이터 시각화를위한 라이브러리로 명명하고 싶은 Python 제품군 중 하나 더 — Bokeh를 사용하면 간단한 명령으로 복잡한 통계 플롯을 매우 빠르게 작성할 수 있습니다.

Bokeh의 인기와 내 목록에 포함 된 이유는 Bokeh가 데이터를 시각적으로 매력적으로 만들어 시각화의 특정 영역에 집중하도록하기 때문입니다. Bokeh는 또한 D3.js와 잘 작동하여 매우 큰 데이터 세트 또는 스트리밍 데이터 세트에 대해 높은 상호 작용 지수로 대화 형 시각화를 생성합니다.

재미있는 사실 : Bokeh ( "boke"라고도 함)라는 단어는 일본어에서 유래했으며 이는 blur를 의미 합니다.

Bokeh로 무엇을 할 수 있습니까?

  1. 다용도 그래픽의 우아하고 간결한 구조
  2. 대규모 또는 실시간 데이터 세트에 대한 고성능 상호 작용 확장
  3. 대화 형 플롯, 대시 보드 및 데이터 애플리케이션을 빠르고 쉽게 생성
  4. HTML, 노트북 또는 서버 출력 활용
  5. Bokeh 시각화를 Flask 및 Django 앱 또는 matplotlib, seaborn, ggplot과 같은 다른 라이브러리로 작성된 시각화에 통합합니다.

5. geoplotlib

Choropleth (Andrea Cuttone)

주로지도를 만들고 지리 데이터를 플로팅하기위한 도구 상자 인 geoplotlib를 사용하여 등치, 히트 맵 또는 점 밀도지도와 같은 다양한지도 유형을 만들 수 있습니다. 대부분의 Python 데이터 시각화 라이브러리는 맵을 제공하지 않으므로 외부 비주얼리 제이션을 위해 Tableau에 의존하지 않고 전용 라이브러리를 보유하는 것이 좋습니다.

특히 내가 가장 좋아하는 기능 중 하나는 실제 값을 색상으로 변환하는 컬러 이었습니다 .

본질적으로지도 플로팅 라이브러리이기 때문에 geoplotlib로 할 수있는 작업이 없습니다.

작성자 : Andrea Cuttone
자세한 정보 :https://github.com/andrea-cuttone/geoplotlib

6. D3.js

데이터 시각화에 대해 이야기 할 때 SVG 벡터 그래픽을위한 지배적 인 도구 인 D3 .js 에 대해 이야기 할 수 없습니다 ! SVG를 사용하면 아무리 깊게 확대해도 그래픽이 픽셀 화되지 않아 보고서에 가장 잘 팔립니다.

D3.js는 다양한 그래픽으로 데이터 마법사를 강화합니다. D3는 브라우저에 정보를로드하고 데이터 요소를 기반으로 보고서를 생성하는 프레임 워크입니다. D3.js는 특정 유형의 그래픽이 아니라 시각화를 만드는 방법을 제안합니다 (내가 가장 잘 이해하는대로).

D3.js로 무엇을 할 수 있습니까?

  1. 분포도 — 바이올린, 밀도, 히스토그램, 상자 그림, 능선
  2. 상관 관계 — 산포, 열지도, 상관 관계도, 거품, 밀도
  3. 순위 — 막대 그래프, 거미, 단어 구름, 병렬, 막대 사탕, 원형
  4. 전체의 일부 — 트리 맵, 도넛, 파이, 덴드로 그램, 원형 패킹
  5. Evolution — 선, 영역, 누적 영역, 스트림 차트
  6. 지도 —지도, 등치, 육각 상자,지도도, 연결
  7. 흐름 — 코드, 산키, 호 다이어그램
  8. 애니메이션

7. ggplot2

R의 풍부한 생태계에는 아름다운 그래픽을 만들기위한 수많은 유명한 패키지가 있지만, 가장 널리 사용되고 일반적으로 사용되는 시각화 패키지 중 하나는 ggplot2 입니다.

ggplot2 는 R 프로그래밍 언어의 Grammar of Graphics를 Python으로 구현하여 계층화 된 사용자 지정 플롯을 구축합니다. 나는 seaborn만큼 광범위한 플롯 컬렉션을 가진 Tidyverseggplot2 를 찾지 못했지만 R의 경우 ggplot2는 가장 강력한 데이터 시각화 라이브러리를 만듭니다 (내가 경험 한 것과 비슷합니다). 더 많은 것을 알고 있다면 의견을 자유롭게 추가하십시오!

ggplot2로 무엇을 할 수 있습니까?

Plotly 그래프 라이브러리에는 플로팅 할 수있는 다양한 그래프가 있습니다.

  1. 기본 차트 : 선, 윤곽선, 밀도, 지터, 막대, 점, 래스터, 다각형, 타일, 깔개, 원형, 분산 형, 거품
  2. 통계 차트 : 박스 플롯, 히스토그램, 바이올린 플롯, 리본, 분위수 차트
  3. 애니메이션 차트
  4. 한계 차트

8. R에 대한 플롯

Plotly는 Python에 대해 살펴 보았을 때 R에서도 사용할 수 있습니다. Plotly in R은 plotly.js 라이브러리를 기본으로 사용하여 대화 형 웹 기반 플롯을 만듭니다. 여기서 장점은 R에서 대부분의 패키지를 사용하여 만들 수없는 등고선도, 캔들 스틱 차트,지도 및 3D 차트를 작성할 수 있다는 것입니다. 또한 약 30 개의 저장소를 사용할 수 있습니다! Plotly는 또한 그래프와 상호 작용하고, 척도를 변경하고, 필요한 기록을 지적 할 수있는 기회를 제공합니다. 경영진에게이를 보여줍니다. 라이브러리는 Tableau와 다소 유사한 그래프 호버링도 지원합니다. 또한 knitr, R Markdown 또는 Shiny 앱에서 Plotly를 쉽게 추가 할 수 있습니다.

R에서 Plotly로 무엇을 할 수 있습니까?

  1. 등고선 플롯
  2. 촛대 차트
  3. 3D 산점도 (Andrew Ng의 Coursera ML 클래스에있는 것과 같음 : p)

pygal은 다시 SVG 그래프 / 차트를 생성하는 Python 모듈입니다. 필자는 Pygal을 사용하지 않았지만 고도로 사용자 정의가 가능하고 코드가 낮은 모듈이지만 매우 단순하다고 읽었습니다.

Bokeh 및 Plotly와 마찬가지로 pygal은 웹 브라우저에 포함 할 수있는 대화 형 플롯도 제공합니다. 이들 모두의 주요 차이점은 차트를 SVG로 출력하는 기능입니다. 더 작은 데이터 세트로 작업하는 한 SVG는 괜찮습니다. 여기서 단점은 수천 개의 데이터 포인트가있는 대규모 데이터 세트로 작업 할 때 발생하지만 렌더링 문제가 발생하고 느려집니다.

pygal로 무엇을 할 수 있습니까?

  1. 선 그래프
  2. 막대 차트
  3. 파이 차트
  4. 지도
  5. 맞춤형 차트

이것으로이 블로그에 대한 나의 끝입니다. 읽어 주셔서 감사합니다! 도움이 되었기를 바랍니다. 어떤 도서관을 사용했거나 배우거나 탐색하기 위해 찾고있는 도서관을 알려주십시오. 더 많은 도서관이 있다면 댓글에 자유롭게 남겨주세요!

면책 조항 :이 기사에 표현 된 견해는 본인의 것이며 엄격한 견해를 나타내지 않습니다.

저자를 알아라

Rashi는 시카고 일리노이 대학교의 대학원생입니다. 그녀는 데이터를 시각화하고 통찰력있는 스토리를 만드는 것을 좋아합니다. 학교 마감일을 맞추기 위해 서두르지 않을 때, 그녀는 좋은 컵의 핫 초콜릿으로 기술, UX 등에 대해 글을 쓰는 것을 좋아합니다.

Suggested posts

블랙 미러의 음악적 관련성

블랙 미러의 음악적 관련성

공상 과학 소설은 Netflix 시리즈 Black Mirror에서 현실을 만납니다. 영국 시나리오 작가 Charlie Brooker가 만든 준 무관 한 이야기의 선집으로, 사회가 기술에 의존하게 된 몇 가지 방식과 그렇지 않은 사람들에게 의미 할 수있는 의미를 자세히 살펴 봅니다. 아주 먼 미래. 이 시리즈는 2011 년부터 2013 년까지 BBC 채널 4에서 처음 방영 된 후 2015 년 넷플릭스에서 선정되었으며 디지털 스트리밍 서비스 전용으로 12 개의 에피소드를 더 공개하도록 의뢰했습니다.

Hyperledger Fabric Blockchain은 어떻게 작동합니까? 설명했습니다!

Hyperledger Fabric Blockchain은 어떻게 작동합니까? 설명했습니다!

이 블로그 게시물의 목표는 Hyperledger Fabric 블록 체인의 작동 방식에 대한 주요 개념을 설명하여 사용 방법에 대한 기본적인 이해를 얻는 것입니다. 내용.

Related posts

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

고유 분해 및 SVD에 유용한 기저의 선형 대수 개념 이해이 기사에서는 고유 분해 또는 특이 값 분해 (SVD)와 같은 행렬 분해 방법을 이해하는 흥미로운 방법 인 기저 개념에 대해 알아 봅니다. 정의 기본은 벡터 공간 (벡터 집합)을 설명하는 데 사용되는 좌표계입니다.

판다와 에라스무스 연구 교환 분석

판다와 에라스무스 연구 교환 분석

Erasmus 프로그램 2011-12에서 발생한 20 만 개의 연구 교환으로 데이터 세트를 분석 한 결과 1987 년 이후 Erasmus 프로그램은 매년 수십만 명의 유럽 학생들에게 한 학기 또는 1 년을 해외에서 보낼 기회를 다른 유럽에서 보낼 수있는 기회를 제공합니다. 경제적 인 지원뿐만 아니라 쉬운 교환 과정을 제공합니다. 유럽의 다양한 사람, 언어 및 문화에 대한 마음과 마음을 열어주는 정말 귀중한 경험입니다.

데이터 과학을위한 8 가지 기본 통계 개념

… 평범한 영어로 설명

데이터 과학을위한 8 가지 기본 통계 개념

통계는 "수량 데이터의 수집, 분석, 해석 및 표현을 다루는 수학의 한 분야"입니다. 프로그래밍과 기계 학습을 혼합하면 데이터 과학의 핵심 기술에 대해 꽤 잘 설명 할 수 있습니다.

데이터 과학의 9 가지 거리 측정

일반적인 거리 측정의 장점과 함정

데이터 과학의 9 가지 거리 측정

감독되거나 감독되지 않는 많은 알고리즘은 거리 측정을 사용합니다. 유클리드 거리 또는 코사인 유사성과 같은 이러한 측정은 종종 k-NN, UMAP, HDBSCAN 등과 같은 알고리즘에서 찾을 수 있습니다.