Pandas 데이터 프레임 스타일 지정

평범한 숫자 이상의 것을 만들어 봅시다.

Unsplash에 Heng Films의 사진

데이터 시각화는 일반 데이터에서 의미있는 결과를 추론 할 수있는 훌륭한 도구입니다. 그들은 현재 데이터를 더 잘 이해하기 위해 탐색 적 데이터 분석 프로세스에서 널리 사용됩니다. 몇 가지 시각화 구조를 Pandas 데이터 프레임에 통합하면 어떻게 될까요? 나는 그것이 평범한 숫자보다 더 좋아 보인다고 생각합니다. 또한 데이터 프레임 표시에 정보를 제공하는 기능을 추가 할 수 있습니다.

pandas 데이터 프레임의 Style 속성을 사용하여이를 달성 할 수 있습니다 . Style 속성은 데이터 프레임의 서식 지정 및 표시를위한 다양한 옵션을 제공 하는 스타일러 개체를 반환합니다 . 이 게시물에서는 몇 가지 예를 살펴보고 데이터 프레임이 다른 스타일로 표시되는 방법을 살펴 봅니다.

매개 변수를 조정하여 사용할 수있는 내장 스타일 함수가 있습니다. 또한 자체 스타일 함수를 작성하여 스타일러 객체에 전달한 다음 렌더링 전에 스타일을 구현할 수도 있습니다.

스타일러 개체를 사용하는 방법에는 두 가지가 있습니다. 하나는 applymap 메소드 로 수행 할 수있는 요소 별 스타일링입니다 . 다른 하나는 적용 방법 을 사용해야하는 열 또는 행 스타일링입니다 .

먼저 numpy와 pandas로 샘플 데이터 프레임을 만들어 보겠습니다.

df = pd.DataFrame({'A':np.linspace(1,8,8),
                   'B':np.random.random(8),
                   'C':np.random.randn(8),
                   'D':np.random.randn(8),
                   'E':np.random.randint(-5,5,8)})
df.iloc[[1,5],[1,3]] = np.nan
df

def color_negative_values(val):
  color = 'red' if val < 0 else 'black'
  return 'color: %s' % color

df.style.applymap(color_negative_values)

def color_max(s):
    is_max = s == s.max()
    return ['background-color: lightblue' if v else '' for v in    is_max]

df.style.apply(color_max)

df.style.apply(color_max, axis=1)

체인 작업으로 다양한 스타일 기능을 결합 할 수 있습니다.

df.style.applymap(color_negative_values).apply(color_max)

df.style.apply(color_max, subset=['B','C'])

사용자 정의 기능 외에도 Pandas에는 일반적인 작업을 충족 할 수있는 몇 가지 기본 제공 스타일 기능이 있습니다. 예를 들어 highlight_null 함수는 누락 된 값을 표시합니다.

df.style.highlight_null(null_color='yellow')

import seaborn as sns
cm = sns.light_palette("green", as_cmap=True)
df.style.background_gradient(cmap=cm)

Highlight_maxhighlight_min 함수는 사용자 정의 color_max 함수와 같이 열 또는 행의 최대 및 최소 값을 표시합니다.

df.style.highlight_min(color='lightgreen', axis=1)
df.style.highlight_max()

Set_properties 함수는 여러 스타일 선택을 결합 할 수 있습니다.

df.style.set_properties(**{'background-color': 'lightblue',
                           'color': 'black',
                           'border-color': 'white'})

df.style.bar(color='lightgreen')

df.style.bar(align='mid', color=['red', 'lightgreen'])

여기서 사용한 스타일 함수는 매우 간단한 것입니다. 그러나 데이터 프레임의 정보력을 향상시키는 더 복잡한 스타일 함수를 만들 수도 있습니다. 우리가 작업하는 모든 데이터 프레임에 동일한 스타일을 사용할 수 있습니다. Pandas는 데이터 프레임간에 스타일을 전송하는 방법을 제공합니다.

먼저 스타일을 스타일러 개체에 저장합니다.

style = df.style.applymap(color_negative_values).apply(color_max)
style

df2 = pd.DataFrame({'col1':np.random.random(8),
                   'col2':np.random.randn(8),
                   'col3':np.random.randint(-5,5,8)})
df2

style2 = df2.style
style2.use(style.export())
style2
  • 커스텀 스타일링 함수를 생성하고 데이터 프레임에 적용하는 방법
  • 내장 스타일 함수를 사용하는 방법
  • 스타일러 개체에서 다른 개체로 스타일을 전송하는 방법

읽어 주셔서 감사합니다. 의견이 있으면 알려주세요.

Suggested posts

좋은 습관을 만들고 유지하는 방법

장기적인 습관을 유지하기위한 생산성 팁

좋은 습관을 만들고 유지하는 방법

두 아이의 엄마가 된 후 일을 끝내기가 더 어려워졌습니다. 나는 한 작업에서 다음 작업으로 뛰어 들었고 하루가 끝날 때까지 아무것도하지 않았을 때 실망했습니다.

양자 컴퓨팅 Pt를위한 프로그래밍. 1 : NumPy

이제 양자 컴퓨팅이면의 물리학을 배우기 시작 했으므로 "이봐, 실제로 양자 컴퓨터를 사용하려면 실제로 양자 장치를 손으로 만들어야합니까?"라고 궁금해 할 것입니다. 답은 양자 컴퓨터를 컴퓨터라고 부르는 이유가 있습니다. 프로그래밍이 가능합니다! 이 시리즈에서는 수학 개념을 시뮬레이션하고 양자 컴퓨터에서 실행하는 소프트웨어를 구축하는 방법을 배우게됩니다. 깨끗하고 현대적이며 라이브러리가 풍부한 언어이기 때문에 Python을 사용하여 코드를 작성할 것입니다.

Related posts

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

고유 분해 및 SVD에 유용한 기저의 선형 대수 개념 이해이 기사에서는 고유 분해 또는 특이 값 분해 (SVD)와 같은 행렬 분해 방법을 이해하는 흥미로운 방법 인 기저 개념에 대해 알아 봅니다. 정의 기본은 벡터 공간 (벡터 집합)을 설명하는 데 사용되는 좌표계입니다.

판다와 에라스무스 연구 교환 분석

판다와 에라스무스 연구 교환 분석

Erasmus 프로그램 2011-12에서 발생한 20 만 개의 연구 교환으로 데이터 세트를 분석 한 결과 1987 년 이후 Erasmus 프로그램은 매년 수십만 명의 유럽 학생들에게 한 학기 또는 1 년을 해외에서 보낼 기회를 다른 유럽에서 보낼 수있는 기회를 제공합니다. 경제적 인 지원뿐만 아니라 쉬운 교환 과정을 제공합니다. 유럽의 다양한 사람, 언어 및 문화에 대한 마음과 마음을 열어주는 정말 귀중한 경험입니다.

데이터 과학을위한 8 가지 기본 통계 개념

… 평범한 영어로 설명

데이터 과학을위한 8 가지 기본 통계 개념

통계는 "수량 데이터의 수집, 분석, 해석 및 표현을 다루는 수학의 한 분야"입니다. 프로그래밍과 기계 학습을 혼합하면 데이터 과학의 핵심 기술에 대해 꽤 잘 설명 할 수 있습니다.

데이터 과학의 9 가지 거리 측정

일반적인 거리 측정의 장점과 함정

데이터 과학의 9 가지 거리 측정

감독되거나 감독되지 않는 많은 알고리즘은 거리 측정을 사용합니다. 유클리드 거리 또는 코사인 유사성과 같은 이러한 측정은 종종 k-NN, UMAP, HDBSCAN 등과 같은 알고리즘에서 찾을 수 있습니다.