웅진OPMS

데이터 시각화 with Python

설진욱 | (주)아이콕스
  • 등록일2022-09-07
  • 파일포맷pdf
  • 파일크기46 M  
  • 지원기기아이폰, 아이패드, 안드로이드, 태블릿, PC
  • 보유현황보유 1, 대출 0, 예약 0
  • 평점 평점점 평가없음

책소개

파이썬을 사용하여 데이터 시각화를 시작하는 분에게 권장하는 필독서!기존 전공자들의 주된 영역이었던 빅데이터, 머신 러닝 등은 이제 전공자가 아니더라도 쉽게 접근할 수 있는 영역이 되었고 행정, 교육, 경제, 경영, 의학, 공학, 과학, 예술, 스포츠 등에서 많은 사람들이 다룰 수 있는 영역으로 보편화 되었습니다.빅데이터, 머신 러닝 과정에서 도출되는 광범위한 데이터들은 엑셀과 같은 표 형태의 데이터, 그래프 등의 형태로 표현이 가능해졌습니다. 데이터를 표현하는 여러 가지 방법 중 가장 빠른 의미 전달의 도구는 역시 시각적인 기법으로 보여 주는 것입니다.이 책은 파이썬을 사용하여 데이터를 시각화하는 데 초점을 두었으며, 일반적으로 자주 사용되는 그래프를 항목 별로 나누어 설명하였고 파이썬에서 제공하는 matplotlib, seaborn 라이브러리로 작성하였습니다. 파이썬의 기초적인 문법을 학습하신 분이라면 이 책을 통해 자신의 상황에 맞는 다양한 분야에서 데이터 분석을 위한 시각화 과정에 응용할 수 있을 것입니다.

저자소개

부산대학교 정밀기계공학과를 졸업하였고, LG전자 세탁기 사업부에 입사하여 사업부 관련 전산 업무를 담당하였습니다. 이후 Visual Basic과 Ms Access를 이용한 약국 도매상 관련 유지 보수 프로그램을 2년 정도 개발하였습니다. PC방에서 사용되는 카운터용 및 클라이언트용 관리 프로그램 개발 업무에 7년 정도 종사하였습니다.
프로그래밍에 대한 강의는 자바를 시작으로 하여 현재 14년째 진행 중이며, 머신러닝, RPA, 데이터베이스, 자바(JSP, Spring), 파이썬, R, 자바스크립트, React, Elasticsearch, VBA 등의 강의가 가능합니다. 새로운 IT 과목에 대한 관심을 계속 가지고 관련 공부는 꾸준히 해 나갈 예정입니다.
저서로는 <데이터 시각화 with 파이썬>과 <비전공자도 쉽게 이해하는 데이터베이스 입문> 등이 있습니다. 어릴 적 즐겨 듣고 보았던 만화나 노래 등에 가끔 심취하며 추억을 회상하기도 합니다.

목차

들어가며

Chapter 01 파이썬 프로그래밍 개요
1.1 Python의 개요
1.2 Python의 특징
__1.2.1 주요 특징
__1.2.2 쉬운 문법
__1.2.3 무료 프로그램
__1.2.4 간결성
__1.2.5 개발 속도의 신속성
1.3 Python의 종류
1.4 Python의 사용처
__1.4.1 파이썬으로 할 수 있는 것
1.5 Python 설치하기
__1.5.1 홈페이지를 이용한 Python 설치
__1.5.2 Python을 위한 환경 변수 설정하기
1.6 파이썬의 코딩 구조
1.7 Jupyter Notebook
__1.7.1 쥬피터 노트북 설치
__1.7.2 새 노트 만들기
__1.7.3 주석과 문서 입력하기
__1.7.4 노트 저장하기
__1.7.5 출력이 제대로 되지 않는 경우
__1.7.6 데이터 시각화
__1.7.7 ipynb2py
1.8 통합 개발 도구(IDE)를 사용한 Python 실행
__1.8.1 PyCharm 설치
__1.8.2 PyCharm 설정
__1.8.3 PyCharm 실행
요약

Chapter 02 판다스 패키지
2.1 Series(시리즈)
__2.1.1 시리즈 생성 방법
2.2 Series의 데이터 읽기와 쓰기
2.3 DataFrame(데이터 프레임)
__2.3.1 DataFrame 생성 방법
2.4 DataFrame 데이터 읽기와 쓰기
2.5 함수 적용과 매핑(apply 함수)
2.6 데이터 병합하기
__2.6.1 merge( ) 함수
2.7 다양한 방식의 데이터 추출
2.8 GroupBy 메카닉
__2.8.1 그룹핑 관련 함수
연습 문제
요약

Chapter 03 데이터 시각화
3.1 matplotlib API
__3.1.1 plt와 연관된 함수
__3.1.2 이미지로 저장하기
3.2 변수 개수 및 형태별 그래프 종류
3.3 꺽은 선 그래프
__3.3.1 특정 국가의 특정 일자에 대한 꺽은 선 그래프
__3.3.2 이중 축 꺽은 선 그래프
3.4 산점도 그래프
__3.4.1 엔진 크기에 대한 주행 마일수의 산점도 그래프
__3.4.2 구동 방식에 의한 색상 구분하기
__3.4.3 산점도와 히스토그램 동시에 그리기
__3.4.4 다이어몬드 데이터 셋과 산점도
3.5 막대 그래프
__3.5.1 특정 일자 일변량 막대 그래프
__3.5.2 특정 국가별 일별 다변량 막대 그래프
__3.5.3 일별 국가별 다변량 막대 그래프
__3.5.4 일별 국가별 누적 막대 그래프
__3.5.5 국가별 일별 누적 가로 막대 그래프
__3.5.6 서브 플로팅 사용하기
__3.5.7 Table이 존재하는 막대 그래프
3.6 파이 그래프
__3.6.1 사용자 정의 비율 지정
__3.6.2 사용자 정의 포지셔닝
__3.6.3 도우넛 파이 그래프
__3.6.4 국가별 중첩 파이 그래프
__3.6.5 특정 파이 영역의 세부 내역 보이기
3.7 상자 수염 그래프
__3.7.1 상자 수염(사용자 정의 색상)
__3.7.2 상자 수염과 바이올린 그래프
3.8 히스토그램
__3.8.1 남자들의 신장
__3.8.2 남자와 여자의 다중 히스토그램 그리기
__3.8.3 총 결재 금액
__3.8.4 총 결재 금액(계급 구간 조정)
__3.8.5 거인국과 소인국의 신장 히스토그램
__3.8.6 거인국과 소인국의 히스토그램을 동일 화면에 그리기
__3.8.7 히스토그램의 누적
연습 문제
요약

Chapter 04 한국 복지 패널 데이터
4.1 seaborn 라이브러리
4.2 한국 복지 패널 데이터 개요
__4.2.1 데이터 파일
__4.2.2 데이터 분석 준비하기
__4.2.3 복지 데이터 전처리
__4.2.4 척도에 대한 이해
__4.2.5 결혼 유무와 종교 유무에 따른 빈도(countplot)
__4.2.6 나이에 따른 히스토그램(distplot)
__4.2.7 결혼 유무와 성별에 따른 히트맵(heatmap)
__4.2.8 두 컬럼간의 짝 그래프(pairplot)
__4.2.9 성별과 나이에 따른 바이올린 그래프(violinplot)
__4.2.10 선형 회귀 모델 그래프(lmplot)
__4.2.11 나이와 소득에 따른 산점도(replot)
__4.2.12 나이와 소득에 따른 산점도와 히스토그램(jointplot)
__4.2.13 성별에 따른 소득 그래프(barplot)
__4.2.14 성별에 따른 소득 상자 수염 그래프(boxplot)
__4.2.15 소득에 따른 나이(이차원 밀집도_kdeplot)
연습 문제
요약

Chapter 05 자동차 데이터 셋
5.1 자동차 데이터 셋 개요
__5.1.1 데이터 파일
__5.1.2 산점도와 Rug Plot(scatterplot)
__5.1.3 엔진 크기 히스토그램(histplot)
__5.1.4 구동 방식에 따른 주행 마일수(stripplot)
__5.1.5 구동 방식에 따른 주행 마일수(swarmplot)
연습 문제
요약

Chapter 06 특별한 그래프
6.1 개요
__6.1.1 성적표 향상 그래프(경사 그래프)
__6.1.2 리본 박스 그래프
__6.1.3 범주형 플로팅
__6.1.4 Density Plotting
__6.1.5 Lollipop Chart
__6.1.6 Ordered Bar Chart
__6.1.7 TreeMap
__6.1.8 Stem Plotting
연습 문제
요약

Chapter. A 연습 문제 해답
판다스 패키지
데이터 시각화
한국 복지 패널 데이터
자동차 데이터 셋
특별한 그래프

Chapter. B 부록
B.1 plot( ) 함수
B.2 Series와 그래프
B.3 DataFrame과 그래프
B.4 서브 플로팅

Chapter. C 찾아보기

한줄 서평