확률과 통계학은 다양한 분야에서 수집된 데이터를 알기 쉽게 정리 및 요약하고 불확실한 미래를 예측하거나 관심 대상 집단의 특성을 추론하는 학문으로, 다양한 데이터를 분석하는 도구로 활용되면서 과학, 공학, 인문학, 사회과학의 학문 분야는 물론이고 이들과 관련된 산업에서 그 중요성이 날로 증대되고 있다. 4차 산업 시대는 데이터 시대라고 해도 과언이 아닌데, 그 핵심 분야인 빅데이터와 인공지능에서도 확률과 통계학은 매우 중요한 역할을 하고 있다. 이에 맞춰 각 분야의 다양한 데이터를 분석하고자 하는 학생들에게 확률과 통계학의 이론을 학습하고 이를 응용할 수 있도록 그 개념과 풍부한 실습 예제를 담아 대학에서 통계학의 교과서 또는 참고서가 되도록 이 책을 집필하게 되었다.
이 책은 데이터 분석의 주요 개념을 소개하고 이후 데이터를 효율적으로 분석할 수 있도록 파이썬 프로그램을 활용한 것이 특징으로, 이를 통해 전공자뿐만 아니라 비전공자들도 데이터 분석을 쉽게 이해할 수 있으며 차후 빅데이터와 인공지능의 알고리즘을 이해하는 데도 큰 도움이 될 것이다.
파이썬 프로그램은 데이터 분석, 시각화, 수치해법 기법 등을 지원하여 통계 데이터를 분석하는 데 특화되어 있을 뿐만 아니라 오픈소스이고 무료 소프트웨어인 것이 큰 장점이라고 할 수 있다. 이에 맞춰 각 절에는 예제와 이를 해결하는 파이썬 프로그램을 수록하여 데이터 분석 과정을 설명하였고, 연습문제에 있는 객관식 문제, 주관식 문제, 파이썬 프로그램 실습 문제를 해결하도록 하여 학습자 스스로가 자기 실력을 측정하는 데 도움이 되게 하였다.
이 책의 1~2장은 수집된 데이터를 정리하고 요약하는 기술통계를 설명하였으며, 3~6장은 확률과 통계학의 개념을 이해하는 데 필수적인 확률과 확률분포 이론 및 표본분포 이론을 다루었다. 7~8장은 추측통계학 분야인 추정과 통계적 가설검정을 다루었고, 9장은 범주형 자료 분석, 마지막 10장은 두 개의 변수를 갖는 데이터 분석을 다루었다.
좋은 책을 위해 최선을 다하였지만 부족한 부분이 있을 수 있다. 이 점은 양해를 바라며 출간 후 나올 수 있는 수정사항 및 연습문제 해설, 파이썬 프로그램 등의 자료는 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이니 참고하기를 바란다. 끝으로, 이 책이 출간되기까지 많은 도움을 주신 자유아카데미 관계자 여러분께 감사드리며, 이 책이 데이터 분석의 기초개념을 이해하고 이를 파이썬 프로그램으로 해결하기를 바라는 독자들에게 조금이나마 도움이 되었으면 한다.