本书是面向新工科建设的新形态教材,介绍了数理统计分析及机器学习、深度学习的基础理论和软件操作,加强了统计分析和数据科学的融合。全书共12章,内容包括数据描述性分析及探索性分析、科学绘图、环境数据分布与假设检验、参数及非参数检验、方差分析、相关分析、回归分析、生存分析、降维分析、聚类分析、分类分析及机器学习、深度学习,特别设置了知识拓展、思考题、逸闻趣事等。本书重视实战操作训练,演示了Excel、SPSS、Python及GPT-4的分析过程,对软件操作及界面进行了详细介绍,完整展现了数据分析的思路和过程。所有习题、例题数据及解题方法均配套电子文件。
本书为浙江省普通本科高校“十四五”重点教材、科学出版社“十四五”普通高等教育本科规划教材,适用于多学科的本科生及研究生课程教学,也可供多学科领域的科研工作者及相关管理人员使用。
第二版前言
第一版序
第一版前言
第1章数据统计描述与图形化1
1.1数据统计概述1
1.2数据分析过程3
1.3数据基本类型3
1.4数据分析软件4
1.4.1使用软件4
1.4.2软件安装、运行5
1.5数据探索性分析7
1.5.1数据管理7
1.5.2数据转换8
1.5.3异常值及缺失值处理8
1.6数据描述性分析9
……