内容简介
本书以“真实数据科学”为核心视角,通过扎实且具实践导向的内容,深入解析负责任的数据科学实践路径。从提出PCS框架(可预测性、可计算性、稳定性)切入,贯穿数据科学生命周期全流程,探究如何通过批判性思维和实证评估,确保数据分析结果的可信度,避免“数据窥探”和误导性结论。
同时,本书敏锐聚焦数据科学实践中的关键环节,借助全球器官捐献数据、美国农业部食物营养数据等真实案例,详细演示数据清洗、探索性数据分析、模型构建等技术的实际应用,展现多重因素如何影响分析质量,以及如何通过严谨的全流程管理提升结果的可靠性。
通过本书,读者将深入理解数据科学实践的核心逻辑,掌握解锁负责任的数据分析与决策的有效方法,了解如何在复杂的真实数据场景中得出可信的结论,从而成为推动数据科学负责任应用的实践者。