数据科学
維基百科,自由的 encyclopedia
数据科学(英語:data science)又称资料科学,是一门利用数据(资料)学习知识的學科,其目标是透过从数据中提取出有价值的部分来生产数据产品[1],学科范围涵盖了:数据取得、数据处理、数据分析等过程,举凡与數據有关的科学均属数据科学。
此條目需要擴充。 (2013年7月15日) |
事实速览 上级分类, 研究對象 ...
关闭
数据科学结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学透过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助[2]。
美国国家标准技术研究所于2015年发表七卷大數據参考框架(NIST Big Data Reference Architecture,NBDRA),于第一卷定义篇中将數據科學定为在理论科学、实验科学和计算科学之后的第四科学科学[3][4]。
数据科学家是把统计学知识和计算机程式设计知识相结合,并将其用于深度分析数据来获得数据见解的职业[5]。