探索性数据分析(Exploratory data analysis,EDA)是数据分析科学家们必备的关键技能之一。因为数据往往是枯燥的,为了吸引人们对某个领域产生兴趣,我们就需要将大量的数据转换为浅显而有趣的故事,毕竟,大家都喜欢听好的故事。为了说明它的力量,我以人类在过去70年中对宇宙的探索为例,制作了一份探索性数据分析。在这篇文章中,我将和大家分享一些出乎我们预料的见解。
为了更加清晰地展现分析成果,我会从大量数据中总结我个人的见解,并将它们以“前十”、“记录”和“显著成就”的内容形式展现在大家面前。为了使文章的语境顺序更加连贯,我会以时间顺序为基准,逐步展开这70年中人类探索宇宙的任务和大事件。
在数据探索过程中,我使用了Python编程,并利用NumPy和Pandas库的进行数据整理。为更加明显地展现数据,我使用了Matplotlib和Seaborn制作图表。代码不会在文章中出现,但我会将完整的代码上传到GitHub上。
太空探索潮的起起伏伏自1957年人类第一次开展太空探索到1978年,太空探索任务数量逐年上升,到1971年到达了顶峰119次。其中1971年到1978年期间,每年的任务数量一直保持在97次以上。而在1979年,当年的任务数量骤降到了49次。此后的30年里每年的任务数量再也没有出现从前那般的高峰。直到2018年,它才再次恢复,当年共完成了117次任务。
那么,如果想成为一名宇航员,需要花费多长时间呢?数据统计,一名宇航员从选拔(开始训练)到第一次执行任务的平均时间约为6.3年。75%的宇航员从他们最初入选开始,到第8年完成了他们的第一次任务,另外的是25%的人则是在4年内就完成了第一次任务。