国际竞赛:全年可参与,世界顶尖名校都认可的竞赛-Kaggle竞赛发表时间:2024-05-09 14:58 在计算机科学、人工智能和数据科学领域,越来越多的学生对参加竞赛产生了兴趣。然而,很多初学者发现,一些竞赛的编程水平要求过高,对于刚入门的同学来说并不友好。 同时,一些备受关注的竞赛如USACO和微软青少年创新杯对选手的能力考察非常全面,想要在这些竞赛中取得好成绩可谓“难于上青天”。 那么,有没有一个既对数学、计算机基础要求不高,但上限又没有天花板,同时还十分有趣的竞赛呢?答案是肯定的,那就是Kaggle竞赛。 Walmart lab data scientist面试官曾说:“参加过Kaggle比赛,我会看你的简历;得过一次10%,我会给你发电话面试的邀请;得过2次或者以上10%,我会给on site面试;得过Kaggle前10,我们会谈笑风生。” 想要在数据科学方向有所建树,除了阅读机器学习论文一年,参加 Coursera 课程,阅读动手实践的机器学习书籍外,参加 Kaggle 竞赛,获取数据科学经验非常好的一种方式! Kaggle赛事简介 Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台。从公司的角度来讲,可以提供一些数据,进而提出一个实际需要解决的问题;从参赛者的角度来讲,他们将组队参与项目,针对其中一个问题提出解决方案,最终由公司选出的最佳方案可以获得5K-10K美金的奖金。 除此之外,Kaggle官方每年还会举办一次大规模的竞赛,奖金高达一百万美金,吸引了广大的数据科学爱好者参与其中。从某种角度来讲,大家可以把它理解为一个众包平台,类似国内的猪八戒。 但是不同于传统的低层次劳动力需求,Kaggle一直致力于解决业界难题,因此也创造了一种全新的劳动力市场——不再以学历和工作经验作为唯一的人才评判标准,而是着眼于个人技能,为顶尖人才和公司之间搭建了一座桥梁。 参赛没有标准答案,只有无限逼近最优解,可以激励参与者提出更好的方案,甚至推动整个行业的发展 Kaggle含金量 ■ Kaggle交流社区的活跃度非常高,许多优秀选手会在社区里开源代码、分享心得,一起成长 ■ Kaggle会根据每场比赛的排名,受到许多企业认可 ■ 比赛全英文,可以练习英语 ■ 业界含金量高 ■ 许多科技巨头在Kaggle举办Recruitment类的竞赛用于招聘数据科学家,比如 Facebook、Amazon、Walmart。 ■ Featured类的比赛为解决商业问题而设立,是Kaggle平台最主要的竞赛类型,奖金高竞争激烈,有金银铜牌奖励,对参赛选手的能力有一定的要求,同时这意味着如果可以取得较好的成绩排名,对于相关领域的申请、求职能起到很强的背书。 ➤ 助力名校申请 一段带奖金高难度的Kaggle比赛的 Prize Winner经历并不会比一段互联网大厂数据分析实习经历逊色,Kaggle项目可以直观地展现你的数据分析能力。Kaggle作为数据科学行业极富盛名的平台,在业界具有极高的认可度。在找相关工作时,一段Kaggle Prize Winner经历将大大提高你的录取概率。 ➤ 学界认可度 得益于Kaggle的海量数据集和开放性,它还成为了一个非常棒的教学实践平台,吸引到哥大、纽大、上交大等设立了相关领域的Capstone Project,以及哈佛、牛津、斯坦福等开设Kaggle-in-Class的课程项目。 Kaggle赛事详情 ✪ 竞赛要求: ■ 编程语言最基础的入门学者也需要学会初步使用一门编程语言。对于毫无基础的新手,推荐使用Python,因为Python作为一种强大的胶水语言,可迅速入门。 ■ 探索数据光有编程语言是不够的,还需要学习如何探索性分析你手上的数据,这是进入数据科学的第一步。因为通常到手的数据都多到不可思议,你要学会取舍和迅速获取最有用的信息。 ■ 模型训练熟悉使用机器学习库,培养良好的习惯,为之后的工作做铺垫实战,从初级可以逐渐增加难度。 ✪ 参赛时间: 全年滚动,随时可以报名 ✪ 适合人群: 对数据科学、数据挖掘、机器学习感兴趣的高中生有一定计算机背景的大学生 ✪ 竞赛流程: ● 注册账号(一人只能有一个账号) ● 选择想要参赛的项目 ● 下载题目的数据 ● 时间截止,评出最优者 ● 获奖的队伍必须提交源代码注:可以以个人或组队的形式参加比赛,在参赛时可以相互分享经验。 ✪ 比赛形式 : Classic:在比赛开始后,用户可以访问完整的数据集。并可以选择在本地或在线进行建模、预测生成预测文件,最后提交预测结果。目前大多数比赛采取本形式。Two-stage:分为第一阶段和第二阶段,第二阶段建立在第一阶段的结果上,第一阶段完成才可参加第二阶段。Kernels:参赛者必须在线提交代码,更加公平,使每个参赛者都使用相同配置的电脑。 Kaggle奖项 kaggle的评价体系 kaggle的用户评价体系是基于三个维度的:竞赛、代码以及社区参与。根据这三个维度把kaggle的用户分成了5个等级: ■ Novice :初始等级,只要注册就算 ■ Contributor :添加资料信息,并且进行了各种指定的动作 即可。如上两个等级没有考虑到用户的比赛成绩和社区声望。 ■ Expert :获得两枚竞赛铜牌;5枚代码铜牌;以及50枚讨论铜牌 ■ Master :获得一枚竞赛金牌,两枚竞赛银牌;10枚代码银牌;50枚讨论银牌以及总共200枚讨论奖牌 ■ Grandmaster :获得5枚竞赛金牌,solo竞赛金牌;15枚代码金牌;50枚讨论金牌以及总共500枚讨论奖牌。 |