第五章〓学会分析数据的方法 志愿填报,选择大于努力,但不重视数据分析的后果,很有可能是努力选择错误! ——勋哥 在掌握了志愿填报基础知识后,我们接下来的主要任务就是学会根据分数选出自己的目标大学。要做到这一点,必须先学会分析志愿填报录取数据的方法,再根据这些方法去分析以往的录取数据,进而找出自己可能能上的目标院校。 勋哥知道,下面可能比较难,但如果能把这一步完成,考生和家长就可以从众多的院校中找到与自己分数最为匹配的大学和专业,从而最大限度地减少了后期的工作量,为集中精力了解大学和专业、筛选出志愿填报院校和专业打下坚实的基础。 这或许是最难的,但也是很有成就感的!坚持住,我的小伙伴们! (1) 学会找到录取数据、下载录取数据的方法。 (2) 学会根据关键概念(线差、省控线、位次)分析整理数据的方法。 (3) 制作分析数据样表一。 第一节下载录取数据 本节任务分为两步: 第一步,找到所需要的录取数据; 第二步,下载所需要的录取数据。但在我们去找数据之前,考生和家长首先要明白,进行志愿填报需要哪些数据? 一、 志愿填报需要哪些数据做参考? 我们只要回顾下我们学习的知识就能列举出一二,总的来说,这些数据是和前面讲解过的知识密切相关的,主要有以下四种。 (一) 省控线数据 省控线数据在各大网站都有公布,有的网站甚至帮我们做好了整理,把近5年的省控线做成了表格,供我们参考。如表51所示,湖南省2016—2018年的各批次省控线都已经汇总好了。 表51湖南省2016—2018年各批次省控线 批次2018年文科2018年理科2017年文科2017年理科2016年文科2016年理科 本一批569513548505530517 本二批526450485424476439 本三批A486409441383431396 本三批B—————— 高职专科批200200200200200200 但这是不是意味着我们就直接引用这个表格呢?勋哥认为,我们必须把省控线数据中自己需要的部分抽离出来,形成另一张数据表,这样更简单明了。如果你是湖南省理科考生,高考成绩为482分,那你将如何制作你的省控线表格呢?可以参考表52,湖南省2016—2018年各批次省控线一览表。 表52湖南省2016—2018年理科各批次省控线 批次2018年理科2017年理科2016年理科 本一批513505517 本二批450424439 本三批A409383396 我们把理科的省控线单独理出来,目的是为后面的数据查找节省时间。为什么留下本一批和本三批A的省控线?原因很简单,因为现在很多省份都陆续实行了本科合并录取的政策,我们所能知道的省控线的数据会越来越少。换句话说就是我们能知道掌握的,可以用来衡量自己分数、定位自己分数的数据会比合并前少,因此留下本一批和本三批数据。 (二) 位次数据 考生在查询高考成绩的时候,查询结果显示的不仅有高考单科成绩和总分,还有高考成绩位次数据。但我们需要知道考生的成绩位次,还需要结合全省一分一段统计表,如第一章第三节中的表12所示。 (三) 考生成绩对应批次院校投档线数据 本章上文我们举了一个湖南理科考生的例子,因为考生高考成绩为482分,对应的批次为本科二批,所以我们要查找下载的数据就应该是湖南省近三年本科二批的院校投档线数据,有的批次投档线的数据如专科投档线数据、艺术类投档线数据等对这位湖南的考生而言,则是没有太大参考意义的。 注: 我们不仅要下载同批次正常投档的院校投档线数据,还要下载相应批次的征集志愿投档线数据。 (四) 院校专业录取分数线数据 这个数据在没有确定目标院校之前,还不需要。 当我们根据分数、位次等数据分析在大学备选库中初步筛选并确定了目标院校时,还要根据目标院校的专业录取分数线来确定我们专业志愿的填报。因此我们必须查找目标志愿院校的专业录取分数数据。 二、 在哪里找所需要的录取数据? 1. 省教育考试院网站 勋哥认为省教育考试院网站是我们下载数据的首选地方,原因很简单,这里的数据最权威,原始数据最准确。有的省教育考试院网站上的数据是非常全的,考生和家长只要把上面要求的数据分门别类下载好就可以进行整理分析了。一般来说,省控线的数据可以在很多网站上查找,但位次数据和院校投档线数据,勋哥推荐尽可能在省教育考试院官网上下载。如图51和图52中所示的一分一段数据表、二本批次投档线统计表以及二本批次征集志愿统计表,每年湖南省教育考试院网站都会有更新,大家只要检索到每年高考录取时间的位置,就可以下载相关数据了。 图51 2. 较著名的高考公益网站 推荐以下几个网站。 (1) 阳光高考网。 教育部指定的唯一高考资讯平台,这个网站的数据相对于其他网站来说更权威,时效性更好,数据比较全,检索也比较方便。 图52 网址为http://gaokao.chsi.com.cn/。 (2) 新浪高考。 这个网站上有部分查询内容是收费的,但免费的内容也还是不错的。 网址为http://edu.sina.com.cn/gaokao/fenshuxian/。 (3) 中国教育在线。 这个网站是比较资深的高考网站,里面的查询内容虽然比较全,免费的内容也比较多,但更新速度不是很快。 网址为http://gkcx.eol.cn/。 (4) 勋哥的公众号xunge3。 勋哥会定期更新各省市相关的数据文件,根据大家的需要制作相关的数据包,通过微信公众号定期推送给大家,希望大家多多关注勋哥的公众号(见封底)。 (5) 勋哥个人网站。 我的网站www.ourschools.cn根据大家的要求上传了一些定制化的数据,供大家查询。网站也会每天更新我的原创视频,可为大家填报志愿提供一些帮助。 三、 下载数据的两种方式 1. 直接下载 有的省份,如江西省、湖南省,直接在网站上提供数据表格的电子稿链接,考生和家长只要轻轻单击鼠标,就能轻松下载所需要的数据。 2. 复制粘帖 有的省份,如湖北省,院校投档线数据是直接附在网页上的,没有提供现成的电子表格以供下载,需要考生和家长在网页上复制粘贴,这就需要考生和家长多花点儿心思。 第二节下载数据整理要求 本节的目标比较简单,主要是大家要依照以下步骤,按下列样表模式,整理近3~4年的高考录取数据。 样表如图53所示,河北省一批录取数据2015—2017年样表。 图53 (1) 在没有合并录取的省份,按批次将三年的投档线数据并列,放在一张表格中。 (2) 每年的投档线按高分到低分排序。 (3) 已合并录取的省份,必须对原批次数据进行备注,如图54所示为山东省2014—2017年本科投档线数据。 图54 为什么要备注?原因很简单,因为数据发生变化了。山东省2017年是本科全部合并在一起录取的,我们把2014—2016年的本科录取数据也要合并在一起,但原来的数据是分批次的,而2017年的录取数据是不分批次的,我们做好备注是为了更好地看合并后原来的录取数据会发生怎样的变化,以便更好地比较。 为了便于讲解,对于高分段院校、低分段院校和中间段院校,我们做了一个简单的规定: 以某省一本院校为基数,排名前20%的学校为高分段院校, 21%~70%为中间分数段院校,71%~100%为低分段院校。(注: 这个可以视不同省份的数据,酌情调整。) 第三节数据分析方法之一: 线差法 作为一名考生,在我们拥有了省控线、位次、院校投档线、专业录取分数线这四大类数据之后,我们应该根据什么方法对这些数据进行有效分析? 我们在第一章第四节对什么是线差进行过分析。因此,我们就不再花太多的篇幅来讲解线差的概念,只用两个实例来讲解如何运用线差法来进行志愿填报。 线差法比较适用于压线考生。对于中间分数段或是高分段考生,适用性相对要差点。下面我们来举例分析。 一、 新疆压线数据分析 数据来源: 新疆2015—2016年理科一本线上25分左右的院校数据(汉语言)。 新疆2015年理科一本省控线为446分,2016年为464分,2017年为437分。 我们先看2015—2016年投档线在一本线上25分之内的大学呈现出怎样的规律,通过观察这些规律,推测2017年的数据表现,然后再对照2017年的数据作为印证。 2015年的数据如表53所示。 2016年的数据如表54所示。 表532015年新疆压线数据分析 学校最高分最低分 沈阳建筑大学492471 西安工程大学479471 北京印刷学院493470 东北农业大学483470 北京师范大学香港浸会大学518468 辽宁工程技术大学484465 宁波大学487462 沈阳农业大学484460 南华大学489460 石河子大学571450 西南大学(荣昌校区)477449 青海大学485446 新疆大学599446 新疆农业大学537446 新疆师范大学511446 表542016年新疆压线数据分析 学校最高分最低分 辽宁工程技术大学507486 沈阳农业大学502486 西南大学(荣昌校区)533484 中国石油大学(华东)566483 西安石油大学522481 北京师范大学香港浸会大学528480 青海大学544474 西南石油大学537473 中国石油大学(北京)克拉玛依514471 东北石油大学519471 新疆农业大学506465 新疆大学576464 石河子大学565464 新疆师范大学519464 数据说明: 每年有两组数据,左边为最高分,右边为最低分,均为一本线上25分。 数据分析: (1) 一本线上25分的学校数量比较少。2015年15所,2016年14所。 在这些大学中,有8所学校是相同的。由于压线的学校数量比较少,8所学校相同,本身就能反映出一定的规律性,说明有很多学校基本上往年都在压线附近的位置。 (2) 有部分院校,数据表现出惊人的一致性。 我们观察一下这两年的数据就会发现: 这些学校中有很多学校线差是一样的。如线差都是0分的学校有新疆师范大学、新疆大学,有很多学校线差相近,如北京师范大学香港浸会大学在2015年为22分,在2016年为16分。如果线差法与后面的院校排名法相结合,我们选出来的学校则更为精确,这一点等我们第四节讲到排名法的时候再来说明。 当然,也有些学校属于变动比较大的,在2015年出现,在2016年25分之内则没有出现,原因在于新疆的招生院校本来就不是很多,因此数据波动性会比较大。 (3) 实操演练。 假如有一位考生2017年的考分为理科线上10分,如何填志愿? 按照平行志愿的原则,我们根据2015—2016年的数据,基本上可以确定的保底学校是新疆师范大学、新疆大学、新疆农业大学、石河子大学,因为这些学校基本上都处于压线的位置。如果要选择冲的学校,我们可以在这些学校上面选择一些波动性比较大的学校,如中国石油大学、西南石油大学、北京师范大学香港浸会大学联合国际学院、西南大学(荣昌校区)、青海大学等,因为数据的原因,我们没有对所有数据进行分析,在对所有数据进行分析后,我们也可以选择更多的学校。 按照这个思路,我们来看一下2017年的录取数据,如表55所示,印证一下我们的想法。 表552017年新疆录取数据 学校最高分最低分 沈阳农业大学486462 北京交通大学(威海校区)509461 南京林业大学500459 北京师范大学香港浸会大学联合国际学院536458 天津商业大学507458 东北石油大学497458 天津理工大学495457 青海大学496455 新疆财经大学525454 福建农林大学475449 中国石油大学(北京)克拉玛依校区498448 昆明理工大学482444 内蒙古大学475443 新疆农业大学454438 石河子大学548437 新疆大学577437 新疆师范大学486437 华北水利水电大学469437 从2017年的数据来看,保底的学校基本上是没有任何问题。而且2015—2016年垫底的大学,在2017年依然是垫底。线差法在低分压线时的运用,能较准确地守住底,选对大学,防范风险。 我们再看一个考生人数相对更多的省份,就能将线差法的这种保底作用看得更清楚明白。 二、 江西省压线数据分析 (1) 2015—2016年文科一本数据(一本线上10分的院校名单),如图55所示。 图55 2015年江西省文科一本省控线为528分,2016年则为523分。下面我们以2016年的数据为基础分析2015年的数据,从中找出与2016年线差较为一致的大学名单。从图56中我们可以清楚地看到,2016年一本压线的院校基本上都能在2015年找到(阴影部分的院校,表示在2015年也是一本线上10分之内的院校),还有很多没有找到的院校是2015年并未在一本线上招生的院校。 图56 这个数据特征就比上面新疆院校的例子更明显。如果考生处于压线位置,通过线差来锁定院校,基本上就可以完成了。 (2) 实操演练。 假定江西省2017年文科考生,考试成绩为一本线上3分,应该如何选择学校? 以2016年的数据为基础,如图57所示,在只考虑院校录取,不考虑专业的情况下,我们可以选择线上5分左右的院校进行匹配。 图57 下面我们对比一下2017年的录取数据,如图58所示,就可以知道,正确运用线差法,填报志愿是有保障的,考生被第七志愿西南科技大学录取。 图58 运用线差法进行压线志愿填报,一定要注意不能冲,或者说冲的学校不能太多,因为一分的差别,在压线位会有很大的差别。要有底线意识,只有这样志愿录取才有保障。 第四节数据分析方法之二: 位次法 我们在实操过程中会发现,有些年份,由于高考试题难度问题,常会导致线差法在实际运用过程中发生偏差,而且线差法对于中间分数段及高分段的考生运用起来会有局限性。在这个时候,我们就会引入另一个指标: 位次。由此产生了位次法。 一、 为什么高分段院校不适用线差法? 为了便于定位高分段院校、低分段院校和中间段院校,我们做了一个简单的规定: 以某省一本院校总数为基数,排名前20%的学校为高分段院校, 21%~70%为中间段院校,71%~100%为低分段院校。(注: 排名指的是按院校投档线的分数从高到低排序形成的排名,比例可以视不同省份的数据酌情调整。) 以江西省2016年文科一批数据为例,2016年文科院校数为204所,其高分段则为前48所院校,如图59所示。2015年江西省文科一本省控线为528分,2016年则为523分,如果从投档线分数来看,差别不大,但如果计算线差,则差距相对较大,这与压线情况的线差是不同的。大家还应注意的是,在理科投档线计算线差,则差距更大。如图510所示,很明显,如果只是从线差的角度来分析,高分段的院校,线差就无法作为有效参考了。当然我们并不排除,有些省份的数据可能也适合线差,这些录取数据呈现出来的规律,一定要具体分析,不能一概而论。 二、 位次法在高分段院校中的运用 观察图59和图510的数据,我们有以下发现: (1) 高分段的上端,位次对应有些差别,但越往下,位次越呈一致化趋势。以图59数据为例,2016年复旦大学为92位,2015年复旦大学则为35位。但到深圳大学,2016年为1343位,2015年为1271位,看似位次数据相差不多,但高位位次差所对应的分数差,肯定要比低位位次差对应的分数差要大得多。 (2) 通过位次法对比发现,高分段院校投档线位次相差不大的院校数量众多。如图510所示,华东政法大学2016年位次为7532,2015年位次则为7083,2016年1分的位次差为590分数位次7532减去591分数位次7215,为327,2015年1分的位次差为591分数位次7367减去592分数位次7064,为303,华东政法大学16位次减15年位次,为451,这样算起来,2015年和2016年相差才1分左右。再看中国海洋大学,2016年位次为6849位,2015年为6979,基本无差别。 这种数据呈现的一致性就是我们选择大学的最重要的逻辑基础。 (3) 实操演练。 假如2017年理科考生,位次为6000位,如何根据位次填报志愿? 思路: 以2016年数据为基准,参考2015年数据,分析位次,找出目标院校。 说明: 只是从选择院校的角度出发,并没有进一步地根据专业优化选择。 江西省录取规则: 一本平行志愿填报10所院校(同分院校并列,可根据自身需求进行筛选)。填报院校如图511所示。 印证: 以2017年的录取数据来看一下初步填好后的录取结果,见图512,如果完全按照上述顺序,则被第三志愿北京科技大学录取,基本符合预期,高出投档线1~2分。 图59 图510 图511 图512 第五节数据分析方法之三: 院校排名法 从第四节我们发现,不同的分析方法,是从数据规律中提炼出来的,那除了线差分析法、位次分析法,从数据中我们还能看出什么规律吗?实际上,高考投档线数据除了提供分数(对应线差法)、分数位次(对应位次法),还有一个数据是很多考生和家长忽略的。这个数据不是自然生成的 ,而是要手工进行排序的,是根据每年的院校投档线,对院校进行排名。 一、 院校排名法的基本逻辑 每一所大学在考生和家长心目中的地位是不一样的。清华、北大为什么每年第一?原因很简单,在考生和家长心目中,最高分就应该去那里!财经类大学为什么这么火,分数这么高?原因还是考生和家长的认同。这种认同感和选择趋势是相对恒定的 ,不管今年的投档线如何,不管今年的高考难度如何,考生和家长自然而然会在心中排序,而这种顺序反映在投档线上,反映在院校的排名上。可以这么说,院校排名的稳定性就是选择的稳定性,这种稳定性就是规律。 二、 院校排名法的运用 高分、低分基本适用,中间分数段要结合线差法和位次法进行分析。 (1) 高分段分析。 我们以图513为例,仔细观察数据规律,就会有以下发现。 图513 虽然位次上有变化,但从高分到低分排序后形成的名次是没有太大变化的。图513把2015—2017年三年的院校排名进行了对比,从高分段数据对比来看,学校排名基本上呈一致的规律性,图中方框部分的院校,与2016年的院校排名完全一致,如果再结合位次分析法,就可以做进一步的优化分析。 (2) 低分段分析。 因为近年来二本院校调整到一本录取的数量较多,所以在运用排名法分析低分段时还要结合线差的方法。从图514可以看出,虽然线差有差别,比如2017年的新疆大学和2015年的新疆大学,但从排名来看,这所大学仍处于排名的底部。换句话说,不论线差如何,每年基本上都是这些学校垫底。抓住了这个规律,再结合线差分析,就可以实行优化填报了。 图514 作业: 根据自己的情况,到省教育考试院网站下载并整理以下数据。 (1) 近三年相应批次省控线,并按第一节的要求制作相关表格。 (2) 近三年相应批次院校投档线数据,并按第二节的格式要求整合成一张表格。 (3) 一分一段表。