全国人口普查是由国家制订统一的时间节点和统一的方法、项目、调查表,严格按照指令依法对全国现有人口普遍地、逐户逐人地进行一次全项调查登记,数据汇总分析报告,普查重点是了解各地人口发展变化、性别比例等,全国人口普查属于国情调查。
人口普查的主要指标主要分短表和长表,短表是基本信息,全部填报,主要包括:
姓名、家庭人口数量、性别、居住面积、与户主关系、出生时间、民族、居住地点、户口登记地、户口性质、是否识字、受教育程度等。
长表是额外信息,抽样填报,在短表信息的基础上,增加了住房情况(住房用途、建筑层数、承重类型、居住面积、房间数、是否合住、是否自来水、炊事燃料、有无厨房、有无厕所、可否洗澡、住房来源、购建费用、月租、管理方式、住房类型)。
居住地变更情况(户籍地、居住地、离开户籍地时间、离开原因、出生地、五年前常住地)。
经济情况(上周工作情况、行业、职业、收入、三月内是否找过工作、能否工作、社保情况、收入来源)、婚育情况(婚姻情况、初婚年月、子女数、生育情况)等。
有的人可能会问:为什么要做人口普查?公安局不都是存信息的吗?实际上两者的目的就不同。
人口普查的目的是全面掌握全国人口的基本情况,为研究制定人口政策和经济社会发展规划提供依据,为社会公众提供人口统计信息服务,而户口登记则是为了维持社会秩序,保护公民的权利和利益,服务于社会主义建设,制定本条例。
大数据除了能帮忙统计分析人口数量、粗略位置外,其他信息很难获得,或者很难获取真实、准确、全面的信息,所以基本是不可替代的。
随着技术的发展和国家各大部委信息化共享,未来有可能会逐步使用信息化手段掌握部分普查信息。
大数据预测和抽样调查纠参,也就是通过大数据进行分析预测,配合抽样调查进行纠正参数,因为每个地区的人口密度都是不一样的。
人口普查其实不需要绝对准确,相对准确就可以,能够满足以“万”或者“千”的精度就可以了。
大数据从哪里来?目前掌握大量数据的有国企和私企。官方背景的有:
1.三大运营商手机定位,优点是实时性,准确性,缺点就是定位较粗,任何一家都不能覆盖全部,加总后需要去重,有部分老人孩子没有手机设备。
2.公安户籍身份证号的优势是全面准确,缺点是并非实时,很多已去世的老人销户迟滞;不全面,众所周知的原因有黑户未上户口。
3.社保数据的优势是量大,实时,缺点是全覆盖,但仍有未覆盖的。
4.医院出生记录的优势是准确实时,缺点是2000年以前有大量人口未在医院出生。
5.教育局及学校的优势是掌握了相当数量的学龄人口,缺点就是不全面。
6.扶贫办的优势是掌握了大量互联网等途径无法掌握的人口情况,缺点也是不全面。
7.水电煤国企的优势是城市地区几乎全覆盖,缺点是农村不全面。
8.银行账户的优势是大量,准确,详实,缺点也是不够全面。
9.非官方背景掌握大量数据的还有百度、阿里、腾讯,这种企业的优势在于实时、量大、详实、易于分析,缺点是分别覆盖不全面,其中最全面的可能是腾讯。
可以看出,有官方背景的企业掌握的数据最全面、最优质,但也都不全面。这些具有官方背景的单位或企业大部分自己都没有全国的数据,都是各地方独自掌握,谈何分享给统计局。
最简单也最迫切的婚姻登记全国联网,也是前几年才完成的,造成全国有大量的重婚情况。换一个城市,拿着合法的身份证就可以再次结婚,还不涉及什么大的利益分歧。
这么看,用上信息化的单位或企业,集中获取数据的成本最低,比如三大运营商、公安、社保、国家电网、百度阿里腾讯等,数据也相对准确。
现阶段大数据如何帮助人口普查呢?
在普查前,需要提前通过空间大数据分析,搞清各地区人口大致数据,方便划分普查区及安排调查员数量。通过大数据分析提前分析调查对象情况,不同调查对象采用不同调查手段,“增速降费”。
对可自主填报的,多宣传通过微信小程序等手段进行自主填报。不可自动填报但有人辅助的,多宣传上面这波人帮忙填报,对不可自主填报的,动员调查员上门调查。
通过大数据分析,提前了解危险区域,保障调查员人身安全。
在普查中,使用大数据技术,分析数百万调查员的调查行为,给予调查提示、降低调查成本、提高调查效率,实时统计汇总调查对象行为。
通过互联网技术,减少调查员重复上门调查次数,实时汇总统计分析调查成果。
在普查后,通过大数据做好成果分析和应用,为下一次调查做好准备,逐步降低普查成本,提高调查效率。
END