five

OES, QCEW|劳动力市场数据集|职业统计数据集

收藏
github2020-05-06 更新2024-05-31 收录
劳动力市场
职业统计
下载链接:
https://github.com/mbkupfer/bls-datasets
下载链接
链接失效反馈
资源简介:
OES包含职业统计数据,主要包括就业、年龄和薪资。QCEW包含雇主报告的职业统计数据,数据可以根据地区、行业或公司规模进行切割。

The OES (Occupational Employment Statistics) encompasses occupational statistical data, primarily including employment, age, and salary information. The QCEW (Quarterly Census of Employment and Wages) contains occupational statistical data reported by employers, which can be segmented by region, industry, or company size.
创建时间:
2018-10-05
AI搜集汇总
数据集介绍
main_image_url
构建方式
OES与QCEW数据集均由美国劳工统计局(BLS)构建,前者包含详细的职业就业、年龄及薪资统计信息,后者涵盖雇主报告的职业统计数据。数据集的构建基于官方统计调查,并整合至bls-datasets库中,便于Python脚本访问。OES数据集自2014年起提供,而QCEW数据集可根据地区、行业或公司规模进行数据切片。
特点
OES数据集特点在于提供了职业的就业总数、平均工资及不同分位数的工资分布,而QCEW数据集特点在于提供按季度划分的就业 establishment 数据,包括工资、税务及就业变化等维度。两者均注重数据隐私,对部分敏感数据进行匿名处理,并在数据集中包含披露代码以指示数据可用性。
使用方法
用户可通过bls-datasets库中的oes与qcew模块获取数据,利用get_data函数根据年份、地区、行业等参数进行数据查询。例如,获取2017年OES数据只需调用oes.get_data(year=2017),而获取特定地区Q1季度的平均周收入则需通过qcew.get_data函数与相应的筛选条件。在使用数据前,用户应检查disclosure_code列以确认数据的可用性。
背景与挑战
背景概述
OES(Occupational Employment Statistics)与QCEW(Quarterly Census of Employment and Wages)数据集是由美国劳工统计局(Bureau of Labor Statistics, BLS)提供的重要资源。OES数据集包含了不同职业的就业、年龄和薪资统计信息,而QCEW数据集则涵盖了雇主报告的职业统计数据,可按地区、行业或公司规模进行切分。这两个数据集自2014年起向公众提供,对于研究劳动市场动态、职业发展趋势以及薪资水平变化具有极高的参考价值,被广泛用于政策制定、市场分析和学术研究等领域。
当前挑战
在研究领域中,这两个数据集面临的挑战主要包括数据完整性的验证,尤其是QCEW数据集中由于雇主保密性导致的某些数据不可用的问题。此外,数据集的处理和整合过程中,由于数据类型的不一致性和不同版本数据间的命名模式差异,对研究人员的分析能力提出了较高的要求。同时,如何确保数据集的及时更新与准确性,以适应不断变化的劳动市场,也是数据集维护者面临的挑战之一。
常用场景
经典使用场景
在社会科学与劳动市场研究领域,OES与QCEW数据集被广泛用于分析职业就业与薪资水平。其经典使用场景在于,研究者可通过数据集深入挖掘不同职业的就业人数、薪资分布以及行业变化趋势,进而为职业规划、教育培训及政策制定提供数据支持。
解决学术问题
该数据集解决了职业就业统计的时效性与准确性问题,为学术界提供了详尽的职业薪资与就业数据,有助于研究者准确把握劳动力市场的动态变化,从而促进相关领域的学术研究与理论发展。
衍生相关工作
基于OES与QCEW数据集,衍生出了一系列相关研究工作,如职业薪资差距分析、行业就业趋势预测及地区经济发展评估等。这些工作不仅丰富了劳动经济学的研究领域,也为社会经济发展提供了重要的决策参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

D4LA-版面分析数据集

# D4LA 文档版面分析数据集 (the most Diverse and Detailed Dataset ever for Document Layout Analysis) ## 数据集概述 D4LA是面向文档版面分析的数据集。 ### 数据集简介 包含12类文档工27类文档版面类型,详细如下: ![d4la](./d4la.jpg) ### 标注格式 ``` D4LA ├── train_images │ ├── 1.jpg ├── test_images │ ├── 2.jpg ├── VGT_D4LA_grid_pkl │ ├── 1.pkl │ └── 2.pkl ├── json │ ├── train.json │ └── test.json ``` ### 引用方式 If you find this repository useful, please consider citing our work: ``` @inproceedings{da2023vgt, title={Vision Grid Transformer for Document Layout Analysis}, author={Cheng Da and Chuwei Luo and Qi Zheng and Cong Yao}, year={2023}, booktitle = {ICCV}, } ``` ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/damo/D4LA.git ```

魔搭社区 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录