five

GME Data|股票市场分析数据集|GameStop股票数据集

收藏
github2024-05-23 更新2024-05-31 收录
股票市场分析
GameStop股票
下载链接:
https://github.com/tangentstorm/gme-data
下载链接
链接失效反馈
资源简介:
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

Data related to the 2021 GameStop stock activity, including daily consolidated GME short volume data, daily failed delivery data, number of shares available for borrowing, options chain data, and open/high/low/close/volume bar charts across different time frames.
创建时间:
2021-03-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
GME Data数据集的构建基于对Gamestop股票(NYSE: GME, XFRA: GS2C)及其相关交易所交易基金(ETFs)的深入分析。数据集的构建过程涉及从多个权威来源获取原始数据,包括美国证券交易委员会(SEC)和金融业监管局(FINRA)。通过自动化脚本,如`finra_shortvol.py`、`borrowable.py`和`ftd.sh`,定期获取和处理这些原始数据,生成每日、每两周和每15分钟的更新数据。此外,`wb-opts.py`和`ibkr_bars.py`脚本用于从Webull和Interactive Brokers获取期权链和K线图数据,确保数据的全面性和实时性。
特点
GME Data数据集的显著特点在于其高频率和多维度的数据更新。数据集不仅涵盖了Gamestop股票的每日空头交易量和每两周的交割失败数据,还提供了每15分钟的借入股票数量和每5分钟的期权链数据。此外,数据集还包括不同时间框架的K线图数据,如每小时的OHLCV数据,为分析提供了丰富的历史背景。这些数据的高频率更新和多维度特性,使得GME Data成为金融分析和算法交易领域的宝贵资源。
使用方法
GME Data数据集的使用方法多样,适用于金融分析师、量化交易员和学术研究人员。用户可以通过访问`gme`目录下的各类数据文件,获取Gamestop股票及其相关ETFs的详细交易信息。例如,`shortvol.txt`文件提供了每日的空头交易量数据,而`ftd.txt`文件则包含了交割失败数据。对于需要实时数据的用户,可以通过运行`crontab.txt`中的定时任务,自动更新数据集。此外,数据集的构建脚本和原始数据文件也提供了透明度和可重复性,便于用户进行深入分析和验证。
背景与挑战
背景概述
GME Data数据集聚焦于2021年GameStop股票(NYSE: GME, XFRA: GS2C)的活动,由一群匿名的研究人员或机构创建。该数据集的核心研究问题围绕GameStop股票的市场行为,特别是其短期交易量、未能交付的数据以及可借股票的数量等。通过提供详细的每日、每两周和每五分钟的快照数据,GME Data为金融市场的研究者提供了宝贵的资源,有助于深入分析和理解股票市场的动态行为,尤其是在高度波动的市场环境中。
当前挑战
GME Data在构建过程中面临多重挑战。首先,数据来源的多样性和复杂性,包括从SEC、FINRA等官方机构获取的原始数据,以及从Webull和Interactive Brokers等交易平台获取的实时数据,增加了数据整合和处理的难度。其次,数据的高频更新需求,如每五分钟更新的期权链数据和每15分钟更新的可借股票数据,要求高效的自动化数据抓取和处理系统。此外,确保数据的准确性和一致性,特别是在处理高波动性股票数据时,也是一个重要的挑战。
常用场景
经典使用场景
在金融分析领域,GME Data数据集的经典使用场景主要集中在对GameStop股票及其相关交易所交易基金(ETFs)的市场行为进行深入分析。通过该数据集,研究者可以获取GameStop股票的每日合并空头交易量、每日未能交付数据、可借股票数量以及不同时间框架下的开盘/最高/最低/收盘/成交量数据。这些数据为研究市场操纵、投资者行为以及市场流动性提供了宝贵的资源。
解决学术问题
GME Data数据集解决了金融市场中多个重要的学术研究问题。首先,它为研究市场操纵行为提供了详细的数据支持,特别是通过分析空头交易量和未能交付数据,可以揭示潜在的市场操纵模式。其次,该数据集有助于研究投资者行为,通过分析不同时间框架下的交易数据,可以深入了解投资者的情绪和决策过程。此外,该数据集还为研究市场流动性和价格发现机制提供了实证基础。
衍生相关工作
GME Data数据集的发布催生了一系列相关的经典工作。首先,许多研究者利用该数据集进行了深入的市场操纵行为研究,发表了多篇高影响力的学术论文。其次,该数据集为金融科技公司提供了开发新型金融工具和算法的基础,推动了金融科技的创新。此外,GME Data数据集还激发了社区对金融市场透明度和监管政策的讨论,促进了相关政策和法规的完善。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ROBEL

ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。

arXiv 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录