自从OpenAI在2022年11月推出其生成式人工智能(AIGC, artificial intelligence generative content, 也有人使用generative AI)产品——ChatGPT后, 整个世界都为之颠覆.生成式人工智能主要有两个主流: 大型语言模型(LLM, large language model)和扩散模型(diffusion model), 新的应用和研究每天都在加速发表.在本文中, 我们首先对大型语言模型表现出来的智能水平提出了一个严肃的问题: 它是否真的拥有像普通人的智能能力一样的通用人工智能(AGI, artificial general intelligence)能力?在本文中, 我首先提出了一个重要的假说: 作为一个封闭的系统, 通过一个大型的语言模型被设计成表示和存储人类的巨大知识和智能的能力和行为, 并配备了最高的价值标准, 即模型必须符合人类的价值, 但大型语言模型内部结构和性质并没有显示其拥有通用人工智能能力.然而, 作为一个开放的系统, 一旦我们输入一些隐含人类知识和智能的格式化文本, 我们就会突然发现, 大型语言模型的输出显示出某些人类智能和行为的特征.其中格式化的输入文本被称为提示(prompt), 提示的智能程度越高, 模型的智能输出就越好.换句话说, 大型语言模型拥有某种以prompt提示为条件的通用人工智能AGI能力.经济学研究和其他社会科学研究如政治、历史、语言学等包括了最复杂的社会形态和人类最深刻的思想, 因此本文试图通过总结其他研究者最新的研究成果来探讨大语言模型的通用人工智能是事实还是错觉?以及大语言模型其他经济功能和效用, 对于这个模型的类通用人工智能的能力, 我们总结这些研究学者的最新研究成果, 包括大语言模型的智商水平, 生成式人工智能的产业经济学, 生成式人工智能下的计算社会科学研究, 大语言模型的商业决策制定, 经济学和其他社会科学, 以及虛拟生成式人工智能经济学家的范式研究等问题.
本文首先提出采用网络爬虫文本挖掘技术, 结合新闻报道及学术研究信息数据(新华网和谷歌学术搜索网)两个数据来源, 根据预测最小偏差采用动态权重方法构建我国2002年1月至2021年12月的中国经济政策不确定指数, 研究其统计性质, 并且采用混频VAR模型融合该指数对我国11个主要宏观变量进行了预测, 实证研究发现: 1)本文构建EPU指数与现实经济政策及内外经济环境不确定一致性较高, 我国经济政策不确定指数具有时间序列长记忆特征, 对未来经济波动具有持续影响效应; 2)本文构建EPU指数对我国11个主要宏观经济变量预测优于不包含EPU指数及基于报纸信息编制的EPU指数; 3)根据混频VAR模型预测, 经济政策不确定对我国主要宏观经济波动存在负向显著效应, 我国2022年GDP增长率预测区间波动幅度为2%, 城镇登记失业率呈现波动幅度越来越大的趋势.本文采用大数据网络爬虫文本挖掘技术构建动态经济政策不确定动态指数, 避免了信息量过少导致的采样误差及媒体报道的主观偏差性, 多来源大数据文本挖掘动态权重技术可为我国货币政策不确定指数、财政政策不确定指数等其它不确定指数构建提供可行策略.
数据要素作为新型生产要素, 在数字经济发展中起着基础性、关键性作用.本文基于356份问卷调查所得的数据, 从物理-事理-人理角度探究了数据要素市场的影响因素.首先, 通过理论分析和文献梳理, 基于WSR系统方法论, 将影响数据要素市场建设的42个因子分为物理维、事理维和人理维; 其次, 基于物理、事理、人理分别进行主成分分析, 从中提取影响三个维度的重要因素; 最后, 根据所提取的重要因素, 通过验证性因子分析, 构建数据要素市场影响因素模型.实证研究表明, 数据要素的供给是关键, 数字技术的突破是基础, 数据价值的测度是前提, 数据收入的分配是动力, 数据安全的保护是底线, 专业人才的培养是重点.最后, 提出了突破关键数字技术、加强市场制度设计、制定数据产权法、加快专业人才队伍建设等政策建议.
共同富裕是社会主义的本质要求, 是中国式现代化的重要特征.研究基于收入不平等视角, 以中国家庭金融调查(China household finance survey, 简称CHFS)数据考察了数字经济对共同富裕的影响机制与影响效应.实证结果表明: 1)数字经济能够显著地缓解居民收入不平等, 通过内生性处理与相关稳健性检验后该结论仍然成立; 2)机制分析表明, 数字经济通过缓解家庭流动性约束、提升居民创业活跃度以及扩大居民社会网络等渠道从而有效降低居民收入不平等; 3)异质性部分显示, 数字经济对居民收入差距的降低效果在中西部省份、农村和数字经济发展程度较低的区域中更加显著, 尤其在受教育程度较低、金融素养较低和数字鸿沟较高的居民家庭中更为显著, 这体现了数字经济的普惠性.扩展讨论结论表明, 数字经济分指数均能显著缩小居民收入差距, 其中数字化效率提升分指数形成的数字红利对居民收入差距的增益效果更大.因此, 本研究为推动我国数字经济发展及促进共同富裕提供了理论支撑和经验证据.
本文使用中国A股的日内高频交易数据, 采用集成神经网络算法实现了针对知情交易行为的精准识别并证实A股市场中存在与股票知情交易程度相关的定价异象.研究发现: 知情交易者的交易手法主要包括首尾盘操纵和策略化下单, 具体表现为首尾盘时段内量价指标的异常变化和日内买卖价差、订单簿深度的短期突变, 上述特征均可被本文建立的模型所捕捉.进一步研究发现, 由于信息不对称所导致的流动性风险使得具有高知情交易倾向的股票需提供额外的风险补偿以吸引普通投资者的进入, 基于本文计算的知情交易指数所构建的多空组合每月可获得1.38%的等权收益率.此外在市值规模较大、流动性较高、机构投资者和大股东持股比例较高的股票中组合收益更加显著.本文的研究对于完善金融市场监管、提升资本市场定价效率具有一定的启示意义.
社交媒体是股市投资者获取金融信息的重要来源, 其中携带的情感等信号与股价走势关系密切.但社交媒体信息表达随意, 口语化严重, 长度较短且语义密度低, 使得基于情感词典的传统文本分析方法存在损失有价值词汇的风险.近期
环境污染的治理是中国发展的重要议题, 污染物的减排必然面对一定的成本.在环境保护与经济发展的权衡取舍下, 减排责任的合理分配成为了环境政策制定的关键抓手.然而, 如何通过减排责任的最优分配来实现全社会减排成本的最小化?这一核心问题仍然缺乏理论回答.对此, 本文提出了一个“效率优先, 公平补偿”的兼顾公平与效率的污染物减排新思路, 并基于中国六大高耗能行业的二氧化硫减排进行模拟分析.利用企业级数据和方向距离函数方法, 本文测算了边际减排成本并构建了边际减排成本曲线, 以此定量验证了本文减排新思路下减排总成本的最小化和福利改进.结果表明: 按照六大行业每年减排1%的目标计算, 相比于“按排放比例分配减排量”的传统方案, 本文的“两步走”方案能够使社会总体和每一个排放主体都节省高达97.67%的减排成本.此外, 污染物边际减排成本的行业间异质性得以凸显, 边际减排成本曲线的应用价值得到体现.在减排责任分配的方案设计和边际减排成本的微观估计方面, 本文提供了有益的参考.
金融结构对经济增长的影响是多年来国内外学者研究的热点问题, 且学者们的研究结果存在差异, 没有得出一致的结论.基于金融结构对经济增长影响的36篇文献、385个实证研究结果, 首先, 应用Meta效应值分析从文献角度将学者们的研究结果进行综合分析, 得出金融结构对经济增长影响的一般性结论, 并进一步探究文献研究结果是否存在发表偏误问题.其次, 通过构建Meta回归模型, 对造成文献研究结果存在差异的因素(指标选择、传导路径、时间、区域、理论基础、效应特征)进行深入探究.综合学者们的差异性研究结果发现, 金融结构对促进经济增长具有正向推动作用.文献中金融结构与经济增长影响的差异性更多体现在传导路径、理论基础和效应特征因素上, 而不是时间效应、区域效应、金融结构变量选择.在传导路径方面, 金融结构通过技术进步促进经济增长的作用强度小于通过产业结构、制度约束促进经济增长的强度.在理论基础方面, 基于新经济地理学理论、新古典增长理论、柯布-道格拉斯理论的研究金融结构与经济增长的相关性强, 基于金融结构理论与最优金融结构理论的研究相关性弱.在效应特征方面, 门槛效应可能会导致金融结构影响经济增长的数值偏小.
我国当前正在构建绿色金融体系, 而包括ESG (environmental, social, and governance)在内的社会责任投资理念将在此过程中扮演重要角色.本文利用基金持股的加权平均CSR (corporate social responsibility)评分来度量基金社会责任, 并从基金暴跌风险的视角探讨了社会责任投资在资本市场中的表现以及对应的机制.基准回归结果表明基金社会责任能显著缓和基金暴跌风险, 呼应了既往研究中企业CSR降低股价暴跌风险的结论.在控制反向因果、选择偏误及其它内生性问题后该缓和作用依然稳健.机制分析表明, 高基金社会责任的基金有适当范围内更高的持股集中度, 且面向因重视社会责任而对财务收益相对不敏感的投资者, 这些都有助于降低基金暴跌风险.在经济高质量绿色发展的要求下, 本研究对于全面认识我国社会责任投资理念与金融系统风险之间的内在联系具有重要的理论和现实意义.
信息处理成本可以影响公司层面信息传递.本文以上交所和深交所2009年起要求上市公司披露XBRL财务报告为准自然实验, 研究信息处理成本降低与公司层面信息传递之间的关系.实证结果表明, 公司采用XBRL财务报告后, 股价中公司层面的特质信息增加; XBRL的实施对会计信息透明度较低的企业更好; 与国有控股企业相比, 非国有控股企业实施XBRL财务报告效果更显著.不同的公司层面信息的度量指标、不同的回归模型以及安慰剂检验都支持以上的结论.
本文提出了降维数据预测方法和组合预测相结合的一种新方法, 旨在通过模型组合避免选择降维数据预测方法造成的不确定性和降维过程中信息损失.以122个宏观经济因子和14个技术指标因子预测SP500股指超额收益为实证对象, 利用单变量预测、单变量预测组合、降维数据预测和降维数据预测组合等进行预测评估.研究发现: 第一, 样本外拟合优度(ROoS2)表明降维数据预测组合优于三种降维预测方法, 落后于单变量VOL(1, 9)和单变量预测组合.确定性等价收益(CER)显示降维数据预测组合优于单变量组合预测, 落后于单变量VOL(1, 9)预测和主成分分析预测.两方面综合结果说明降维数据预测组合均衡兼顾了统计上的预测精度和经济上的收益.第二, 不同经济周期和不同风险厌恶系数的结果表明降维数据预测组合方法是均衡稳健的.最后, 针对组合预测包含的信息提出一个简单的计量检验方法, 检验结果表明组合预测能够利用降维数据预测最优的模型的信息, 避免单一模型造成的信息损失.
增强市场流动性是我国证监会推出融资融券制度的初衷之一, 然而相关研究中关于融资融券的实际效果如何的结论并不一致, 且研究中的内生性问题一直未得到解决.本文从价格影响和交易成本两个维度实证研究了融资融券交易对沪市A股股票流动性的影响.基于融资融券标的范围调整方式, 本文使用断点回归处理了相关研究中一直未能解决的内生性问题, 并发现在价格影响维度, 融资融券交易会在市场温和波动时缩小价格影响(改善流动性), 在市场大幅波动时扩大价格影响(恶化流动性).随后本文对投资者的融资融券交易模式进行了识别, 发现投资者在不同市场波动程度下呈现出不同的交易模式, 从而对这种差异性给出了可能的解释.而在交易成本维度, 本文发现只有对于信息不对称程度较低的股票, 融资融券交易才可以降低其交易成本(改善流动性).
产品的在线评论作为一种网络口碑对消费者选择产品和商家改进产品质量都有着重要地作用, 电商平台为了获取更多在线评论, 采取了奖励措施来促进用户发表评论.现有文献研究了好评奖励对评论效价的影响, 而本文进一步考虑用户的异质性, 探究了奖励政策对于不同类型用户群体的评论效价和评论质量两个维度的影响.以亚马逊和当当网在卖的84本图书102, 175条评论的真实数据为例, 采用计量经济学中的双重差分模型进行实验, 结果表明奖励政策对评论效价和评论质量都有显著的影响, 具体地, 奖励政策对用户评分和评论文本长度有正向影响, 对评论有用性有消极影响, 且不同满意度的用户群体对于奖励的反应存在不同.最后基于实验结果提出了相应的管理启示, 可辅助在线平台制定合理的评论奖励政策.
股票市场波动率的准确预测对于投资者预判股市走势、优化资产配置和规避风险以及监管机构预警风险和稳定市场秩序等都具有重要的理论和现实意义.本文在基于高频数据的HAR模型基础上, 融合机器学习中的Lasso和随机森林方法进行模型特征选择, 采用神经网络方法刻画变量间的非线性特征, 构建了几类崭新的已实现波动率模型, 并实证评价和比较各类模型对股票市场已实现波动率的预测性能.实证结果表明: 跳跃成分的引入可以提高股票市场已实现波动率的样本外预测精度; 基于Lasso和随机森林进行特征选择的HAR扩展模型的样本外预测性能明显优于传统的HAR模型和GARCH类模型; 采用神经网络方法刻画波动率的非线性特征能进一步提高模型的样本外预测精度; 在所有考察的预测模型中, Lasso-NN-J模型的样本内和样本外预测性能最佳, 并且在不同的预测滚动窗口宽度、不同的个股高频数据以及随机抽样模拟检验下, 该模型的样本外预测性能相当稳健.