格局·相关性·方法论——领域应用中统计研究的聚焦1
Paradigm, Relevance and Methodology: The Focus of Statistical Research in Field Applications
收稿日期: 2022-06-20
基金资助: |
|
Received: 2022-06-20
Fund supported: |
|
作者简介 About authors
邱东,教授,博士,江西财经大学讲席教授,研究方向:国民经济核算、经济测度、国际比较、中国统计改革与发展、多指标综合评价方法、可持续发展、宏观调节与区域发展等,E-mail:abcdqiu@sina.com
本文在内容上是《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》2的续篇, 试图从更为一般性的角度进一步探讨“应用统计方法研究”相关的“学科规范”问题, 即数理统计方法在社会经济领域应用过程中应该侧重做什么和怎样做, 关键是为什么这样做.全文分为三个部分: 研究的格局、研究的相关性和应用过程中的方法论研究.研究聚焦所面临的第一个选择是: 偏理论, 还是偏应用?这需要把握好研究的学科格局.进而对论题的聚焦则需要注重“研究的相关性”, 否则实证就失去了其不可或缺的社会经济意义.要达成实证研究的“内在一致性”和“外在一致性”, 统计学者应该充分发挥自己的专业优势, 深入开展“统计应用方法研究”, 其内涵便是本文试图概括阐述的, 以便统计实证奠基于方法应用的“机理”.统计应用过程也需要方法论研究, 这便是本文的核心观点(聚焦点).
关键词:
In terms of content, this paper is a sequel to the paper of "The Focus of Data Science Applications in the Socio-Economy: On Statistics at a Crossroads: Who is for the Challenge?", and attempts to further explore the Discipline Norms related to Applied Statistical Methods Research from a more general perspective. That is, when mathematical statistics methods are applied in the field of Socio-Economy, what should be emphasized and how to do, and more importantly, why to do so. The paper divides into three parts: The paradigm of the research, the relevance of the research and the methodology in the application. The first choice facing the research focus is: Theory or application? This requires a good grasp of the discipline paradigm of research. Furthermore, the focus on the topic needs to pay attention to the "relevance of research", otherwise the empirical research would lose its indispensable Socio-Economic significance. In order to achieve the Internal Consistency and External Consistency of empirical research, statisticians should give full play to their professional advantages and carry out in-depth research on statistical application methods. Its connotation is the mechanism summarized and expounded in the paper that statistical demonstration supports the basement to the application of the methods. The processes of statistical application also require methodological research, which is the core point and focus of this paper.
Keywords:
本文引用格式
邱东.
QIU Dong.
统计无所不在. 业内人士为这种普遍存在而自豪, 然而相反相成, 正因为存在这种弥漫性(也即"无指向性"), 往往让学统计的人、甚至搞统计的人找不着"北", 缺乏专业发展的方位感. 特别是数理方法在社会经济领域应用中, 统计研究到底应该聚焦在哪里? 往往容易出现种种疑惑, 故应深入探讨以拓展认知. 如对研究重心不知所措, 所谓论文自然就容易沦为"大作业", 实证分析就容易沦为"虚证分析", 或人们所诟病的"伪计量", 这是社会经济定量研究中值得警惕的流行病, 它从反面告诉我们, 对学科如何规范发展进行探讨, 确实很有必要.
1 对研究格局的认知和把握
无论哪个学科, 研究者通常都愿意强调学术观点的创新, 然而, 研究格局的把握更为重要. 相比其他学科, 格局对统计相关学科尤为重要, 因为一个最为基础的道理: 分布是统计的底色. 无论是公开揭示, 还是隐秘蕴含, 统计理论和方法的所谓好坏1, 往往只是相对于特定分布而言. 只有切实把握了自己所面对的学科格局, 研究者方能恰如其分地确定其"专业定位", 进而在研究中较好地聚焦于对其合适的论题, 提升其研究的生产率.
1东北师范大学史宁中教授曾经说过: 数学是关于对错的学科, 而统计学是关于好坏的学科.
本部分第一小节先一般性地描述知识状态迁移的格局; 第二小节分析统计学在人工智能时代所面临的严峻态势; 第三小节强调纯理论、纯方法论研究与应用研究的区分; 第四小节则提出区分"定量分析小循环"和"定量分析大循环".
1.1 知识状态迁移的格局
首先尝试用一张图描述从学生到学者知识状态迁移的格局, 见图 1 "知识状态类别图"2.
图1
2人通常需要两种类型的学习: To learn something about everything and learn everything about something.
如果坚持努力学习, 究竟能学成什么样子呢? 学习行为的格局大致可以分成四类:
第一类, 陈景润式的专家. 现在专家的称号到处用, 其实少数人能成为真正的专家. 不过相反相成, 有些专家过于专业, 在其知识领域外, 这类专家竟然可能显得比较平常, 甚至容易被人误解为弱智.
第二类, 百科全书式人物. 这里且以亚里士多德为代表. 天才的成就似乎难用后天努力来解释, 此类人物当然颇为稀少3. 而到了知识大爆炸和学科分工极度细化的当代, 真博士更是凤毛麟角.
3"格格不入"的爱德华
第三类, "茶客". 这个称呼取自四川街头的独特景观, 他们有空就在那里喝茶聊天, 似乎什么都知道, 可以信口开河. 然而单个茶客往往所知有限, 一个话题在某一位口中不会持续多久, 内容并不能真正深入下去, 需要有人"接龙". "茶客"属于社会大课堂的"学生兼先生", "不求甚解"是其特色. 不过如果要想弥补认知的广博, 这倒也是一种社会知识的补充方式.
第四类, "半八"式行者. 这是绝大多数在学之人的状态. 处于学习过程之中, 有的偏向钻研, 深度学习(deep learning); 有的则偏好通识, 倾向于"广度学习(breadth learning)".
这里称之为"半八", 一来是其在图中的线条就是汉字"八"的右侧一半4, "半八"的形态又可以分为两大类, 一类曲线是先平后降, 呈现"倒U曲线"的右半边5, 往亚里士多德先生那种又专又博的智者靠; 再一类曲线则先降后平, 呈现U型曲线的左半边, 往陈景润先生那类专家靠.
4如果纵轴放右边, 则是八字的另一半.
5厦门大学经济学院钟威博士建议做这种描述.
取名"半八"的另一个理由是提示我们自警"斤两", 与无穷现实和广袤知识相比, 个人习之所得无非"半斤八两", 还得对学、对问都保持敬畏之心. 过程持续, 人在旅途, 知识生产尤其如此, 我们往往很狭隘, 即便拿到高等学位也并非名副其实的"博士", 而好多所谓专家又往往沦为"砖家", 不可不防.
这个图的意义在于, 向学之人都应该尽可能往原点的右上方推进, 也即朝着专与博相协调的方向提升自己. 然而, 专业教育往往将人推进狭窄的胡同里, 不管受教育者的特质, 也不管毕业后被替代的可能性多大. 这个图也有助于启发多数学人, 在理论和应用这两大研究领域中, 究竟应该如何做出选择.
1.2 人工智能发展对统计学的压迫及应对
在大数据时代, 人工智能的发展呈压倒性态势, 社会变化呈现加速状态, 个人在好多时候犹如身处"过山车"上, 定位尤其艰难, 但又很迫切. 人工智能的发展导致了一种悖相: 人越来越像机器, 而机器越来越像人, 人类竟然与机器相向而行. "自然人"被"数字人"替代的可能性6究竟如何? 时间到底在谁手里? 终极追问令人茫然.
6邱东《数字人——人, 还是非人? 》, 载《统计使人豁达》, 中国统计出版社2014年版.
在这种紧迫的人生格局下, 知识生产领域也需要注意发挥学者的"比较优势", 同时也需要充分注意到往往隐含着的"比较劣势", 它与"比较优势"一体两面、密切相关. 比较还需要注意其对象, 究竟与什么比? 至少需要关注以下三个方面:
1) 人与机器比较.
人能否跑赢机器? 已经成为切实问题. 机器越发聪明, 即人类智能的"相对矮化", 对知识界的冲击究竟是什么? 如果时间在计算机手里, 则应对挑战的核心就转变为: 如何延缓"被替代"? 新闻、法律、会计……好多领域相继沦陷, "替代"正在快速进行时. 学生和学者所持"人力资本"亟待确定投资方向, 机不可失.
2) 人与人比较.
就本学科的相关学科(往往也是竞争性学科)而言, 数理统计学者与数学学者、计算机科学者、各实质性学科的领域学者相比, 哪类学者被人工智能替代的可能性比较低? 不同学科领域之间的优势和劣势又如何判断?
统计学学者与数学学者、计算机学科学者的差异可能主要在于对象空间的选择重心. 都宣称从事数据科学, 究竟谁来主导这一新兴学科? 北京大学王汉生教授曾经提出过一个判断, 统计学家与计算机科学家相比处于劣势(王汉生(2016)). 再者, 如果都强调面对现实社会的应用研究, 统计学与领域学者的比较优势又如何建立? 恐怕需要在学科大格局中深入思考.
3) 人的精力与待学习知识比.
知识界不乏聪明的头脑, 他们理解和接受知识比较快, 然而不可忽略的是其连带的负面效应, 往往缺乏深入思考和反思的机会. 很多人把所学到的认知当成一种理所当然, 甚至天经地义, 并作为拓展新知的基础和前提. 缺乏"问题意识", 头脑就容易沦为大号的知识储存器. 由此可见, 似乎聪明也需要区分不同的类型, 至少在东方知识传统中, "问"之于"学"非常重要, 是为"学问".
不管聪明与否, 学无止境, 学生和学者都面临着现实选择: "厚基础"与"宽口径", 精力究竟如何分布, 即面对"深度课程(depth courses)"和"广度课程(breadth courses)"这两类, 时间如何分布? 有一点需要明确, "打基础"的工作其实无法彻底完成. 你学到的知识越多, 你所意识到的未知世界的边界(即你的未知与已知的边界)越长, 则你"已知的未知"越多7. 传统的"仓储式"学习方式与当代知识爆炸趋势相悖, 学习精力中深度和广度间取
7The more you know, the less you know. 英文这个说法不过是学生对学习必要性的一种调侃或诡辩.
统计学习和研究到底应该聚焦在哪里? 首先要明确学科格局, 而且要注意发挥学习安排的自主性8. 学习效用优化的前提, 是学科格局把握得好, 而把握统计学的学科格局, 我们应该特别关注两个统计学学科报告9.
8笔者相关的经验之一是: 处理好"规定动作"与"自选动作"的关系, 前者及格即可, 后者则力求优秀, 这样整体学习效果会比较突出.
9Lindsay, Kettenring and Siegmund (2004), He, et al. (2019). 笔者称之为"LKS报告"和"HMYW2019统计学报告". 在《"LKS报告"对经济统计学的启示》和《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》中, 笔者提出了对这两个学科报告的评价.
1.3 纯理论、方法论研究, 还是应用研究
明确了学科格局, 就需要做出一个方向性的选择, 本人的统计研究到底应该聚焦在哪里? 格局把握的第一条, 或者说需要明确的一条基本界线, 是选择做统计学纯理论、纯方法论的研究, 还是做"应用统计方法研究"10?
10邱东: 《从市场实现看应用统计方法研究的桥梁作用》, 载《统计研究》2001年第4期, 收入邱东《谁是政府统计的最后东家》(统计百家丛书)中国统计出版社2003年版, 也收入《经济统计学科论》, 中国财政经济出版社2013年版. 严格而论, 纯理论、纯方法论研究与应用研究二者之间并没有绝对界线, 但是对两个取向做出区分, 有利于人力资源的有效分布.
从社会需求和个人素质看, 恐怕多数人选择后者——从事理论或方法在某个领域的应用. 任何偏好都基于特定约束, 如果不考虑自己面临的内外两方面约束, 随心所欲, 就容易撞墙11.
11这种墙倒未必有形, 可"玻璃墙"就是让人难以真正达成原本的求真意愿, 除非存心甘当南郭先生.
如果选了做"应用统计方法研究", 就得认真看看, 这种研究到底应该是个什么模式, 也就是其"学科规范"问题. 这里要注意, 本文特意用了引号, 指明这种研究应该落实在应用阶段的方法论思考, 特别强调这种研究与领域学者的"统计应用研究"还有所不同.
领域从业者只是把统计方法当成工具, 可用的数理工具多着呢, 人家未必在乎某种工具的效用改进. 然而高质量的实证研究, 为了得出更合乎现实的科学结论, 也往往得同时注意定量方法的改进和数据质量的提升, 这也正是统计学者的专业优势所在. 如果统计专业出身的学者也停留于方法"套用", 甚至在方法使用上都不比人家高明, 那这份研究就失去了其应有的价值. 你会的人家也会, 反倒是人家的"领域知识"你不大会, 如果没什么研究的"增加值", 所谓研究就容易被边缘化. 好多人搞不清楚12其中的蹊跷, 于是生出许多麻烦.
12如果过于明白这个道理, 也容易走投机取巧的路子, 应用就沦为"应付差事".
显然, 统计方法并不是统计专业学者"专利", 你能用, 别人也可以用, 而且, 好多"别人"用得未必比你差. 到了人工智能时代, 甚至机器都会来抢饭碗. 不能抱怨这种专业竞争, 方法发明出来, 就是给大家用的, 统计方法在任何意义上都属于公共产品. 这样一来, 统计专业学者在应用过程中的优势到底在哪里? 本专业的增加值究竟体现在哪里? 就得好好琢磨了.
笔者一直强调: 应该是方法"应用"而不是"套用", 别看只是一字之差, 研究的格调立见高下. "纯理论和纯方法论研究"可以只在抽象空间13思考, 偏重于方法的数理逻辑自洽——"内部一致性". 而"应用统计方法研究"则须聚焦于方法与研究对象的"匹配性", 也就是方法的"外部一致性", 即"应用"的"应". 只有"相应", 方法才确实有其效用, 其代价便是应用场合的约束, 便是选择方法"应用"随之而来的"紧箍咒".
13由于空间的同质性, 自然可以天马行空, 不必脚踏实地, 外人嫉妒不得.
两种"一致性", 内外有别. 既然选择了做应用研究这份差事, 就不能再顽固地端着"纯理论研究"的架势, 得有面对现实、甚至虎落平阳的心理准备. 背熟了几种工具的使用说明书, 未必可以凌驾四方, "占领军"的心态可要不得, "重理论、轻应用"的高位姿态也不得不放弃.
尤其是在社会经济领域, 面对的是"复杂有机现象", 更需生敬畏之心. 对研究者而言"实地"未必净土, 既然投身应用领域, 就不可无拘无束地天马行空, 就得脚踏实地——自恃高贵的"脚"就得往"实地"上"踏"——即追求"外在一致性". 实践结果会警告我们, 方法"应用"并没有"公式套用"那么简单, 其一, 研究往往面临多重不同类型的不确定性, 究竟如何处理, 莫衷一是. 其二, 在领域应用时, 数据和方法的"可调整空间"比较大, 但不可因此暗自得意, 莫忘了有一利必有一弊, 反之亦然. 调整的权力大, 研究者的学术责任也大, 故而, 应用过程中也需要方法论的思考.
1.4 "定量分析小循环"和"定量分析大循环"
究竟如何理解应用过程中的统计方法论研究? 我们可以通过论文的一般构成格式来理解这一点. 众所周知, 海外学术期刊发表论文也有不可或缺的构成要素14. 择要而言, 统计应用研究类论文包括以下五个部分: 论题综述、投入数据、定量方法、数据结果、相关对策建议. 如图 2 "定量分析过程图"15所示.
图2
14早年中国科举考试有所谓"八股"之说, 古今中外, 大道相通.
如图 2所示, "定量分析大循环"包括了五个部分, 所谓"循环"是指其构成部分的多轮次互相作用, 这确定了应用统计方法研究和高质量实证研究的基本格局, 与"定量分析小循环"相比, 主要的区别自然在于"论题综述"和"相关对策建议"这两部分, 要保证"外部一致性", 关键在于"小循环"中所用是数据和方法与论题是否相应, 而对策建议是否独出心裁, 正检验了这种相应性的程度.
相对而言, "定量分析小循环"仅包括其中数据和方法三个部分, 数据和方法之间也应该多轮次地相互作用, 但这种相互作用不能局限于自身, 那就成了"没头没尾的大作业", 定量研究失魂落魄, 论题综述和对策建议成了摆设. 须知, 数据与方法调适的"缘由"或"动力"乃至"依据"正来自于大循环中的定性分析两个部分. 只有让"定量分析小循环"实质性地成为"定量分析大循环"的有机组成部分, 才可能达成研究的"内部一致性"和"外部一致性".
如果这五部分缺乏实质性内容, 哪怕是到了研究生的层次, 所做的研究还缺乏灵魂, 有的应用型论文就像"大作业"一样, 没头没尾, 形式大于内容, 只是在数据和方法之间打转转. 这样一来, 自称的"创新点"差强人意, 严格而论, 不具备所在领域博士甚至硕士的品质, 并不合格. 这种学生毕业了, 无论到企业, 还是政府部门, 统计分析总是避不开的"本职工作", 估计届时只能应付差事, 勉为其难.
因此, 论题综述是应用研究的逻辑起点, 尤其需要"第一性思考", 需要思想的纵深穿透力, 需要发现和应对"异质性问题"的能力, 需要所用数据和方法与"领域知识"交叉的能力. 如果定量分析是在社会经济领域应用, 经济统计学便可以为此奠定基础, 从而需要构建"经济统计意识", 作为一种不可或缺的专业素养.
中国科学院洪永淼教授2016年撰文指出: "作为经济测度方法论的经济统计学, 不仅是提供定量描述经济实际运行的理论、方法和工具, 也是经济实证研究的先决条件与基础", "经济统计学面临不少挑战, 但有深厚的学科基础与巨大的发展空间, 其作用是任何相关学科均不能替代的"16.
16洪永淼(2016). 经济统计学与计量经济学等相关学科的关系及发展前景. 统计研究, (5): 3–12. 洪教授的这篇专文对两个学科的关系做了较为系统的论述, 本文专门阐述计量经济研究的数据基础, 或可视为对洪教授该文的一个补充和支撑.
2021年12月26日, 洪永淼教授还为全国青年经济统计学会做了年会的主题报告——《大数据革命和经济测度》, 分为12部分: 经济测度与经济统计学、经济测度与经济理论、经济测度范式演变、经济测度与时代背景、大数据与经济测度、高频宏观经济指标测度、文本数据与社会经济心理测度、基于估计与预测的经济测度、新型结构化数据与经济测度、数据可视化表示、大数据的代表性与测度偏差、结论与展望. 这份大容量的主题报告是基于时代背景对经济测度做出的系统阐述.
值得强调指出的是, 本文图 2中实际上列出了两门经济统计学. 国外流传好多"商业和经济用统计学(statistics for business and economics)"教材. 应该注意到, 英文名字中的for意味着"外在", 从一般到特殊, 从数理统计方法到应用领域. 不可忽视的是, 国外还有"经济统计学(statistics of economics)"的用法, 英文名字中的of意味着"内在", 所谓"内"即在经济学的学科群中, 也即economic statistics, 主体内容是宏观经济学(macroeconomics)的首要组成部分. 所谓统计之"统", 即为宏观(state), 在全球化时代则还需扩充为全球视野.
在考虑两门经济统计学对接的母学科背景时, 需要注意这么几点:
第一, "微观、宏观、计量"并不是经济学的全部内容, 只是主流学派教学安排. 经济学是"学科群", 还存在其他流派的经济学认知. 特别是, 还存在与主流学派基本观点相悖学派, 这些年来"行为经济学" "复杂经济学"等纷纷兴起, 值得注意其创新对数理方法应用影响.
第二, 一部经济学教科书往往可以用做多门课程教材, 例如财政学、国际经济学等, 也包含经济统计学基础内容. 不同国家学科分类详细程度不同, 教学内容安排方式也有区别.
第三, 经济学中的经济统计内容只是其最为基础的内容, 不能以为经济统计仅此而已. 例如, 宏观经济学第一章通常都要论述GDP统计, 作为理论阐述的基础, 看似简单明了, 但GDP测度将会遇到的种种陷阱却极少涉及. 从事定量分析的大循环, 需要充分掌握领域知识, 而经济统计学正是数理方法与领域知识的连接之桥, 仅仅掌握宏观经济学第一章的内容显然不够.
2 "应用统计方法研究"的相关性
明确了宏观的专业定位, 明确了应用研究中的统计学者的使命, 在论题的把握中就特别需要关注"应用统计方法研究"的相关性. 这里所说的相关性与我们所熟悉的"统计相关性"有关系, 但并不完全相同, 主要指向研究的社会经济意义, 是宏观意义上的相关. 本文作此番强调, 自然有其针对性和现实价值, 因为应用研究中常见的误解和误操作是, 盲目地以所谓客观性或者科学性为教条, 似乎完全可以坚守研究者的"中性"立场, 不屑于或不敢于追求研究的社会经济意义. 这种迷信正是实证虚化的缘由所在, 故而需要展开剖析.
本部分由4个小节组成: 第一小节阐述相关性在应用统计方法研究必要性; 第二小节从论文结构角度说明如何用定性分析保障定量相关性; 第三小节从三个领域说明因果关系探索与相关性; 第四小节试图打破计量模型"错但有用"的迷信, 追问应用研究的"应"之所在.
2.1 相关性为什么是应用统计方法研究所不可或缺的?
人是追求意义的动物, 而意义往往相对于研究对象的格局而言. 第一部分所说的格局主要是研究的格局, 这部分的阐述也要涉及格局, 是应用对象格局(或领域格局).
这里需要注意这样几点: 1)把握应用对象格局, 方能实现研究的意义, 统计学科是为实证研究服务的得力工具, 把握"应用统计方法研究"的相关性, 则有助于充分体现统计专业工具的价值和优势. 2)如同数学分析离不开"定义域", 关注相关性, 也是应用过程中进行方法论思考不可或缺的要素, 否则, 观念的误读和误用, 容易使得定量分析失去本应该有的意义, 貌似精确的结论却可能扭曲对社会经济现象的认知. 3)意义赋予方法以生命, 而分析相关性让这种赋予切实、持续. 4)做任何定量结论都需思考并交代出方法可行性实现语境或论域.
对实证和定量分析的学人而言, 注重相关性可能存在着某种心理障碍, 这是源自于"事实与价值二分"的悠久传统. 好多学者以单纯从事"事实判断"为己任, 试图逃开"价值判断"的烦恼. 真正能看透研究格局主客观关系的学者不多. 在《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》中, 笔者引用了达尔文先生、科学哲学家汉森先生和美国古生物学家古尔德先生的论断, 他们明确地指出了似乎比较残酷的人类认知现实——主观性从根本意义上无法从研究中消除.
关键在于, 所谓客观事实庞大且多元, 而人的认知能力却是有限的, 再聪明的头脑也只能是认知到事实的某个方面或某个部分, 哪怕是基本方面或基本部分, 但决不会是其全部. 典型的例如碳排放的"国别责任", 至少可以从: 1)现期排放总量, 2)人均排放量, 3)历史累积排放量, 4)全球生产链"链位"相关排放量等不同指标来判定, 总归需要选择一个基础指标作为研究工具或平台. 而当实证者选择采用某个指标时, 主观性就已经进入到研究当中了. 因此, 研究者不应该自以为客观, 似乎计量和实证只进行"事实判断", 似乎能完全避开"价值判断".
美国哲学家希拉里
尽管我们承认研究和认知中主观因素的存在, 还是要追求定量分析的客观性, 如同我们追求真理, 虽不可能达成终极真理, 但还是要向真理而不懈探索.
追求客观性, 应该注意到相反相成的道理, 基于这个思想, 基本对策就是"去蔽", 采取多维的思维来应对多元的事实, 就是要把隐含在所谓客观事实后面的各种主观倾向都尽可能地揭示出来, 把各种行为主体(利益相关方)的主观性都尽可能地揭示出来, 让这些不同观点交叉、冲突、博弈, 才可能形成一个比较接近客观事实的认知.
由此可见, 注重研究的相关性, 并不是刻意强化自己的主观见解, 而是让多维思维落到实处, 帮助形成更为客观的认知格局. 毛病并不在提出所谓"偏见", 因为往往"偏才得以形成新见"17, 根本问题在于不同观点的交锋太少, 而套用计量模型往往是用数值计算代替了真正的学术研究.
17笔者曾发表过《"偏"往往得以"见"》的随笔, 参见《偏, 得以见》, 广西师范大学出版社2010年版.
而且, 如果现有认知格局存在着偏差, 提出新观点时就没有义务给出一个平衡的说法, 没有义务为对方辩手提供依据, 仅提出一个方向或方面的看似单一的说法, 正是要强力去对冲已有的偏差认知, 所谓"偏执"恰恰有利于形成社会对该事物认知的一个动态平衡格局. 人们在裁判不同观点时往往会有"各打五十大板"的习惯, 所以才需要辩方各执己见.
2.2 用定性保障定量的相关性
下面就进一步剖析定性与定量相互提升的过程.
好多人觉得既然是定量研究, 那么论文主体就应该是数据和数理方法, 对论题综述和对策建议不大在意, 热衷于在数据和模型的表面打转转, 以为这才是定量分析的正事儿. 这种处理手法的狭隘, 在于把"数据"仅仅当成"数值", 局限于"定量分析小循环", 忘了"数据"是"有据之数"18, 更不懂得"汝果欲学诗, 功夫在诗外"的理儿.
18尤其到了大数据时代, 定量并不仅仅针对数字, 需要思考: 非结构化数据的存在意味着什么?
我们说某些论文"没头没尾", 就像没有研究之魂的"大作业", 并不是论文真的没列入"论题综述"和"对策建议", 而是指这两部分与数据、方法部分没有切实的逻辑联系, 只是一种形式化的存在.
特别是文后所罗列的几条对策建议, 做不做该文的定量分析都能"写"出来, 十有八九是从网上copy过来的, 其实这种结尾直接就把作者的模型运算过程及其数值结果否定了. 应用研究要得出"相应的用", "干货"就是咨询建议: 今后如何在社会竞争中相应地博弈. 如果你的判断和对策了无新意, 那辛辛苦苦的数据分析又何苦来哉? 洋洋好几万言, 用了那么前沿的新方法, 最后告诉读者: 吃饱了不饿, 怕饿多吃点, 如此云云, 不是在出洋相么?
好多人崇拜纯理性思维, 总感觉应用研究比纯理论、纯方法论研究容易, 其实未必全然如此. 起码有一点, 让真心做应用研究的人非常沮丧: 应用研究面对着现实空间——往往多元、异质、混频、随机、混沌、模糊……受到的约束比抽象空间更多.
应用理论概念和方法时, 必须进行一个"具象"的过程, 把理论和方法构建时所抽象掉的特别因素再还原到分析中, 否则, 就不会得出切实有效的对策建议.
研究就是"再寻找(re
论题综述, 针对研究得以展开的论域背景, 为什么要做这个题目? 研究的起点如何? 以往相关研究已经做了哪些工作? 得到了哪些阶段性的认知? 不同的研究者达成了哪些共识? 又各有哪些不同的见解? 从不同角度看论题, 对这些见解应该如何评价? 特别是, 已有研究存在哪些缺陷? 如果要加以弥补, 是否(或在哪些方面)初步具备了深入、提升和拓展的条件? 或者, 如何补充推进研究的条件?
概括而言, 就是要把握前人相关研究所构建的认知格局——概括而言就是"四点论": 已有认知的共同点、差异点、优点和缺点19. 明确了这四点, 研究的方位感就建立起来了, 就大致知道自己的研究应该如何下手了.
19即笔者1990年做博士论文时所强调的.
既为综述, 就不能光是"述"没有"综", 所谓"梳理"并不是平行地转录人家的话, 还得做出自己的系统评判, 是为其"综". 综述部分决定了该项研究的必要性或意义, 也决定了该项研究的出发点, 及其内容重心. 有了高质量的、真正意义上的综述, 数据和方法之间就可以"灵动"了, 不再是冷冰冰的数值计算.
2.3 因果关系的探索与研究的相关性(意义实现)
人们进行科学研究, 探索世事之间的因果关系是最为要紧的兴趣, 论题中的因素相关关系是因果关系存在和成立的前提, 所以保持研究的相关性才有助于明确对象因素间的相关关系, 也才可能深入探索世事间的因果关系.
还要看到, 因果关系相对而言是一种"紧致性关系", 而论题中各因素间的相关关系则往往是一种"松散性关系", 只有多维度地考察世事间的相关性, 才可能达成对世事间因果关系的真实认知. 计算方法和定量模型, 是对已有数量关系认知的概括, 该种关系得以成立的"有效空间"值得关注和深究, 这便是坚持研究相关性的意义所在.
然而, 不少人把现成的计算方法和定量模型当成教条甚至宗教信条, 迷信所谓科学的力量. 殊不知, 现实世界中确定真实的因果关系何其难! 哪里来那么多天经地义? 从物理世界到日常生活, 再到社会关系, 探索因果关系所带来的疑惑只会越来越多, 而且都与研究的相关性密切相关. 下面给出若干正反两方面的研究实例:
第一, 人类何以笃定成为全球变暖的主因? 2021年物理学诺贝尔奖授予了因果推断研究, 其主要研究结论是全球变暖的主要原因是人类活动. 这等于设立了一个不等式: 人类活动对大气的影响大于自然变化对大气的影响. 该式成立的前提是, 两种影响都是可测度的. 笔者的疑问20在于: 就算人类可以测度自身活动对大气的影响, 可以测度大气层内自然变化对全球变暖影响, 可是人类能够测度外空间自然变化对地球影响吗? 测度边界究竟在哪里?
20参见邱东《2021年诺贝尔物理学奖对经济测度的启示》, 载《中国统计》 2022年第1期.
第二, 吸烟与健康的弊与利. 生活中的一个典型例子就是, "吸烟有害健康"这个因果推断, 真那么理所当然吗? 在笔者看来, 该结论正确至少隐含着一个前提: 仅从生命"长度"来定义健康21. 但如果改从生命"丰度"看吸烟的功效呢? 例如, 不少人认定吸烟可能减少帕金森症的概率; 再例如, 吸烟可以构建一个改变精神状态的机制; 还例如, 吸烟可能让女士性感……这个所谓"吸烟益处"的单子还可以开下去, 都能让生命, 至少是生活, 更加丰富, 岂不是"吸烟有益健康"么?
21其实就长度看, 也有不少人并不认同"吸烟有害健康", 例如民间讲是否抽烟喝酒与寿命长短的段子, 是否抽烟喝酒的生存年龄, 从63岁、73岁、83岁到93岁, 否定了吸烟喝酒对寿命的伤害. 当然这里都说成3这个数值, 隐含着线性思维的习惯.
于是, 貌似"不二"的断言也面临着选择问题: 如果减少生命长度
第三, 学科的文理划分与有机无机划分哪个更为基本? 国人习惯将文科、理科作为学科的基本分类, 且习惯上认为理科比文科更难. 哈耶克先生将对象是否"有机"作为学科的基本分类, 并认定研究复杂有机现象的学科更为困难, 即生物学比经典物理学更难, 而社会科学应该比生物学更难. 社会科学研究需要探讨人的"自反性(reflexivity)", 这是需要采用模糊学方法、动态方法的根本性原因. 统计界都知道, 不懂生物学无法搞好生物统计, 然而对当代经济科学却表现出极端的漠视, 典型的是在实证研究中无视经济统计学, 否认学科基础, 是认知逻辑倒置的一种表现.
第四, 库兹涅茨的贡献与实证分析的全构成. 作为米契尔先生的学生, 库兹涅茨教授并不是国民收入概念及其测度的首创者, 按照罗考夫教授的概括22, 在经济统计学领域他至少有以下四个方面的创造性: 1)各种不同来源的数据如何结合, 以得出有说服力的估计; 2)探讨对测度造成困难的各种经济和哲学事项; 3)展示基于估计的有关经济发展的重要问题; 4)对一代经济学家作为"学者型导师(scholar-teacher)"典范的作用. 这个概括突显了库兹涅茨作为经济统计学大师的专业贡献, 也体现了"问题-数据-方法-方法论-问题"的全过程.
22参见邱东《社会问题导向的方法论—— < 联邦经济统计开发过程背后的论战>述评》, 载邱东(2021a) 《基石还是累卵——经济统计学之于实证研究》, 科学出版社: 90–110.
第五, "主体追问"与国势研判. 在人文社会科学研究中, 还需要提防"文明等级论"的误导和"行为主体隐身"造成的"观念误读"23. 从全球视野看, 资源和利益的分配往往偏态, 但如果采用作为"平均数科学"的统计方法进行定量处理, 数据结果却容易隐含"平均假设": 平均人、平均企业、平均国. 须知: 只定量不定性的前提是, 定性问题已经得到解决, 显然, 在社会现象的实证分析中并非如此. 明确将国家作为事实而非形式上的基本测度单位, 补充"主体追问"或"谁的追问(who's questions)", 如提升了谁的效益? 谁的可持续发展? 深究"受益主体", 有助于纠正各种国势误判.
23莫热先生专门强调指出了不同文化交流中的"观念误读效应", 值得警惕.
国势的研判, 历来都是统计学最为相关的事项, 是统计本源和社会意义所在. 选题本身就是应用研究的一种主观态度, 我们好多人掌握了那么多高精尖的计量模型和数理方法, 为什么不用来为中国的高质量发展奠定量化认知基础? 为什么听任国外恶意竞争者对中国的歪曲和诽谤? 为什么听任国内一些似是而非的说法谬传?
当下, 诸多国势判断问题需要澄清, 需要深化、拓展和提升. 例如, 中国到底是不是全球化的最大赢家? 中国究竟是不是最大的碳排放国家? "全球化"与"国家产业链完整"存在怎样的逆向关系? 美欧政客究竟是在搞"逆全球化", 还是在搞"没有中国的全球化"? 保持中国作为"最大消费群体" (市场)的可持续性, 需要注意些什么? 究竟应该如何估计一国的经济增长潜力?
反思一下前些年最深刻的教训, 放开生二胎中国人口就会激增7000万? 严重背离现实的预测. 套用人口预测模型为什么错得那么离谱? 因为活生生的人在模型里仅仅成了数字, 人之为人的属性都不见了, 这种"计量不较质"的做法对社会危害相当大. 由此可知, 模型所表现的精确性看似更为权威, 切不可四处套用. 异质性无法避免, 导致加总和比较上存在测度陷阱, 这是"应用统计方法研究"比纯理论、纯方法论研究更难的一个重要原因.
2.4 计量模型"错但有用"的追问——"应"之所在
在经济计量界流行这样一个很受用的判断: 所有的模型都是错的, 但有些是有用的24. 而且此言出自统计学名家, 于是有人便理直气壮、不分青红皂白到处搬用模型. 的确, 模型大多有其正面作用, 但恰恰因为有用的模型非常多, 我们反而不能"抄作业"了.
24George E P Box: All models are wrong, but some are useful.
做研究起码需要知道: 就特定论域而言, 哪些模型是有用的? 模型推断是客观的吗? 反对"套用", 则模型有用性判断的接续问题在于: "有用"的标准是什么? 谁制定了这个标准? 对谁、对什么事物和在哪里、在啥时候"有用"? 一旦涉及到"谁" "什么" "哪里"和"啥时候", 即"行为主体" "研究对象" "空间"和"时间", 主观性就介入了! 所标榜的"科学"和"客观"就可能打折扣了, 就需要真的"研究"了, 就需要关注研究的"相关性"了. 我们不能既以模型的"有用性"为骄傲, 同时又标榜模型的"客观性", 以精密科学自诩, 这两个判断在基本逻辑上相悖.
问题还远未完结. 进而, 所谓的这个"用"有没有成本和负面效应? 按照经济学公理, 天下没有免费的午餐, 欲其"有用", 就必然会连带产生"成本", 除了显性成本, 还有隐性成本, 换个判别思路还有机会成本, 甚至带来"负效应". 如果模型有用但同时具有正负效应的话, 那么隐含的计量麻烦就是: 每次使用模型的"净效用"又有多大? 谁来真正承担这个"净效用"? 即需要进行模型应用的"成本效益分析"25. 而且从长期来看, 模型使用成本和效益的动态过程如何? 这些问题都指向笔者所强调的应用之"应".
25笔者郑重建议对"套利(arbitrage)"做广义理解, 人们的所有行为都是一种套利. "利"不仅是利润(profit), 而是利益(benefit), 区分二者在经济测度中非常重要. 从"当事人角度"看学科问题, 对教师而言是教什么? 对学生而言是学什么? 知识的供求双方都涉及到选择, 也即套利.
从科学哲学角度看, 这也是在化解"一般性"和"特殊性"之间的基本矛盾. "模型应用"与"模型构建"正相反, 主要需要做两方面工作: 首先需要辨识, 抽象之后所形成的"一般"在此应用场合是否成立? 所要应用的计量模型对现实问题而言是相匹配的, 从而是可靠的. 其次, 应用其实是进行抽象的逆过程——"具象化", 根据所分析的现实问题, 把构建模型过程中抽象掉的特殊因素再添加回来, 这也是一种"还原"26, 即对现实世界的回归27.
26这与"还原论"中的"还原"还有所不同.
27"现场统计学会"这个概念很好, 但不宜搞成"伪现场".
模型应用时必须包含一个"具象过程", 这就是为什么需要注重"相机抉择"28本领的原因. 关键在于这个"机"字——时机? 机缘? 机理? 然而总归不是"机器的机"29, 大机器时代过去了! 经典物理学需要经历重大反思, 当下选择的大背景即为: 从"大数据时代"到"人工智能时代", 显然随着历史发展, 注重机理挖掘, 才真正达成"应用统计方法研究"相关性.
28相机抉择的英文译文似有偏颇. The discretionary (任意的、自由决定的) approach, 如果只看字面意思, 选择中不可分割的"约束"就没有表达出来, discretionary choice. 生活中"选择(choice)"是一个大词, 但肯定基于"约束", 进而, 我们日常生活中讲的"见机行事"与相机抉择是什么关系? 2004年驾校的师徒有这样一段对话. 师傅: 开车得记住一条: 该快不快是等死; 该慢不慢是找死. 徒弟: 师傅, 什么时候"该快"? 什么时候"该慢"? 师傅: 那得看现场! 徒弟过后的点评: 师傅说的并不是废话, 而是铁律. 开车必须调节速度, 但快慢不能预先确定; 不能一概而论——"看现场"就是"相机抉择".
29英文中"机理(mechanism)"这个词是从大机器时代流传下来的, 与"机械的(mechanical)"在词源上太近了, 需要使用者自警.
3 方法论——"应用统计方法研究"
在把握学科格局的前提下选择了应用研究, 对论题相关性的重视又为研究意义的实现奠定了基础, 接下来自然就是应用过程的方法论思考了, 避免在数据和方法的小圈子里"打转转", 籍此可以大大提升研究的水平和质量.
本部分包括以下四个小节: 第一小节"数据"不仅仅是"数字"; 第二小节统计方法应用经验的概括: 过程中的方法论思考; 第三小节为什么在应用过程中"方法"还需要"论"; 第四小节事理逻辑的真实连接: "定性-定量-定性"的大循环.
3.1 "数据"不仅仅是"数字"
综述部分主要解决研究的"必要性"问题, 而数据和方法部分则主要解决研究的"可行性"问题. 可行性决定了必要性的实现程度, 研究的增加值究竟能达成几何? 应用研究, 最终还是受制于可行性, 可以说多半是可行性为王. 数据和方法部分是各种可行性与必要性的博弈, 尽可能让二者匹配. 究竟应该做些什么?
2001年, 笔者提出了开展"应用统计方法研究"的七条建议30, 未必全面, 但可以作为参考, 以利于明确学科发展的方向. 其中两条是关于数据的, 一是如何分析数据以得出相关论题的正确结论, 一是如何选择数据, 如何进行数据的再开发.
30参见邱东(2001) 《从市场实现看应用统计方法研究的桥梁作用》, 统计研究第4期. 收入邱东《谁是政府统计的最后东家》(统计百家丛书)中国统计出版社2003年版, 也收入邱东《经济统计学科论》, 中国财政经济出版社2013年版.
这里要注意以下几点:
首先, "基础数据"连接着"待研究问题"与备选方法, 统计专业出身的不应该把自己当"局外人". 好多统计学学位论文在交代其研究尚存问题时, 通常都会列上一条: 由于缺少合适的数据, 本来可以使用的流行方法却无法操作, 留待将来补充云云. 检讨中还暗示自己具备了使用最先进方法的能力, 似乎应该有人把现成的数据准备好, 供自己使用, 这种"摆位"很不专业. 连库兹涅茨教授都亲自动手做数据采集和整理的基础工作, 我们的研究生居然以"数据用户"自居! 居然忘记了自己就是"搞数据的"!
其次, 如果在社会经济领域应用, 指标就是计量模型中的变量, 从而基础数据就是数理统计与经济统计的连接点. 重视数据基础结构, 也存在一个适度的问题. 例如, 有人提出的"数据导向"31其实很可能造成偏误, 因为数据本身是沉默的, 一定是某个(些)行为主体"让数据说话", 数据清洗也存在用什么方法、清洗哪些等待选择问题, 须知, "噪声"本身是相对于特定数据用户而言的32.
31在《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》中, 笔者专门强调了"数据整理方法", 以避免单纯搞数据分析的套用习惯.
32参见邱东(2019b) 《社会科学统计学者的操守——数据之"据"和应用的"应"》, 全国企业经济统计学会第13届年会论文集.
再次, 数据是研究"可行性"与"必要性"博弈的主战场, 要开展的研究应该具备哪些方面的数据, 又能够得到哪些数据, 其质量如何? 如何将不同来源的基础数据整理、协调和再加工? "数据基础结构(data infrastructure)", 不可掉以轻心.
又次, 大数据本身的数据分布特点是"厚今薄古", 越是靠近的年份, 数据就越充分, 而且往往是压倒性的充分; 而历史数据则比较稀疏, 往往只有独一份的估计值, 例如安格斯
33Maddison A, (2005). Measuring and Interpreting World Economic Performance 1500
3.2 统计方法应用经验的概括: 过程中的方法论思考
"七条建议"中还有五条涉及到计算方法34在应用过程中的方法论思考: 1)如何从论题研究的角度评判现有统计方法? 2)现有统计方法中此论域应用时需要的前提条件, 包含的假设? 3)现有统计方法应用的场合与范围? 4)不同方法应用于同一论题的比较研究; 5)不同学科方法交叉应用研究.
34这里的方法是狭义的, 单指计算方法. 如果广义地理解, 数据整理方法也是一类方法.
在应用过程中进行方法论思考, 应该注意以下几个问题:
第一, 方法是演进的, 为什么需要持续改进所得到的方法, 为什么需要方法之衍生? 例如, 抽样技术方法的演进, 从简单随机到系统抽样、分层抽样、整群抽样和多阶段抽样等等, 都有其原由, 有其各自适合的应用场景. 再例如, 随机动态一般均衡模型(DSGE)与一般均衡模型(GE)相比, 从方法增加值的理念加以分析: 在"一般均衡"的基础上, 再加上动态(dynamic)和随机(stochastic)的视角, 模型的模拟效果就比较好, 当然并不是绝对地好, 数据结果的精确性提升在什么意义上可接受? 还需要结合所分析的课题做出解释. 而且模型的改进是开放的, 是否需要再增加模糊学(fuzzy)视角35? 即是否可以搞FDSGE? 扩展而言, 恐怕可以进一步探索"? DSGE"模型.
35在《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》中, 笔者专门强调了对"模糊不确定性"的分析.
第二, 随着学科发展, 方法库越来越丰富, 通常并非只有一种方法可用于该问题研究, 这便出现了"方法选用"问题. 要避免"随大流"的做法, 不宜按照流行程度(所谓"学科前沿")来选用, 而应注重问题分析的特征性要求和数据的可得性. 这与买东西类似, 只买贵的, 不买对的, 令人耻笑.
第三, 始终保持"怀疑"的治学态度, 不管多么高深的前沿模型, 也应该深入思考其应用所面临的约束, 还有这些约束对数据结果的可能影响, 从方法"可用"提升到"好用", 才能真正得出可靠的数据结果. 同时, 这样的应用研究才能为纯方法论研究提供案例和素材, 保持本学科的可持续发展.
第四, 即便是应用研究, 也可以并应该进行"第一性思考". 笔者多次强调, 再复杂的模型也不过是加减乘除的衍生品, 因而, 模型有效的基本要求就是保持可加性和可比性. 尤其要注意, 在数学空间可加、可比, 到现实空间则未必, 所以方法应用时就需要注意论域(语境)的变迁及其影响, 否则, 结论容易出现颠覆性风险. 始终记在心头的一个问题是: 在数学和领域科学之间, 交叉学科究竟如何定位?
3.3 概述: 为什么在应用过程中"方法"还需要"论"
概括而言, 方法是活的, 真正动态(广义)的, 是有生命的, 是有灵魂的, 所以需要"论(ology)", 需要"方法论(methodology)".
"套用"之所以逊于"应用", 关键在于对"方法"的态度. 前者把方法当成固化之物, 当成没有灵魂的器具, 可以随意处置; 而在后者则对方法抱有敬畏之心, 方法本身带有生命意义, 从而, 方法需要"论", 即思想的交锋, 且需要学者们代代相"论", 其中有传承、有质疑、有争辩、有批判、有放弃、有悬置、有割舍、有添加……通过种种"论"为方法增添价值, 从而使得方法的生命意义趋于"充满".
"应用方法论要素"包括: 方法产生的背景和格局、方法的设计理念和意义所在、方法构建所需要的基础性概念及其关系、方法应用所依赖的假设和条件、方法成立的逻辑机理(如各概念节点如何切实链接等)、适于方法应用的场域及其范围、诸方法比较中的优点和缺点(局限性)、方法之间如何互相借鉴优化, 如此等等.
总体来看, 方法论研究应该是分层次的动态演化过程, "应用统计方法研究"要为"纯方法论研究"提供背景资料和案例, 也要为特定领域的量化分析提供工具支撑, 是统计方法应用到各领域的坚实桥梁, 故而需要应用过程中的方法论研究, 否则, 就难取得高质量的实证分析成果, 也难有统计方法自身的可持续发展.
强调应用过程中的方法论探索, 并不否认"一般方法论"的研究. 毋宁说, 应用过程中的方法论探索, 恰恰为"一般方法论"的研究提供了不可或缺的素材. 例如, 法兰西斯
方法论发展是方法与其应用互相促进、多轮次的完整过程, 从特殊到一般, 从一般到特殊, 构成了这个完整过程的两个方向相反的子过程. 故而, 在方法的应用过程中, 还需要进行某种逆过程——与方法构建中的抽象过程方向相反, 即需要将特殊场景因素再添加回来, 需要让一般化的方法"脚踏实地", 让理论与实践真正打通. 因其一般性, 方法自然放之四海皆可用, 但不等于放之四海而皆准, 不能将"可用"与"皆准"混为一谈. 准不准, 就得看"用"得是否"相应".
3.4 事理逻辑的真实连接: "定性-定量-定性"的大循环
如果投入数据质量高, 方法应用过程切合实际, 那么数据结果部分的质量也容易得到保障, 进而对策建议也就可能产生更好的应用效果. 顺理成章, 良性循环.
对"定量分析大循环", 笔者概括提出以下几点认识.
第一, 五部分构成一个轮次循环.
前文论述了论文格式的五个部分, 需要注意的是, 它们构成了应用研究的一个轮次的循环, 其中包含了数据与方法之间的"定量分析小循环". 强调"定量分析大循环", 论题从领域诸问题中提炼而来, 结论对应解释领域特定问题而去, 小循环在其中起到量化的支撑作用. 从定性研究, 到定量研究, 再到定性研究. 请注意, 前面的定性与后面的定性不同, 经历了"定量分析小循环", 后面的定性应该得到升华, 这也是定量分析的"增加值"所在.
第二, 定性也支撑着定量.
言说统计方法的应用, 总强调要包含定性内容, 是不是越界? 或者工作重心不对头? 请看控制论之父的教导, 维纳先生曾强调指出: 如果要仿效现代物理学, 数学经济学必须从批判地叙述这些定量概念开始. 笔者以为, 这句话至少包含了以下三个意思, 1)起点是"叙述概念", 也即定性工作; 2)叙述是动态的——应该批判地进行; 3) "概念"与"定量概念"还有所不同, 领域科学中的概念可能是"理论概念"或"定义性概念", 未必可以直接进行定量处理, 这就需要将之转化为"定量概念": "可测度概念"或"操作性概念", 在经济领域, 这正是经济统计的一项基础性工作——从概念到指标.
第三, 研究顶多得到"小结".
应用研究有了定性结论, 并非完事大吉, 严格而论, "结论"是一个非常自傲的词, 体现了某种"知识的僭妄". 世事吊诡, 人类唯一能确定的就是"不确定". 毕竟, 事情还未完结, 研究哪里就可以得出结论? 充其量可以得出一些"小结". 强调这一点, 主要是为了避免对自己的定量数据结果做"过度解读", 要知道自己的定量数据结果必定基于一定的前提条件, 如果能在某些设定下成立, 就已经是很好的研究成果了.
第四, 负面结果也有正效应.
数据和方法的高质量工作, 未必就能得出预期的数据结果及其相应结论, 但这个貌似失败的探索过程也有其价值, 甚至也可以达成一类研究成果, 应该做出总结, 在什么背景下这种数据定量分析无法奏效, 指出"此路不通", 也具有研究的增加值.
第五, 是否具有学术上的增加值?
如果对科学和知识真正怀有敬畏之心, 老老实实用量化来支撑定性, 就笃行在靠近真理的路上. 科研之路漫长, 高质量的应用研究应该是一个多轮次的循环过程. 身不由己, 寻求"外部一致性"非常艰难, 这里就需要具有经济统计中"增加值"的理念, 扪心自问, 我在这个论题上是否切实做出了创新? 推动了知识进步?
无论就学科整体, 还是其某方面内容而言, 方法改进和创新都非易事, 不可期望过高. "最优"难以企及, "次优"都难能可贵. 过于精确和漂亮的数据结果反倒需要警惕其真伪, "真计量"往往陷于难以匹配的困苦之中. 不过, "增加值"思维也有助于建立信心: 我的思考确有一二新的成分, 略加"演进"{甚至未必非得是"进化", 在多维思考格局中, "退化"也可能是一种贡献.}, 就当得起"创新"二字了.
判断认知的新旧和真伪, 也需要学科格局的把握, 格局大于观点. 或者说, 学科格局是认知创新和探索的宏观基础.
第六, 倡导"问题带方法"的路径37.
37在《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》中, 笔者专门分析了"问题导向"的研究路径.
真正研究应倡导"问题带方法"的进路, 为什么不能反过来——"方法带问题"? 因那是写教材的做法, 列出公式, 找几个算例, 再加上现成软件, 这种套路很难让学生真正掌握方法内在机理. 用教学路子来做研究, 学生迷茫多半来自于"满堂灌"的陋习. 教学固然能扩充工具库, 十八般武艺可供使用, 但好不好用, 还得在具体论题研究过程中得到某种程度的确认.
授之以渔而非授之于鱼, 应该是"授业"和"传道"之要. 既然是"应用", 就得把重心放在"应"字上. 教师采取负责任的职业态度, 就需要努力实践"授之以渔"的师者文化传统. 所谓"渔", 在这里就体现为应用的"方法论".
此外, "解惑"这个说法有个前提——所论及的"知识点"固化, 学生不懂, 需要老师解释. 其实, 知识往往还在演进过程中, 师生间、学生之间更应该是"论惑", 不仅需要解答学生提出的疑惑, 还应该努力揭示论题所隐含的陷阱和矛盾, 让学生在议论过程中增长"理解问题"的能力, 还应该增长"发现问题"的能力, 是为"研究生"之本意. 知识并不是固定的, 正是在"论惑"中勃发了生命. 现在我们的学术研讨会召开得比较多, 但真正的论点交叉却很不够, "会议"不仅要"会", 而且要"议", 为"议"而"会".
第七, 规规矩矩探讨方法"机理".
无论哪个专业或行当, 都得把事儿当成事儿, 正经做事, 不该对付, 对学者而言, 就得认真进行"学科规范"方面的思考. 即为匠人, 就该独具匠心. 匠心何在? 笔者是回答是: 应用方法时聚焦于"机理"——探索支撑着"如何"做的"为什么", 前面所讲数据与方法的七条思考, 都围绕"机理"二字展开. "脑书(headbook)"38和"手册(handbook)"俱备, 得心应手, 心手相通, 才可丰富"应用统计方法研究"的灵魂, 正经心思应该聚焦在此.
38笔者2015年在国际收入与财富协会SNA专题研讨会大会报告中首次提出, 系自创的英文单词, 以强调推进经济统计发展仅有系列手册(handbook)的不足.
第八, 避免学术研究的三种通病.
社会上做研究存在三种通病, 一是把学问只当作数学, 二是把所谓"主流"认知当作迷信的教条, 三是把知识当成了饭碗. "唯数理"的认知混淆了抽象空间与现实空间. 而认知即便成为"主流", 也未必就是天经地义. 在谋学位、求职位时或许容易出现"把学问当饭碗"的举动, 但内心应该知道所欠的"研究债", 不能循此一条道跑到黑, 捧上了饭碗, 就应该做一些真正的研究, 知识分子的良知应该让我们选择走图基先生所言的"坎坷道路".
第九, 注意"统计"一词的使用语境.
需要指明的是, 本文是在社会流行的语境下使用"统计"这个词的. 有人说, 数理统计方法在经济领域应用, 就是经济统计学. 从文理渗透、学科交叉的角度来认定, 只要不是方法"套用", 在经济领域应用时尊重"领域知识", 同时注重应用中的方法论思考, 这种经济统计学确实应该大力提倡.
不过, 社会科学领域还存在与之不同的经济统计学, 不能忘了, statistics (德文为Staaten-kunde)这个词的原意本是"国势学"39, 这门学问17世纪流行于欧陆各国, 以德国为盛. 其时英国还有威廉
392015年经济学诺贝尔得主安格斯
究竟什么是作为社会科学的经济统计学? 好多人并不清楚, 笔者2016年曾发表过专论40, 近年来系列出版的专业著述(集中体现为"当代经济统计学批判系列")也多有涉及, 还准备再撰一文做进一步阐述.
40参见邱东(2016) 《经济统计学: 从德国传统到当代困境》, 载北京师范大学学报第6期, 也收入《经济测度逻辑挖掘: 困难与原则》, 科学出版社2018年版.
1本文发端于一篇随笔, 几经交流, 演变为这篇探讨学科规范问题的论文. 成稿后曾向天津财经大学/河南大学肖红叶教授、厦门大学/吉林财经大学曾五一教授、浙江财经大学李金昌教授、浙江工商大学苏卫华教授、江西财经大学罗良清教授等征求意见. 2021年12月受厦门大学方颖教授、林明教授邀请前去做学术交流, 与经济学院部分教师做了较深入的讨论(会议交流由杨灿教授主持). 其后, 本文内容在江西财经大学统计学院和湖南工商大学统计学院做了专题讲座. 厦门大学经济学院是我多篇重要论文的"首发地", 在此向帮助形成本文思想的诸位老师表示诚挚的谢意. 本文刊发稿按照几位评审专家的意见做了修改, 观点阐述更为明确, 以利于避免歧解, 谨致衷心谢意.
2载于《计量经济学报》2021年第2期, 该文针对只认可数据分析方法、只认可随机不确定性、只认可"方法导向"这三种偏差, 提出应该注重数据整理方法、注重模糊不确定性、注重"问题导向". 而在大数据时代, 作为"数据导向"很可能成为"方法导向"的一种变形.
参考文献
经济统计学如何才能做到不忘初心
[J]. ,
How Can Economic Statistics Stay True to Its Original Purpose?
[J].
大数据时代统计学面临的机遇与挑战
[J]. ,
Opportunities and Challenges in the Age of Big Data for Statistics
[J].
经济统计学与计量经济学等相关学科的关系及发展前景
[J]. ,
The Relationship between Economic Statistics, Econometrics and other Related Disciplines and their Development Prospects
[J].
大数据、机器学习与统计学: 挑战与机遇
[J]. ,
Big Data, Machine Learning and Statistics: Challenges and Opportunities
[J].
大数据与统计新思维
[J]. ,
Big Data and New Statistical Thinking
[J].
从市场实现看应用统计方法研究的桥梁作用
[J]. ,
The Bridge Function of Applied Statistical Method Research from the Perspective of Market Realization
[J].
大数据时代对统计学的挑战
[J]. ,
Challenges to Statistics in the Age of Big Data
[J].
经济统计学: 从德国传统到当代困境
[J]. ,
Economic Statistics: From German Tradition to Contemporary Predicament
[J].
践行社会经济统计的历史使命高质量研判国势(上)——落实中共中央《十四五规划建议》精神的专题思考
[J]. ,
Practicing the Historical Mission of Socio Economic Statistics, Studying and Judging the National Situation with High Quality
[J].
数据科学在社会经济领域应用的重心——兼评《十字路口的统计学, 谁来应对挑战》
[J]. ,
The Focus of Data Science Application in the field of Social Economy-With a Review of "Statistics at the Crossroads, Who Will Meet the Challenges"
[J].
2021年诺贝尔物理学奖对经济测度的启示
[J]. ,
Enlightenment of 2021 Nobel Prize in Physics on Economic Measurement
[J].
模糊性情形下互动决策的行为探析
[J]. ,
Analysis of the Behavior in Interactive Decision-making under Ambiguous Situation
[J].
A Report on the Future of Statistics
[J]. ,
Measuring and Interpreting World Economic Performance 1500-2001
[J]. ,
/
〈 | 〉 |