本篇推送来自JOM最新online的一文,该文主要讲了三个问题:
什么样的方法论贡献是重要的?
这种重要性在不同的方法论发展阶段有什么差异?
(资料图)
作者应该如何提出自己的方法论贡献?
这篇文章还以Dul等人推进的NCA方法为示例,对有益使用QCA来做出方法论贡献的学者亦有一定参考。文章篇幅较大,翻译过程未苛求尽善尽美。
1、背景与问题
学科进步取决于两个交互的支柱:理论改进和方法改进。现有针对理论贡献的指导已较为丰富,但很少有针对方法论贡献的说明。希望提供方法论贡献的学者,以及负责评估它的编辑和审稿人,不得不依赖临时的、模糊的(“I know it when I see it”)以及随意武断的指导。缺乏方法论贡献的指导可能会阻碍知识的累积发展,并在导致已发表文章中的质量差异。
方法论贡献的重要性在于,它们使学者能够回答有关个体、群体和组织如何表现的新问题,并以更严格的方式重新审视现有问题。例如,内生性问题的识别和解决重塑了研究设计和分析实践(Bettis、Gambardella、Helfat 和 Mitchell,2014;Shaver,2021)。元分析结构方程模型 (MASEM) 的传播促进了对在单独初级研究中无法进行的边界条件检验,以及整合替代路径模型的大量证据(Bergh 等人,2016)。作为作者、审稿人和编辑,我们五个人(本文作者)共同与"Journal of Management’期刊合作,旨在解决以下问题:在JOM等期刊中,什么构成了方法论贡献?
本文提供了一个多方面的视角。首先,本文确定了四种类型的方法论贡献。其次,因为进步取决于方法的成熟度,本文提出了一个生命周期模型来说明在方法开发的整个范围内可能做出的各种贡献。最后,本文确定了阻碍发表的常见陷阱,并提供避免它们的建议。总的来说,本文的目的是为开发适用于宏观和微观研究以及定量和定性研究的方法论进展提供方向。
2、方法论贡献的类型
本文提供了一种类型学来描述可能的方法论贡献。根据经验,这种类型学基于两个重要维度:该贡献对当前理论和实践的改变程度(minor vs. major)以及该贡献对潜在受众的有用性(limited vs. large)。如图1所示,二者结合的矩阵产生了四个独特类别。在这两个维度的评价都很差的论文不太可能通过评审过程。这鼓励作者思考在经过额外的细化后,他们方法论导向的文章在图1中哪些地方最适合。
(1)右上象限表示一种重大方法论贡献,即针对广泛受众并做出了较大改变。例如,Gioia、Corley 和 Hamilton(2013)关于开展和报告归纳研究的文章。这篇文章为对组织进行严格定性研究的不同方法提供全面的建议,极大推进了该领域。谷歌学术引用超过 7,500 次,证明该文的广泛受众和改变程度。
(2)右下象限表示一种渐进的方法论贡献,即针对广泛受众但做出相对适度的改变。例如,Aguinis、Villamor 和 Ramani (2021) 关于使用 Amazon 的 Mechanical Turk (MTurk) 进行在线数据收集的文章。该文回顾了 MTurk 的优势和挑战,并就如何使用 MTurk 来源的数据规划、实施和报告研究结果提供了最佳实践建议。虽然该文没有修改 MTurk 的基本应用(改变程度一般),但鉴于使用 MTurk 来源数据的研究数量不断增加,该文服务的受众群体较为广泛。
(3)左上象限表示一种适度的方法论贡献,其贡献并不在它本身,而是伴随着实质性的理论贡献。例如,Bergh 等人 (2016) 发表在SMJ的文章。因为本文的作者团队中包含该文的3名作者,所以本文可以提供一些关于论文发表过程的“内部”见解;我们相信这有助于阐明适度方法论贡献的本质。该论文的第一版是使用一种新兴的元分析方法与结构方程模型 (MASEM) 相结合,对"战略领导-绩效’关系进行测试。这一版本被拒,因为审稿人和编辑认为理论贡献不重要。他们建议将重点放在当时对战略管理学者来说很新颖的MASEM 方法,并使用"战略领导-绩效’数据来展示该技术。作者重写了这篇论文,描述应该如何使用该技术以及它可以揭示哪些独特的见解,首先介绍了使用 MASEM 的入门知识,然后使用两个数据集进行了演示——一个侧重于战略领导,另一个侧重于战略资源。因为新的审稿人认为这篇论文涉及的内容太多,作者删除了第二个演示,重点关注如何使用 MASEM 以及为战略领导提供的见解。最终,该论文基于这些双重贡献被接受。
(4)左下象限表示一种较小的方法论贡献,针对较少群体的研究带来相对较小的变化。尽管这样的贡献仍然有意义,但仅提供这种贡献的论文不太可能被顶级期刊接受。这种贡献可以被称之为“research lagniappe”(附赠的但不重要的东西,比如饭后赠送的甜点)。在研究领域内,Upson、Ketchen、Connelly 和 Ranft (2012)的AMJ文章在其主要内容的基础上提供了一些额外的方法贡献(即,AMJ的使命所要求的理论贡献)。该研究从管理领域之外引进了一种适合少数情况的分析技术。由于数据中的公司有三个选择——保持市场、发展市场或放弃市场——作者使用了竞争风险回归(competing risks regression)。正如Upson等人(2012: 102) 指出,“这种分析方法已被用于其他领域,例如社会学和医学。但是,据我们所知,尚未用于管理领域。”一个表示方法论贡献是" lagniappe’ 的指标是仅在讨论部分(不是引言)中阐述的贡献。
更一般地说,作者、审稿人和编辑在开发和评估期刊投稿时应仔细考虑两个维度——潜在受众和变化程度。该建议适用于仅做出方法论贡献的研究,或将方法论贡献作为其研究贡献之一的实证研究。关于前者,虽然"home runs’(吸引大量受众并促进重大变革的贡献)是可取的,但二者的融合可能相对较少。当提供更有限的贡献时(拥有较少受众或提供较少创新),作者和把关者(编辑和审稿人)可能无法一直认同该贡献是否提供了有意义的“增值”。这种潜在冲突指出了友好审稿人的重要性,他们可以帮助在提交之前清楚地框定和强调论文的增值。在不关注研究方法的期刊(例如JOM)上评审方法性论文进行的审稿人,不可能都是方法专家。因此,作者必须尽量减少行话(jargon),提供清晰的定义,以及仔细解释想法。
方法论的贡献可以服务于实证研究中的多个目标:为了解决实证挑战而引入的方法论进步,例如使用模拟来估计大量文献中的p-hacking程度(Goldfarb 和 King,2016),或者引入一种新的分析技术(例如,Certo、Withers 和 Semadeni,2017)。无论如何,实证研究中的方法论贡献应当与理论贡献互补,而不能替代理论贡献。换句话说,方法论贡献是推动知识向前发展的必要但不充分条件。审稿人和编辑很少会仅仅因为一篇文章有方法论进步而原谅其实质性贡献的薄弱。撰写此类论文的作者可能明智地“发挥自己的优势”,将论文重点放在其方法论贡献上,并将所研究的实质性关系作为理论和知识的额外延伸。例如,Bergh (1995) 报告了重复测量分析应用中的问题,然后展示了解决这些问题如何导致对多样化-绩效关系的新经验和理论见解,即实证贡献与理论贡献相结合。本文的后续部分讨论这些场景的一些常见问题和解决方案。
3、方法论贡献的生命周期模型
一旦某一方法论开始流行,对这一方法可能做出的贡献就会越来越少。这说明,需要从生命周期的角度来看待方法论贡献,从而理解如何、为何以及何时评估工作重要性。生命周期概念通常包含从出生到死亡的过程,但阶段数量和每个阶段的内容各不相同(Rink & Swan,1979)。本文提出了一个四阶段的生命周期。我们依靠两个例子。首先,我们说明了围绕必要条件分析 (NCA)的各种贡献,该方法最近被引入并越来越多地用于管理研究[Dul, Hak, Goertz, and Voss’s (2010); Dul’s (2016b); and Dul, van der Laan, and Kuik’s (2020)]。其次,我们将重点介绍介绍各种方法的文章,以说明特定生命周期阶段中的示例工作。
阶段一:初始
初始阶段(Inception)的特点是方法论的萌芽。这一阶段包括四种独特的贡献类型。
(1)创造(Creation),包括制定方法、确定基本假设、证明有效性以及确定如何将其应用于组织情境。例如,Dul 等人 (2010) 的文章确定了他们制定的“必要条件假设”(即“ X对Y是必要的”)在运营管理文献中的普遍性。虽然这些假设以各种措辞和形式存在,但作者在单一的NCA标签下整合了许多不同假设,并开发了测试技术。
(2)转移(Transfer),引入一种方法论至新受众。转移的主要贡献在于解释方法并重新验证技术(因为新受众的期望和关注点可能不同)。它还应该展示这种方法相对于当前实践的优势,例如识别实用性好处(统计简约性)、现在可以回答的尚未解决的研究问题,以及可以利用的未使用数据源。例如,Dul (2016b) 的文章说明了 NCA 与组织研究的相关性,并将该方法扩展为包括具有单变量和多变量的离散和连续条件。未知方法的扩展及其可用性(包括插图、用户推荐和软件工具)使该文成为做出转移贡献的一个黄金标准。Shaver (1998) 强调内生性对解释回归系数构成威胁,说明了转移如何改变方法论格局。他描述了自变量的误差项通常是非随机的并且与分析模型的误差项相关。然后,他演示了如何通过使用 Heckman (1979) 的两阶段计量经济学技术来纠正这种影响。
(3)精炼和扩展(Refinement and extension)涉及对现有方法的改进。为了获得有意义的贡献,精炼和扩展提出了方法改良,证明了对新方法的需求,并列出了它的优点和缺点。全面的精炼对当前实践的改进进行了量化,并展示了对结论的重大变化。例如,因为以前没有办法在零假设方法下定量测试 NCA,Dul 等人(2020) 提出了一种测试零空间显著性的技术,作为 NCA 分析的一部分。该文通过扩展 NCA 的可用性为该领域做出了贡献。另一个例子是 Spector、Rosen、Richardson、Williams 和 Johnson (2017) 在共同方法方差 (CMV) 方面的工作。虽然 CMV 长期以来一直被认为是一个问题,但作者通过识别共享数据源与非共享数据源的独特影响来重新概念化该问题。与高质量的细化和扩展贡献一致,他们提出了两个经验示例,并提供了有关如何解决 CMV 的指导。
(4)重新评估(reevaluation)重新审视已有方法中的既定元素(基本逻辑、有效性或核心假设)来做出贡献。Sorjonen, Alex, and Melin (2017); Sorjonen and Melin (2019); and Dul, van der Laan, Kuik, and Karwowski (2019)之间的辩论提供了一个示例。Sorjonen 等人(2017)利用一系列模拟质疑 NCA结论的有效性,因为预测变量、样本量和标准误差的偏度可能会产生模拟必要条件的结果。Dul 等人(2019)认为模拟存在缺陷并且结果被误解,批评这些担忧是没有根据的。Sorjonen 和 Melin (2019) 的回应重新定义了这个问题,他们承认,不仅NCA可能会违反这些假设,而且许多显著性测试也可能会违反这些假设。本文在这里不是确定任何一方的论点的合理性,而是指出这种交流的贡献,因为它激发了人们对一种方法的优点的思考。
阶段二:精炼和比较
第2阶段的特点是探索方法的相对优势和局限性,它包括两种类型的贡献。
一是确定新方法适用的边界条件。当边界条件以前未被识别并因此导致结论存在缺陷时,此类研究的贡献最大。回到NCA示例,Thiem (2021) 提供了两个边界条件:NCA 无法建立因果关系,并无法识别导致结果的多个自变量的构型。Dul、Vis 和 Goertz (2021) 驳斥了这两者,认为 NCA 的目的不是确定因果关系的充分性(不是确定结果实现的水平),而是确定阻止结果实现的水平,并且 NCA 无法评估多变量构型是该方法的已知限制。
第二种贡献是比较(comparisons),即考虑与替代方法相关的边界条件。最简单的比较考虑一整套替代方法的相对优点和缺点,提供了很小的贡献。更复杂的比较解释了替代方法产生不同结果的情况并为其应用提供指导。NCA 的方法论工作包括三次比较。首先,针对不同受众(商业与社会学学者)的两篇类似文章比较了 NCA 与模糊集定性比较分析(fsQCA)的适用情况(Dul,2016a;Vis & Dul,2018)。这两篇文章通过介绍和对比多种方法及其优缺点、提出选择标准和说明应用,为该领域做出了贡献。Richter、Schubring、Hauff、Ringle 和 Sarstedt (2020) 的第三次 NCA 比较展示了如何结合使用 NCA 和偏最小二乘结构方程模型 (PLS-SEM)。该文通过比较和组合方法提供了独特的贡献,展示了如何将 NCA(侧重于必要条件)与 PLS-SEM(侧重于充分性)结合使用,以创建一种以前无法识别的因果关系评估方法。Hill等人(2021) 比较微观和宏观学者用来解决内生性的替代数据和研究设计方法,而 Bliese、Schepker、Essman 和 Ployhart (2020) 研究了如何在微观和宏观层面在面板数据中解决内生性(另见 Certo等人,2017)。
阶段三:知识巩固与传播
这一阶段的贡献的特点是回顾和整合研究趋势并提供最先进的实践。在缺乏方法指导时,用户指南(user guide)提供了一种贡献。然而,仅作为用户指南的手稿不太可能提供充足的贡献发表在顶级期刊上。例如,Dul (2019) 的 NCA 用户指南已作为一本书出版。
随时间的推移,新方法的应用方式会出现细微差别。如果不加以约束,应用的多样性会导致研究中出现不可比较的(incomparable)结果。提供"最佳实践’的论文通过从现有资源中识别相互矛盾的指导、展示不同选择对结果的影响以及为确定“最佳”实践提供证据来做出方法论贡献。例子包括 Bergh 和 Holbein (1997) 对如何使用纵向分析的评估,以及通过实证论证提出更好的方法;Shook、Ketchen、Hult 和 Kacmar (2004) 对在战略管理研究中使用结构方程模型 (SEM) 的评估;以及 Duriau、Reger 和 Pfarrer (2007) 对内容分析的评论。最近的一个例子是 Gonzalez-Mulé 和 Aguinis (2018) 对 63 种元回归应用的评估。
阶段四:置换(Displacement)
在生命周期的最后阶段,反驳(refutation)预示着方法论的失败。对这些论文的建议通常是“不使用这种方法是明智的,但如果你必须...... . . 。” 在实践中,许多反驳出现在方法开发过程(在第 1 阶段重新评估)、在方法比较过程(第 2 阶段)或作为最佳实践文章的一部分(第 3 阶段)。例如,Ketchen 和 Shook (1996) 对聚类分析的评估结合了重新评估、比较和最佳实践的要素。
一个可能更具破坏性的反驳是 Bagozzi、Yi 和 Phillips (1991) 引入 SEM 来构建验证方法。他们使用验证性因子分析来检查聚合效度和区分效度,这显著改善了自 1950 年代以来一直是黄金标准的多特征多方法 (MTMM) 方法。他们展示了 SEM 方法相对于 MTMM 技术的优势,例如同时量化多个构念之间的测量误差。
最后一个场景,替代(replacement)是方法生命周期中的隐形阶段,表现为一种方法不再出现在文献中。例如,"Canonical correlations’曾经在组织研究中很常见,但现在除了作为补充分析外很少出现。同样,随着计算机变得越来越普及,使用相关性检验假设让位于更好的技术,例如回归和因子或多变量方差分析。
总体而言,认识到一种方法从开始到死亡所经历的生命阶段,可以让与其相关的各种可能的贡献得到赞赏、追求和实现。接下来讨论作者在寻求方法论贡献时遇到的一些常见陷阱以及克服这些陷阱的一些建议。
4、陷阱和建议
考虑一下对提出的方法论贡献的有希望的作者的反馈:尽管您的数据源具有创新性,并且手稿本身写得很好,但您的论文中还没有解决一个基本问题:您的方法创新如何提供改善管理学研究的潜力?迄今为止,您所讨论的工具似乎在管理学者中的使用有限,并且没有明确的证据表明与该工具相关的问题——例如,以前从该工具得出的建议是如何有偏见或不充分的?此外,很难评估您的改进的相对优点。因此,虽然您的想法可能很有趣,但全面评估它们所需的更改范围超出了修订中可以完成的范围。
收到这种类型的反馈是痛苦的。虽然没有什么安慰,但提供这种反馈对编辑来说也是痛苦的,尤其是当他们经常写类似的信件时。在这里,我们详细介绍了一些我们观察到的以及我们自己犯下的常见错误,存在多个陷阱会大大增加被拒稿的可能性。
陷阱一:框架制定(Framing)
由于手稿的定位是文章的基础,因此框架制定中的主要缺陷通常会导致拒稿。作者应该清楚地定义他们的主题,指定其范围,并证明其对大量学者的重要性。作者需要明确证明论文的相关性和重要性。例如,Boyd、Haynes、Hitt、Bergh 和 Ketchen (2012: 280)对 1980 年至 2009 年间发表的 1,173 篇战略管理实证文章进行了内容分析,以确定权变观点的使用、废弃和误用情况。这表明他们的见解是从几十年来发表的大量文章中提炼出来的。对于新兴主题,作者应该证明为什么新的工具可能会成为主流。对于更成熟的主题,我们建议采用“问题化(problematization)”而不是“缺口发现(gap spotting)”方法,作者在现有方法应用中识别不利于研究结果的局限性。例如,Bergh (1993, 1995)展示了使用纵向数据的研究存在的两个问题:第一,当变化也可以被理论化时,纵向概念模型具有静态假设;第二,纵向分析测试汇总数据并假设随着时间的推移的非相关误差,导致不充分的解释和有偏见的结果。记录、描述和解决这些问题成为主要贡献。
第一个框架制定问题是作者提供了一个推测性的理论基础,而不是记录现有方法中问题的性质和程度。Ketchen 和 Shook (1996: 442) 对一项有争议的技术的评估部分记录了它的问题,并指出一些学者建议频繁使用聚类分析是战略管理的尴尬。例如,当 Meyer (1991) 要求杰出的研究人员评估该领域时,聚类分析被挑出来作为一种“方法论耻辱”。此外,有人声称“这种方法中固有的实证主义永远烙印在我们集体的背后”(Meyer,1991:826)。而聚类分析经常提供模棱两可的结果,助长了这一批评。在这种情况下,一位审稿人建议将相关段落从讨论部分移至引言,以更好地表达待解决问题的重要性。
第二个框架制定问题是作者对现有方法的优缺点进行有偏见或不完整的比较。在最近提交给JOM的一篇文章中,作者重点关注了传统方法的潜在弱点,并详细阐述了新方法的优势。通过审查过程,作者最终将他们的论文从“我们的方法比他们的更好”重新定义为"引入和评估新方法"。这种重新定位包括确定新方法的优势和劣势,并阐明它何时可能(不可能)替代传统方法。
第三个框架制定问题是“想象的孤岛(imaginary silo)”,即使用一种在管理研究之外领域的技术,同时夸大了该领域的遥远性。考虑到学科之间交叉引用的普遍性,管理学者可以随时使用任何商业学科中使用的大多数方法(Biehl、Kim 和 Wade,2006)。此外,存在于商业领域之外的方法并代表其具有独特性。宏观和微观研究人员都借鉴了经济学、社会学和心理学的工作和方法,以及看似遥远的医学、生物学和物理学领域的方法。总体而言,作者需要证明该方法论与管理学者相关,但目前仍然停留在某一遥远学科领域中。
陷阱二:执行(Execution)
第二类陷进是执行陷阱,即作者描述但不检验进展,或检验进展但不将其结果与现有方法进行比较。在第一种情况下,作者应该增加实证检验以及和现有方法的比较。没有比较的论文很少能在审查过程中幸存下来。其次,作者应证明新方法的优越性,例如对理论发展的更好见解和改进的解释力,并应指定特定工具相关性的边界条件。例如,Certo等人(2017)测试了综合的混合方差检验方法(hybrid mixed variance tests),该方法区分面板数据集中的公司间和公司内效应。他们指出,测试纵向数据的典型做法是关注企业间的差异(即,企业间效应),汇集数据,并包括对企业差异随时间变化的固定效应控制。这样一来,学者们就无法检验公司内部变化(Bergh,1995)。他们使用之前发表的一篇文章来说明企业固定效应和“混合”方法是如何得出不同的结论的,以及综合的混合方差检验是如何改善理论发展的。
陷阱三:增值(Value Added)
最后一类陷阱与本文提出的解决方案所提供的增值有关。该解决方案应改进现有方法并改变假设关系的结论。它也应该是可用的,即方法的进步需要有被目标受众采用的合理可能性。作者应提供有关如何使用该方法的针对性和具体的分步建议,以增加使用该方法的可能性。如果可能,他们应该就如何获取必要的组件(例如,特定类型的数据或工具)提供指导。例如,Podsakoff、MacKenzie 和 Podsakoff(2016)说明了如何通过清晰且易于理解的四个阶段过程来开发概念定义。在每个阶段,作者就如何进行和实施这一过程提出了具体建议。
5、总结
调查记者Bob Woodward 曾经观察到“新闻业的核心困境是你不知道你的无知” 。试图为管理研究做出方法论贡献,尤其是在JOM等大型期刊中,创造了一个涉及“unknown unknown”的平行困境。像其他人一样,我们发现自己处于一个困难的境地,渴望做出方法论贡献,但不确定究竟是什么构成了一个“方法论贡献”,以及编辑和审稿人期望看到的方法论贡献是什么。我们今天仍在为此苦苦挣扎——没有简单的答案。但我们希望,通过利用我们作为作者、审稿人和编辑的经验,本文提供的见解和想法将帮助读者改进他们的方法论工作,最大限度地提高在一流期刊上被接受的机会,帮助积累知识,并在手稿开发和评估过程中提供更多的一致性和客观性。
文献:
Bergh, D. D., Boyd, B. K., Byron, K., Gove, S., & Ketchen, D. J. 2022. What Constitutes a Methodological Contribution? Journal of Management, forthcoming
标签:
要文