快捷导航

网游分类软件分类

StataCorp Stata 17中文破解版 v17.0

大小:890MB

时间:2021-10-21

类别:办公软件

系统:PC

立即下载没有对应的手机版,本软件为电脑版,电脑版软件不支持手机安装。
提取码:o0k4
StataCorp Stata 17是一款功能非常强大的数据分析软件,这个版本快速、准确、易于使用。它提供你所有的数据科学需求--数据操作、可视化、统计和自动报告。你可以通过点击来创建一个自定义图形。或者你可以编写脚本,以可重复的方式产生成百上千的图形。将图表导出为EPS或TIFF用于出版,导出为PNG或SVG用于网络,或导出为PDF用于查看。通过集成的图形编辑器,你可以点击改变关于你的图形的任何内容,或添加标题、注释、线条、箭头和文本。在这里用户能够找到超级实用的数据分析功能,帮助用户在这里快速的对各种数据进行统计、分析、管理和图像化现实,让用户能够更加直观的对各种数据进行使用,节省了超多的运算和整理数据的时间。这个新版本中加入了很多新功能,可以完成更复杂的数据分析,比如生存数据、面板数据、多层次数据、调查数据、离散选择数据、多重输入数据、分类数据、时间序列数据等等本站为大家提供的是StataCorp Stata 17中文破解版,并在下文中提供了该软件的详细安装破解教程, 操作简单易懂, 感兴趣的朋友下载试试吧。
StataCorp Stata 17中文破解版

安装教程

1、从本站下载数据包并解压,运行安装程序SetupStata17.exe点击next。

2、选择同意协议然后点击next。

3、设置安装信息,然后点击next。

4、选择安装类型然后点击next。

5、设置安装目录然后点击next。

7、选择安装选项然后点击next。

8、点击install开始安装。

9、软件正在安装,请耐心等待。

10、安装完成。

11、将破解补丁复制到安装目录下替换原文件即可。

软件新功能

1、表格
用户一直希望我们提供更优异的表格功能。现在您可以轻松地创建用于比较回归结果或摘要统计信息的表格,可以创建自定义样式并将其应用于所构建的任何表格,还可以将表格导出到MSWord,PDF,HTML,LaTeX,MS Excel或Markdown并且将它们放在报告中。同时table命令已经被修改。新的collect前缀从任意多个命令中收集任意多个结果,生成表,将它们导出为多种格式。您还可以使用新的Tables Builder来单击并创建表格。

2、贝叶斯计量经济学
Stata可用于计量经济学,并且可以用该软件进行贝叶斯统计。现在,该软件还可以用来执行贝叶斯计量经济学。想用概率陈述来回答经济问题,例如,那些参加职业培训计划的人是否更有可能在未来五年内继续受雇?想结合经济过程的先验知识吗?该软件的新贝叶斯计量经济学功能可以提供帮助。适合许多贝叶斯模型,例如横截面模型、面板数据模型、多层模型和时间序列模型。使用贝叶斯因子比较模型,获得预测结果。
在经济计量模型中使用贝叶斯方法的一个优点是结合了实际中常用的模型参数的外部信息。这些信息可能来自历史数据,也可能来自对经济过程的自然了解。无论哪种方式,贝叶斯方法都可以使我们将外部信息与我们在当前数据中观察到的信息结合起来,以形成对感兴趣的经济过程的更现实的看法。
该软件在贝叶斯计量经济学领域提供了一些新功能:
贝叶斯VAR模型
贝叶斯IRF和FEVD分析
贝叶斯动态预测
贝叶斯纵向/面板数据模型
贝叶斯线性和非线性DSGE模型

3、Stata运行更快
该软件重视数据准确性的同时也非常重视处理速度。两者之间通常需要权衡取舍,但该软件努力为用户提供两全其美的选择。在该软件中,我们更新了sort和collapse背后的算法,使这些命令运行更快。同时,对一些估计命令,如mixed,运行速度上也得到了改进,这些命令适合多级混合效应模型。

4、DID和DDD模型
新的估计命令didressage和xtdidressage用重复测量数据拟合差异中的差异(DID)和差异中的差异或三重差异(DDD)模型。didregress适用于重复横截面数据,xtdidregress适用于纵向/面板数据。
利用重复测量数据,用DID和DDD模型估计平均治疗(ATET)效果。治疗效果可以是药物治疗对血压的影响,也可以是培训计划对就业的影响。与现有的teffects命令提供的标准横截面分析不同,在评估ATET时,是否对组和时间效应进行了分析控制,其中组可识别重复测量。附加群体效应及其与时间相互作用的DDD分析控制---您最多可以指定三个组变量或两个组变量和一个时间变量。

5、区间删失Cox模型
半参数Cox比例风险回归模型通常用于分析未审查和右删失事件时间数据。新的估计命令stintcox使Cox模型适用于区间删失的事件时间数据。
区间删失发生在对某个感兴趣的事件(如癌症复发)的时间没有直接观察到,但已知在某个区间内时。例如,定期检查可以发现癌症复发,但不能观察到确切的复发时间。我们只知道在先前检查和当前检查之间的某个时间段复发了癌症。忽略区间删失可能导致不正确的(有偏见的)结果。
当基线风险函数完全不确定时,区间删失事件时间数据的半参数估计具有挑战性,因为没有一个事件时间是精确观测的。因此,这些数据的“半参数”建模通常采用样条法或分段指数模型作为基线风险函数。直到最近的方法学进展(在stintcox命令中实现)才提供真正的区间删失事件时间数据半参数建模。

6、多元变量分析
您需要分析多个研究的结果。这些研究报告了多种效应大小,它们很可能在一项研究中相互关联。单独的meta分析(例如使用现有meta命令的meta分析)将忽略相关性。现在可以使用新meta mvregression命令执行多元meta分析,这将解释相关性。

7、贝叶斯VAR模型
Bayes前缀现在支持var命令来拟合贝叶斯向量自回归(VAR)模型。
VAR模型研究多个时间序列之间的关系,包括结果变量的滞后作为模型预测因子。
已知这些模型具有许多参数:有K个果变量和p个滞后,至少就有p(K ^ 2 + nn1)个参数。模型参数的可靠估计非常具有挑战性,尤其对于小数据集。
贝叶斯VAR模型通过结合模型参数的先验信息来稳定参数估计,从而克服了这些挑战。

8、贝叶斯多级模型:非线性、联合、 SEM-like等
使用bayesmh命令新的随机效果语法,拟合贝叶斯多层次模型的宽度。
您可以更容易地拟合单变量线性和非线性多层次模型。现在您可以拟合多元线性和非线性多层次模型了!并考虑到增长的线性和非线性多级模型,联合纵向和生存时间模型,SEM型模型等。

9、治疗效果lasso评估
您可以使用teffects来估计治疗效果。您也可以使用lasso来控制众多协变量。(当我们提到“多”时,指的是成百上千甚至更多!)现在您可以使用telasso来估计治疗效果并控制众多协变量。

10、Galbraith图
新命令meta-galbraithplot生成Galbraith图用于meta分析。这些图可用于评估研究的异质性和检测潜在的异常值。当有许多研究时,它们也被用来替代森林图,用于总结meta分析结果。

11、留一法元分析
您现在可以通过使用新的选项leaveoneout与meta summarize和meta forestplot来执行留一元的元分析。
省略元分析通过在每项分析中排除一项研究来进行多项元分析。研究产生夸大的效应量是很常见的,这可能会扭曲整体结果。省略的meta分析有助于调查每个研究对总体效应大小估计的影响,并确定有影响力的研究。参见[META] META summarize和[META] META forestplot。

12、贝叶斯纵向/面板数据模型
您可以通过使用xtreg来拟合随机效应面板数据或纵向模型,使用xtlogit或xtprobit来拟合连续结果,使用xtlogit或xtprobit来拟合二进制结果,使用xtologit或xtoprobit来拟合顺序结果等。在Stata17中,您可以通过简单地在这些模型前面加上bayes来拟合这些模型的Bayesian版本。

13、面板数据多项式logit模型
新估计命令xtmlogit将面板数据多项式logit(MNL)模型与随时间观察到的分类结果相匹配。假设我们收集了几个星期关于个人对餐馆选择的数据。餐厅选择是没有自然顺序的分类结果,因此我们可以使用现有的mlogit命令(使用cluster-robust标准误差)。xtmlogit直接对单个特征进行建模,因此可能产生更有效的结果。它可以很好地解释可能与协变量相关的特征。

14、零膨胀的有序logit模型
新的估计命令ziologit拟合零膨胀的有序逻辑回归模型。当数据在最低类别中表现出比标准有序逻辑模型预期的更高的观测值时,使用该模型。我们将最低级别的观察值称为零,因为它们通常对应于没有行为或特征。
零膨胀是通过假设零同时来自逻辑模型和有序逻辑模型来解释的。每个模型都可以有不同的协变量,结果可以显示为比值比而不是默认系数。

15、趋势非参数检验
nptrend命令现在支持跨有序组的四个趋势检验。您可以选择Cochran-Armitage检验,Jonckheere-Terpstra检验,线性趋势检验和Cuzick检验中进行选择。前三个检验是新的,第四个检验由nptrend执行。

16、贝叶斯动态预测
动态预测是在拟合向量自回归(VAR)模型等多变量时间序列模型后常用的预测工具。在拟合经典var模型后,使用fcast计算动态预测。在使用bayes:var拟合贝叶斯VAR模型之后,现在可以使用bayesfcast来计算贝叶斯动态预测。
贝叶斯动态预测产生预测值的整个样本,而不是经典分析中的单个预测。该样本可用于解答各种建模问题,例如,在估计预测不确定性时,模型在不作渐近正态假设的情况下预测未来观测值的能力。这对于可能怀疑渐近正态性假设的小数据集特别有吸引力。

17、贝叶斯IRF和FEVD分析
脉冲响应函数(IRFs),动态乘数函数和预测误差方差分解(FEVDs)通常用于描述多元时间序列模型(如VAR模型)的结果。VAR模型具有许多参数,可能难以一一解释。IRFs和其他函数将多个参数的效果合并到一个摘要中(每个时间段)。例如,IRFs测量一个变量的冲击(变化)对给定结果变量的影响。
贝叶斯IRFs(和其他函数)使用IRFs的“精确”后验分布产生结果,这不依赖于渐近正态性的假设。它们还可以为小数据集提供更稳定的估计,因为它们包含了有关模型参数的先验信息。

18、lasso惩罚选择BIC
惩罚参数的选择是lasso分析的基础。使用小的惩罚函数可能会包含太多的变量。使用较大的惩罚函数可能会忽略潜在的重要变量。
Lasso估计已经提供了几种惩罚选择方法,包括交叉验证、自适应和插件。现在可以使用贝叶斯信息准则(BIC)通过指定选择(BIC)选项来选择lasso之后的惩罚参数进行预测,并选择lasso进行推断。此外,新的后估计命令bicplot在拟合lasso模型后,将BIC值绘制为惩罚参数的函数。这为最小化BIC函数的惩罚参数的值提供了方便的图形展示。

19、集群数据lasso分析
现在,您可以在套索分析中考虑集群数据。忽略聚类可能会导致错误结果,因为同一聚类中的观测值之间存在相关性。使用用于预测的lasso命令(如lasso和elasticnet),可以指定新cluster({it clustvar})选项。使用用于推断的lasso命令(如poregress),可以指定新的vce(cluster{it clustvar})选项。

20、贝叶斯线性和非线性DSGE模型
现在,可以通过在dsge和dsgenl前面加上前缀bayes:来拟合贝叶斯线性和非线性动态随机一般均衡(DSGE)模型。通过从30多种不同的先验分布中进行选择,结合有关模型参数范围的信息。进行贝叶斯IRF分析,进行区间假设检验,使用Bayes因子比较模型等。

21、Do-file编辑器:导航控制,增强的书签功能…
Stata 17中的Do-file Editor有以下改进:
1.书签:现在与do-files一起保存。
2.新的导航控件:可以轻松浏览do文件。
3.语法高亮显示支持Java和XML。
4.选中区域中引号,括号和方括号的自动补全。例如,选择文本mymacro,然后输入左引号`; Do文件编辑器将用单引号绑定文本选择,将选择更改为“mymacro”。
书签:Do文件编辑器最需要的特性之一是能够在Do文件中保存书签。书签用于标记感兴趣的行,以便以后更容易地导航到它们。书签在浏览长Do-files时特别有用。您可以将书签添加到do文件中执行数据管理、显示摘要统计和执行统计分析的部分。然后,您可以使用菜单,工具栏或新的导航控件在这些部分之间快速来回移动,而无需滚动几行代码来查找所需的部分。
导航控件:该软件通过新的导航控件使导航do-files更容易,该控件显示书签及其标签的列表。从导航控件中选择书签会将Do文件编辑器移动到书签所在的行。除了书签之外,导航控件还将显示do文件中的程序列表。从导航控件中选择一个程序把Do文件编辑器移到程序的定义中。可以轻松的将程序添加到导航控件中。Do文件编辑器将自动向导航控件添加程序定义。

22、日期和时间功能更新
该软件增加了新的便利功能,用于处理该软件和Mata中的日期和时间。新功能可以分为三类:
1. Datetime持续时间: Datetime durations:用于获取持续时间的函数,例如ages。
2.相对日期: 基于其他日期返回日期的函数,例如相对于给定日期的下一个生日。
3. Datetime组件:从Datetime值中提取不同组件的函数。
新函数以闰年、闰日和闰秒(如适用)为单位。闰秒是一秒调整,偶尔应用于协调通用时间(UTC)。

23、Intel Math Kernel Library (MKL)
引入了在兼容硬件(所有基于Intel和AMD的64位计算机)使用Intel Math Kernel Library(MKL),并提供了深度优化的LAPACK例程。
LAPACK代表线性代数包,是一套免费提供的例程,用于求解联立方程组、特征值问题和奇异值问题等。Mata运算符和函数(例如qrd()、lud()、和cholesky())在可能的情况下利用LAPACK进行许多数值操作。
由英特尔MKL支持的LAPACK提供了最新的LAPACK例程,这些例程针对现代Intel和现代AMD处理器使用的64位Intel x86-64指令集进行了优化。使用MKL的Mata函数和操作符在性能方面有很大的优势。
最重要的是,您无需采取任何措施即可充分利用速度提升的优势。使用这些Mata函数和运算符以及Mata函数和运算符本身的该软件命令将在兼容硬件上自动使用“英特尔MKL”。

24、运用于Apple Silicon
Stata 17是一个通用的应用程序,它将在带有Apple Silicon和Intel处理器的Mac上运行。带有Apple Silicon的Mac包括新的MacBook Air, MacBook Pro和Mac mini,它们都带有M1处理器。M1芯片有更高的性能和更高的能效
尽管M1 被认为是入门级的,但我们发现,M1 Macs本机运行该软件的性能比Intel Macs高出30–35%。它们的性能甚至远远超过价格超过两倍的Intel Mac!对于那些坚持在他们的Apple Silicon Mac电脑上只使用Apple-Silicon原生软件的用户来说,从安装程序到应用程序本身,该软件的任何部分都不需要用到Rosetta 2。
该软件的功能与在M1 Mac或Intel Mac上本地运行该软件的方式相同,M1 Mac不需要特殊许可证。在未来的几年里,我们将继续支持并发布针对带有英特尔处理器的Mac的新版本该软件。

25、JDBC
将该软件与数据库连接变得更加容易。该软件添加了对JDBC(Java数据库连接)的支持。JDBC是在程序和数据库之间交换数据的跨平台标准。
新的jdbc命令支持jdbc标准,用于与具有矩形数据的关系数据库或非关系数据库管理系统交换数据。您可以从一些最流行的数据库供应商(如Oracle、MySQL、Amazon Redshift、Snowflake、Microsoft SQL Server等)导入数据。jdbc的优点在于它是一个跨平台的解决方案,因此我们的jdbc设置对Windows、Mac和Unix系统的工作方式是相同的。
如果您的数据库供应商提供了一个JDBC驱动程序,那么您可以下载并安装该驱动程序,然后通过JDBC在数据库上读取、写入和执行SQL。您可以将整个数据库表加载到该软件中,也可以使用SQL SELECT将表中的特定列加载到该软件中。您还可以将所有变量插入数据库表中,或仅插入数据集的子集。
26、集成Java
在该软件中,您现在可以直接在该软件中嵌入和执行Java代码。您可以在以前版本的该软件中创建和使用Java插件,但这需要您编译代码并将其捆绑到Jar文件中。在do文件中执行Java,您可以自由地执行直接绑定到该软件代码的Java代码。您可以在do文件或ado文件中编写Java代码,甚至可以从该软件中交互式地调用Java(如JShell)。
Java的优势之一在于它与Java虚拟机一起打包的大量APIs。还有许多有用的第三方库可用。根据需要,您甚至可以编写并行代码以利用多核运算。
您编写的Java代码是动态编译的,不需要使用外部编译器。此外,还包括该软件函数接口(SFI)Java包,提供该软件和Java之间的双向连接。SFI包中有访问该软件当前数据集、帧、宏、标量、矩阵、值标签、特征、全局Mata矩阵、日期和时间值等的类。
该软件将Java开发工具包(JDK)与其安装捆绑在一起,因此不涉及其他设置。
27、集成H2O
在该软件中,我们一直在尝试连接H2O,这是一个可扩展的分布式开源机器学习和预测分析平台。您可以在https://docs.h2o.ai/上了解有关H2O的更多信息。
通过集成H2O,您可以在该软件上启动、连接和查询H2O集群。此外,我们提供了一套命令来操作集群上的数据(H2O帧)。例如,可以通过导入数据文件或加载该软件的当前数据集来创建新的H2O帧。您还可以从中拆分、合并和查询H2O帧。
虽然这对我们来说还处于实验阶段,但我们希望让我们的用户可以试用。另一方面,因为这是一个实验状态,语法和功能可能会发生变化。当使用该软件命令提供对H2O给定功能的访问时,请记住这是H2O功能。虽然您可以通过该软件命令访问它,但它所能做的高于H2O并且在该软件之外。
28、PyStata
该软件引入了一个我们称之为概念。该软件是一个包含该软件和Python交互的所有方式的术语。
该软件的特点是能够从该软件调用Python代码。该软件通过允许您通过一个新的
从一个独立的Python环境调用该软件,大大扩展了这一功能。
您可以在基于IPython内核的环境中方便地访问该软件和Mata(例如,Jupyter Notebook和控制台以及Jupyter Lab和控制台);在支持IPython内核的其他环境中(例如Spyder IDE和PyCharm IDE);或者从命令行访问Python时(例如,Windows命令提示符、macOS终端、Unix终端和Python的IDLE)。

29、Jupyter Notebook
Jupyter Notebook是一个功能强大且易于使用的web应用程序,它允许您将可执行代码、可视化效果、数学方程和公式、叙述性文本和其他富媒体组合在一个文档(“笔记本”)中,用于交互式计算和开发。它被研究者和科学家广泛地用来分享他们的想法和成果,以促进合作和创新。
在该软件中,作为PyStat的一部分,可以使用IPython(交互式Python)内核从Jupyter笔记本调用该软件和Mata。这意味着您可以在一个环境中结合Python和该软件的功能,使您的工作易于复制并与其他人共享。
从Jupyter Notebook调用该软件是由新的包驱动的。
以上是该软件29处更新的内容,对于更详细的功能介绍,还请移步科学软件网查看。
北京天演融智软件有限公司(科学软件网)是该软件软件在中国的授权经销商,为中国的用户提供优质的软件销售和培训服务。

软件功能

1、统计功能
该软件的统计功能很强,除了传统的统计分析方法外,还收集了近 20 年发展起来的新方法,如 Cox 比例风险回归,指数与 Weibull 回归,多类结果与有序结果的 logistic 回归, Poisson 回归,负二项回归及广义负二项回归,随机效应模型等。具体说,具有如下统计分析能力:
数值变量资料的一般分析:参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。
分类资料的一般分析:参数估计,列联表分析 ( 列联系数,确切概率 ) ,流行病学表格分析等。
等级资料的一般分析:秩变换,秩和检验,秩相关等
相关与回归分析:简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数 ( 中位数 ) 回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。
其他方法:质量控制,整群抽样的设计效率,诊断试验评价, kappa 等。
2、作图功能
作图模块中主要提供如下八种基本图形的制作 : 直方图 (histogram) ,条形图 (bar), 百分条图 (oneway) ,百分圆图 (pie) ,散点图 (twoway) ,散点图矩阵(matrix) ,星形图 (star) ,分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
3、矩阵运算功能
矩阵代数是多元统计分析的重要工具,提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、 Cholesky 分解、 Kronecker 内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。
4、程序设计功能
这是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上,我们这个软件的 ado 文件 ( 高级统计部分 ) 都是用自带的语言编写的
其统计分析能力远远超过了 SPSS ,在许多方面也超过了 SAS !由于该软件在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说, SAS 的运算速度要比 SPSS 至少快一个数量级,而 Stata 的某些模块和执行同样功能的 SAS 模块比,其速度又比 SAS 快将近一个数量级!) 也是采用命令行方式来操作,但使用上远比 SAS 简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了 SAS 。用该软件绘制的统计图形相当精美,很有特色。

软件特征

1、双重差分法的官方命令
“双重差分法”(Difference-in-differences,简记DID)或许是最常用的计量方法。怎么能没有DID的该软件官方命令呢?为此,该软件及时地推出了DID的官方命令xtdidregress;其中,“xt” 表示这是适用于面板数据的命令。
除了进行常规的 DID 估计,命令xtdidregress还允许最多指定三个“分组变量”(group variables),或两个分组变量与一个时间变量,从而进行“三重差分法”(Difference-in-differences-in-differences,简记DDD)的估计。
另外,针对“重复截面数据”(repeated cross-sectional data),即所谓“准面板”(pseudo panel data),该软件也推出了相关的新命令didregress,可进行类似 DID 的估计。更重要的是,你可以用DID的官方命令,轻松地画平行趋势图啦~
2、完美的表格输出
实证研究者经常需要将该软件的多个回归结果以表格形式输出到word文件中。虽然早有官方命令estimates table可完成此类任务,但比较死板;故此前该软件用户一般使用非官方命令(比如estout或outreg)来输出回归结果。为此,该软件大幅改善了原来的table命令,使用户可轻松地以表格形式汇报回归结果(regression results)或统计特征(summary statistics)。
进一步,你可以设计回归表格的风格(styles),并应用于所创建的表格,然后将此表格输出到Word或其他形式的文件(包括PDF、HTML、LaTex、Excel、markdown 等)。另外,你还可以使用新增的前缀(prefix)collect,来收集该软件命令的各种估计结果。最后,该软件还新增了Table Builder(表格创建器),让用户可通过点击鼠标(point-and-click)来创建表格。
3、Lasso的新功能
作为“高维回归”(high-dimensional regression)的常用工具,该软件已经推出了有关Lasso(Least Absolute Shrinkage and Selection Operator,即所谓 “套索估计量”)的一系列官方命令。该软件则提供了更多有关 Lasso 的新功能。
使用Lasso估计处理效应模型。在该软件中,可使用命令teffects估计“处理效应”(treatment effects)模型;而命令lasso则用于估计协变量很多的高维模型。该软件则将二者结合起来,其推出的新命令telasso,可估计包含很多协变量的处理效应模型。
使用 BIC 选择Lasso惩罚参数。作为一种“惩罚回归”(penalized regression),在进行Lasso估计时,需要选择惩罚参数(penalty parameter)。在该软件中,可使用交叉验证(cross-validation)、适应性方法(adaptive method)或代入法(plugin)来选择惩罚参数。
在该软件中,新增了选择项 “selection(bic)”,可使用 “贝叶斯信息准则”(Bayesian Information Criterion,简记BIC)选择惩罚参数。而且,新增的估计后命令(postestimation command)bicplot 可以很方便地将此选择过程可视化。
使用Lasso处理聚类数据。对于“聚类数据”(cluster data),由于每个聚类中观测值存在自相关,故通常的Lasso估计可能导致偏差。在该软件中,在使用命令lasso或elasticnet时,可通过新增选择项 “cluster(clustvar)” 来处理聚类数据。进一步,对于使用Lasso进行统计推断的命令,比如poregress(表示partialing-out regress),则可使用该软件的新增选择项 “cluster(clustvar)” 来得到聚类稳健的标准误(cluster-robust standard errors)。
4、离散选择模型的新命令
离散选择模型(discrete choice model)是微观计量经济学的常用模型。在该软件中,增加了以下离散选择模型的新命令:
“面板多项逻辑模型”(panel multinomial logit model)。对于横截面数据的多项逻辑模型,该软件已有mlogit命令。该软件新增的xtmlogit命令则可使用面板数据估计多项逻辑模型。这无疑是该软件在离散选择模型方面的一大进步,因为此前只能使用xtlogit或xtprobit估计面板二值选择模型。
“零膨胀排序逻辑模型”(zero-inflated ordered logit model)。对于排序数据(ordered data),此前可使用该软件命令ologit或oprobit进行估计。在实践中,有时排序数据中最低类别所占比重很大。若将最低类别的取值记为“零”,则存在所谓“零膨胀”现象。此时可使用Stata 17的新增命令ziologit,估计更有效率的“零膨胀排序逻辑模型”(zero-inflated ordered logit model)。
5、久期数据的新命令
“久期数据”(duration data)常用于生物统计的 “生存分析”(survival analysis),在经济学中也有广泛用途,例如失业的持续时间,婚姻的延续时长,王朝的寿命等。久期数据常存在 “删失”(censoring)或 “归并” 问题,比如当研究结束时,有些病人可能尚未死亡;或者有些失业者还未找到工作。
该软件新推出的命令stintcox,可使用Cox模型来估计一种特殊的“区间删失”(interval-censored)数据。对于区间删失数据,我们只知道事件发生于某个区间,但无法确知其发生时点;比如,只知道癌症复发于两次体检之间的时段。如果忽略久期数据存在的区间删失问题,则会导致估计偏差。
6、贝叶斯计量经济学的全面升级
在大数据时代,由于数据日益复杂而多样,在处理有些问题时,基于频率学派的传统计量方法可能不便使用,使得贝叶斯学派的计量经济学逐渐兴起。频率学派认为待估计的参数是给定的未知数(fixed unknown parameters),而贝叶斯学派则将未知参数视为服从某个分布的随机变量,并可随时根据新的样本信息将其 “先验分布”(prior distribution)更新为 “后验分布”(posterior distribution)。该软件将该软件中原有的贝叶斯统计学与计量经济学进行了全面升级。
贝叶斯面板数据模型(Bayesian panel-data models)。该软件目前已有的面板命令包括xtreg(静态面板),xtlogit或xtprobit(面板二值选择模型),以及xtologit或xtoprobit(面板排序模型)等。在该软件中,如果要使用贝叶斯方法估计这些面板模型,只要在原命令之前加上 “前缀”(prefix)bayes即可。
贝叶斯向量自回归模型(Bayesian VAR models)。“向量自回归”(Vector Autoregression,简记VAR)是常见的时间序列模型。在已有的该软件中,可用命令var来估计VAR模型,而后续命令则包括:使用fcast进行 “动态预测”(dynamic forecast),以及使用irf估计 “脉冲响应函数”(impulse response function,简记 IRF)与 “预测误差方差分解”(forecast error variance decomposition,简记 FEVD)。
在该软件中,则可使用命令“bayes: var”(即在命令var之前加上前缀 bayes)估计贝叶斯的 VAR 模型,然后用bayesfcast进行动态预测;而脉冲响应函数与预测误差方差分解也可类似地得到。
然后,使用bayesfcast进行动态预测;
而脉冲响应函数(IRF)与预测误差方差分解(FEVD)也可类似地得到。
使用贝叶斯方法估计VAR模型有两大好处。首先,VAR模型通常包含较多参数,若样本较小,则估计结果不稳定。而贝叶斯方法由于较易“整合先验信息”(incorporating prior information),故在用小样本估计VAR模型时更为稳健。
其次,经典的VAR模型使用大样本理论进行统计推断与预测,需要假设估计量服从渐近正态分布,在小样本中不易满足。而贝叶斯方法则不使用大样本理论,也无须渐近正态的假设,故更适用于小样本。
贝叶斯多层模型(Bayesian multilevel models)。该软件新推出的bayesmh命令可以估计一系列的贝叶斯多层模型,包含“单变量”(univariate)或“多变量”(multivariate)的线性与非线性多层模型(linear and nonlinear multilevel models),乃至面板的生存时间模型(joint longitudinal and survival-time models)以及结构方程之类的模型(SEM-type models)等。
贝叶斯线性与非线性DSGE模型(Bayesian linear and nonlinear DSGE models)。“动态随机一般均衡”(Dynamic Stochastic General Equilibrium,简记DSGE)模型是宏观经济学的主流模型。在该软件中,可使用命令dsge与dsgenl分别估计线性与非线性的 DSGE 模型。
在该软件中,只要在命令dsge与dsgenl之前加上前缀bayes,即可估计相应的线性或非线性的贝叶斯DSGE模型。可供用户选用的 “先验分布”(prior distribution)多达30以上,并可进行贝叶斯脉冲响应分析(Bayesian IRF analysis),区间假设检验(interval hypothesis testing),以及使用贝叶斯因子(Bayesian factors)来比较模型等。
7、非参数的趋势检验
有时样本数据中存在分组(比如,分为3组),且这些分组有天然的排序(比如,记为1,2,3组),即所谓 “排序分组”(ordered groups)。在这种排序分组的数据中,经常希望检验某个变量在此分组排序中(比如,第1-3组),是否存在某种趋势,比如此变量的取值倾向于越来越大,即所谓 “tests for trend across ordered group”。
为此,可使用该软件已有命令nptrend,进行非参数的Cuzick秩检验(Cuzick test using ranks)。而该软件的最新版nptrend命令,则在 Cuzick秩检验之外,新增了三个非参数检验,即“Cochran-Armitage test”,“Jonckheere-Terpstra test” 与“linear-by-linear trend test”,使得命令nptrend的功能大大增强。
8、元分析的新命令
“元分析”(meta-analysis)将多个类似的研究结果综合在一起。比如,针对某个疫苗的有效性(vaccine efficacy),在世界各地进行了多个实验,如何将每个实验所得的疫苗有效性指标,通过加权平均得到统一的度量。该软件将该软件的元分析功能作了进一步的提升。
多维元分析(Multivariate meta-analysis)。在将多个研究结果综合在一起时,其中的每个研究可能同时汇报 “多个效应规模”(multiple effect sizes),而这些效应之间可能存在相关性。若使用该软件既有的 meta命令,则会忽略这种相关性。该软件的新增命令meta mvregress可进行多维元分析,并处理这种相关性。
加尔布雷斯图(Galbraith plots)。该软件还新增了命令meta galbraithplot,可以画元分析的 “加尔布雷斯图”(Galbraith plots)。此图可用于评估不同研究之间的异质性(assessing heterogeneity of the studies),并发现潜在的极端值(potential outliers)。
留一元分析(Leave-one-out meta analysis)。该软件新增了 “留一元分析”(Leave-one-out meta-analysis)的功能。所谓“留一元分析”,就是在进行元分析时,每次均留出一个研究(不放在样本中),以考察元分析结果的稳健性;比如,最终结果是否过度依赖于某个研究。在使用该软件命令meta summarize或meta forestplot进行元分析时,可使用新增的选择项leaveoneout来进行留一元分析。
9、该软件与Python、Java、H2O及Jupyter Notebook的整合
在大数据时代,该软件也在加快与主流软件平台的整合,为用户提供更多的增值服务。这在该软件的此次升级中体现尤其突出。
与 Python 的整合(Python integration)。Python已是炙手可热的主流计算机语言。为此,该软件专门提供了一个与Python的接口,让用户在熟悉的该软件界面下调用Python,并在该软件中显示运行结果。该软件则更进一步,推出了新的Python包(Python package),使得用户可在Python 中方便地调用。还引入了一个新概念 “PyStata” ,包括与Python交互的所有方式。
与 Java 的整合(Java integration)。Java是一种应用广泛的跨平台编程语言。在该软件中,你可以十分方便地在该软件程序中嵌入并执行 Java 代码。
对于JDBC数据交换格式的支持(Support for JDBC)。JDBC(Java Database Connectivity)是一个在不同程序与数据库之间交换数据的跨平台标准(a cross-platform standard for exchanging data between programs and databases)。在该软件中,通过支持JDBC,使得该软件用户可从一些最流行的数据库导入数据,包括Oracle、MySQL、AmazonRedShift、Snowflake、Microsoft SQL Server等。
与H2O的整合(H2O integration)。H2O是一款流行的机器学习软件平台。在该软件中,你可以连接并调用H2O的机器学习算法。这无疑为用户打开了另外一扇通往机器学习的窗口!
在Jupyter Notebook中使用该软件)。Jupyter Notebook是一款基于网页的流行“集成开发环境”(integrated development environment,简记 IDE),尤其方便展示代码、公式、文字与可视化。在该软件中,作为该软件的一部分,你可以从 Jupyter Notebook调用 该软件与Mata。这意味着,你可以在同一环境中整合Python与该软件的功能,使得你的工作更加可复制(reproducible)且易于分享。
10、Do文件编辑器的改进与该软件速度提升等
Do文件编辑器的改进(Do-file Editor improvements)。随着编程的重要性日益提高,该软件在Do文件编辑器中加入了 “自动填写完成”(autocompletion)与 “语法高亮”(syntax highlighting)的功能。该软件又将Do文件编辑器的功能进一步提升。
在该软件的Do文件编辑器中,可通过设置 “bookmarks”(书签)而在一个较长的do文件中迅速跳至想要编辑的部分。该软件的Do文件编辑器还新增了“navigation control”(导航),其中罗列所有的书签及其标签(bookmarks and their labels),以该Do文件中的全部“程序”(programs)。
该软件的速度提升(。在大数据时代,基础算法的速度越来越重要。为此,该软件更新了命令sort与collapse的算法,使之更为快捷。另外,该软件也提升了命令mixed(用于估计多层混合效应模型,即 multilevel mixed-effects models)的运行速度。
使用Intel Math Kernel Library(MKL)提升速度。该软件引入了Intel Math Kernel Library(MKL),适用于所有Intel或AMD的64位计算机,从而可调用深度优化(deeply optimized)的LAPACK(Linear Algebra PACKage)线性代数包。这将使得该软件与Mata的底层计算速度进一步提升,而该软件用户无须作任何事情即可享用。
处理日期与时间的新函数(New functions for dates and times)。该软件引入了方便处理日期与时间的新函数,包括Datetime duration(计算持续时间),Datetime relative dates(计算相对日期,比如下个生日的日期),以及Datetime(从日期中提取不同的成分)。这些新函数还会自动考虑闰年(leap years)、闰日(leap days)与闰秒(leap seconds)的因素。
总之,Stata 17是一次令人激动的重大升级,不仅有贝叶斯计量经济学的高歌猛进,与主流计算机语言平台的深度整合,更便于编程的Do文件编辑器,而且更为贴近计量实战的需求(DID,表格输出,离散选择等)。显然,在可预见的将来,该软件依然会是经管社科的首选计量与统计软件。
展开全部内容

精品推荐

相关软件

同类热门

登月探险家版本大全 恐怖塔防游戏大全 部落争霸全部版本 格斗游戏有哪些 刺激游戏推荐 西游游戏有哪些 动画设计软件大全 仙侠游戏大全 宅男10大看片神器 万象直播大全 经典动作游戏推荐 经营类游戏推荐

0条评论