在 Python 中计算两组数据的 Cohen’s D 效应值

今日研究美国商务部的NME倾销幅度计算程序,对DOC的 Differential Price Analysis 有了初步的理解。DOC在进行价格差异分析时,使用了Cohen’s D统计方法,来测试应诉企业的美国销售价格是否在不同的季度、不同的区域/州、不同的客户之间具有明显差异。

美国商务部的分析是在SAS中进行的。以下代码显示了如何在python中进行 Cohen’s D 的计算: 继续阅读“在 Python 中计算两组数据的 Cohen’s D 效应值”

使用python语言进行全年一次性奖金个人所得税计算以及临界值分析

按照税务局的规定,员工的全年一次性奖金每年可享受一次按照除以12的商数确定税率计算个人所得税的优惠算法。网上又有人说该算法下存在个人所得税的盲区,在该盲区内多发1元奖金将会使交的税比增加的奖金还多。

为了验证该说法,我曾尝试在LibreOffice中用电子表格下公式进行计算,但是由于公式复杂且数据量大,很难完成。最终发现使用python配合pandas库可以非常快速地完成计算。 继续阅读“使用python语言进行全年一次性奖金个人所得税计算以及临界值分析”

在Python中实现SAS的PROC MEANS功能

在SAS中,使用PROC MEANS过程配合WEIGHT和OUTPUT等语句可以很方便地计算不同组合下的N, SUMWGT, SUM, MEAN, MIN, MAX, STD等统计量。Python是免费开源的编程语言,配合pandas库可以完成很多的统计计算和科学数据分析工作。

那么,python中有没有类似的代码来完成SAS中的PROC MEANS任务呢?参考Stack Overflow上的一篇问答帖子,我测试并重新整理成了以下完整的代码以及用法示例。 继续阅读“在Python中实现SAS的PROC MEANS功能”