5、列联表 contingency table)
列联表(contingency table/two-way table)是将观测数据按两类特征列出的频数表。行(Row)记为R,列(Column)记为C。下图为5×3的列联表,横排按照股票的规模划分 为小盘股、中盘股和大盘股。纵列按照行业部门划分为通信服务生活必需品、能源、医疗和公用事业。
联合频率(Joint frequencies)是横排和纵列相交的频率,如图中小盘通信股的
频率为55。
边际频率(marginal frequencies 电脑显示乱码)是横排或纵列联合频率的加总,如图中小盘股的总频率为575(=55+ 50+ 175+275+2)。
有三种方式可以描述该表的相对频率(relative frequencies)。
(1)将联合频率除以总频率。例如,小盘医疗股的相对频率为27.5%(=275/1000)。
(2)将联合频率除以纵列的边际频率。小盘医疗股的相对频率47.8%(=275/575)。
(3)将联合频率除以横排的边际频率。小盘医疗股的相对频率63.22%(=275/435)。
列联表应用较广,可用于评估资产的表现,又称混淆矩阵(confusion matrix)。
此外,还可用于检验两个分类变量的关联情况。检验统计量为卡方检验(chi-square test of independence),假设检验部分详述。