帕累托排序学习：基于推荐系统公平性的排序学习

作者 | 汪昊

审校 | 孙淑娟

推荐系统公平性是 2017 年以来爆火的人工智能研究领域。知名的人工智能公司比如 Twitter, Google, IBM和百度，都创立了人工智能伦理团队或研发了人工智能伦理产品。然而让人遗憾的是，人工智能伦理研究在国内起步较晚，跟国外相比，目前仍然存在着一定差距。

排序学习是在 2010 年左右爆发的机器学习技术，在推荐系统和信息检索领域都得到了广泛的应用。在最近几年，排序学习成为了热门的人工智能伦理研究算法基准。

本文将要介绍的是 2022 年在国际学术会议 CISAT 2022 (International Conference on Computer Information Science and Application Technology) 发表的论文 Pareto Pairwise Ranking for Fairness Enhancement of Recommender Systems。本文主要讲解了如何结合帕累托分布和排序学习实现公平的排序学习推荐算法。

帕累托排序学习：基于推荐系统公平性的排序学习

图1. MovieLens 数据集观影评分差概率分布

我们根据观察（图1）和统计学理论（齐夫分布的统计估计）可以得到如下结论：同一个用户对不同物品的评分差的概率分布正比于评分差。我们修改概率矩阵分解的损失函数，得到我们发明的新算法帕累托排序学习（Pareto Pairwise Ranking）的损失函数公式：

帕累托排序学习：基于推荐系统公平性的排序学习

把我们刚才的观察带入到损失函数公式中，我们得到如下损失函数公式：

帕累托排序学习：基于推荐系统公平性的排序学习

我们把 L 取对数，得到如下公式：

帕累托排序学习：基于推荐系统公平性的排序学习

我们利用随机梯度下降公式求解损失函数对数，得到如下公式：

帕累托排序学习：基于推荐系统公平性的排序学习

帕累托排序学习的算法流程如下：

帕累托排序学习：基于推荐系统公平性的排序学习

图2和图3显示的是帕累托排序学习在 MovieLens 1 Million Dataset 数据集上的测试结果。论文作者对比了 10 种推荐系统算法，发现帕累托排序学习算法在公平性指标上表现最好。

帕累托排序学习：基于推荐系统公平性的排序学习

图 4 和图 5 显示的是帕累托排序学习在 LDOS-CoMoDa 数据集上的测试结果。帕累托排序学习算法在公平性指标上的表现依然最好。

帕累托排序学习算法是国内少见的基于公平性的排序学习推荐系统算法。算法原理简单，实现简便，运行速度快。作者在 16G RAM 和 Intel Core i5 的联想笔记本上测试，执行速度飞快。人工智能伦理研究在国际上目前是研究热点，希望引起大家的足够重视。

作者简介

汪昊，前 Funplus 人工智能实验室负责人，在 ThoughtWorks, 豆瓣，新浪，网易等公司有超过 11 年的研发和管理经验。在推荐系统、聊天机器人、风控反欺诈领域有丰富的技术经验。在国际学术会议和期刊上发表论文 30 篇，获得最佳论文奖/最佳论文报告奖3次。2006 年 ACM 区域赛金牌。本科和硕士毕业于美国犹他大学。对外经贸大学在职 MBA。