北航团队提出全新偏好数据构建框架,助力大模型实现更全面的对齐效果
近期,北京航空航天大学、AI 初创公司零一万物、清华大学等团队合作,提出了一种 PopAlign 框架。它集成了六种对比响应的引导生成策略,全面覆盖了在响应生成过程中可能出现的各种对比先验。这些对比策略分别包括前缀对比、示例对比、引导对比、参数数量对比、排行榜对 ......
近期,北京航空航天大学、AI 初创公司零一万物、清华大学等团队合作,提出了一种 PopAlign 框架。它集成了六种对比响应的引导生成策略,全面覆盖了在响应生成过程中可能出现的各种对比先验。这些对比策略分别包括前缀对比、示例对比、引导对比、参数数量对比、排行榜对 ......