斯坦福大学的研究者提出了一种名为Backpack的模型,以解决语言大模型中存在的偏见问题。该模型通过调整(sense vector)来干预模型的输出,使模型的行为更容易预测和控制,同时保持丰富的表现力。