Tanji Hwang's picture

1

Tanji Hwang

thwang9

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 4 months ago

Margin Adaptive DPO: Leveraging Reward Model for Granular Control in Preference Optimization

Paper • 2510.05342 • Published Oct 6, 2025 • 6