Tags: #reward-modeling

Machine Learning Research Toolkit

1.5k

RLHFlow/RLHF-Reward-Modeling

A comprehensive collection of recipes and code for training various reward models crucial for Reinforcement Learning from Human Feedback (RLHF) in large language models.

rlhf reward modeling large language models

Details

LLM Alignment Framework

Python

1.4k

An open-source framework providing code, models, and insights for stable Reinforcement Learning from Human Feedback (RLHF) training in Large Language Models, focusing on the PPO algorithm and reward modeling.

llm rlhf ppo

Details

Tags: #reward-modeling

RLHFlow/RLHF-Reward-Modeling

OpenLMLab/MOSS-RLHF