Alineación y Seguridad
Datos de Preferencia Humana
Conjunto de datos recopilado a partir de evaluaciones humanas comparativas entre diferentes respuestas del modelo, sirviendo como base para el entrenamiento de alineación y la optimización.
← Volver