Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!

This is the project page of the paper: Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!

Name		Name	Last commit message	Last commit date
Latest commit History 69 Commits
ClimateNeRF_files		ClimateNeRF_files
LLMFinetuneRisk_files		LLMFinetuneRisk_files
resources		resources
.gitattributes		.gitattributes
README.md		README.md
index.html		index.html
index_backup_old_example.html		index_backup_old_example.html
index_for_reference_only.html		index_for_reference_only.html

Provide feedback