Джейлбрейки

Ресурс	Описание
JailbreakBench	Веб-сайт, посвященный оценке и анализу методов джейлбрейка языковых моделей
L1B3RT45	GitHub-репозиторий, содержащий информацию и инструменты, связанные с джейлбрейком ИИ
llm-hacking-database	Этот репозиторий содержит различные атаки на большие языковые модели.

Таблица лидеров по галлюцинациям

Модель	Частота галлюцинаций	Частота фактической согласованности	Частота ответов	Средняя длина итога (слова)
GPT 4 Turbo	2.5%	97.5%	100.0%	86.2
Snowflake Arctic	2.6%	97.4%	100.0%	68.7
Intel Neural Chat 7B	2.8%	97.2%	89.5%	57.6
01-AI Yi-1.5-34B-Chat	3.0%	97.0%	100.0%	83.7
GPT 4	3.0%	97.0%	100.0%	81.1
GPT 4o mini	3.1%	96.9%	100.0%	76.3
Microsoft Orca-2-13b	3.2%	96.8%	100.0%	66.2
Qwen2-72B-Instruct	3.5%	96.5%	100.0%	100.1
GPT 3.5 Turbo	3.5%	96.5%	99.6%	84.1
Mistral-Large2	3.6%	96.4%	100.0%	77.4
01-AI Yi-1.5-9B-Chat	3.7%	96.3%	100.0%	85.0

Из этого репозитория (обновлено 25 июля)