Джейлбрейки
    | Ресурс |  Описание |  
    | JailbreakBench |  Веб-сайт, посвященный оценке и анализу методов джейлбрейка языковых моделей |  
  | L1B3RT45 |  GitHub-репозиторий, содержащий информацию и инструменты, связанные с джейлбрейком ИИ |  
  | llm-hacking-database |  Этот репозиторий содержит различные атаки на большие языковые модели. |  
  
 Таблица лидеров по галлюцинациям
    | Модель |  Частота галлюцинаций |  Частота фактической согласованности |  Частота ответов |  Средняя длина итога (слова) |  
    | GPT 4 Turbo |  2.5% |  97.5% |  100.0% |  86.2 |  
  | Snowflake Arctic |  2.6% |  97.4% |  100.0% |  68.7 |  
  | Intel Neural Chat 7B |  2.8% |  97.2% |  89.5% |  57.6 |  
  | 01-AI Yi-1.5-34B-Chat |  3.0% |  97.0% |  100.0% |  83.7 |  
  | GPT 4 |  3.0% |  97.0% |  100.0% |  81.1 |  
  | GPT 4o mini |  3.1% |  96.9% |  100.0% |  76.3 |  
  | Microsoft Orca-2-13b |  3.2% |  96.8% |  100.0% |  66.2 |  
  | Qwen2-72B-Instruct |  3.5% |  96.5% |  100.0% |  100.1 |  
  | GPT 3.5 Turbo |  3.5% |  96.5% |  99.6% |  84.1 |  
  | Mistral-Large2 |  3.6% |  96.4% |  100.0% |  77.4 |  
  | 01-AI Yi-1.5-9B-Chat |  3.7% |  96.3% |  100.0% |  85.0 |  
  
 Из этого репозитория (обновлено 25 июля)