Перейти к содержанию

Архитектура

3 типа архитектуры LLM

Архитектуры

Риски архитектуры

Риск Описание
Рекурсивное загрязнение LLM могут производить неправильный вывод с высокой уверенностью. Если такой вывод используется в обучающих данных, это может привести к тому, что будущие LLM будут обучаться на загрязненных данных, создавая проблему обратной связи.
Долг данных LLM полагаются на огромные наборы данных, часто слишком большие для тщательной проверки. Этот недостаток прозрачности и контроля над качеством данных представляет значительный риск.
Непрозрачность черного ящика Многие критические компоненты LLM скрыты в "черном ящике", контролируемом поставщиками моделей, что затрудняет пользователям эффективное управление и смягчение рисков.
Манипуляция промптами Манипулирование входными промптами может привести к нестабильному и непредсказуемому поведению LLM. Этот риск аналогичен состязательным входным данным в других системах МО.
Отравление данных Обучающие данные могут быть намеренно или непреднамеренно загрязнены, что приводит к нарушению целостности модели. Это особенно проблематично, учитывая размер и объем данных, используемых в LLM.
Экономика воспроизводимости Высокая стоимость обучения LLM ограничивает воспроизводимость и независимую проверку, что приводит к зависимости от коммерческих организаций и потенциально непроверенных моделей.
Надежность модели Присущая LLM стохастическая природа и отсутствие истинного понимания могут сделать их вывод ненадежным. Это поднимает вопросы о том, следует ли доверять им в критически важных приложениях.
Целостность кодирования Данные часто обрабатываются и представляются заново способами, которые могут внести предвзятость и другие проблемы. Это особенно сложно с LLM из-за их неконтролируемой природы обучения.

Из статьи Berryville Institute of Machine Learning (BIML)