КПД@quant_prune_distill P.420

КПД

Не проплаченной рекламы пост (от @transformerslovedeatch).

Стартап в области безопасности ИИ ищет инженера LLM (Оптимизация и RL Alignment)

Чем предстоит заниматься.

⭐️ Дообучение и Оценка Sota llm, аттаки на blackbox модели
⭐️ Улучшение RL для атак на модели, настройки моделей (PPO, RLHF, стабильность обучения).
⭐️ Бенчмаркинг и оценка качества моделей (ELO-метрики, alignment).
⭐️ Оптимизация инференса (vLLM, SGLang, TRT).

Требования.

🪄 Опыт работы с LLM (архитектуры, RL, alignment).
🪄 Знание PyTorch/JAX.
🪄 Реальная практика с RL методами (DPO, RLHF — плюс).
🪄 Опыт с системами инференса (vLLM, kuber, docker).
🪄 Публикации в NeurIPS/ICML/ICLR и др. — сильный плюс.

Преимущество

Экспертиза в байесовской оптимизации, эволюционных алгоритмах, гиперпараметрическом поиске, автоматической оптимизации промптов.

Условия

⚡️Зарплата: 80K–130K usd + опционы.
⚡️Релокация в Париж🥐, полная занятость.
⚡️Работа с передовым стеком (AI research, model alignment).

Форма для отклика
https://forms.gle/z45WwdBTRHrd8inM9

👍7❤1

www.tgoop.com/quant_prune_distill/420

1.66K viewsedited Feb 10 at 13:21

tgoop.com/quant_prune_distill/420

Create: 2025-02-10
Last Update: 2025-08-24 10:54:54

BY КПД

Share with your friend now:
tgoop.com/quant_prune_distill/420

Telegram News

Не проплаченной рекламы пост (от @transformerslovedeatch).